4. O princípio de Hardy-Weinberg



Documentos relacionados
Probabilidade: Diagramas de Árvore

A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva.

Critérios de divisibilidade em bases numéricas genéricas

Em muitas aplicações, estamos interessados em subgrafos especiais de um determinado grafo.

Algarismos Significativos Propagação de Erros ou Desvios

Probabilidade e Estatística. Correlação e Regressão Linear

4 Critérios para Avaliação dos Cenários

3 Algoritmos propostos

1ª e 2ª leis da termodinâmica

Determinantes. De nição de determinante de uma matriz quadrada. Determinantes - ALGA /05 15

b. As medidas de posição mais importantes são as medidas de tendência central. Dentre elas, destacamos: média aritmética, mediana, moda.

2 PROPRIEDADES ÓPTICAS

Testes não-paramétricos

MÉTODO DE FIBONACCI. L, em que L

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

7 - Distribuição de Freqüências

Cap. IV Análise estatística de incertezas aleatórias

R X. X(s) Y Y(s) Variáveis aleatórias discretas bidimensionais

Covariância na Propagação de Erros

Proposta de resolução da Prova de Matemática A (código 635) 21 de Junho de 2010

Notas Processos estocásticos. Nestor Caticha 23 de abril de 2012

Análise dos resíduos e Outlier, Alavancagem e Influência

Termo-Estatística Licenciatura: 4ª Aula (08/03/2013)

Introdução. Uma lâmpada nova é ligada e observa-se o tempo gasto até queimar. Resultados possíveis

ESTATÍSTICA. na Contabilidade Revisão - Parte 2. Medidas Estatísticas

Departamento de Informática. Modelagem Analítica do Desempenho de Sistemas de Computação. Modelagem Analítica. Disciplina: Variável Aleatória

CÁLCULO DA DIRECTRIZ

DIFERENCIANDO SÉRIES TEMPORAIS CAÓTICAS DE ALEATÓRIAS ATRAVÉS DAS TREND STRIPS

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16%

Flambagem. Cálculo da carga crítica via MDF

DELINEAMENTOS EXPERIMENTAIS

Prof. Lorí Viali, Dr.

PROVA 2 Cálculo Numérico. Q1. (2.0) (20 min)

INTRODUÇÃO À PROBABILIDADE. A probabilidade é uma medida da incerteza dos fenômenos. Traduz-se por um número real compreendido de 0 ( zero) e 1 ( um).

Escalonamento Baseado em Prioridades Fixas

QUESTÕES DISCURSIVAS Módulo 01 (com resoluções)

Capítulo 1 Variáveis Elétricas

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Medidas de tendência central. Média Aritmética. 4ª aula 2012

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Comprimento de Arco. Comprimento de Arco

2 Incerteza de medição

Introdução e Organização de Dados Estatísticos

Identidade dos parâmetros de modelos segmentados

Eletrotécnica AULA Nº 1 Introdução

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

3 A técnica de computação intensiva Bootstrap

Plano de amostragem do ISA-Capital 2008 Maria Cecília Goi Porto Alves Maria Mercedes L. Escuder 24 de junho de 2009

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

Regressão Linear Simples by Estevam Martins

2 Principio do Trabalho Virtual (PTV)

TEORIA DE ERROS * ERRO é a diferença entre um valor obtido ao se medir uma grandeza e o valor real ou correto da mesma.

Conceitos básicos de transferência de Calor:

CORRELAÇÃO E REGRESSÃO

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

Sistemas de equações lineares

% Al 48 b) Alumínio que fica em solução. Precisamos calcular o equilíbrio da alumina com Al e O no aço:

O que heterocedasticidade? Heterocedasticidade. Por que se preocupar com heterocedasticidade? Exemplo de heterocedasticidade.

Escola Secundária de Lousada Ficha de trabalho de Matemática do 7º ano nº Data: / / 2011 Assunto: Tratamento de dados I Lições nº, e,

Gráficos de Controle para Processos Autocorrelacionados

Implementação Bayesiana

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

ESTUDO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

Termodinâmica e Termoquímica

Prof. Lorí Viali, Dr.

MAP Cálculo Numérico e Aplicações

Introdução a Combinatória- Aplicações, parte II

Lei das Malhas (KVL) Lei dos Nós (KCL)

PREFEITURA DA CIDADE DE SÃO PAULO SECRETARIA MUNICIPAL DE TRANSPORTES. CONCORRÊNCIA nº /12-SMT Processo Administrativo nº

Laboratório de Mecânica Aplicada I Determinação de Centros de Gravidade

Autores: Dani Gamerman (IM-UFRJ) Oswaldo Gomes de Souza Junior (SERPROS)

A VELOCIDADE ESCALAR. Prof. Alberto Ricardo Präss

Medidas de Tendência Central. Introdução Média Aritmética Moda Mediana

Interpolação Segmentada

Estatística II Antonio Roque Aula 18. Regressão Linear

Probabilidade e Estatística I Antonio Roque Aula 4. Resumos Numéricos de Distribuições

FUNDAMENTOS DE ROBÓTICA. Modelo Cinemático de Robôs Manipuladores

Coordenação de Semáforos

Teoria Elementar da Probabilidade

Variáveis Indicadoras. Roteiro. Introdução

Y = AN α, 0 < α < 1 (1) Π = RT CT = P Y W N (2) Π/ N = α N α -1 AP W = 0. W = α P AN α -1. P = W/α AN α -1

Incerteza na Medição da Largura de Cordões de Solda

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

Q 1-1,5(Q3-Q1) < X i < Q 3 + 1,5(Q 3 -Q 1 ) Q 3 +1,5(Q 3 -Q 1 ) < X i < Q 3 +3(Q 3 -Q 1 ) Q 1 3(Q 3 -Q 1 ) < X i < Q 1 1,5(Q 3 -Q 1 )

CÁLCULO DE INCERTEZAS: FOLHA DE CÁLCULO VERSUS PROGRAMA DEDICADO

Aula Características dos sistemas de medição

Sempre que surgir uma dúvida quanto à utilização de um instrumento ou componente, o aluno deverá consultar o professor para esclarecimentos.

Prioridades com Teste de Escalonabilidade

Uma construção de códigos BCH

COEFICIENTE DE GINI: uma medida de distribuição de renda

ANÁLISE MATRICIAL DE ESTRUTURAS DE BARRAS PELO MÉTODO DE RIGIDEZ

DISTRIBUIÇÃO DA AÇÃO DO VENTO NOS ELEMENTOS DE CONTRAVENTAMENTO CONSIDERANDO O PAVIMENTO COMO DIAFRAGMA RÍGIDO: ANÁLISE SIMPLIFICADA E MATRICIAL

Prof. Lorí Viali, Dr.

Cap. 6 - Energia Potencial e Conservação da Energia Mecânica

CAPITULO II - FORMULAÇAO MATEMATICA

Transcrição:

4. O prncípo de Hardy-Wenberg Em 1908 G. H. Hardy, matemátco nglês, e o médco alemão Wlhelm Wenberg propuseram que as populações de seres vvos dplódes se constturam em sstemas heredtáros suetos ao mendelsmo. Mostraram que a partr das freqüêncas alélcas de um loco podemos predzer as freqüêncas genotípcas se os acasalamentos fossem aleatóros. De lá para cá foram cunhados dversos nomes para esta proposta. Foram adconados crtéros evolutvos a sua enuncação e um tratamento matemátcos extenso. Entre os nomes destacamos: Teorema de Hardy-Wenberg, Equlíbro de Hardy-Wenberg. Prncípo de Hardy-Wenberg, Le de Hardy-Wenberg. De todos eles o mas comum é o Equlíbro de Hardy-Wenberg é o de aplcação mas errônea de todos. Dadas as condções evolutvas exgdas apenas uma população teórca podera satsfazêlas, pos se trata de um conceto ad hoc, crado para sto. Nestas condções o melhor termo nos parece Prncípo de Hardy-Wenberg. os demas nomes podem ser utlzados, mas nem sempre correspondem ao uso que está sendo feto do conceto. O teorema exgra uma demonstração e assm, nessa população teórca, esse teorema fo demonstrado ad nauseam, até que os bologstas se convencessem de que era precso muta matemátca para entendê-lo. A le exgra a demonstração de um estado natural estável, reconhecdo e nvarável dentro de certos lmtes acetáves, mas não subsstra sem as suposções evolutvas. O prncpo pode ser austado coerentemente de modo a representar uma stuação real se austando ao mínmo de suposções acetáves. Uma dscussão extensa destes usos não cabera aqu, mas nteressa a todos aqueles que deseam facltar o entendmento da aplcação da matemátca aos prncípos bológcos. Neste texto trataremos sempre do Prncípo de Hardy-Wenberg como prncípo descartando os demas concetos como mprópros ou nconvenentes. 4.1. A proposção de Hardy e Wenberg O Prncípo de Hardy-Wenberg começa com a determnação das freqüêncas alélcas em uma população. Como estes alelos estão em um loco dfclmente os alelos serão detectados antes da detecção dos genótpos. Assm quando calcularmos as freqüêncas dos alelos de um loco á teremos as freqüêncas dos genótpos encontrados. Com estes dados á poderemos responder a 1ª pergunta: Como poderemos descrever genetcamente uma população? A resposta é smples: tome um ou mas locos como referenca e descreva suas freqüêncas. Isto é sufcente. É claro que podemos adconas mas elementos a esta resposta, mas ela é sufcente. Exemplo: População de Pernambuco. Loco de ccr5. Alelos: ccr5 e ccr5. Freqüêncas alélcas 0,958 e 0,0418, respectvamente. Com sto á sabemos que este loco na população de Pernambuco tem determnadas freqüêncas, porcentagens, probabldades. É claro que a estas, poderemos adconar outras nformações, melhorando o quadro em relação a população ou ao loco. Mas fca uma ndagação prmera. Como nós á sabemos as freqüêncas genotípcas, pos foram os genótpos que dentfcamos prmero: como poderemos assocar as freqüêncas alélcas às freqüêncas genotípcas que á conhecemos? Esta é a grande necessdade nesta etapa do processo de caracterzação genétca de uma população.

Consdere um loco com dos alelos A e a com freqüêncas p e q. Quando os gametas carregando estes alelos se encontrarem produzrão zgotos AA, Aa e aa. A formação destes ndvíduos se dará da segunte manera (ver tabela 4.1.1): Tabela 4.1.1 Formação dos ndvíduos pela unção dos gametas. p q A a p A AA p Aa pq q a aa qp aa q Observe que podemos dzer que A se encontra com A para formar AA com probabldade p p = p. p é a probabldade de A e p é a probabldade de AA. Do mesmo modo se formarão Aa e aa com probabldades pq e q. As probabldades p, pq e q descrevem as freqüêncas genotípcas quando A e a se encontram aleatoramente. Observe, no entanto que as freqüêncas genotípcas da população em estudo á são conhecdas e p, pq e q descrevem outras freqüêncas genotípcas. Quas? Estas freqüêncas são as freqüêncas genotípcas de uma população teórca crada a partr das freqüêncas alélcas da população real. Vamos exemplfcar com o loco ccr5. As freqüêncas alélcas no loco, na população de Pernambuco são: 0,958 para ccr5 (p) e 0,0418 para ccr5 (q) calculadas da Tabela 3... As freqüêncas genotípcas reas da população de Pernambuco são as mostradas na tabela: Tabela 4.1.. Freqüêncas genotípcas na população de Pernambuco para o loco ccr5 nas populações, real e teórca. População N ccr5/ccr5 ccr5/ ccr5 ccr5/ ccr5 PE 51 33 15 3 Freqüêncas genotípcas na população real 0,983 0,0598 0,010 Freqüêncas genotípcas na população teórca 0,9181 0,0801 0,0017 p pq q Freqüêncas Alélcas p = 0,958 q = 0,0418 Conclundo esta apresentação chamo a atenção para o fato de que estamos falando de duas populações dferentes. Uma é a população real e a outra é a população teórca. As duas possuem um loco com dos alelos, freqüêncas alélcas e freqüêncas genotípcas. As freqüêncas alélcas são as mesmas, mas as freqüêncas genotípcas são dferentes. Mas a maor dferença de todas é que a população teórca pode respetar qualquer suposção que queramos e a mao delas é a suposção de acasalamentos aleatóros. As freqüêncas genotípcas da população teórca estão de acordo com a aleatoredade dos acasalamentos dos seus ndvíduos. Esta exgênca sera completamente descabda para uma população natural. Esta é a manera de relaconar as freqüêncas alélcas com as freqüêncas genotípcas através de uma população teórca levando em conta certas suposções báscas. É o que veremos a segur.

4.. O prncípo de Hardy-Wenberg Com as freqüêncas alélcas de uma população real construímos uma população teórca e comparamos as duas dstrbuções de freqüêncas genotípcas. Fazemos sto porque a dstrbução teórca tem propredades matemátcas que nos permtem trar conclusões mportantes. Se a população real for semelhante à população teórca poderemos estender as conclusões para a população real e compreender seu comportamento genétco. É mportante compreender aqu que, daí em dante, a população teórca será a representante da população real em todos os estudos futuros pertnentes. Para compararmos duas populações ncamos verfcando suas dferenças quanto as freqüêncas genotípcas. Elas sempre exstem, mas seu somatóro será sempre zero. Para contornar sto elevamos cada dferença ao quadrado e o somatóro agora será dferente de zero. Este número, em geral tende a ser muto grande e vara muto de população para população. Para evtar seu crescmento desmeddo dvdmos cada quadrado pela freqüênca teórca e assm normalzamos os resultados de modo a produzr uma dstrbução que tem algumas propredades útes. Partes destas propredades são descrtas como suposções. Na lteratura sobre genétca de populações estas suposções são: Os organsmos são dplódes A reprodução é sexuada. As gerações são não-superpostas. O gene em consderação tem dos alelos. As freqüêncas alélcas são dêntcas nos machos e nas fêmeas. Os acasalamentos são aleatóros. O tamanho da população é muto grande (em teora, nfnto). Com tal tamanho a derva genétca é neglgencável. A mgração é neglgencável. A mutação pode ser gnorada. A seleção natural não afeta os alelos em consderação. Estas suposções são apresentadas como necessáras para apoar o Prncípo de Hardy- Wenberg (ver Hartl e Clar, 1997 e outros textos sobre o assunto). Pelo que vmos até aqu podemos dzer que as freqüêncas genotípcas de uma população podem ser descrtas como a soma ndcada do quadrado de suas freqüêncas alélcas se os acasalamentos forem aleatóros, sem referenca às demas suposções acma. Neste caso o Prncípo de Hardy-Wenberg pode ser enuncado assm: Dada uma população real qualquer e um loco nesta população, com qualquer número de alelos, suas freqüêncas genotípcas serão descrtas pelo quadrado da soma ndcada de suas freqüêncas alélcas. Matematcamente: (p + q) = (p + pq + q ) onde p e q são freqüêncas alélcas. O afastamento destas condções, ou sea, se as freqüêncas genotípcas das duas populações forem dferentes, os acasalamentos, nesta população, não são aleatóros. É mportante notar que aquelas suposções ctadas acma não estão relaconadas com o Prncípo de Hardy-Wenberg, mas sm com a necessdade de estender este prncpo para explcar outros fenômenos. Não é necessára qualquer menção ao tamanho populaconal, mas a exgênca de organsmos dplódes procede. De agora em dante chamaremos a população teórca de população teórca assocada.

Faremos agora a 3ª pergunta: Como sabermos se uma dstrbução genotípca de uma população real dfere sgnfcatvamente de sua população teórca assocada? Como falamos antes, comparamos suas dferenças. Os grupos sanguíneos do sstema MN nos seres humanos são controlados por dos alelos, M e N. Cada alelo codfca uma molécula de polssacarídeo na superfíce das hemácas e pode ser dstngudo por meo de reagentes químcos aproprados. Os tpos de moléculas são desgnados M e N respectvamente e os alelos M e N são codomnantes, o que quer dzer que se expressão nos heterozgotos. Numa amostra de 1000 ngleses Race e Sanger (1975) encontraram: 98 M, 489 MN e 13 N. O calculo da freqüênca p de M e q de N e a comparação com a população teórca assocada podem ser realzados como se segue. Na tabela 4..1 temos: Tabela 4..1 Avalação da dferença entre a dstrbução genotípca real e a dstrbução genotípca teórca assocada. SISTEMA SANGUÍNEO N MM MN NN p q População real (O) 1.000 98 489 13 0,543 0,458 Freqüêncas genotípcas na população real 0,98 0,498 0,13 Freqüêncas genotípcas na população teórca 0,94 0,496 0,09 População teórca (E) 1.000 94,3 496,4 09,3 Dferença (d) 3,694-7,387 3,694 d 13,644 54,575 13,644 d /E 0,046 0,110 0,065 0,1 O quadrado as dferenças são dvddas por E (as freqüêncas genotípcas teórcas correspondentes) e somadas às parcelas de cada genótpo. O total 0,0639 fo obtdo pela segunte fórmula: χ = ( O E E ) Esta é a fórmula para se calcular o qu-quadrado uma estatístca que avala dferenças entre dstrbuções esperadas e observadas. A dstrbução esperada é a dstrbução de freqüêncas genotípcas da população teórca e a dstrbução observada é a dstrbução de freqüêncas genotípcas da população real. É o que se vê na últma lnha da tabela acma. O resultado desta fórmula é comparado com os resultados de uma tabela de qu-quadrado de referênca. Se o qu-quadrado calculado for menor que o qu-quadrado de tabela podemos dzer que as dferenças entre as duas dstrbuções não são sgnfcatvas e usar a dstrbução teórca como se fosse a dstrbução real. A partr daí a população teórca representará a população em estudos futuros. O qu-quadrado de referenca, na tabela do qu-quadrado, é 3,841. Qualquer valor menor que este mplca a não-dferença entre a população real e a teórca e acetamos a dstrbução teórca como se fosse a real. Esta dstrbução teórca va predzer o quanto acharemos de cada genótpo em amostras futuras. 4.3. Aplcação do prncípo de Hardy-Wenberg Uma aplcação forense. Um homem que vem de uma dada população é apontado por uma mulher como pa do seu flho. Antes do uso do DNA em Genétca de Populações para a determnação de paterndade a solução fcava sempre ncompleta, pos as provas eram muto dfíces de consegur. Com a

possbldade de se comparar genótpos da mãe, do flho e do suposto pa fca mas fácl resolver o problema. Temos que responder a uma pergunta: Fulano é o pa bológco de Beltrano? Como o flho tem DNA dos seus pas, separados, em dos conuntos de cromossomos nós podemos analsando o DNA do beltrano separar o DNA da mãe e o do seu pa bológco. Depos dsto basta comparar o DNA do flho que pertence ao seu pa bológco com o DNA do suposto pa. Se houver concdênca em todos os locos calcula-se a probabldade de paterndade. Se não houver concdênca em todos os locos o suposto pa é dto excluído do grupo dos possíves pas do beltrano. Nestes casos a exclusão de paterndade é decsva. Não há como atrbur paterndade a alguém que não tem o mesmo DNA do requerente. O calculo da probabldade leva em conta as freqüêncas alélcas no loco e a ocorrênca dos alelos nos envolvdos. De um modo geral podemos, prelmnarmente, defnr o índce de paterndade como o número que representa o quanto a evdenca de DNA é favorável a paterndade. Os índces sgnfcatvos estão acma de 1.000. A probabldade de paterndade é calculada de forma smples a partr do índce da segunte manera? IP P = IP +1 As probabldade acetáves como defndoras da paterndade estão acma de 0,999, sto é consegudo aumentando o número de locos examnados. A segur damos um exemplo de uma análse de paterndade para o tro mãe-flho-suposto pa usando-se dez locos. LOCO Mãe Flho (a) SPa AO Freqüênca Índce de IP do alelo Paterndade acumulado obrgatóro (IP) CSF1PO 11/11 10/11 10/10 10 0,819 3,5474 3,55 THO1 6/6 6/7 7/8 7 0,648 1,888 6,70 TPOX 8/10 8/9 8/9 9 0,1119 4,4683 9,93 vwa 16/18 16/17 17/18 17 0,1798,7809 83,3 D16S539 11/1 11/13 13/13 13 0,1361 7,3475 611,53 D7S80 9/11 11/1 11/1 1 0,1749,8588 1.748,3 D13S317 9/14 8/14 8/11 8 0,1048 4,7710 8.340,81 D18S51 1/14 1/14 14/14 14 0,1313 7,6161 63.54,79 D1S11 9/30 9/9 9/9 9 0,15 4,7059 98.940,19 D8S1179 13/14 13/13 10/13 13 0,89 1,7674 58.349,58 0,9999981 A análse da paterndade precsa de freqüêncas alélcas. Na prmera lnha verfcamos que o alelo obrgatóro está presente no suposto pa, em homozgose. O índce de paterndade, calculado como 1/p, sendo p a freqüênca do alelo obrgatóro, é 1,7737 mas como ele é homozgoto a freqüênca será 1/p e fca 3,5474. O índce de paterndade calculado para cada loco va consttur o produtóro: IP. é o número da lnha onde o IP se encontra. No nosso caso IP = 58.349,58 e a probabldade de paterndade é 0,9999981 o que sgnfca paterndade pratcamente provada. Estas operações e o resultado se baseam no fato de que as freqüêncas alélcas foram calculadas na população de Pernambuco e a população se encontra de acordo com o Prncípo de Hardy-Wenberg para os locos analsados.

4.4. Extensão do prncípo de Hardy-Wenberg Quando um loco contver mas de dos alelos as freqüêncas genotípcas serão representadas da segunte manera: = 1 = ( p + p + p + + p ) = p + p p 1 3 L Daqu qualquer p pode ser calculado da segunte manera: para qualquer alelo. p = p + p p Lendo a fórmula: A freqüênca de qualquer alelo em um loco é gual a: o quadrado da freqüênca do homozgoto mas duas vezes o somatóro do produto da freqüênca do alelo em questão pela freqüênca de todos os outros alelos. Observação ao estudante. Esta defnção não é uma defnção operaconal, uma fórmula de laboratóro. É uma explcação básca do prncpo de Hardy-Wenberg.