INTRODUÇÃO À EVOLUÇÃO MOLECULAR: O MODELO DE JUKES-CANTOR

Documentos relacionados
IV Simpósio Nacional / Jornadas de Iniciação Científica IMPA, Rio de Janeiro INTRODUÇÃO À EVOLUÇÃO MOLECULAR: O MODELO DE JUKES-CANTOR

Difusão entre Dois Compartimentos

Em muitas situações duas ou mais variáveis estão relacionadas e surge então a necessidade de determinar a natureza deste relacionamento.

MEDIDAS DE POSIÇÃO: X = soma dos valores observados. Onde: i 72 X = 12

MEDIDAS DE TENDÊNCIA CENTRAL I

Estatística - exestatmeddisper.doc 25/02/09

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Estimação Pontual

Cap. 5. Testes de Hipóteses

MEDIDAS DE DISPERSÃO:

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou. experimental.

Introdução à Teoria dos Números Notas 1 Os Princípios da Boa Ordem e de Indução Finita Prof Carlos Alberto S Soares

MAE0229 Introdução à Probabilidade e Estatística II

Distribuições de Probabilidades

Distribuições Amostrais. Estatística. 8 - Distribuições Amostrais UNESP FEG DPD

Métodos iterativos. Capítulo O Método de Jacobi

Macroeconometria Aula 3 Revisão de estatística e teste de hipótese

Sumário. Mecânica. Sistemas de partículas

Faculdade de Tecnologia de Catanduva CURSO SUPERIOR DE TECNOLOGIA EM AUTOMAÇÃO INDUSTRIAL

Regressão Simples. Parte III: Coeficiente de determinação, regressão na origem e método de máxima verossimilhança

Professor Mauricio Lutz REGRESSÃO LINEAR SIMPLES. Vamos, então, calcular os valores dos parâmetros a e b com a ajuda das formulas: ö ; ø.

Econometria: 3 - Regressão Múltipla

Teoria Elementar da Probabilidade. a) Cada experiência poderá ser repetida indefinidamente sob condições essencialmente inalteradas.

MÓDULO 8 REVISÃO REVISÃO MÓDULO 1

? Isso é, d i= ( x i. . Percebeu que

DISTRIBUIÇÃO HIPERGEOMÉTRICA

CAPÍTULO 3 MEDIDAS DE TENDÊNCIA CENTRAL E VARIABILIDADE PPGEP Medidas de Tendência Central Média Aritmética para Dados Agrupados

Interpolação. Exemplo de Interpolação Linear. Exemplo de Interpolação Polinomial de grau superior a 1.

Confiabilidade Estrutural

Prof. Janete Pereira Amador 1

Modelo de Regressão Simples

Construção e Análise de Gráficos

Média. Mediana. Ponto Médio. Moda. Itabira MEDIDAS DE CENTRO. Prof. Msc. Emerson José de Paiva 1 BAC011 - ESTATÍSTICA. BAC Estatística

Relatório 2ª Atividade Formativa UC ECS

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

ANÁLISE DE REGRESSÃO E CORRELAÇÃO

Cursos de Licenciatura em Ensino de Matemática e de EGI. Teoria de Probabilidade

NOTAS DE AULA DA DISCIPLINA CE076. ], T 2 = conhecido como T 2 de Hotelling

ESTATÍSTICA MÓDULO 2 OS RAMOS DA ESTATÍSTICA

6.1 - PROCEDIMENTO DE AVALIAÇÃO DE INCERTEZA EM MEDIÇÕES DIRETAS

REGRESSÃO LINEAR 05/10/2016 REPRESENTAÇAO MATRICIAL. Y i = X 1i + 2 X 2i k X ni + i Y = X + INTRODUÇÃO SIMPLES MÚLTIPLA

ANÁLISE DE ERROS. Todas as medidas das grandezas físicas deverão estar sempre acompanhadas da sua dimensão (unidades)! ERROS

Tabela 1 Números de acidentes /mês no Cruzamento X em CG/07. N de acidentes / mês fi f

HIDROLOGIA E RECURSOS HÍDRICOS. Análise estatística aplicada à hidrologia

n. A densidade de corrente associada a esta espécie iônica é J n. O modelo está ilustrado na figura abaixo.

Centro de massa, momento linear de sistemas de partículas e colisões

Revisão de Estatística X = X n

Nas Instituições de Ensino Superior(IES), há uma relação direta entre a qualidade do ensino e a taxa de inadimplência. A taxa de inadimplência das

Controle Estatístico de Qualidade. Capítulo 6 (montgomery)

Centro de Ciências Agrárias e Ambientais da UFBA Departamento de Engenharia Agrícola

1. Conceitos básicos de estatística descritiva 1.3. Noção de extracção aleatória e de probabilidade

Sumário. Mecânica. Sistemas de partículas

7 Análise de covariância (ANCOVA)

d s F = m dt Trabalho Trabalho

II. Propriedades Termodinâmicas de Soluções

Regressao Simples. Parte II: Anova, Estimação Intervalar e Predição

Estatística Descritiva. Medidas estatísticas: Localização, Dispersão

Como CD = DC CD + DC = 0

Estudo do intervalo de confiança da regressão inversa utilizando o software R

a) 1,8 e 4,6. b) 2,0 e 2,2. c) 1,8 e 5,2. d) 2,0 e 4,6. e) 2,0 e 1,9.

TESTES DE PROPORÇÕES TESTE DE UMA PROPORÇÃO POPULACIONAL

16/03/2014. IV. Juros: taxa efetiva, equivalente e proporcional. IV.1 Taxa efetiva. IV.2 Taxas proporcionais. Definição:

Projeto e Análise de Algoritmos Recorrências. Prof. Humberto Brandão

A análise de variância de uma classificação (One-Way ANOVA) verifica se as médias de k amostras independentes (tratamentos) diferem entre si.

Inferência Estatística e Aplicações I. Edson Zangiacomi Martinez Departamento de Medicina Social FMRP/USP

CEDEPLAR - UFMG Nivelamento em Estatística 2013 Prof a Sueli Moro. Variáveis aleatórias

2. MODELO DETALHADO: Relações de Recorrência. Exemplo: Algoritmo Recursivo para Cálculo do Fatorial Substituição Repetida

Dados Experimentais. Isto é chamado de experimento controlado. Uma das vantagens

Avaliação da qualidade do ajuste

Aula 9. Aula de hoje. Aula passada. Self-normalized Importance Sampling Gerando amostras complicadas Variância amostral Simulação

ESTATÍSTICA Aula 7. Prof. Dr. Marco Antonio Leonel Caetano

REGESD Prolic Matemática e Realidade- Profª Suzi Samá Pinto e Profº Alessandro da Silva Saadi

Capítulo 5: Ajuste de curvas pelo método dos mínimos quadrados

MEDIDAS DE DISPERSÃO 9. MEDIDAS DE DISPERSÃO

Estatística. 2 - Estatística Descritiva

Capítulo V - Interpolação Polinomial

Estudo das relações entre peso e altura de estudantes de estatística através da análise de regressão simples.

ESTATÍSTICA Exame Final 1ª Época 3 de Junho de 2002 às 14 horas Duração : 3 horas

1. Conceito de variável aleatória Podemos estudar, por exemplo, algumas características dos alunos do Curso de estatística.

Apêndice 1-Tratamento de dados

5 Critérios para Análise dos Resultados

( ) ( IV ) n ( ) Escolha a alternativa correta: A. III, II, I, IV. B. II, III, I, IV. C. IV, III, I, II. D. IV, II, I, III. E. Nenhuma das anteriores.

RACIOCÍNIO LÓGICO / ESTATÍSTICA LISTA 2 RESUMO TEÓRICO

O delineamento amostral determina os processos de seleção e de inferência do valor da amostra para o valor populacional.

n. A densidade de corrente associada a esta espécie iônica é J n. O modelo está ilustrado na figura abaixo.

50 Logo, Número de erros de impressão

Exercícios - Sequências de Números Reais (Solução) Prof Carlos Alberto S Soares

( k) Tema 02 Risco e Retorno 1. Conceitos Básicos

MÉTODO DOS MÍNIMOS QUADRADOS

Apostila de Introdução Aos Métodos Numéricos

IND 1115 Inferência Estatística Aula 9

Momento Linear duma partícula

x n = n ESTATÍSTICA STICA DESCRITIVA Conjunto de dados: Organização; Amostra ou Resumo; Apresentação. População

Regressão e Correlação

AULA Produto interno em espaços vectoriais reais ou complexos Produto Interno. Norma. Distância.

Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

Probabilidades e Estatística LEGM, LEIC-A, LEIC-T, MA, MEMec

13 ESTIMAÇÃO DE PARÂMETROS E DISTRIBUIÇÃO AMOSTRAL

ESTATÍSTICA APLICADA À ZOOTECNIA

Atividades Práticas Supervisionadas (APS)

Probabilidade II Aula 10

Transcrição:

Departameto de Matemátca ITRODUÇÃO À EVOLUÇÃO MOLECULAR: O MODELO DE JUKES-CATOR Aluo: Adraa Cruz Marts Oretador: Sérgo Berardo Volcha Itrodução A bologa molecular tem tdo eorme mpacto em dversos ramos da bologa e medca Em partcular, abru ovos horzotes para o estudo da evolução e da flogea De fato, um dos prcípos fudametas da teora da evolução de Darw é o de que todos os orgasmos atuas descedem de um acestral comum Portato, a descoberta da exstêca de grade varedade (polmorfsmos) à ível molecular (proteías e ácdos uclécos) etre dvíduos, tato da mesma espéce quato de espéces dferetes, levatou a possbldade de se estudar o paretesco evolucoáro dos orgasmos através da comparação de caracteres moleculares, estededo dessa forma as téccas de estudo tradcoalmete usadas em paleotologa (morfologa, fsologa, comportameto, etc) Do poto de vsta molecular, as varações etre dvíduos estão lgadas a alterações a estrutura do DA, tpcamete (mas ão somete) por mutações, tas como substtuções de ucleotídeos em sítos dvduas da molécula Surge etão aturalmete a hpótese de que quato maor o acúmulo de dfereças etre trechos homólogos do DA de dvíduos de duas espéces, meor sera o paretesco etre tas espéces Isto sgfca que a partr da observação destas seqüêcas em orgasmos atuas sera possível estmar o mometo em que houve a separação do acestral comum Esta déa tem revolucoado a área da sstemátca/taxooma, revelado relações suspetadas etre orgasmos e permtdo a costrução de árvores flogeétcas ( árvores da vda ) mas cofáves, precsas e completas [] Porém, este método de recostrução ão é algo smples de ser realzado e costtu um dos maores desafos do estudo da chamada flogeétca molecular Há város fatores que complcam a aálse, partcularmete o fato de a taxa de mutação ão ser geralmete costate; e ada que em algus caso ela seja, deve-se cosderar a ocorrêca de mutações slecosas e repetdas, que ão são dretamete observáves Date desta dfculdade, foram desevolvdas dversas ferrametas estatístcas assm como modelos probablístcos que permtem determar, sob certas codções e com certa margem de erro, a dstâca evolucoára Esta é uma vasta área de pesqusa atual, extremamete atva e multdscplar, evolvedo bologa, geétca, boformátca, estatístca, teora da probabldade, otmzação, etc este projeto, estudamos um dos modelos mas smples de evolução molecular: o modelo de Jues-Cator Apesar de coter certas hpóteses um tato quato rrealstas (tas como a depedêca etre os sítos do DA e que as substtuções de ucleotídeos ocorrem com mesma probabldade) este modelo admte uma aálse matemátca relatvamete dreta e ada é muto utlzado como uma prmera aproxmação [6] Os objetvos prcpas deste projeto foram o de eteder os prcípos báscos da evolução molecular e a aplcação de algumas téccas matemátcas em seu estudo, partcularmete oções de teora da probabldade ossa prmera tarefa fo a de os famlarzar com os prcpas cocetos bológcos relacoados à evolução molecular Em seguda estudamos cocetos de teora da probabldade ecessáros para compreeder o modelo de Jues-Cator, o qual os cocetramos Por outro lado, ão fo possível abordar o estudo de costrução de árvores flogeétcas propramete dto, pos exgra a abordagem de téccas estatístcas sofstcadas que estão além do escopo do projeto

Departameto de Matemátca 2 A Teora eutra da evolução molecular e o modelo de Wrght-Fsher A formulação cal da teora da seleção atural de Charles Darw fo baseada exclusvamete em observações fetas o ível feotípco, sto é, de característcas macroscópcas (morfológcas, fsológcas e comportametas) dos orgasmos Descohecase a orgem das varações assm como os mecasmos da heredtaredade Equato ão hava um cohecmeto efetvo referete à exstêca e a atureza dos gees e ao seu papel a evolução, acredtava-se que exstam essecalmete dos tpos de modfcações resposáves pela evolução das espéces modfcações vatajosas ou prejudcas e somete um tpo de mecasmo resposável pela determação do desto destas modfcações (fxação ou ão) a seleção atural Posterormete, com os avaços da geétca e da bologa molecular descobru-se que as varações surgem devdo à certas alterações estruturas o materal geétco (o DA), tpcamete as mutações Com a descoberta, os aos 96, de uma suspetada varação etre dvíduos ao ível molecular, surgu a hpótese de que mutas destas varações ão sofreram ação da seleção atural, sto é seram eutras O coceto de mutação eutra se aplca a todas as mutações que ão são ecessaramete resposáves pelo aparecmeto de característcas adaptatvas (ão possuem mpacto sgfcatvo a habldade dos orgasmos sobrevverem ou se reproduzrem) e que, portato, ão possuem sua fxação (uma população) determada pela seleção atural Um exemplo deste tpo de mutação são as alterações slecosas, que acarretam a substtução de certos amoácdos de uma proteía (estrutura prmára), mas ão afetam a coformação (estruturas secudára e tercára) e, portato, a fução da proteía correspodete Em 968, o geetcsta japoês Motoo Kmura propôs que, à ível molecular, mutações eutras seram mas freqüetes que os demas tpos de mutação e que sua fxação ocorrera por efetos puramete estatístcos ou aleatóros, a chamada derva gêca Com sso, troduzu-se outro mecasmo de evolução: a fxação de mutações eutras por derva gêca Esta ova déa evolucoára sugera que as mutações resposáves pelo surgmeto de característcas adaptatvas vatajosas possuram pouca cotrbução para a varabldade geétca das populações por serem extremamete raras e se fxarem muto rapdamete (pela seleção atural) Além dsso, Kmura excluu, em sua teora eutra, as mutações prejudcas de suas cosderações já que estas ão cotrburam em para a varabldade geétca em para a evolução molecular, uma vez que são rapdamete elmadas por meo da chamada seleção egatva É mportate ressaltar que esta chamada teora eutra da evolução, ada que teha causado muta cotrovérsa, ão ega a exstêca da seleção atural em sua mportâca para a evolução o etato, ao cotráro de Darw, que ão dspuha dos cohecmetos de bologa molecular, a teora eutra lda essecalmete com varações à ível molecular Com o auxílo de modelos matemátcos aproprados e da oção de relógo molecular (que dscutremos posterormete), a teora eutra de Kmura costtu uma das prcpas ferrametas para a compreesão da evolução molecular Um modelo probablístco relatvamete smples de derva eutra é dscutdo em seguda 2 O modelo de Wrght-Fsher O modelo de derva gêca fo troduzdo pela prmera vez a década de 92 por Sewall Wrght e Roald Fsher o cotexto da geétca de populações e em tempo dscreto O modelo em tempo cotíuo fo retomado por Kmura a década de 96, utlzado téccas da teora de processos estocástcos (dfusões), o cotexto da teora eutra da evolução molecular O modelo de Wrght-Fsher lustra o processo evolucoáro de mudaça a freqüêca dos alelos em uma população que ocorre de forma teramete aleatóra devdo aos efetos de amostragem em uma população fta

Departameto de Matemátca a versão mas smples, o modelo descreve a evolução de um lócus com apeas dos alelos (eg A e B) em uma população com úmero fxo de dvíduos haplódes em gerações ão-superpostas (,, 2, ), sujeta a cruzameto aleatóro a ausêca de qualquer tpo de mutação A segur, descrevemos a obteção de algus resultados deste modelo e suas propredades Prmeramete, cosderamos X como a varável aleatóra que represeta o úmero de alelos do tpo A a geração A população a geração + é gerada a partr da geração pela amostragem bomal (ver Apêdce ) de alelos de um cojuto de gees ( gee pool ) o qual a fração cal de alelos A é suposta ser π ( π, o caso dplóde) 2 Logo, dado que X e cosderado a amostragem bomal dos alelos, a probabldade (codcoal) de que X + j é dada por: j j pj Ρ( Χ + j Χ ) π ( π ),, j j A seqüêca de varáves aleatóras { Χ } é um exemplo de um processo estocástco em tempo dscreto chamado Cadea de Marov Homogêea com matrz de trasção p j e espaço de estados S {,,,} Um processo Marovao satsfaz a detdade: Ρ( Χ + + Χ, Χ,, Χ ) Ρ( Χ + + Χ ), ou seja, a probabldade codcoal de que o sstema esteja em um dado estado após passos, dados todos os passos aterores, é a mesma que a probabldade codcoal cohecedo-se apeas o estado o passo medatamete ateror (propredade de memóra curta ) Já a homogeedade temporal do processo sgfca que: ( Χ j Χ ) Ρ Χ j Χ ( ) Ρ + Lstamos a segur algumas propredades báscas do modelo Ε ) [ Χ Χ ] Χ Ε [ Χ Χ ] π, pos a partr da esperaça da dstrbução bomal, temos que j A partr dsto, podemos coclur também que Ε[ Χ Χ ] Χ Ε[ Χ ] processo é costate em méda jp j, sto é, o 2) Os estados e são absorvetes : uma vez atgdos, ão se alteram pos represetam, respectvamete, a ausêca do alelo A a população e a preseça exclusva do alelo A a população Isto é, este caso, p j, para ( j ),,,, e p p ote que como o úmero de estados é fto, evetualmete um dos estados absorvetes é ecessaramete atgdo, em tempo fto, e, ocorre fxação de um dos alelos (ver fgura )

Departameto de Matemátca Fgura : O gráfco lustra a varação a freqüêca de dos alelos ao logo das gerações Verfcamos que, em tempo fto, evetualmete ocorre a fxação de um dos alelos e o desaparecmeto do outro alelo a população ) Seja a a probabldade de fxação do alelo A, dado que Χ, etão: a π Portato, se um state cal, surge um ovo alelo (e que pode ser terpretado como o surgmeto de uma mutação aquele state) ele se fxa com probabldade / Esta propredade é extremamete mportate e vale a pea verfcá-la com mas detalhe Demostração: Seja A o eveto de fxação e a Ρ( A Χ ) Como { Χ j} Ω j Vamos codcoar a varável Χ :, ode represeta a uão dsjuta dos evetos { Χ j}, j j,, e Ω é o espaço amostral, temos: Α Α I Ω Α I { Χ j} a Ρ( Α Χ ) ( Α I { Χ } ) Ρ( Χ ) j Ρ j Ρ ( Α, Χ j Χ ) Mas temos: a Ρ, j j j j Ρ Ρ ( A Χ j Χ ) Ρ( A Χ j, Χ ) Ρ( Χ j Χ ) * ( A Χ j) pj (Cosderado a propredade de Marov) ( A Χ j) pj (Cosderado a homogeedade) * Aqu, usamos que para quasquer evetos A, B e C: Ρ( A I B C) Ρ( A B I C) Ρ( B C)

Departameto de Matemátca a j p j Isto é, j a a j j p Lembrado que j e a, a jp j j r v,,,, temos que o vetor ( ) Τ é solução da equação: r r r r r ρ v v c ρ v ρ( c v) c v, para qualquer costate real c, ode ρ [ pj ] é a matrz de trasção Logo r a ( a, a,, a ) Τ c( ) Τ,,,, sto é, a c Logo, a c a π, CQD 22 O relógo molecular Em uma população de dvíduos dplódes Com o auxílo do modelo de derva gêca de Wrght-Fsher, pode-se obter a taxa de fxação,, de um ovo alelo esta população: O úmero médo de mutações por geração é determado pelo produto etre úmero de gametas produzdo por geração, 2, e a taxa de ocorrêca de uma mutação por geração, u Cosderado que a fração de mutações que se fxam, de acordo com o modelo de Wrght- Fsher, é /2, obtemos: ( 2 u) u, 2 sto é, u Este é um dos resultados mas mportates da teora eutra da evolução De acordo com este modelo a taxa a qual as mutações eutras ocorrem é gual à taxa de fxação de um ovo alelo Ora, um alelo pode ser pesado como um trecho de DA, dgamos de m ucleotídeos Supodo que a taxa de fxação e a taxa de mutação por síto sejam, respectvamete, u s e s, dêtcas para todos os sítos, e que os sítos são depedetes, segue do resultado acma que: u m us m s us s Ou seja, sob a teora eutra e o cotexto do modelo de Wrght-Fsher, a taxa de mutação de ucleotídeos por síto é gual à sua taxa de fxação por síto Esta é a base da oção do relógo molecular O termo relógo molecular fo troduzdo em 965, por Emle Zuceradl e Lus C Paulg, para lustrar esta acumulação de substtuções de moômeros de macromoléculas de mportâca bológca (o caso orgalmete por eles estudado era o de substtuções de amoácdos em proteías), supostamete a uma taxa costate, o que permtra estmar o paretesco etre orgasmos pela comparação de dfereças observáves de seqüêcas homólogas (ver fgura 2) este setdo, pode-se dzer que as moléculas são capazes de determar seu tempo evolucoáro através do acúmulo de substtuções (dvergêca), fucoado assm como um verdadero documeto hstórco da evolução É mportate

Departameto de Matemátca observarmos, etretato, que a hpótese da ocorrêca de substtuções a uma taxa costate é uma aproxmação, e que a verdade esta taxa pode flutuar muto de gee para gee, de espéce para espéce, etc; o que complca substacalmete a aálse Fgura 2: Calculado um relógo molecular humao O úmero observado de dfereças é determado para um par de gees homólogos de humao e oragotago, aqu, este úmero é chamado de x O úmero de substtuções por lhagem é x/2 e o úmero por mlhões de aos é x/26 este caso, a partr do tempo de dvergêca etre os dos orgasmos (tempo de separação de um acestral comum) fo possível determar o úmero de dfereças acumuladas x Poderíamos também realzar o cálculo verso, obtedo o tempo de separação a partr da observação de x Em todo caso, é precso um modelo matemátco que faça a correção etre as dfereças observadas e as substtuções que realmete ocorreram desde a separação etre as espéces O modelo de Jues-Cator faz exatamete sso O modelo de Jues-Cator A dstrbução de probabldade de Posso Os prcpas evetos resposáves pela dvergêca etre seqüêcas do DA são as mutações e fxações De acordo com a teora eutra da evolução molecular, a taxa de fxação das mutações é gual à taxa com a qual as mutações eutras surgem, portato, podemos aalsar estes dos evetos de forma cojuta o caso mas smples, mutações correspodem à troca de um ucleotídeo por outro (ou substtução) em um síto específco de uma molécula de DA Apesar de seu caráter aleatóro dvdual, mutações têm efetos prevsíves, o setdo de que podem ser estmados através de médas estatístcas obtdas a partr da aplcação de modelos probablístcos adequados o modelo de Jues-Cator supõe-se que o acúmulo de substtuções de ucleotídeos durate a evolução molecular é um processo que pode ser descrto pela dstrbução de λ probabldade de Posso de parâmetro λ cuja fórmula é expressa por Ρ(, λ) e,!,,2,, λ > que, por sua vez, pode ser obtda a partr da dstrbução bomal de probabldade Exstem váras formas de obter este resultado e descrevemos uma delas a segur [] A dstrbução bomal p p q Β ( ;, ) pode ser escrta como: ( )( 2) ( + ) p q! Podemos multplcar e dvdr por e obter:

Departameto de Matemátca 2 ( )( ) ( ) p ( p) ( )! Fazedo com que de tal forma que p λ permaeça costate, cada termo do ( ) produto ( )[ ] tederá a, e ( p) se reduzrá a λ Também: p λ λ e () e λ Portato, o lmte como com p λ (e como p ), temos: λ e p q λ λ e Ρ( ; λ) e!! Este resultado forece a dstrbução de Posso com parâmetro λ como lmte da dstrbução bomal, para o caso de grade e p pequeo, que é o caso de mutações de ucleotídeos Observamos que a méda da dstrbução de Posso é exatamete λ (ver Apêdce 2) Aplcada à evolução molecular, a dstrbução de Posso forece a probabldade de que,,2,, substtuções ocorram em um segmeto de DA de um determado tamaho em um tervalo de tempo defdo O úmero médo esperado de substtuções observadas em um tervalo fxo de tempo é dado por 2tµ, ode µ é a taxa de substtução (úmero médo de substtuções por síto de seqüêca, por udade de tempo) e t é o tempo decorrdo desde o mometo da dvergêca etre as duas seqüêcas de DA comparadas Como cada uma das duas seqüêcas acumulou substtuções depedetemete durate um tervalo de tempo t, jutas elas tveram um tempo correspodete a t + t 2t para dvergr (ver fgura 2) Portato, a fórmula de Posso para a evolução molecular pode ser expressa por: ( 2tµ ) 2tµ Ρ ( ;2tµ ) e! Aqu, Ρ( ;2tµ ) é a probabldade de que um úmero,,2,, de substtuções ocorra em um síto do DA em um tervalo de tempo t quado a taxa de substtução é µ 2 A fórmula de Jues-Cator A aplcação da fórmula de dstrbução de probabldade de Posso o estudo da evolução molecular é, o etato, lmtada, pos, freqüetemete, ão sabemos em a taxa de substtução µ em o tempo t de dvergêca etre as duas seqüêcas Para solucoar este problema, foram desevolvdos métodos de obteção do úmero médo 2tµ de substtuções depedetemete das varáves t e µ Teorcamete, poderíamos obter o úmero médo de substtuções através da observação do úmero de posções que dferem etre as duas seqüêcas homólogas alhadas o etato, esta proporção de dfereças, x / L (úmero médo de substtuções dferetes observadas, x, dvddo pelo úmero total de ucleotídeos o trecho comparado, L) ão leva em cosderação os evetos que ão são observados como, por exemplo, as substtuções múltplas e recorretes Portato, para obter o úmero médo de substtuções, precsamos cosderar os evetos escoddos e, assm, coverter/corrgr a proporção de dfereças observada em uma dstâca evolucoára efetva (úmero total de substtuções realmete ocorrdas por síto desde a separação das espéces)

Departameto de Matemátca Fgura : O dagrama lustra a ocorrêca de uma substtução de ucleotídeo em um síto da molécula de DA Para realzar esta coversão, precsaríamos cosderar todas as mudaças que um ucleotídeo específco e os ucleotídeos de um determado síto podem sofrer Em seguda, deveríamos calcular a probabldade de mudaças dvduas, assumdo o processo de substtução como sedo um processo de Posso, e estmar o úmero de mudaças que ão são reveladas a comparação das duas seqüêcas Este procedmeto aparetemete complcado pode ser codesado por uma fórmula matemátca, a fórmula de Jues-Cator O prmero e mas smples modelo desevolvdo com o objetvo de obter esta dstâca evolucoára etre seqüêcas de DA fo descrto em 969 por Thomas H Jues e Charles R Cator Este modelo é baseado a suposção de que as trasções (troca etre bases de mesmo tpo: puras ou prmdas) ocorrem com a mesma probabldade que as demas substtuções -trasversões- (ver fgura 4) e a obteção de sua fórmula geral é descrta a segur [4]

Departameto de Matemátca Fgura 4: Exstem dos tpos de mutações de substtuções do DA Trasções são trocas que ocorrem etre puras ( A G ) ou etre prmdas ( C T ) Já as trasversões correspodem às trocas etre puras e prmdas Apesar de haver o dobro de trasversões possíves, trasções são mas freqüetes que trasções Prmeramete, cosderemos um síto de ucleotídeo específco com uma determada probabldade de sofrer,,2,, substtuções durate um tervalo de tempo fxo De acordo com a dstrbução de probabldade de Posso, a probabldade de ocorrerem λ substtuções é Ρ( e Como a méda da dstrbução de Posso é λ, segue que λ é o! úmero médo de substtuções que levou às dfereças observadas ( fxadas ) etre duas seqüecas homólogas o tervalo de tempo dado Assumdo que, o íco deste tervalo de tempo, o síto estvesse sedo ocupado por um determado ucleotídeo, por exemplo, A, podemos desgar por I( a probabldade de que, após substtuções, o fal do tervalo, o síto seja ocupado ovamete por um ucleotídeo A De forma smlar, podemos desgar por D( a probabldade de que, após substtuções, o síto seja ocupado por um ucleotídeo dferete: G, C ou T Desta maera, cocluímos que I( + D( e, portato, D( I( Agora, podemos aalsar o que ocorre quado a próxma (+) substtução ocorre As probabldades correspodetes seram etão I(+) e D(+) Se, após substtuções o síto estvesse sedo ocupado por um A, etão, após + substtuções, o ucleotídeo este síto ão pode ser um A Se, após substtuções o síto estvesse sedo ocupado por um C, etão, após uma substtução adcoal, a probabldade de substtução por um A é, e o mesmo é verdade para o síto ocupado por um G ou um T, após substtuções A partr dsto, cocluímos que, se após substtuções, depedetemete de o síto estar sedo ocupado por um C, T ou G, a probabldade de que ele volte a ser ocupado por um A é Como a probabldade de um ucleotídeo A ser substtuído por C, T ou G, após substtuções é D( e como, se ocorreu esta substtução, exste uma probabldade de : de que o síto volte a ser ocupado por um ucleotídeo A após uma ova substtução, etão:

Departameto de Matemátca I ( + ) D( Se, agora, substturmos D( por I(, obtemos: I( + ) [ I( ] Podemos otar que, se, orgalmete, o síto estava sedo ocupado por um A e se ehuma substtução ocorreu (), o síto permaece com o ucleotídeo A Portato, defmos I() Para I(), obtemos: I ( + ) [ I() ] [ ] Para obter I(2), escrevemos I( + ) / ( ) ou I(2) / Repetdo este processo, podemos obter I( e, coseqüetemete, D( para todos os teros ão-egatvos Quado tora-se muto grade, a dfereça etre I ( e I ( + ) fca desprezível e, sob estas crcustacas, podemos substtur ambas as expressões por um símbolo comum b e reescrever a equação I ( + ) / [ I ( ] como b ( b), ou seja, b / b, sto é, b + b e ( 4b ) Após as smplfcações adequadas, obtemos falmete: b / 4 Escrevemos I' ( I( b (tal que I ( I'( + b ) ei' ( + ) I( + ) b Subtrado b de ambos os lados da equação I( + ) [ I( ], podemos escrever: I( + ) b [ I( ] b I( b [ I'( + b] b (aqu, substtuímos I ( por I '( + b ) 4 I'( b b I'( b 4 I '( (pos b / 4 ) 4 I '( I'( E, como I' ( + ) I( + ) b, temos que: I' ( + ) I'( Podemos, etão, escrever: I'() I() b, 4 4 I' () I'(), 4 I' (2) I'() I '() 2 I'() Logo, I' ( I'() Adcoamos b a ambos os lados da últma equação e escrevemos:

Departameto de Matemátca I' ( + b I '() + b Como I '( + b I(, obtemos: I( I '() + b E, como b / 4 e I '() / 4, obtemos: I( + 4 4 Falmete, uma vez que D( I(, podemos escrever: D( + 4 4 4 4 4 Até este mometo, cosderamos substtuções dvduas uma por uma e obtvemos a probabldade de dfereças em sítos dvduas Agora, ao vés de aalsar valores dvduas da varável aleatóra,, 2, e especfcar a probabldade de cada uma dvdualmete, devemos cosderar a seqüêca tera e as dfereças de todos os sítos jutos Cosderamos que pode assumr qualquer valor tero ão-egatvo com uma certa probabldade Para sso, precsamos aalsar o somatóro do produto etre a probabldade de dfereças para os valores dvduas da varável e a proporção de dfereças observadas etre as seqüêcas Chamado o somatóro de D, podemos escrever: Probabldade de dfereças para valores dvduas 64748 4 } D Ρ( 4 Ρ( 4 Proporção de dfereças após substtuções (movemos o somatóro para detro dos parêteses) λ 4! λ e (substtuímos P( pela fórmula geral da dstrbução de Posso) λ e e 4 Logo: (pela defção de 4 λ D e 4 x e ode λ x ) Desevolvedo este resultado, podemos obter:

Departameto de Matemátca 4 4 λ D e 4 4 e λ D Aplcado o logartmo atural em ambos os lados, obtemos: 4 4 λ l D 4 λ l D 4 Esta é a fórmula de Jues-Cator para estmar λ, o úmero médo de substtuções por x síto Com sso, podemos achar 2tµ e sto os permte ferr µ e/ou t, já que D ; úmero L médo de dfereças observado por síto (ver fgura ) obtdo da observação das dfereças etre as seqüêcas Date do crescmeto do estudo da evolução molecular, já foram desevolvdos outros modelos probablístcos mas complexos que levam em cosderação, por exemplo, a varação a composção de ucleotídeos, a dfereça a probabldade de ocorrêca de trasversões e trasções (sabe-se que trasções são mas freqüetes que trasversões), assm como outros fatores que podem fluecar a freqüêca e a atureza das substtuções de ucleotídeos Dessa forma, tas modelos são capazes de forecer uma correção mas precsa para as substtuções ão observadas 4 Apêdce Ao laçarmos uma moeda, por exemplo, temos dos resultados possíves, caras K e coroas C, e estes são os elemetos do espaço amostral Ω Quado a moeda é laçada duas vezes, o espaço amostral aproprado Ω cotém 4 elemetos, KK, KC, CK, CC este caso, podemos defr uma varável aleatóra X como sedo o úmero de caras Cosderado uma moeda hoesta, cada um dos evetos, KK, KC, CK, CC, ocorre com uma mesma probabldade (/4) De uma maera mas geral, quado caras são obtdas com uma probabldade q e coroas são obtdas com probabldade p (p+q), e se os resultados dos laçametos são depedetes, temos: 2 2 Ρ( Χ ) ( p) ( q) Ρ( Χ Ρ( Χ ) 2q( p) 2q( q) 2) ( q) De uma forma geral, se laçarmos a moeda vezes, etão potos do espaço amostral Ω correspodem à exatamete caras (logo, - coroas) e a fução de dstrbução de probabldade este caso é portato: p p q Β (,, ) Esta fórmula, chamada dstrbução bomal, forece a probabldade de sucessos em tetatvas depedetes de um expermeto que tem probabldade p de sucesso (e q p de fracasso ) em cada tetatva Aqu, é o coefcete bomal que pode ser reescrto a forma: 2

Departameto de Matemátca!!( )! Podemos aplcar a dstrbução bomal de probabldade para qualquer experêca que teha dos resultados possíves, sucesso e fracasso (ou caras e coroas, alcaçou e falhou, etc) cosderado uma seqüêca depedete de evetos em que cada resultado tem a mesma probabldade de ocorrêca (esta seqüêca é chamada uma seqüêca de provas de Beroull) Utlzada como hpótese para a amostragem de gees a costrução de uma ova geração, por exemplo, a dstrbução bomal de probabldade forece a probabldade de que um gee específco (eg A) seja escolhdo para formar o cojuto de gees da geração segute, +, a partr de um cojuto de gees com dos alelos (eg A e B), a geração (ver fgura 5) Cosderado a amostragem bomal este caso, estamos supodo que os dos alelos possuem a mesma probabldade de serem escolhdos para formar a geração segute e que estes evetos são depedetes Podemos observar que os evetos têm dos resultados possíves: escolher o alelo ou ão escolher o alelo Fgura 5: Formação de um ovo cojuto de gees ( gee pool ) através da amostragem de alelos de uma geração para a outra 5 Apêdce 2 o estudo da probabldade, a esperaça, valor médo ou expectâca de uma varável aleatóra mede, grosso modo, como seus valores estão localzados Mas geralmete, para uma varável aleatóra X que admta somete valores dscretos, com pesos p(x), o seu -ésmo mometo é defdo por: Ε( Χ ) x p( x), sedo a esperaça correspodedo ao caso o caso uma varável aleatóra com dstrbução de Posso de parâmetro λ, temos: λ Ε[ Χ] Ρ( Χ e! Como o termo e ão depede de, podemos retrá-lo do somatóro e obter: λ Ε[ Χ] e! Como o termo da dstrbução de Posso é gual a zero, temos: λ λ λ Ε[ Χ] e e ( )! ( )! Se chamarmos m, temos: m λ λ Ε[ Χ] e λ e λ e λ m x m!

Departameto de Matemátca Cocluímos, portato, que a méda da dstrbução de probabldade de Posso de parâmetro λ é exatamete λ 6 Bblografa LECOITRE, G & LE GUYADER, H The tree of lfe Harvard Uversty Press, Cambrgde, Massachustts (26) 2 BROW, T A Geomes 2ed Oxford: Wley-Lss, 22 572p GRIMMETT, G R & STIRZAKER, D R Probablty ad Radom Processes 2ed Oxford: Oxford Uversty Press, 992 6p 4 KLEI, J & TAKAHATA, Where do we come from? The molecular evdece for Huma Descet ed Berl: Sprger, 2 462p 5 TAVARÉ, S & ZEITOUI, O Lectures o Probablty Theory ad Statstcs ew Yor: Sprger Verlag, 24 4p 6 PATCHER, L & STURMFELS, B The mathematcs of phylogeomcs Sam Revew, Vol 49, º, 27 pp -