Departameto de Matemátca ITRODUÇÃO À EVOLUÇÃO MOLECULAR: O MODELO DE JUKES-CATOR Aluo: Adraa Cruz Marts Oretador: Sérgo Berardo Volcha Itrodução A bologa molecular tem tdo eorme mpacto em dversos ramos da bologa e medca Em partcular, abru ovos horzotes para o estudo da evolução e da flogea De fato, um dos prcípos fudametas da teora da evolução de Darw é o de que todos os orgasmos atuas descedem de um acestral comum Portato, a descoberta da exstêca de grade varedade (polmorfsmos) à ível molecular (proteías e ácdos uclécos) etre dvíduos, tato da mesma espéce quato de espéces dferetes, levatou a possbldade de se estudar o paretesco evolucoáro dos orgasmos através da comparação de caracteres moleculares, estededo dessa forma as téccas de estudo tradcoalmete usadas em paleotologa (morfologa, fsologa, comportameto, etc) Do poto de vsta molecular, as varações etre dvíduos estão lgadas a alterações a estrutura do DA, tpcamete (mas ão somete) por mutações, tas como substtuções de ucleotídeos em sítos dvduas da molécula Surge etão aturalmete a hpótese de que quato maor o acúmulo de dfereças etre trechos homólogos do DA de dvíduos de duas espéces, meor sera o paretesco etre tas espéces Isto sgfca que a partr da observação destas seqüêcas em orgasmos atuas sera possível estmar o mometo em que houve a separação do acestral comum Esta déa tem revolucoado a área da sstemátca/taxooma, revelado relações suspetadas etre orgasmos e permtdo a costrução de árvores flogeétcas ( árvores da vda ) mas cofáves, precsas e completas [] Porém, este método de recostrução ão é algo smples de ser realzado e costtu um dos maores desafos do estudo da chamada flogeétca molecular Há város fatores que complcam a aálse, partcularmete o fato de a taxa de mutação ão ser geralmete costate; e ada que em algus caso ela seja, deve-se cosderar a ocorrêca de mutações slecosas e repetdas, que ão são dretamete observáves Date desta dfculdade, foram desevolvdas dversas ferrametas estatístcas assm como modelos probablístcos que permtem determar, sob certas codções e com certa margem de erro, a dstâca evolucoára Esta é uma vasta área de pesqusa atual, extremamete atva e multdscplar, evolvedo bologa, geétca, boformátca, estatístca, teora da probabldade, otmzação, etc este projeto, estudamos um dos modelos mas smples de evolução molecular: o modelo de Jues-Cator Apesar de coter certas hpóteses um tato quato rrealstas (tas como a depedêca etre os sítos do DA e que as substtuções de ucleotídeos ocorrem com mesma probabldade) este modelo admte uma aálse matemátca relatvamete dreta e ada é muto utlzado como uma prmera aproxmação [6] Os objetvos prcpas deste projeto foram o de eteder os prcípos báscos da evolução molecular e a aplcação de algumas téccas matemátcas em seu estudo, partcularmete oções de teora da probabldade ossa prmera tarefa fo a de os famlarzar com os prcpas cocetos bológcos relacoados à evolução molecular Em seguda estudamos cocetos de teora da probabldade ecessáros para compreeder o modelo de Jues-Cator, o qual os cocetramos Por outro lado, ão fo possível abordar o estudo de costrução de árvores flogeétcas propramete dto, pos exgra a abordagem de téccas estatístcas sofstcadas que estão além do escopo do projeto
Departameto de Matemátca 2 A Teora eutra da evolução molecular e o modelo de Wrght-Fsher A formulação cal da teora da seleção atural de Charles Darw fo baseada exclusvamete em observações fetas o ível feotípco, sto é, de característcas macroscópcas (morfológcas, fsológcas e comportametas) dos orgasmos Descohecase a orgem das varações assm como os mecasmos da heredtaredade Equato ão hava um cohecmeto efetvo referete à exstêca e a atureza dos gees e ao seu papel a evolução, acredtava-se que exstam essecalmete dos tpos de modfcações resposáves pela evolução das espéces modfcações vatajosas ou prejudcas e somete um tpo de mecasmo resposável pela determação do desto destas modfcações (fxação ou ão) a seleção atural Posterormete, com os avaços da geétca e da bologa molecular descobru-se que as varações surgem devdo à certas alterações estruturas o materal geétco (o DA), tpcamete as mutações Com a descoberta, os aos 96, de uma suspetada varação etre dvíduos ao ível molecular, surgu a hpótese de que mutas destas varações ão sofreram ação da seleção atural, sto é seram eutras O coceto de mutação eutra se aplca a todas as mutações que ão são ecessaramete resposáves pelo aparecmeto de característcas adaptatvas (ão possuem mpacto sgfcatvo a habldade dos orgasmos sobrevverem ou se reproduzrem) e que, portato, ão possuem sua fxação (uma população) determada pela seleção atural Um exemplo deste tpo de mutação são as alterações slecosas, que acarretam a substtução de certos amoácdos de uma proteía (estrutura prmára), mas ão afetam a coformação (estruturas secudára e tercára) e, portato, a fução da proteía correspodete Em 968, o geetcsta japoês Motoo Kmura propôs que, à ível molecular, mutações eutras seram mas freqüetes que os demas tpos de mutação e que sua fxação ocorrera por efetos puramete estatístcos ou aleatóros, a chamada derva gêca Com sso, troduzu-se outro mecasmo de evolução: a fxação de mutações eutras por derva gêca Esta ova déa evolucoára sugera que as mutações resposáves pelo surgmeto de característcas adaptatvas vatajosas possuram pouca cotrbução para a varabldade geétca das populações por serem extremamete raras e se fxarem muto rapdamete (pela seleção atural) Além dsso, Kmura excluu, em sua teora eutra, as mutações prejudcas de suas cosderações já que estas ão cotrburam em para a varabldade geétca em para a evolução molecular, uma vez que são rapdamete elmadas por meo da chamada seleção egatva É mportate ressaltar que esta chamada teora eutra da evolução, ada que teha causado muta cotrovérsa, ão ega a exstêca da seleção atural em sua mportâca para a evolução o etato, ao cotráro de Darw, que ão dspuha dos cohecmetos de bologa molecular, a teora eutra lda essecalmete com varações à ível molecular Com o auxílo de modelos matemátcos aproprados e da oção de relógo molecular (que dscutremos posterormete), a teora eutra de Kmura costtu uma das prcpas ferrametas para a compreesão da evolução molecular Um modelo probablístco relatvamete smples de derva eutra é dscutdo em seguda 2 O modelo de Wrght-Fsher O modelo de derva gêca fo troduzdo pela prmera vez a década de 92 por Sewall Wrght e Roald Fsher o cotexto da geétca de populações e em tempo dscreto O modelo em tempo cotíuo fo retomado por Kmura a década de 96, utlzado téccas da teora de processos estocástcos (dfusões), o cotexto da teora eutra da evolução molecular O modelo de Wrght-Fsher lustra o processo evolucoáro de mudaça a freqüêca dos alelos em uma população que ocorre de forma teramete aleatóra devdo aos efetos de amostragem em uma população fta
Departameto de Matemátca a versão mas smples, o modelo descreve a evolução de um lócus com apeas dos alelos (eg A e B) em uma população com úmero fxo de dvíduos haplódes em gerações ão-superpostas (,, 2, ), sujeta a cruzameto aleatóro a ausêca de qualquer tpo de mutação A segur, descrevemos a obteção de algus resultados deste modelo e suas propredades Prmeramete, cosderamos X como a varável aleatóra que represeta o úmero de alelos do tpo A a geração A população a geração + é gerada a partr da geração pela amostragem bomal (ver Apêdce ) de alelos de um cojuto de gees ( gee pool ) o qual a fração cal de alelos A é suposta ser π ( π, o caso dplóde) 2 Logo, dado que X e cosderado a amostragem bomal dos alelos, a probabldade (codcoal) de que X + j é dada por: j j pj Ρ( Χ + j Χ ) π ( π ),, j j A seqüêca de varáves aleatóras { Χ } é um exemplo de um processo estocástco em tempo dscreto chamado Cadea de Marov Homogêea com matrz de trasção p j e espaço de estados S {,,,} Um processo Marovao satsfaz a detdade: Ρ( Χ + + Χ, Χ,, Χ ) Ρ( Χ + + Χ ), ou seja, a probabldade codcoal de que o sstema esteja em um dado estado após passos, dados todos os passos aterores, é a mesma que a probabldade codcoal cohecedo-se apeas o estado o passo medatamete ateror (propredade de memóra curta ) Já a homogeedade temporal do processo sgfca que: ( Χ j Χ ) Ρ Χ j Χ ( ) Ρ + Lstamos a segur algumas propredades báscas do modelo Ε ) [ Χ Χ ] Χ Ε [ Χ Χ ] π, pos a partr da esperaça da dstrbução bomal, temos que j A partr dsto, podemos coclur também que Ε[ Χ Χ ] Χ Ε[ Χ ] processo é costate em méda jp j, sto é, o 2) Os estados e são absorvetes : uma vez atgdos, ão se alteram pos represetam, respectvamete, a ausêca do alelo A a população e a preseça exclusva do alelo A a população Isto é, este caso, p j, para ( j ),,,, e p p ote que como o úmero de estados é fto, evetualmete um dos estados absorvetes é ecessaramete atgdo, em tempo fto, e, ocorre fxação de um dos alelos (ver fgura )
Departameto de Matemátca Fgura : O gráfco lustra a varação a freqüêca de dos alelos ao logo das gerações Verfcamos que, em tempo fto, evetualmete ocorre a fxação de um dos alelos e o desaparecmeto do outro alelo a população ) Seja a a probabldade de fxação do alelo A, dado que Χ, etão: a π Portato, se um state cal, surge um ovo alelo (e que pode ser terpretado como o surgmeto de uma mutação aquele state) ele se fxa com probabldade / Esta propredade é extremamete mportate e vale a pea verfcá-la com mas detalhe Demostração: Seja A o eveto de fxação e a Ρ( A Χ ) Como { Χ j} Ω j Vamos codcoar a varável Χ :, ode represeta a uão dsjuta dos evetos { Χ j}, j j,, e Ω é o espaço amostral, temos: Α Α I Ω Α I { Χ j} a Ρ( Α Χ ) ( Α I { Χ } ) Ρ( Χ ) j Ρ j Ρ ( Α, Χ j Χ ) Mas temos: a Ρ, j j j j Ρ Ρ ( A Χ j Χ ) Ρ( A Χ j, Χ ) Ρ( Χ j Χ ) * ( A Χ j) pj (Cosderado a propredade de Marov) ( A Χ j) pj (Cosderado a homogeedade) * Aqu, usamos que para quasquer evetos A, B e C: Ρ( A I B C) Ρ( A B I C) Ρ( B C)
Departameto de Matemátca a j p j Isto é, j a a j j p Lembrado que j e a, a jp j j r v,,,, temos que o vetor ( ) Τ é solução da equação: r r r r r ρ v v c ρ v ρ( c v) c v, para qualquer costate real c, ode ρ [ pj ] é a matrz de trasção Logo r a ( a, a,, a ) Τ c( ) Τ,,,, sto é, a c Logo, a c a π, CQD 22 O relógo molecular Em uma população de dvíduos dplódes Com o auxílo do modelo de derva gêca de Wrght-Fsher, pode-se obter a taxa de fxação,, de um ovo alelo esta população: O úmero médo de mutações por geração é determado pelo produto etre úmero de gametas produzdo por geração, 2, e a taxa de ocorrêca de uma mutação por geração, u Cosderado que a fração de mutações que se fxam, de acordo com o modelo de Wrght- Fsher, é /2, obtemos: ( 2 u) u, 2 sto é, u Este é um dos resultados mas mportates da teora eutra da evolução De acordo com este modelo a taxa a qual as mutações eutras ocorrem é gual à taxa de fxação de um ovo alelo Ora, um alelo pode ser pesado como um trecho de DA, dgamos de m ucleotídeos Supodo que a taxa de fxação e a taxa de mutação por síto sejam, respectvamete, u s e s, dêtcas para todos os sítos, e que os sítos são depedetes, segue do resultado acma que: u m us m s us s Ou seja, sob a teora eutra e o cotexto do modelo de Wrght-Fsher, a taxa de mutação de ucleotídeos por síto é gual à sua taxa de fxação por síto Esta é a base da oção do relógo molecular O termo relógo molecular fo troduzdo em 965, por Emle Zuceradl e Lus C Paulg, para lustrar esta acumulação de substtuções de moômeros de macromoléculas de mportâca bológca (o caso orgalmete por eles estudado era o de substtuções de amoácdos em proteías), supostamete a uma taxa costate, o que permtra estmar o paretesco etre orgasmos pela comparação de dfereças observáves de seqüêcas homólogas (ver fgura 2) este setdo, pode-se dzer que as moléculas são capazes de determar seu tempo evolucoáro através do acúmulo de substtuções (dvergêca), fucoado assm como um verdadero documeto hstórco da evolução É mportate
Departameto de Matemátca observarmos, etretato, que a hpótese da ocorrêca de substtuções a uma taxa costate é uma aproxmação, e que a verdade esta taxa pode flutuar muto de gee para gee, de espéce para espéce, etc; o que complca substacalmete a aálse Fgura 2: Calculado um relógo molecular humao O úmero observado de dfereças é determado para um par de gees homólogos de humao e oragotago, aqu, este úmero é chamado de x O úmero de substtuções por lhagem é x/2 e o úmero por mlhões de aos é x/26 este caso, a partr do tempo de dvergêca etre os dos orgasmos (tempo de separação de um acestral comum) fo possível determar o úmero de dfereças acumuladas x Poderíamos também realzar o cálculo verso, obtedo o tempo de separação a partr da observação de x Em todo caso, é precso um modelo matemátco que faça a correção etre as dfereças observadas e as substtuções que realmete ocorreram desde a separação etre as espéces O modelo de Jues-Cator faz exatamete sso O modelo de Jues-Cator A dstrbução de probabldade de Posso Os prcpas evetos resposáves pela dvergêca etre seqüêcas do DA são as mutações e fxações De acordo com a teora eutra da evolução molecular, a taxa de fxação das mutações é gual à taxa com a qual as mutações eutras surgem, portato, podemos aalsar estes dos evetos de forma cojuta o caso mas smples, mutações correspodem à troca de um ucleotídeo por outro (ou substtução) em um síto específco de uma molécula de DA Apesar de seu caráter aleatóro dvdual, mutações têm efetos prevsíves, o setdo de que podem ser estmados através de médas estatístcas obtdas a partr da aplcação de modelos probablístcos adequados o modelo de Jues-Cator supõe-se que o acúmulo de substtuções de ucleotídeos durate a evolução molecular é um processo que pode ser descrto pela dstrbução de λ probabldade de Posso de parâmetro λ cuja fórmula é expressa por Ρ(, λ) e,!,,2,, λ > que, por sua vez, pode ser obtda a partr da dstrbução bomal de probabldade Exstem váras formas de obter este resultado e descrevemos uma delas a segur [] A dstrbução bomal p p q Β ( ;, ) pode ser escrta como: ( )( 2) ( + ) p q! Podemos multplcar e dvdr por e obter:
Departameto de Matemátca 2 ( )( ) ( ) p ( p) ( )! Fazedo com que de tal forma que p λ permaeça costate, cada termo do ( ) produto ( )[ ] tederá a, e ( p) se reduzrá a λ Também: p λ λ e () e λ Portato, o lmte como com p λ (e como p ), temos: λ e p q λ λ e Ρ( ; λ) e!! Este resultado forece a dstrbução de Posso com parâmetro λ como lmte da dstrbução bomal, para o caso de grade e p pequeo, que é o caso de mutações de ucleotídeos Observamos que a méda da dstrbução de Posso é exatamete λ (ver Apêdce 2) Aplcada à evolução molecular, a dstrbução de Posso forece a probabldade de que,,2,, substtuções ocorram em um segmeto de DA de um determado tamaho em um tervalo de tempo defdo O úmero médo esperado de substtuções observadas em um tervalo fxo de tempo é dado por 2tµ, ode µ é a taxa de substtução (úmero médo de substtuções por síto de seqüêca, por udade de tempo) e t é o tempo decorrdo desde o mometo da dvergêca etre as duas seqüêcas de DA comparadas Como cada uma das duas seqüêcas acumulou substtuções depedetemete durate um tervalo de tempo t, jutas elas tveram um tempo correspodete a t + t 2t para dvergr (ver fgura 2) Portato, a fórmula de Posso para a evolução molecular pode ser expressa por: ( 2tµ ) 2tµ Ρ ( ;2tµ ) e! Aqu, Ρ( ;2tµ ) é a probabldade de que um úmero,,2,, de substtuções ocorra em um síto do DA em um tervalo de tempo t quado a taxa de substtução é µ 2 A fórmula de Jues-Cator A aplcação da fórmula de dstrbução de probabldade de Posso o estudo da evolução molecular é, o etato, lmtada, pos, freqüetemete, ão sabemos em a taxa de substtução µ em o tempo t de dvergêca etre as duas seqüêcas Para solucoar este problema, foram desevolvdos métodos de obteção do úmero médo 2tµ de substtuções depedetemete das varáves t e µ Teorcamete, poderíamos obter o úmero médo de substtuções através da observação do úmero de posções que dferem etre as duas seqüêcas homólogas alhadas o etato, esta proporção de dfereças, x / L (úmero médo de substtuções dferetes observadas, x, dvddo pelo úmero total de ucleotídeos o trecho comparado, L) ão leva em cosderação os evetos que ão são observados como, por exemplo, as substtuções múltplas e recorretes Portato, para obter o úmero médo de substtuções, precsamos cosderar os evetos escoddos e, assm, coverter/corrgr a proporção de dfereças observada em uma dstâca evolucoára efetva (úmero total de substtuções realmete ocorrdas por síto desde a separação das espéces)
Departameto de Matemátca Fgura : O dagrama lustra a ocorrêca de uma substtução de ucleotídeo em um síto da molécula de DA Para realzar esta coversão, precsaríamos cosderar todas as mudaças que um ucleotídeo específco e os ucleotídeos de um determado síto podem sofrer Em seguda, deveríamos calcular a probabldade de mudaças dvduas, assumdo o processo de substtução como sedo um processo de Posso, e estmar o úmero de mudaças que ão são reveladas a comparação das duas seqüêcas Este procedmeto aparetemete complcado pode ser codesado por uma fórmula matemátca, a fórmula de Jues-Cator O prmero e mas smples modelo desevolvdo com o objetvo de obter esta dstâca evolucoára etre seqüêcas de DA fo descrto em 969 por Thomas H Jues e Charles R Cator Este modelo é baseado a suposção de que as trasções (troca etre bases de mesmo tpo: puras ou prmdas) ocorrem com a mesma probabldade que as demas substtuções -trasversões- (ver fgura 4) e a obteção de sua fórmula geral é descrta a segur [4]
Departameto de Matemátca Fgura 4: Exstem dos tpos de mutações de substtuções do DA Trasções são trocas que ocorrem etre puras ( A G ) ou etre prmdas ( C T ) Já as trasversões correspodem às trocas etre puras e prmdas Apesar de haver o dobro de trasversões possíves, trasções são mas freqüetes que trasções Prmeramete, cosderemos um síto de ucleotídeo específco com uma determada probabldade de sofrer,,2,, substtuções durate um tervalo de tempo fxo De acordo com a dstrbução de probabldade de Posso, a probabldade de ocorrerem λ substtuções é Ρ( e Como a méda da dstrbução de Posso é λ, segue que λ é o! úmero médo de substtuções que levou às dfereças observadas ( fxadas ) etre duas seqüecas homólogas o tervalo de tempo dado Assumdo que, o íco deste tervalo de tempo, o síto estvesse sedo ocupado por um determado ucleotídeo, por exemplo, A, podemos desgar por I( a probabldade de que, após substtuções, o fal do tervalo, o síto seja ocupado ovamete por um ucleotídeo A De forma smlar, podemos desgar por D( a probabldade de que, após substtuções, o síto seja ocupado por um ucleotídeo dferete: G, C ou T Desta maera, cocluímos que I( + D( e, portato, D( I( Agora, podemos aalsar o que ocorre quado a próxma (+) substtução ocorre As probabldades correspodetes seram etão I(+) e D(+) Se, após substtuções o síto estvesse sedo ocupado por um A, etão, após + substtuções, o ucleotídeo este síto ão pode ser um A Se, após substtuções o síto estvesse sedo ocupado por um C, etão, após uma substtução adcoal, a probabldade de substtução por um A é, e o mesmo é verdade para o síto ocupado por um G ou um T, após substtuções A partr dsto, cocluímos que, se após substtuções, depedetemete de o síto estar sedo ocupado por um C, T ou G, a probabldade de que ele volte a ser ocupado por um A é Como a probabldade de um ucleotídeo A ser substtuído por C, T ou G, após substtuções é D( e como, se ocorreu esta substtução, exste uma probabldade de : de que o síto volte a ser ocupado por um ucleotídeo A após uma ova substtução, etão:
Departameto de Matemátca I ( + ) D( Se, agora, substturmos D( por I(, obtemos: I( + ) [ I( ] Podemos otar que, se, orgalmete, o síto estava sedo ocupado por um A e se ehuma substtução ocorreu (), o síto permaece com o ucleotídeo A Portato, defmos I() Para I(), obtemos: I ( + ) [ I() ] [ ] Para obter I(2), escrevemos I( + ) / ( ) ou I(2) / Repetdo este processo, podemos obter I( e, coseqüetemete, D( para todos os teros ão-egatvos Quado tora-se muto grade, a dfereça etre I ( e I ( + ) fca desprezível e, sob estas crcustacas, podemos substtur ambas as expressões por um símbolo comum b e reescrever a equação I ( + ) / [ I ( ] como b ( b), ou seja, b / b, sto é, b + b e ( 4b ) Após as smplfcações adequadas, obtemos falmete: b / 4 Escrevemos I' ( I( b (tal que I ( I'( + b ) ei' ( + ) I( + ) b Subtrado b de ambos os lados da equação I( + ) [ I( ], podemos escrever: I( + ) b [ I( ] b I( b [ I'( + b] b (aqu, substtuímos I ( por I '( + b ) 4 I'( b b I'( b 4 I '( (pos b / 4 ) 4 I '( I'( E, como I' ( + ) I( + ) b, temos que: I' ( + ) I'( Podemos, etão, escrever: I'() I() b, 4 4 I' () I'(), 4 I' (2) I'() I '() 2 I'() Logo, I' ( I'() Adcoamos b a ambos os lados da últma equação e escrevemos:
Departameto de Matemátca I' ( + b I '() + b Como I '( + b I(, obtemos: I( I '() + b E, como b / 4 e I '() / 4, obtemos: I( + 4 4 Falmete, uma vez que D( I(, podemos escrever: D( + 4 4 4 4 4 Até este mometo, cosderamos substtuções dvduas uma por uma e obtvemos a probabldade de dfereças em sítos dvduas Agora, ao vés de aalsar valores dvduas da varável aleatóra,, 2, e especfcar a probabldade de cada uma dvdualmete, devemos cosderar a seqüêca tera e as dfereças de todos os sítos jutos Cosderamos que pode assumr qualquer valor tero ão-egatvo com uma certa probabldade Para sso, precsamos aalsar o somatóro do produto etre a probabldade de dfereças para os valores dvduas da varável e a proporção de dfereças observadas etre as seqüêcas Chamado o somatóro de D, podemos escrever: Probabldade de dfereças para valores dvduas 64748 4 } D Ρ( 4 Ρ( 4 Proporção de dfereças após substtuções (movemos o somatóro para detro dos parêteses) λ 4! λ e (substtuímos P( pela fórmula geral da dstrbução de Posso) λ e e 4 Logo: (pela defção de 4 λ D e 4 x e ode λ x ) Desevolvedo este resultado, podemos obter:
Departameto de Matemátca 4 4 λ D e 4 4 e λ D Aplcado o logartmo atural em ambos os lados, obtemos: 4 4 λ l D 4 λ l D 4 Esta é a fórmula de Jues-Cator para estmar λ, o úmero médo de substtuções por x síto Com sso, podemos achar 2tµ e sto os permte ferr µ e/ou t, já que D ; úmero L médo de dfereças observado por síto (ver fgura ) obtdo da observação das dfereças etre as seqüêcas Date do crescmeto do estudo da evolução molecular, já foram desevolvdos outros modelos probablístcos mas complexos que levam em cosderação, por exemplo, a varação a composção de ucleotídeos, a dfereça a probabldade de ocorrêca de trasversões e trasções (sabe-se que trasções são mas freqüetes que trasversões), assm como outros fatores que podem fluecar a freqüêca e a atureza das substtuções de ucleotídeos Dessa forma, tas modelos são capazes de forecer uma correção mas precsa para as substtuções ão observadas 4 Apêdce Ao laçarmos uma moeda, por exemplo, temos dos resultados possíves, caras K e coroas C, e estes são os elemetos do espaço amostral Ω Quado a moeda é laçada duas vezes, o espaço amostral aproprado Ω cotém 4 elemetos, KK, KC, CK, CC este caso, podemos defr uma varável aleatóra X como sedo o úmero de caras Cosderado uma moeda hoesta, cada um dos evetos, KK, KC, CK, CC, ocorre com uma mesma probabldade (/4) De uma maera mas geral, quado caras são obtdas com uma probabldade q e coroas são obtdas com probabldade p (p+q), e se os resultados dos laçametos são depedetes, temos: 2 2 Ρ( Χ ) ( p) ( q) Ρ( Χ Ρ( Χ ) 2q( p) 2q( q) 2) ( q) De uma forma geral, se laçarmos a moeda vezes, etão potos do espaço amostral Ω correspodem à exatamete caras (logo, - coroas) e a fução de dstrbução de probabldade este caso é portato: p p q Β (,, ) Esta fórmula, chamada dstrbução bomal, forece a probabldade de sucessos em tetatvas depedetes de um expermeto que tem probabldade p de sucesso (e q p de fracasso ) em cada tetatva Aqu, é o coefcete bomal que pode ser reescrto a forma: 2
Departameto de Matemátca!!( )! Podemos aplcar a dstrbução bomal de probabldade para qualquer experêca que teha dos resultados possíves, sucesso e fracasso (ou caras e coroas, alcaçou e falhou, etc) cosderado uma seqüêca depedete de evetos em que cada resultado tem a mesma probabldade de ocorrêca (esta seqüêca é chamada uma seqüêca de provas de Beroull) Utlzada como hpótese para a amostragem de gees a costrução de uma ova geração, por exemplo, a dstrbução bomal de probabldade forece a probabldade de que um gee específco (eg A) seja escolhdo para formar o cojuto de gees da geração segute, +, a partr de um cojuto de gees com dos alelos (eg A e B), a geração (ver fgura 5) Cosderado a amostragem bomal este caso, estamos supodo que os dos alelos possuem a mesma probabldade de serem escolhdos para formar a geração segute e que estes evetos são depedetes Podemos observar que os evetos têm dos resultados possíves: escolher o alelo ou ão escolher o alelo Fgura 5: Formação de um ovo cojuto de gees ( gee pool ) através da amostragem de alelos de uma geração para a outra 5 Apêdce 2 o estudo da probabldade, a esperaça, valor médo ou expectâca de uma varável aleatóra mede, grosso modo, como seus valores estão localzados Mas geralmete, para uma varável aleatóra X que admta somete valores dscretos, com pesos p(x), o seu -ésmo mometo é defdo por: Ε( Χ ) x p( x), sedo a esperaça correspodedo ao caso o caso uma varável aleatóra com dstrbução de Posso de parâmetro λ, temos: λ Ε[ Χ] Ρ( Χ e! Como o termo e ão depede de, podemos retrá-lo do somatóro e obter: λ Ε[ Χ] e! Como o termo da dstrbução de Posso é gual a zero, temos: λ λ λ Ε[ Χ] e e ( )! ( )! Se chamarmos m, temos: m λ λ Ε[ Χ] e λ e λ e λ m x m!
Departameto de Matemátca Cocluímos, portato, que a méda da dstrbução de probabldade de Posso de parâmetro λ é exatamete λ 6 Bblografa LECOITRE, G & LE GUYADER, H The tree of lfe Harvard Uversty Press, Cambrgde, Massachustts (26) 2 BROW, T A Geomes 2ed Oxford: Wley-Lss, 22 572p GRIMMETT, G R & STIRZAKER, D R Probablty ad Radom Processes 2ed Oxford: Oxford Uversty Press, 992 6p 4 KLEI, J & TAKAHATA, Where do we come from? The molecular evdece for Huma Descet ed Berl: Sprger, 2 462p 5 TAVARÉ, S & ZEITOUI, O Lectures o Probablty Theory ad Statstcs ew Yor: Sprger Verlag, 24 4p 6 PATCHER, L & STURMFELS, B The mathematcs of phylogeomcs Sam Revew, Vol 49, º, 27 pp -