I Parte onstrução de cladogramas
carácter apomorfismos () Um exemplo Ingroup de OTUs ( ) e OTUs () () uma topologia () nenhum s homoplasias não representam a ascendência comum, e contrariam o postulado de raridade das alterações*. onstituem ruído histórico. Uma topologia será tanto mais representativa quanto melhor tire partido do sinal histórico. *se bem que, numa grande escala de tempo, a raridade seja um postulado muito relativo Pressupostos ascendência comum, com modificações divergência por bifurcação independência dos caracteres sinapomorfismo
carácter apomorfismos () OTUs () () M = m i = é o número mínimo de passos no ingroup. Os valores m i são o número de estados do caráter informativo i menos (neste exemplo, todos os m i = =, e i =,,, ) Um exemplo Índices de consistência e de retenção () nenhum G = g i = 8 é o número máximo de passos no ingroup. ada g i (carácter informativo) é dado pelo número de OTUs (incluindo o ) menos F i, que é o respectivo número de OTUs com o estado de caráter mais frequente. S (de steps, também se usa L, de length) é o número de passos informativos resultantes da topologia g i não-informativo não-informativo S = 7 I = M/S =,7 RI = (G S)/(G M) =,
carácter apomorfismos S = 7 I =,7 RI =, () OTUs () () matriz de distâncias Um exemplo Matriz de distâncias () nenhum e são o par mais próximo, e é o mais distante de ambos, que sugere por exemplo a nova topologia: reversão Este cladograma é mais curto (S = ), sem homoplasias, e melhor nos valores de I e especialmente RI. Mas / dos passos informativos são reversões, e, pior que isso, estão distribuídos desigualmente entre os OTUs ( para e, para e para ). S = I =,7 RI =,
Um exemplo Ramificação mais profunda carácter apomorfismos () OTUs () () () nenhum Novo cladograma que, não melhorando S (e, por inerência, I e RI), é o que obedece melhor a um importante princípio da parcimónia: a ramificação hierarquicamente mais profunda deve conter o maior número possível de passos informativos (neste caso ). Em contrapartida, contém duas homoplasias. matriz de distâncias s distâncias menores mantêm- -se, mas as que envolvem o ramo mais profundo são aparentemente exageradas, por implicarem homoplasias S = I =,7 RI =,
Parcimónia máxima (MP) Pssume que a mutação é um evento raro < etermina a topologia que requer o número mínimo de mutações Pnalisa cada nó possível entre grupos, comparando-os em posições informativas (com dois estados de caráter representados vezes cada) < ada mutação é definida pelo tipo de caráter analisado (por exemplo caráter de Wagner, reversível, versus caráter de armin-sokal, irreversível) < iferentes tipos de mutação podem ter pesos diferentes na avaliação das alternativas
Exercício char a solução MP para sequências de OTUs GTGGTTGTTT GGGGGTGTGG GTGGGTGTGT GGGGGTGTTG penas 7 posições informativas (sublinhadas) 7
Exercício Topologias possíveis para cada OTUs GTGGTTGTTT GGGGGTGTGG GTGGGTGTGT GGGGGTGTTG penas 7 posições informativas (sublinhadas) Resumo da variação informativa 7 7 P eterminar a mais parcimoniosa: < Mesma probabilidade de transições e transversões < Transversões x menos prováveis que transições 8
Limitações da MP Situações de erro Long branch attraction: OTUs mais divergentes tendem a agrupar-se Real Obtida unikonts cenancestral eukaryote bikonts ~9 Mya Famoso caso da tree of life de Woese rchaebacteria ctinobacteria Endobacteria yanobacteria Hadobacteria hlorobacteria Proteobacteria Planctobacteria Sphingobacteria Spirochaetae Woese et al., 99 cenancestral prokaryote ~ Mya origin of life avalier-smith 9
lternativas om base nas distâncias e não nos caracteres PUsando a matriz de distâncias ou um derivado da mesma, agrupa-se hierarquicamente a partir dos mais próximos PUPGM (Unweighted Pair Group Method with rithmetic Mean) < O método mais simples, assume igualdade de extensão dos ramos de cada bifurcação < Utilizado para produzir cladogramas preliminares para servirem de base a métodos mais intensivos PNJ (Neighbor-Joining): a partir dum cladograma sem hierarquia (topologia star ), determinar passo a passo o agrupamento que minimiza S < onsiderado muito eficiente para grandes cladogramas (muitas OTUs) < Utilizado para produzir um cladograma de base para o método ME PME (Minimum Evolution): aperfeiçoa o resultado duma NJ, usando topologias de qualidade próxima para estimar a extensão do ramos, com erros-padrão (mínimos quadrados).
lternativas Funções de verosimilhança Pfins à MP, mas integrando cálculos de verosimilhança das topologias < verosimilhança dum cladograma é a probabilidade de resultarem os estados de carácter observados, tendo em conta a topologia dada. Estas abordagens exigem a avaliação de todas as topologias possíveis P ML (Maximum Likelihood): define a priori um modelo de mutação. P Inferência ayesiana: parte dum modelo de mutação arbitrário e vai-o ajustando à medida que progride na construção do cladograma.
Testes P ootstrap (reamostragem) < Simular uma repetição da experiência/amostragem com apenas parte da informação; na prática, o procedimento de calcular um cladograma com apenas um subconjunto dos carateres, tomados aleatoriamente, é repetido muitas vezes (,...) para obter muitas combinações diferentes de carateres. < percentagem de vezes que um determinado clade aparece nos cladogramas obtidos é usada como medida do support desse grupo no cladograma testado. P Inner ranch (métodos NJ e ME) < Semelhante ao bootstrap, mas os critérios de support são diferentes. P ecaimento de remer < ompara o cladograma em teste com a melhor alternativa caso uma determinada ramificação fosse retirada (por exemplo, o efeito que teria retirar a ramificação entre cavalo e burro, ficando os dois com igual hierarquia de parentesco com o rinoceronte); o valor de S deverá aumentar e a diferença dá uma medida do decaimento, associado à alternativa, que se considera correlacionada com a significância do clade definido por essa ramificação. P Neutralidade
UPGM 99 P. monticola pathogenesis-related pro() P. monticola pathogenesis-related pro() P. monticola pathogenesis-related pro() 9 P. pinaster pr- P. monticola pathogenesis-related pro... P. monticola pathogenesis-related pro() P. glauca m7g P. glauca m7g() P. mariana m7g MP P. abies m7g O. sativa PRc O. sativa Indica Group PRa. NJ..8. P. abies m7g... O. sativa PRc P. mariana m7g 99 P. glauca m7g() 7 P. glauca m7g P. pinaster pr- 7 P. monticola pathogenesis-related pro() P. monticola pathogenesis-related pro() P. monticola pathogenesis-related pro() P. monticola pathogenesis-related pro... 99 P. monticola pathogenesis-related pro() O. sativa Indica Group PRa ML 7 P. pinaster pr- P. glauca m7g 99 P. abies m7g P. glauca m7g() P. mariana m7g O. sativa PRc. 9 9 P. monticola pathogenesis-related pro() P. monticola pathogenesis-related pro() P. monticola pathogenesis-related pro() O. sativa Indica Group PRa 7 99 P. monticola pathogenesis-related pro... P. monticola pathogenesis-related pro().
Software O programa MEG (http://megasoftware.net/) é fornecido para a aula prática. Outras recomendações: P Mesquite (mesmos autores do Maclade; Windows, Mac, Linux) http://mesquiteproject.org/mesquite/features.html P TNT (Windows e Linux; MacOS versão antiga) http://www.zmuc.dk/public/phylogeny/tnt/ P Pebble (Windows, Mac, Linux) http://www.cebl.auckland.ac.nz/software.php P PUP* (MacOS 9-., Windows) http://paup.csit.fsu.edu/ P TOPLi (Windows, MacOS, Linux, Solaris) http://www.topali.org/ P Mrayes (Windows, MacOS) http://mrbayes.sourceforge.net/index.php Uma listagem mais extensa é fornecida no Moodle. Lista de softwares de Felsenstein http://evolution.genetics.washington.edu/phylip/software.html (execução local) http://evolution.genetics.washington.edu/phylip/software.serv.html (servidores)