I Parte. Construção de cladogramas

Documentos relacionados
PESQUISA OPERACIONAL -PROGRAMAÇÃO LINEAR. Prof. Angelo Augusto Frozza, M.Sc.

Prof. Daniela Barreiro Claro

Inteligência Artificial

3º Ano do Ensino Médio. Aula nº06

AULA 19 Análise de Variância

Testes de Hipóteses Estatísticas

AULA 07 Distribuições Discretas de Probabilidade

Pressuposições à ANOVA

Bombons a Granel. Série Matemática na Escola. Objetivos 1. Introduzir e mostrar aplicações do produto de matrizes.

Probabilidade. Evento (E) é o acontecimento que deve ser analisado.

LINEARIZAÇÃO DE GRÁFICOS

AULA 4 DELINEAMENTO EM QUADRADO LATINO (DQL)

Modelos de Regressão Linear Simples - Erro Puro e Falta de Ajuste

ATuLCo. Manual de Instruções. Gestor de Agência de Viagens. ATuLCo Gestor de Agencia de Viagens. Horário Abreu Nr António Felgueiras Nr.

DEPARTAMENTO DE MATEMÁTICA

ADMINISTRAÇÃO DE BANCOS DE DADOS MÓDULO 8

DISTRIBUIÇÕES ESPECIAIS DE PROBABILIDADE DISCRETAS

Probabilidade. Luiz Carlos Terra

Aula 6 Propagação de erros

EXAME DE MACS 2º FASE 2014/2015 = 193

17/10/2012. Bases Instrumentais de bioinformática aplicada à Epidemiologia Molecular das doenças transmissíveis. Fábio Gregori. O que é?

Gerenciamento do Escopo do Projeto (PMBoK 5ª ed.)

Aula 8 21/09/ Microeconomia. Demanda Individual e Demanda de Mercado. Bibliografia: PINDYCK (2007) Capítulo 4

Ondas EM no Espaço Livre (Vácuo)

Análise Qualitativa no Gerenciamento de Riscos de Projetos

Como os serviços diferem entre si e como podem ser classificados?

Engenharia de Software II

Modelo Entidade Relacionamento (MER) Professor : Esp. Hiarly Alves

ActivALEA. ative e atualize a sua literacia

Comandos de Eletropneumática Exercícios Comentados para Elaboração, Montagem e Ensaios

[RESOLUÇÃO] Economia I; 2012/2013 (2º semestre) Prova da Época Recurso 3 de Julho de 2013

Introdução. Ou seja, de certo modo esperamos que haja uma certa

Probabilidade e Estatística 2008/2. Regras de adicão, probabilidade condicional, multiplicação e probabilidade total.

PROGRAMAÇÃO DE COMPUTADORES

Organização e Arquitetura de Computadores. Ivan Saraiva Silva

Aula de Exercícios - Teorema de Bayes

2 Segmentação de imagens e Componentes conexas

Impressora Latex série 300. Garantia limitada

MDS II Aula 04. Concepção Requisitos Diagrama de Casos de Uso (Use Cases)

MODELAGENS. Modelagem Estratégica

Álgebra Linear Aplicada à Compressão de Imagens. Universidade de Lisboa Instituto Superior Técnico. Mestrado em Engenharia Aeroespacial

Modelo Comportamental

Tipos de problemas de programação inteira (PI) Programação Inteira. Abordagem para solução de problemas de PI. Programação inteira

Árvores. ! utilizada em muitas aplicações. ! modela uma hierarquia entre elementos. ! O conceito de árvores está diretamente ligado à recursão

Cap. II EVENTOS MUTUAMENTE EXCLUSIVOS E EVENTOS NÃO- EXCLUSIVOS

MÓDULO 2 Topologias de Redes

ESTRUTURA DO CURSO 08:00-10:00 RTQ-R

Universidade Federal de Goiás Campus Catalão Departamento de Matemática

Diagnóstico da Convergência às Normas Internacionais IAS 8 Accounting Policies, Changes in Accounting Estimates and Errors

RELATÓRIO DE AVALIAÇÃO DEPARTAMENTO DE EDUCAÇÃO PRÉ ESCOLAR. Ano Letivo 2014/ º Período

Arquitecturas de Software Enunciado de Projecto

Programação Orientada a Objetos SANTOS, Rafael

Conceitos de Gestão de Estoques. Prof. Ruy Alexandre Generoso

FÍSICA EXPERIMENTAL 3001

ORIENTAÇÕES PARA ELABORAÇÃO DE RELATÓRIO DE INICIAÇÃO CIENTÍFICA

Pós-Graduação em Computação Distribuída e Ubíqua

Probabilidade e Estatística

Estudo sobre a dependência espacial da dengue em Salvador no ano de 2002: Uma aplicação do Índice de Moran

A Estatística e a Engenharia

Auxiliar em Administração de Redes Redes de Computadores I

Matrizes. matriz de 2 linhas e 2 colunas. matriz de 3 linhas e 3 colunas. matriz de 3 linhas e 1 coluna. matriz de 1 linha e 4 colunas.

ENGENHARIA DE SOFTWARE

Métodos Estatísticos Avançados em Epidemiologia

COLÉGIO SHALOM 9 ANO Professora: Bethânia Rodrigues 65 Geometria. Aluno(a):. Nº.

Como vender MAIS com base nos RECURSOS DA REGIÃO. 25 de maio de 2012 Castelo Branco Alberto Ribeiro de Almeida

Faculdade de Economia, Administração e Contabilidade de Ribeirão Preto USP Departamento de Economia

EGEA ESAPL - IPVC. Resolução de Problemas de Programação Linear, com recurso ao Excel

Lista de Exercícios 5: Soluções Teoria dos Conjuntos

Física Experimental III

AGRUPAMENTO DE ESCOLAS DE PÓVOA DE LANHOSO

Observando embalagens

CASOS DE TESTE PALESTRANTE: MARCIA SILVA

Relatório do Experimento 1 Sistema Massa - Mola. Fernando Henrique Ferraz Pereira da Rosa

Conteúdo programático

TESTES SOCIOMÉTRICOS

SUPERVISÃO Supervisão Comportamental

Matemática Básica Intervalos

Relatório das Provas da 2ª. Fase - Vestibular 2016

Função. Adição e subtração de arcos Duplicação de arcos

DRAWBACK INTEGRADO DRAWBACK INTEGRADO

A dependência entre a inflação cabo-verdiana e a portuguesa: uma abordagem de copulas.


Modelo Lógico: Tabelas, Chaves Primárias e Estrangeiras

Avaliação de Empresas Profa. Patricia Maria Bortolon

Universidade Federal do ABC Disciplina: Natureza da Informação Lista de Exercícios 02 Códigos e conversão A/D Prof. João Henrique Kleinschmidt

Seu pé direito nas melhores Faculdades

M =C J, fórmula do montante

GIL, Antonio Carlos. Como elaborar projetos de pesquisa. São Paulo, Editora Atlas,

Distribuição Normal de Probabilidade

Matemática Discreta - 08

Sistemática dos seres vivos

de fevereiro de 2002

MANUAL DO INSTALADOR XD EM AMBIENTES MICROSOFT WINDOWS

Gestão da Qualidade. Aula 13. Prof. Pablo

Métodos Estatísticos Avançados em Epidemiologia

Lógica de Programação. Profas. Simone Campos Camargo e Janete Ferreira Biazotto

tipo e tamanho e com os "mesmos" elementos do vetor A, ou seja, B[i] = A[i].

Técnicas de Contagem I II III IV V VI

UM JOGO BINOMIAL 1. INTRODUÇÃO

Transcrição:

I Parte onstrução de cladogramas

carácter apomorfismos () Um exemplo Ingroup de OTUs ( ) e OTUs () () uma topologia () nenhum s homoplasias não representam a ascendência comum, e contrariam o postulado de raridade das alterações*. onstituem ruído histórico. Uma topologia será tanto mais representativa quanto melhor tire partido do sinal histórico. *se bem que, numa grande escala de tempo, a raridade seja um postulado muito relativo Pressupostos ascendência comum, com modificações divergência por bifurcação independência dos caracteres sinapomorfismo

carácter apomorfismos () OTUs () () M = m i = é o número mínimo de passos no ingroup. Os valores m i são o número de estados do caráter informativo i menos (neste exemplo, todos os m i = =, e i =,,, ) Um exemplo Índices de consistência e de retenção () nenhum G = g i = 8 é o número máximo de passos no ingroup. ada g i (carácter informativo) é dado pelo número de OTUs (incluindo o ) menos F i, que é o respectivo número de OTUs com o estado de caráter mais frequente. S (de steps, também se usa L, de length) é o número de passos informativos resultantes da topologia g i não-informativo não-informativo S = 7 I = M/S =,7 RI = (G S)/(G M) =,

carácter apomorfismos S = 7 I =,7 RI =, () OTUs () () matriz de distâncias Um exemplo Matriz de distâncias () nenhum e são o par mais próximo, e é o mais distante de ambos, que sugere por exemplo a nova topologia: reversão Este cladograma é mais curto (S = ), sem homoplasias, e melhor nos valores de I e especialmente RI. Mas / dos passos informativos são reversões, e, pior que isso, estão distribuídos desigualmente entre os OTUs ( para e, para e para ). S = I =,7 RI =,

Um exemplo Ramificação mais profunda carácter apomorfismos () OTUs () () () nenhum Novo cladograma que, não melhorando S (e, por inerência, I e RI), é o que obedece melhor a um importante princípio da parcimónia: a ramificação hierarquicamente mais profunda deve conter o maior número possível de passos informativos (neste caso ). Em contrapartida, contém duas homoplasias. matriz de distâncias s distâncias menores mantêm- -se, mas as que envolvem o ramo mais profundo são aparentemente exageradas, por implicarem homoplasias S = I =,7 RI =,

Parcimónia máxima (MP) Pssume que a mutação é um evento raro < etermina a topologia que requer o número mínimo de mutações Pnalisa cada nó possível entre grupos, comparando-os em posições informativas (com dois estados de caráter representados vezes cada) < ada mutação é definida pelo tipo de caráter analisado (por exemplo caráter de Wagner, reversível, versus caráter de armin-sokal, irreversível) < iferentes tipos de mutação podem ter pesos diferentes na avaliação das alternativas

Exercício char a solução MP para sequências de OTUs GTGGTTGTTT GGGGGTGTGG GTGGGTGTGT GGGGGTGTTG penas 7 posições informativas (sublinhadas) 7

Exercício Topologias possíveis para cada OTUs GTGGTTGTTT GGGGGTGTGG GTGGGTGTGT GGGGGTGTTG penas 7 posições informativas (sublinhadas) Resumo da variação informativa 7 7 P eterminar a mais parcimoniosa: < Mesma probabilidade de transições e transversões < Transversões x menos prováveis que transições 8

Limitações da MP Situações de erro Long branch attraction: OTUs mais divergentes tendem a agrupar-se Real Obtida unikonts cenancestral eukaryote bikonts ~9 Mya Famoso caso da tree of life de Woese rchaebacteria ctinobacteria Endobacteria yanobacteria Hadobacteria hlorobacteria Proteobacteria Planctobacteria Sphingobacteria Spirochaetae Woese et al., 99 cenancestral prokaryote ~ Mya origin of life avalier-smith 9

lternativas om base nas distâncias e não nos caracteres PUsando a matriz de distâncias ou um derivado da mesma, agrupa-se hierarquicamente a partir dos mais próximos PUPGM (Unweighted Pair Group Method with rithmetic Mean) < O método mais simples, assume igualdade de extensão dos ramos de cada bifurcação < Utilizado para produzir cladogramas preliminares para servirem de base a métodos mais intensivos PNJ (Neighbor-Joining): a partir dum cladograma sem hierarquia (topologia star ), determinar passo a passo o agrupamento que minimiza S < onsiderado muito eficiente para grandes cladogramas (muitas OTUs) < Utilizado para produzir um cladograma de base para o método ME PME (Minimum Evolution): aperfeiçoa o resultado duma NJ, usando topologias de qualidade próxima para estimar a extensão do ramos, com erros-padrão (mínimos quadrados).

lternativas Funções de verosimilhança Pfins à MP, mas integrando cálculos de verosimilhança das topologias < verosimilhança dum cladograma é a probabilidade de resultarem os estados de carácter observados, tendo em conta a topologia dada. Estas abordagens exigem a avaliação de todas as topologias possíveis P ML (Maximum Likelihood): define a priori um modelo de mutação. P Inferência ayesiana: parte dum modelo de mutação arbitrário e vai-o ajustando à medida que progride na construção do cladograma.

Testes P ootstrap (reamostragem) < Simular uma repetição da experiência/amostragem com apenas parte da informação; na prática, o procedimento de calcular um cladograma com apenas um subconjunto dos carateres, tomados aleatoriamente, é repetido muitas vezes (,...) para obter muitas combinações diferentes de carateres. < percentagem de vezes que um determinado clade aparece nos cladogramas obtidos é usada como medida do support desse grupo no cladograma testado. P Inner ranch (métodos NJ e ME) < Semelhante ao bootstrap, mas os critérios de support são diferentes. P ecaimento de remer < ompara o cladograma em teste com a melhor alternativa caso uma determinada ramificação fosse retirada (por exemplo, o efeito que teria retirar a ramificação entre cavalo e burro, ficando os dois com igual hierarquia de parentesco com o rinoceronte); o valor de S deverá aumentar e a diferença dá uma medida do decaimento, associado à alternativa, que se considera correlacionada com a significância do clade definido por essa ramificação. P Neutralidade

UPGM 99 P. monticola pathogenesis-related pro() P. monticola pathogenesis-related pro() P. monticola pathogenesis-related pro() 9 P. pinaster pr- P. monticola pathogenesis-related pro... P. monticola pathogenesis-related pro() P. glauca m7g P. glauca m7g() P. mariana m7g MP P. abies m7g O. sativa PRc O. sativa Indica Group PRa. NJ..8. P. abies m7g... O. sativa PRc P. mariana m7g 99 P. glauca m7g() 7 P. glauca m7g P. pinaster pr- 7 P. monticola pathogenesis-related pro() P. monticola pathogenesis-related pro() P. monticola pathogenesis-related pro() P. monticola pathogenesis-related pro... 99 P. monticola pathogenesis-related pro() O. sativa Indica Group PRa ML 7 P. pinaster pr- P. glauca m7g 99 P. abies m7g P. glauca m7g() P. mariana m7g O. sativa PRc. 9 9 P. monticola pathogenesis-related pro() P. monticola pathogenesis-related pro() P. monticola pathogenesis-related pro() O. sativa Indica Group PRa 7 99 P. monticola pathogenesis-related pro... P. monticola pathogenesis-related pro().

Software O programa MEG (http://megasoftware.net/) é fornecido para a aula prática. Outras recomendações: P Mesquite (mesmos autores do Maclade; Windows, Mac, Linux) http://mesquiteproject.org/mesquite/features.html P TNT (Windows e Linux; MacOS versão antiga) http://www.zmuc.dk/public/phylogeny/tnt/ P Pebble (Windows, Mac, Linux) http://www.cebl.auckland.ac.nz/software.php P PUP* (MacOS 9-., Windows) http://paup.csit.fsu.edu/ P TOPLi (Windows, MacOS, Linux, Solaris) http://www.topali.org/ P Mrayes (Windows, MacOS) http://mrbayes.sourceforge.net/index.php Uma listagem mais extensa é fornecida no Moodle. Lista de softwares de Felsenstein http://evolution.genetics.washington.edu/phylip/software.html (execução local) http://evolution.genetics.washington.edu/phylip/software.serv.html (servidores)