LGN BIOMETRIA DE MARCADORES GENÉTICOS

Documentos relacionados
LGN BIOMETRIA DE MARCADORES GENÉTICOS

LGN Genética. Aula 5 Ligação I

ESTATÍSTICA COMPUTACIONAL

Mapas de Ligação e de. Marcadores Moleculares a Programas de Melhoramento

Ligação, permuta e mapeamento. Prof. David De Jong Depto. de Genética

LGN215 - Genética Geral

e Mapeamento gênico em eucariotas

Ligação Gênica e Mapeamento

Ligação, permuta e mapeamento. Prof. David De Jong Depto. de Genética

Como os alelos localizam-se em um mesmo. dos gametas, a não ser que ocorra permutação ou crossing over;

Ligação, Recombinação e Mapeamento gênico em eucariotas

5 Filtro de Kalman Aplicado ao Modelo de Schwartz e Smith (2000)

LGN GENÉTICA. Aula 6 - Ligação II. Antonio Augusto Franco Garcia Filipe Inácio Matias Marianella F. Quezada Macchiavello

LGN215 - Genética Geral

Ligação Gênica II. Teste dos Três Pontos

Técnicas computacionais em probabilidade e estatística II

Problemas de otimização

Tratamento de dados em Física

Minera c ao de Dados Aula 6: Finaliza c ao de Regress ao e Classifica c ao Rafael Izbicki 1 / 33

BIOLOGIA LINKAGE OU LIGAÇÃO FATORIAL

Ligação, permuta e mapas genéticos: ligação e permuta genética, estimativa da freqüência de permuta

Experimentos Fatoriais 2 k Fracionados

Grafos Hamiltonianos e o Problema do Caixeiro Viajante. Prof. Ademir Constantino Departamento de Informática Universidade Estadual de Maringá

LGN GENÉTICA. Aula 5 - Ligação I. Antonio Augusto Franco Garcia Filipe Inácio Matias Marianella F. Quezada Macchiavello

étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

Distribuições Amostrais e Estimação Pontual de Parâmetros

Lista de Exercícios Programação Inteira. x 2 0 e inteiros.

Clustering (k-means, SOM e hierárquicos)

Medida do Tempo de Execução de um Programa. David Menotti Algoritmos e Estruturas de Dados II DInf UFPR

Exemplo de Aplicação de Algoritmos Genéticos. Prof. Juan Moisés Mauricio Villanueva cear.ufpb.br/juan

Universidade Federal de Pernambuco Departamento de Estatística Inferência Estatística (PGE 951) Método de Máxima Verossimilhança (M.M.V.

Função de Verossimilhança

Algoritmos Genéticos. Princípio de Seleção Natural. Sub-áreas da Computação Evolutiva. Idéias básicas da CE. Computação Evolutiva

Comparação dos algoritmos delineação rápida em cadeia e seriação, para a construção de mapas genéticos

Inferência Bayesiana - Aula 1 -

Algoritmos Genéticos

Aula 13: Branch-and-bound

Algoritmos Genéticos

Análise Bayesiana de Dados - Aula 1 -

Estatística e Modelos Probabilísticos - COE241

diferença não aleatória na distribuição dos fatores de risco entre os dois grupos

LIGAÇÃO GÊNICA (3ª LEI DA GENÉTICA)

Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Ligação e Recombinação Gênica Elaboração de Mapas Cromossômicos QTLs e sua detecção

Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados

MELHORAMENTO GENÉTICO. Seleção Genômica

MÉTODOS ESTATÍSTICOS PARA EXATIDÃO DE MAPEAMENTO E AVALIAÇÃO DE MODELOS

BIOLOGIA - 2 o ANO MÓDULO 52 LIGAÇÃO GÊNICA

Aula 17: Planos de Corte

Nós estudamos isso em nossa aula extra de Regressão Múltipla!

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

TESTE DOS 3 PONTOS. A B 8u

5. Expressões aritméticas

2284-ELE/5, 3316-IE/3

Descodificação iterativa

3. Resolução de problemas por meio de busca

Inteligência Artificial

MAPEAMENTO CROMOSSÔMICO

BIOMETRIA. Profa. Dra. Mõnica Trindade Abreu de Gusmão

CC-226 Aula 07 - Estimação de Parâmetros

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

LIGAÇÃO OU VINCULAÇÃO GÊNICA

Estimativa de freqüência de recombinação no mapeamento genético de famílias de irmãos completos

Cálculo Numérico. Resumo e Exercícios P1

LIGAÇÃO. 2ª Lei de Mendel -> segregação independente -> para genes localizados em cromossomos diferentes.

Ligação Gênica ou Ligação Fatorial (Linkage)

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...

03/06/2014. Tratamento de Incertezas TIC Aula 18. Conteúdo Inferência Estatística Clássica

Aprendizagem de Dados Simbólicos e/ou Numéricos

3. Estimação pontual USP-ICMC-SME. USP-ICMC-SME () 3. Estimação pontual / 25

ESTATÍSTICA COMPUTACIONAL

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

W 8. Nas colunas "k =1 a n" executar: Nas linhas "i =1 a m" executar: Em cada linha "i" de "j=1 a n" executar: z = c ik + c kj

Rafael Izbicki 1 / 38

Disciplina de Modelos Lineares Professora Ariane Ferreira

AULA 15 - Distribuição de Bernoulli e Binomial

BIO-103 Biologia evolutiva

Lista de Exercícios Programação Inteira. x 2 0 e inteiros.

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

Algoritmo Array Rápido para Filtragem de Sistemas Lineares Sujeitos a Saltos Markovianos com Variação Estruturada dos Parâmetros no Tempo

MATRIZES - PARTE Definição e Manipulação de Matrizes AULA 21

Estruturas de Dados 2

Gauss-Seidel para Solução de Sistemas com Matrizes Banda Usando Armazenamento Especial

IA: Inteligência Artificial

Distribuições de Probabilidade

Algoritmos Genéticos Fernando Lobo

Algoritmos Evolutivos para Otimização

Universidade Federal de Lavras

sobre o grafo probabilístico completo de um sistema de regulação gênica

Estratégias Evolutivas EEs. Prof. Juan Moisés Mauricio Villanueva

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

Comparação entre intervalos de confiança calculados com métodos bootstrap e intervalos assintóticos

Cálculo Numérico BCC760

Métodos de Amostragem. Métodos de Amostragem e Avaliação de Algoritmos. Métodos de Amostragem. Métodos de Amostragem. Métodos de Amostragem

PROCURA E PLANEAMENTO

lnteligência Artificial

Transcrição:

LGN5830 - BIOMETRIA DE MARCADORES GENÉTICOS AULA 3: MAPAS GENÉTICOS II Antonio Augusto Franco Garcia Roland Vencovsky Departmento de Genética ESALQ/USP 007

CONTEÚDO 1 ANÁLISE DE LIGAÇÃO (CONT.) Revisão Teste de Dois Pontos (F ) Grupos de Ligação ORDENAÇÃO DOS LOCOS Fundamentos Estatísticas (Critérios) Algoritmos de Ordenação

CONTEÚDO 1 ANÁLISE DE LIGAÇÃO (CONT.) Revisão Teste de Dois Pontos (F ) Grupos de Ligação ORDENAÇÃO DOS LOCOS Fundamentos Estatísticas (Critérios) Algoritmos de Ordenação

CONTEÚDO 1 ANÁLISE DE LIGAÇÃO (CONT.) Revisão Teste de Dois Pontos (F ) Grupos de Ligação ORDENAÇÃO DOS LOCOS Fundamentos Estatísticas (Critérios) Algoritmos de Ordenação

DELINEAMENTOS GENÉTICOS

RC Função de verossimilhança para r no RC1: ( 1 r L(r) = ) n1 ( r ) n ( r.. ) n3. ( 1 r ) n4 Estimador de máxima verossimilhança para r: ˆr = n + n 3 n 1 + n + n 3 + n 4 = n R n R + n NR r (fração de recombinação): Probabilidade de ocorrer uma recombinação num dado intervalo entre locos

RC Função de verossimilhança para r no RC1: ( 1 r L(r) = ) n1 ( r ) n ( r.. ) n3. ( 1 r ) n4 Estimador de máxima verossimilhança para r: ˆr = n + n 3 n 1 + n + n 3 + n 4 = n R n R + n NR r (fração de recombinação): Probabilidade de ocorrer uma recombinação num dado intervalo entre locos

RC Função de verossimilhança para r no RC1: ( 1 r L(r) = ) n1 ( r ) n ( r.. ) n3. ( 1 r ) n4 Estimador de máxima verossimilhança para r: ˆr = n + n 3 n 1 + n + n 3 + n 4 = n R n R + n NR r (fração de recombinação): Probabilidade de ocorrer uma recombinação num dado intervalo entre locos

TESTE DA RAZÃO DE VEROSSIMILHANÇA Princípio: comparar valores da verossimilhança considerando diferentes valores dos parâmetros θ: valor do parâmetro sob H 0 ˆθ: valor do parâmetro sob H 1 Estatística razão de verossimilhanças: LRT = log L(θ) = [l(θ) l(ˆθ)] L(ˆθ) LOD (log of the odds): LOD = log 10 L(ˆθ) L(θ)

TESTE DA RAZÃO DE VEROSSIMILHANÇA Princípio: comparar valores da verossimilhança considerando diferentes valores dos parâmetros θ: valor do parâmetro sob H 0 ˆθ: valor do parâmetro sob H 1 Estatística razão de verossimilhanças: LRT = log L(θ) = [l(θ) l(ˆθ)] L(ˆθ) LOD (log of the odds): LOD = log 10 L(ˆθ) L(θ)

TESTE DA RAZÃO DE VEROSSIMILHANÇA Princípio: comparar valores da verossimilhança considerando diferentes valores dos parâmetros θ: valor do parâmetro sob H 0 ˆθ: valor do parâmetro sob H 1 Estatística razão de verossimilhanças: LRT = log L(θ) = [l(θ) l(ˆθ)] L(ˆθ) LOD (log of the odds): LOD = log 10 L(ˆθ) L(θ)

TESTE DA RAZÃO DE VEROSSIMILHANÇA Princípio: comparar valores da verossimilhança considerando diferentes valores dos parâmetros θ: valor do parâmetro sob H 0 ˆθ: valor do parâmetro sob H 1 Estatística razão de verossimilhanças: LRT = log L(θ) = [l(θ) l(ˆθ)] L(ˆθ) LOD (log of the odds): LOD = log 10 L(ˆθ) L(θ)

TESTE DA RAZÃO DE VEROSSIMILHANÇA Princípio: comparar valores da verossimilhança considerando diferentes valores dos parâmetros θ: valor do parâmetro sob H 0 ˆθ: valor do parâmetro sob H 1 Estatística razão de verossimilhanças: LRT = log L(θ) = [l(θ) l(ˆθ)] L(ˆθ) LOD (log of the odds): LOD = log 10 L(ˆθ) L(θ)

RC EXEMPLO Uso de um Sistema Algébrico Computacional (MAXIMA)

CONTEÚDO 1 ANÁLISE DE LIGAÇÃO (CONT.) Revisão Teste de Dois Pontos (F ) Grupos de Ligação ORDENAÇÃO DOS LOCOS Fundamentos Estatísticas (Critérios) Algoritmos de Ordenação

POPULAÇÃO F Genótipo Código freq. esp. (p i ) freq. obs. (f i ) AB AB AB Ab 1 Ab (1 r) 4 n 1 r(1 r) n Ab 0 r 4 n 3 AB ab 1 Ab r(1 r) n 4 ab 11 r n 5 AB ab 11 Ab ab 10 ab (1 r) n 5 r(1 r) n 6 ab 0 r 4 n 7 ab ab 01 ab ab 00 r(1 r) n 8 (1 r) 4 n 9

F Função de verossimilhança para r: L(r) = [ ] (1 r) n1 +n 9 [ ] n +n r(1 r) 4 +n 6 +n 8 [ ] r n3 +n 7 [ ] (1 r) n5 4 4 + r Estimador de máxima verossimilhança para r: Uso do MAXIMA

F Função de verossimilhança para r: L(r) = [ ] (1 r) n1 +n 9 [ ] n +n r(1 r) 4 +n 6 +n 8 [ ] r n3 +n 7 [ ] (1 r) n5 4 4 + r Estimador de máxima verossimilhança para r: Uso do MAXIMA

F Função de verossimilhança para r: L(r) = [ ] (1 r) n1 +n 9 [ ] n +n r(1 r) 4 +n 6 +n 8 [ ] r n3 +n 7 [ ] (1 r) n5 4 4 + r Estimador de máxima verossimilhança para r: Uso do MAXIMA Maxima encountered a Lisp error: Error in PROGN [or a callee]: The storage for CONS is exhausted. Currently, 4873 pages are allocated. Use ALLOCATE to expand the space.

MÉTODOS NUMÉRICOS Em várias situações, não é possível obter formas explicítas para os MLE s Nesses casos, é comum a utilização de métodos numéricos (algoritmos) Um algoritmo muito usado é o algoritmo EM E: Expectation; M: Maximization (Esperança e Maximização)

MÉTODOS NUMÉRICOS Em várias situações, não é possível obter formas explicítas para os MLE s Nesses casos, é comum a utilização de métodos numéricos (algoritmos) Um algoritmo muito usado é o algoritmo EM E: Expectation; M: Maximization (Esperança e Maximização)

MÉTODOS NUMÉRICOS Em várias situações, não é possível obter formas explicítas para os MLE s Nesses casos, é comum a utilização de métodos numéricos (algoritmos) Um algoritmo muito usado é o algoritmo EM E: Expectation; M: Maximization (Esperança e Maximização)

ALGORITMO EM EM: método iterativo para obter estimativas de máxima verossimilhança Muito usado em análises de mapeamento genético Mostrou-se muito poderoso na prática, principalmente quando as observações possuem dados incompletos quanto à informação EXEMPLOS 1 Numa população F, não é possível separar as classes Ab/aB e AB/ab Para marcadores dominantes, AA = Aa 3 No mapeamento de QTL s, não é possível separar QQ, Qq e qq, já que os genótipos dos QTL s não são observáveis

ALGORITMO EM EM: método iterativo para obter estimativas de máxima verossimilhança Muito usado em análises de mapeamento genético Mostrou-se muito poderoso na prática, principalmente quando as observações possuem dados incompletos quanto à informação EXEMPLOS 1 Numa população F, não é possível separar as classes Ab/aB e AB/ab Para marcadores dominantes, AA = Aa 3 No mapeamento de QTL s, não é possível separar QQ, Qq e qq, já que os genótipos dos QTL s não são observáveis

ALGORITMO EM EM: método iterativo para obter estimativas de máxima verossimilhança Muito usado em análises de mapeamento genético Mostrou-se muito poderoso na prática, principalmente quando as observações possuem dados incompletos quanto à informação EXEMPLOS 1 Numa população F, não é possível separar as classes Ab/aB e AB/ab Para marcadores dominantes, AA = Aa 3 No mapeamento de QTL s, não é possível separar QQ, Qq e qq, já que os genótipos dos QTL s não são observáveis

ALGORITMO EM EM: método iterativo para obter estimativas de máxima verossimilhança Muito usado em análises de mapeamento genético Mostrou-se muito poderoso na prática, principalmente quando as observações possuem dados incompletos quanto à informação EXEMPLOS 1 Numa população F, não é possível separar as classes Ab/aB e AB/ab Para marcadores dominantes, AA = Aa 3 No mapeamento de QTL s, não é possível separar QQ, Qq e qq, já que os genótipos dos QTL s não são observáveis

ALGORITMO EM EM: método iterativo para obter estimativas de máxima verossimilhança Muito usado em análises de mapeamento genético Mostrou-se muito poderoso na prática, principalmente quando as observações possuem dados incompletos quanto à informação EXEMPLOS 1 Numa população F, não é possível separar as classes Ab/aB e AB/ab Para marcadores dominantes, AA = Aa 3 No mapeamento de QTL s, não é possível separar QQ, Qq e qq, já que os genótipos dos QTL s não são observáveis

ALGORITMO EM EM: método iterativo para obter estimativas de máxima verossimilhança Muito usado em análises de mapeamento genético Mostrou-se muito poderoso na prática, principalmente quando as observações possuem dados incompletos quanto à informação EXEMPLOS 1 Numa população F, não é possível separar as classes Ab/aB e AB/ab Para marcadores dominantes, AA = Aa 3 No mapeamento de QTL s, não é possível separar QQ, Qq e qq, já que os genótipos dos QTL s não são observáveis

ALGORITMO EM O EM faz uma clara distinção entre os dados observados (Y ), que são incompletos, e os dados completos (X), não observáveis Alguma função t(x) = Y associa X e Y Idéia básica: tomar X tal que a obtenção de estimativas de máxima verossimilhança torne-se trivial para os dados completos

ALGORITMO EM O EM faz uma clara distinção entre os dados observados (Y ), que são incompletos, e os dados completos (X), não observáveis Alguma função t(x) = Y associa X e Y Idéia básica: tomar X tal que a obtenção de estimativas de máxima verossimilhança torne-se trivial para os dados completos

ALGORITMO EM O EM faz uma clara distinção entre os dados observados (Y ), que são incompletos, e os dados completos (X), não observáveis Alguma função t(x) = Y associa X e Y Idéia básica: tomar X tal que a obtenção de estimativas de máxima verossimilhança torne-se trivial para os dados completos

ALGORITMO EM Assume-se que os dados completos tenham função de densidade f(x/θ) Passo E: calcula-se a esperança condicional Q(θ/θ n ) = E [log f(x/θ) Y, θ n ] (θ n é o valor estimado atual de θ) Passo M: maximiza-se Q(θ/θ n ) com respeito à θ, fornecendo uma nova estimativa para θ n (denominada θ n+1 ) Os dois passos são repetidos até haver convergência

ALGORITMO EM Assume-se que os dados completos tenham função de densidade f(x/θ) Passo E: calcula-se a esperança condicional Q(θ/θ n ) = E [log f(x/θ) Y, θ n ] (θ n é o valor estimado atual de θ) Passo M: maximiza-se Q(θ/θ n ) com respeito à θ, fornecendo uma nova estimativa para θ n (denominada θ n+1 ) Os dois passos são repetidos até haver convergência

ALGORITMO EM Assume-se que os dados completos tenham função de densidade f(x/θ) Passo E: calcula-se a esperança condicional Q(θ/θ n ) = E [log f(x/θ) Y, θ n ] (θ n é o valor estimado atual de θ) Passo M: maximiza-se Q(θ/θ n ) com respeito à θ, fornecendo uma nova estimativa para θ n (denominada θ n+1 ) Os dois passos são repetidos até haver convergência

ALGORITMO EM Assume-se que os dados completos tenham função de densidade f(x/θ) Passo E: calcula-se a esperança condicional Q(θ/θ n ) = E [log f(x/θ) Y, θ n ] (θ n é o valor estimado atual de θ) Passo M: maximiza-se Q(θ/θ n ) com respeito à θ, fornecendo uma nova estimativa para θ n (denominada θ n+1 ) Os dois passos são repetidos até haver convergência

ALGORITMO EM Maximizando-se Q(θ/θ n ), há aumento em log g(y/θ) (verossimilhança dos dados observados) No passo E, estimam-se as estatísticas para os dados completos, condicionados aos dados incompletos observados No passo M, os dados completos estimados são usados para obter as estimativas de máxima verossimilhança

ALGORITMO EM Maximizando-se Q(θ/θ n ), há aumento em log g(y/θ) (verossimilhança dos dados observados) No passo E, estimam-se as estatísticas para os dados completos, condicionados aos dados incompletos observados No passo M, os dados completos estimados são usados para obter as estimativas de máxima verossimilhança

ALGORITMO EM Maximizando-se Q(θ/θ n ), há aumento em log g(y/θ) (verossimilhança dos dados observados) No passo E, estimam-se as estatísticas para os dados completos, condicionados aos dados incompletos observados No passo M, os dados completos estimados são usados para obter as estimativas de máxima verossimilhança

ESTIMANDO r NUM F Vimos que f(x/θ) = L(r) = [ ] (1 r) n1 +n 9 [ ] n +n r(1 r) 4 +n 6 +n 8 [ ] r n3 +n 7 [ (1 r) 4 4 + r Logo, log f(x/θ) = n 1 log (1 r) 4 + n log r(1 r) + n 3 log r 4 + n 4 log r(1 r) + n 51 log (1 r) + n 5 log r + n 6 log r(1 r) + n 7 log r 4 + n 8 log r(1 r) + n 9 log (1 r) 4 E portanto E [log f(x/θ)] = n 1 log (1 r) 4 + n log r(1 r) + n 3 log r 4 + n 4 log r(1 r) + log (1 r) E(n 51 ) + log r E(n 5) + n 6 log r(1 r) + n 7 log r 4 + n 8 log r(1 r) + n 9 log (1 r) 4 ] n5

ESTIMANDO r NUM F Vimos que f(x/θ) = L(r) = [ ] (1 r) n1 +n 9 [ ] n +n r(1 r) 4 +n 6 +n 8 [ ] r n3 +n 7 [ (1 r) 4 4 + r Logo, log f(x/θ) = n 1 log (1 r) 4 + n log r(1 r) + n 3 log r 4 + n 4 log r(1 r) + n 51 log (1 r) + n 5 log r + n 6 log r(1 r) + n 7 log r 4 + n 8 log r(1 r) + n 9 log (1 r) 4 E portanto E [log f(x/θ)] = n 1 log (1 r) 4 + n log r(1 r) + n 3 log r 4 + n 4 log r(1 r) + log (1 r) E(n 51 ) + log r E(n 5) + n 6 log r(1 r) + n 7 log r 4 + n 8 log r(1 r) + n 9 log (1 r) 4 ] n5

ESTIMANDO r NUM F Vimos que f(x/θ) = L(r) = [ ] (1 r) n1 +n 9 [ ] n +n r(1 r) 4 +n 6 +n 8 [ ] r n3 +n 7 [ (1 r) 4 4 + r Logo, log f(x/θ) = n 1 log (1 r) 4 + n log r(1 r) + n 3 log r 4 + n 4 log r(1 r) + n 51 log (1 r) + n 5 log r + n 6 log r(1 r) + n 7 log r 4 + n 8 log r(1 r) + n 9 log (1 r) 4 E portanto E [log f(x/θ)] = n 1 log (1 r) 4 + n log r(1 r) + n 3 log r 4 + n 4 log r(1 r) + log (1 r) E(n 51 ) + log r E(n 5) + n 6 log r(1 r) + n 7 log r 4 + n 8 log r(1 r) + n 9 log (1 r) 4 ] n5

ESTIMANDO r NUM F Note que a Esperança foi calculada em relação à n 51 e n 5 que, se fossem conhecidos, tornariam o problema bem mais simples (essa é a idéia do EM!) n 51 e n 5 : podem ser modelados usando a distribuição binomial Lembrete: X B(n, p), E(X) = np P (n 51 ) = (1 r) (1 r) + r E(n 51 ) = n 5 (1 q); E(n 5 ) = n 5 q = 1 q; P (n 5 ) = r (1 r) + r = q

ESTIMANDO r NUM F Note que a Esperança foi calculada em relação à n 51 e n 5 que, se fossem conhecidos, tornariam o problema bem mais simples (essa é a idéia do EM!) n 51 e n 5 : podem ser modelados usando a distribuição binomial Lembrete: X B(n, p), E(X) = np P (n 51 ) = (1 r) (1 r) + r E(n 51 ) = n 5 (1 q); E(n 5 ) = n 5 q = 1 q; P (n 5 ) = r (1 r) + r = q

ESTIMANDO r NUM F Note que a Esperança foi calculada em relação à n 51 e n 5 que, se fossem conhecidos, tornariam o problema bem mais simples (essa é a idéia do EM!) n 51 e n 5 : podem ser modelados usando a distribuição binomial Lembrete: X B(n, p), E(X) = np P (n 51 ) = (1 r) (1 r) + r E(n 51 ) = n 5 (1 q); E(n 5 ) = n 5 q = 1 q; P (n 5 ) = r (1 r) + r = q

ESTIMANDO r NUM F Note que a Esperança foi calculada em relação à n 51 e n 5 que, se fossem conhecidos, tornariam o problema bem mais simples (essa é a idéia do EM!) n 51 e n 5 : podem ser modelados usando a distribuição binomial Lembrete: X B(n, p), E(X) = np P (n 51 ) = (1 r) (1 r) + r E(n 51 ) = n 5 (1 q); E(n 5 ) = n 5 q = 1 q; P (n 5 ) = r (1 r) + r = q

ESTIMANDO r NUM F Note que a Esperança foi calculada em relação à n 51 e n 5 que, se fossem conhecidos, tornariam o problema bem mais simples (essa é a idéia do EM!) n 51 e n 5 : podem ser modelados usando a distribuição binomial Lembrete: X B(n, p), E(X) = np P (n 51 ) = (1 r) (1 r) + r E(n 51 ) = n 5 (1 q); E(n 5 ) = n 5 q = 1 q; P (n 5 ) = r (1 r) + r = q

ESTIMANDO r NUM F Finalmente, Q(θ/θ n ) = n 1 log (1 r) 4 + n log r(1 r) + n 3 log r 4 + n 4 log r(1 r) + log (1 r) n 5 (1 q) + log r n 5q + n 6 log r(1 r) + n 7 log r 4 + n 8 log r(1 r) + n 9 log (1 r) 4 Agora é possível derivar e encontrar o ponto de máximo Com ajuda do MAXIMA: ˆr = (n + n 4 + n 6 + n 8 ) + (n 3 + n 7 + qn 5 ) n

ESTIMANDO r NUM F Finalmente, Q(θ/θ n ) = n 1 log (1 r) 4 + n log r(1 r) + n 3 log r 4 + n 4 log r(1 r) + log (1 r) n 5 (1 q) + log r n 5q + n 6 log r(1 r) + n 7 log r 4 + n 8 log r(1 r) + n 9 log (1 r) 4 Agora é possível derivar e encontrar o ponto de máximo Com ajuda do MAXIMA: ˆr = (n + n 4 + n 6 + n 8 ) + (n 3 + n 7 + qn 5 ) n

ESTIMANDO r NUM F Finalmente, Q(θ/θ n ) = n 1 log (1 r) 4 + n log r(1 r) + n 3 log r 4 + n 4 log r(1 r) + log (1 r) n 5 (1 q) + log r n 5q + n 6 log r(1 r) + n 7 log r 4 + n 8 log r(1 r) + n 9 log (1 r) 4 Agora é possível derivar e encontrar o ponto de máximo Com ajuda do MAXIMA: ˆr = (n + n 4 + n 6 + n 8 ) + (n 3 + n 7 + qn 5 ) n

ESTIMANDO r NUM F Finalmente, Q(θ/θ n ) = n 1 log (1 r) 4 + n log r(1 r) + n 3 log r 4 + n 4 log r(1 r) + log (1 r) n 5 (1 q) + log r n 5q + n 6 log r(1 r) + n 7 log r 4 + n 8 log r(1 r) + n 9 log (1 r) 4 Agora é possível derivar e encontrar o ponto de máximo Com ajuda do MAXIMA: ˆr = (n + n 4 + n 6 + n 8 ) + (n 3 + n 7 + qn 5 ) n

USO DO EM PARA ESTIMAR r NUM F Passo E: dado um valor inicial (chute) para r, obtém-se q = r (1 r) + r Passo M: usando esse valor de q, r é estimado novamente ˆr = (n + n 4 + n 6 + n 8 ) + (n 3 + n 7 + qn 5 ) n O processo é repetido até a convergência

USO DO EM PARA ESTIMAR r NUM F Passo E: dado um valor inicial (chute) para r, obtém-se q = r (1 r) + r Passo M: usando esse valor de q, r é estimado novamente ˆr = (n + n 4 + n 6 + n 8 ) + (n 3 + n 7 + qn 5 ) n O processo é repetido até a convergência

USO DO EM PARA ESTIMAR r NUM F Passo E: dado um valor inicial (chute) para r, obtém-se q = r (1 r) + r Passo M: usando esse valor de q, r é estimado novamente ˆr = (n + n 4 + n 6 + n 8 ) + (n 3 + n 7 + qn 5 ) n O processo é repetido até a convergência

USO DO EM EXEMPLO - MAIZE DATA 1 1 0 0 0 0 0 1 1 1 0 0 1 1 1 1 1 0 0 1 3 1 1 1 1 1 4 1 0 0 0 0 0 0 0 0 1 5 0 0 1 1 1 1 1 1 1 1 1 1... 170 1 0 0 1 1 1 1 1 1 1 1 1 171 1 1 0 1 1 1 1 0 0 0 Obtenhar ˆr entre M 1 e M usando o algoritmo EM

USO DO EM EXEMPLO - MAIZE DATA Usando o R Uso do EM F o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o Fração de Recomb. 0.90 0.95 0.300 0.305 o o o r.est= 0.3074 0 10 0 30 40 50 Iteração

FORMA GERAL PARA ˆr USANDO O EM Liu (1998): Vimos que ˆr = (n + n 4 + n 6 + n 8 ) + (n 3 + n 7 + qn 5 ) n Forma geral: ˆr = 1 f i P i (R/G) n i P i (R/G): prob. de um dado genótipo possuir um gameta recombinante Essa última expressão pode ser usado com combinações de marcadores, p. ex., dominante e co-dominante, etc.

FORMA GERAL PARA ˆr USANDO O EM Liu (1998): Vimos que ˆr = (n + n 4 + n 6 + n 8 ) + (n 3 + n 7 + qn 5 ) n Forma geral: ˆr = 1 f i P i (R/G) n i P i (R/G): prob. de um dado genótipo possuir um gameta recombinante Essa última expressão pode ser usado com combinações de marcadores, p. ex., dominante e co-dominante, etc.

FORMA GERAL PARA ˆr USANDO O EM Liu (1998): Vimos que ˆr = (n + n 4 + n 6 + n 8 ) + (n 3 + n 7 + qn 5 ) n Forma geral: ˆr = 1 f i P i (R/G) n i P i (R/G): prob. de um dado genótipo possuir um gameta recombinante Essa última expressão pode ser usado com combinações de marcadores, p. ex., dominante e co-dominante, etc.

FORMA GERAL - F Genótipo freq. esp. (p i ) freq. obs. (f i ) P i (R/G) AB AB AB Ab 1 Ab AB ab 1 (1 r) 4 n 1 0 r(1 r) n 1/ Ab 0 r 4 n 3 1 r(1 r) n 4 1/ Ab r ab 11 (1)r n / 5 r /+(1 r) / = q AB ab 11 Ab ab 10 ab (1 r) n 5 r(1 r) n 6 1/ ab 0 r 4 n 7 1 ab ab 01 ab ab 00 r(1 r) n 8 1/ (1 r) 4 n 9 0

FORMA GERAL - L(r) Vimos que L(r) = [ (1 r) 4 ] n1 +n 9 [ r(1 r) ] n +n 4 +n 6 +n 8 [ ] r n3 +n 7 [ ] (1 r) n5 4 + r Forma geral: L(r) = i p f i i

FORMA GERAL - L(r) Vimos que L(r) = [ (1 r) 4 ] n1 +n 9 [ r(1 r) ] n +n 4 +n 6 +n 8 [ ] r n3 +n 7 [ ] (1 r) n5 4 + r Forma geral: L(r) = i p f i i

CONTEÚDO 1 ANÁLISE DE LIGAÇÃO (CONT.) Revisão Teste de Dois Pontos (F ) Grupos de Ligação ORDENAÇÃO DOS LOCOS Fundamentos Estatísticas (Critérios) Algoritmos de Ordenação

GRUPOS DE LIGAÇÃO Biologicamente: grupos de genes no mesmo cromossomo Estatisticamente: grupos de locos que segregam conjuntamente Critérios: Para um par de locos i e j, sejam r ij : estimativa de dois pontos de r p ij : p-valor relativo à H 0 : r ij = 1/ z ij : LOD Score

GRUPOS DE LIGAÇÃO Biologicamente: grupos de genes no mesmo cromossomo Estatisticamente: grupos de locos que segregam conjuntamente Critérios: Para um par de locos i e j, sejam r ij : estimativa de dois pontos de r p ij : p-valor relativo à H 0 : r ij = 1/ z ij : LOD Score

GRUPOS DE LIGAÇÃO Biologicamente: grupos de genes no mesmo cromossomo Estatisticamente: grupos de locos que segregam conjuntamente Critérios: Para um par de locos i e j, sejam r ij : estimativa de dois pontos de r p ij : p-valor relativo à H 0 : r ij = 1/ z ij : LOD Score

FORMAÇÃO DOS GRUPOS Usualmente: OU Se [r ij c e p ij b], i e j pertencem ao mesmo grupo Se [r ij c e z ij a], i e j pertencem ao mesmo grupo c: máx. fração recomb. para declarar ligação b: máx. valor do p-valor para declarar ligação a: mín. valor do LOD para declarar ligação a, b e c: atribuídos pelo usuário Usual: c = 0.5 e a = 3 (como saber se estão corretos?) Uso da propriedade transitiva

FORMAÇÃO DOS GRUPOS Usualmente: OU Se [r ij c e p ij b], i e j pertencem ao mesmo grupo Se [r ij c e z ij a], i e j pertencem ao mesmo grupo c: máx. fração recomb. para declarar ligação b: máx. valor do p-valor para declarar ligação a: mín. valor do LOD para declarar ligação a, b e c: atribuídos pelo usuário Usual: c = 0.5 e a = 3 (como saber se estão corretos?) Uso da propriedade transitiva

FORMAÇÃO DOS GRUPOS Usualmente: OU Se [r ij c e p ij b], i e j pertencem ao mesmo grupo Se [r ij c e z ij a], i e j pertencem ao mesmo grupo c: máx. fração recomb. para declarar ligação b: máx. valor do p-valor para declarar ligação a: mín. valor do LOD para declarar ligação a, b e c: atribuídos pelo usuário Usual: c = 0.5 e a = 3 (como saber se estão corretos?) Uso da propriedade transitiva

FORMAÇÃO DOS GRUPOS Usualmente: OU Se [r ij c e p ij b], i e j pertencem ao mesmo grupo Se [r ij c e z ij a], i e j pertencem ao mesmo grupo c: máx. fração recomb. para declarar ligação b: máx. valor do p-valor para declarar ligação a: mín. valor do LOD para declarar ligação a, b e c: atribuídos pelo usuário Usual: c = 0.5 e a = 3 (como saber se estão corretos?) Uso da propriedade transitiva

FORMAÇÃO DOS GRUPOS Usualmente: OU Se [r ij c e p ij b], i e j pertencem ao mesmo grupo Se [r ij c e z ij a], i e j pertencem ao mesmo grupo c: máx. fração recomb. para declarar ligação b: máx. valor do p-valor para declarar ligação a: mín. valor do LOD para declarar ligação a, b e c: atribuídos pelo usuário Usual: c = 0.5 e a = 3 (como saber se estão corretos?) Uso da propriedade transitiva

FORMAÇÃO DOS GRUPOS Usualmente: OU Se [r ij c e p ij b], i e j pertencem ao mesmo grupo Se [r ij c e z ij a], i e j pertencem ao mesmo grupo c: máx. fração recomb. para declarar ligação b: máx. valor do p-valor para declarar ligação a: mín. valor do LOD para declarar ligação a, b e c: atribuídos pelo usuário Usual: c = 0.5 e a = 3 (como saber se estão corretos?) Uso da propriedade transitiva

FORMAÇÃO DOS GRUPOS Usualmente: OU Se [r ij c e p ij b], i e j pertencem ao mesmo grupo Se [r ij c e z ij a], i e j pertencem ao mesmo grupo c: máx. fração recomb. para declarar ligação b: máx. valor do p-valor para declarar ligação a: mín. valor do LOD para declarar ligação a, b e c: atribuídos pelo usuário Usual: c = 0.5 e a = 3 (como saber se estão corretos?) Uso da propriedade transitiva

LIGAÇÃO EXEMPLO - MAIZE DATA Há evidências de que os marcadores M 1 e M estejam no mesmo grupo de ligação?

LIGAÇÃO EXEMPLO - MAIZE DATA Há evidências de que os marcadores M 1 e M estejam no mesmo grupo de ligação? Sim, já que ˆr = 0, 3074; LRT = 7, 974; p = 8, 4 10 7 e LOD = 6, 07

CONTEÚDO 1 ANÁLISE DE LIGAÇÃO (CONT.) Revisão Teste de Dois Pontos (F ) Grupos de Ligação ORDENAÇÃO DOS LOCOS Fundamentos Estatísticas (Critérios) Algoritmos de Ordenação

INTRODUÇÃO Sturtevant (1913): ordenação é um processo de minimizar o número de crossing-over Princípio: locos mais próximos possuem menor probabilidade de ocorrência de c.o. As estatísticas usadas para avaliar ordens são extensões das empregadas nos testes de três pontos

INTRODUÇÃO Sturtevant (1913): ordenação é um processo de minimizar o número de crossing-over Princípio: locos mais próximos possuem menor probabilidade de ocorrência de c.o. As estatísticas usadas para avaliar ordens são extensões das empregadas nos testes de três pontos

INTRODUÇÃO Sturtevant (1913): ordenação é um processo de minimizar o número de crossing-over Princípio: locos mais próximos possuem menor probabilidade de ocorrência de c.o. As estatísticas usadas para avaliar ordens são extensões das empregadas nos testes de três pontos

CONTEÚDO 1 ANÁLISE DE LIGAÇÃO (CONT.) Revisão Teste de Dois Pontos (F ) Grupos de Ligação ORDENAÇÃO DOS LOCOS Fundamentos Estatísticas (Critérios) Algoritmos de Ordenação

TESTE DE TRÊS PONTOS EXEMPLO ˆr AB = 0, 10 ˆr AC = 0, ˆr BC = 0, 30 Qual a ordem dos locos? Difícil de generalizar e implementar. Não há garantia de obter a melhor ordem.

TESTE DE TRÊS PONTOS EXEMPLO ˆr AB = 0, 10 ˆr AC = 0, ˆr BC = 0, 30 Qual a ordem dos locos? Difícil de generalizar e implementar. Não há garantia de obter a melhor ordem.

TESTE DE TRÊS PONTOS EXEMPLO ˆr AB = 0, 10 ˆr AC = 0, ˆr BC = 0, 30 Qual a ordem dos locos? Resp: B-A-C Difícil de generalizar e implementar. Não há garantia de obter a melhor ordem.

TESTE DE TRÊS PONTOS EXEMPLO ˆr AB = 0, 10 ˆr AC = 0, ˆr BC = 0, 30 Qual a ordem dos locos? Resp: B-A-C Difícil de generalizar e implementar. Não há garantia de obter a melhor ordem.

SARF, PARF, SALOD SARF : Sum of Adjacent Recombination Fraction SARF = m 1 i=1 ˆr ai a i+1 P ARF : Product of Adjacent Recombination Fraction P ARF = m 1 i=1 ˆr ai a i+1 SALOD: Sum of Adjacent Lod Score SALOD = m 1 i=1 ẑ ai a i+1 OBJETIVO: Menor SARF, menor P ARF, maior SALOD

SARF, PARF, SALOD SARF : Sum of Adjacent Recombination Fraction SARF = m 1 i=1 ˆr ai a i+1 P ARF : Product of Adjacent Recombination Fraction P ARF = m 1 i=1 ˆr ai a i+1 SALOD: Sum of Adjacent Lod Score SALOD = m 1 i=1 ẑ ai a i+1 OBJETIVO: Menor SARF, menor P ARF, maior SALOD

SARF, PARF, SALOD SARF : Sum of Adjacent Recombination Fraction SARF = m 1 i=1 ˆr ai a i+1 P ARF : Product of Adjacent Recombination Fraction P ARF = m 1 i=1 ˆr ai a i+1 SALOD: Sum of Adjacent Lod Score SALOD = m 1 i=1 ẑ ai a i+1 OBJETIVO: Menor SARF, menor P ARF, maior SALOD

SARF, PARF, SALOD SARF : Sum of Adjacent Recombination Fraction SARF = m 1 i=1 ˆr ai a i+1 P ARF : Product of Adjacent Recombination Fraction P ARF = m 1 i=1 ˆr ai a i+1 SALOD: Sum of Adjacent Lod Score SALOD = m 1 i=1 ẑ ai a i+1 OBJETIVO: Menor SARF, menor P ARF, maior SALOD

VEROSSIMILHANÇA Princípio: comparar a verossimilhança das ordens: L(θ) = i p f i i (cuidado, essa fórmula não é multiponto) A ordem com maior verossimilhança é a ordem mais provável para o conjunto de dados Dadas as propriedades estatísticas da verossimilhança, é o melhor critério Principais problemas: 1 Cálculos complexos e demorados Embora forneça valores da verossimilhança, não é claro como esses valores podem ser comparados, já que não há GL s para tanto

VEROSSIMILHANÇA Princípio: comparar a verossimilhança das ordens: L(θ) = i p f i i (cuidado, essa fórmula não é multiponto) A ordem com maior verossimilhança é a ordem mais provável para o conjunto de dados Dadas as propriedades estatísticas da verossimilhança, é o melhor critério Principais problemas: 1 Cálculos complexos e demorados Embora forneça valores da verossimilhança, não é claro como esses valores podem ser comparados, já que não há GL s para tanto

VEROSSIMILHANÇA Princípio: comparar a verossimilhança das ordens: L(θ) = i p f i i (cuidado, essa fórmula não é multiponto) A ordem com maior verossimilhança é a ordem mais provável para o conjunto de dados Dadas as propriedades estatísticas da verossimilhança, é o melhor critério Principais problemas: 1 Cálculos complexos e demorados Embora forneça valores da verossimilhança, não é claro como esses valores podem ser comparados, já que não há GL s para tanto

VEROSSIMILHANÇA Princípio: comparar a verossimilhança das ordens: L(θ) = i p f i i (cuidado, essa fórmula não é multiponto) A ordem com maior verossimilhança é a ordem mais provável para o conjunto de dados Dadas as propriedades estatísticas da verossimilhança, é o melhor critério Principais problemas: 1 Cálculos complexos e demorados Embora forneça valores da verossimilhança, não é claro como esses valores podem ser comparados, já que não há GL s para tanto

CONTEÚDO 1 ANÁLISE DE LIGAÇÃO (CONT.) Revisão Teste de Dois Pontos (F ) Grupos de Ligação ORDENAÇÃO DOS LOCOS Fundamentos Estatísticas (Critérios) Algoritmos de Ordenação

BUSCA EXAUSTIVA Princípio: comparar todas as ordens possíveis, segundo algum critério (ex: veross.) EXEMPLO - MOUSE DATA (M1, M3 E M14) L ABC (ˆr 1, ˆr ) = 1, 9 10 53 L ACB (ˆr 3, ˆr ) = 4, 73 10 89 L BAC (ˆr 1, ˆr 3 ) = 6, 789 10 73 MAPMAKER/EXP Ordem ABC ACB BAC LOD log 10 1,9 10 53 1,9 10 53 = 0 log 10 4,73 10 89 = 35, 61 1,9 10 53 6,789 10 log 73 10 = 19, 45 1,9 10 53

BUSCA EXAUSTIVA Princípio: comparar todas as ordens possíveis, segundo algum critério (ex: veross.) EXEMPLO - MOUSE DATA (M1, M3 E M14) L ABC (ˆr 1, ˆr ) = 1, 9 10 53 L ACB (ˆr 3, ˆr ) = 4, 73 10 89 L BAC (ˆr 1, ˆr 3 ) = 6, 789 10 73 MAPMAKER/EXP Ordem ABC ACB BAC LOD log 10 1,9 10 53 1,9 10 53 = 0 log 10 4,73 10 89 = 35, 61 1,9 10 53 6,789 10 log 73 10 = 19, 45 1,9 10 53

BUSCA EXAUSTIVA Princípio: comparar todas as ordens possíveis, segundo algum critério (ex: veross.) EXEMPLO - MOUSE DATA (M1, M3 E M14) L ABC (ˆr 1, ˆr ) = 1, 9 10 53 L ACB (ˆr 3, ˆr ) = 4, 73 10 89 L BAC (ˆr 1, ˆr 3 ) = 6, 789 10 73 MAPMAKER/EXP Ordem ABC ACB BAC LOD log 10 1,9 10 53 1,9 10 53 = 0 log 10 4,73 10 89 = 35, 61 1,9 10 53 6,789 10 log 73 10 = 19, 45 1,9 10 53

O PROBLEMA DO CAIXEIRO VIAJANTE Problema: Deve visitar n cidades. Qual a rota mais curta? Solução: somar o caminho total percorrido e escolher a menor rota

O PROBLEMA DO CAIXEIRO VIAJANTE Problema: Deve visitar n cidades. Qual a rota mais curta? Solução: somar o caminho total percorrido e escolher a menor rota

PROBLEMA DO CAIXEIRO VIAJANTE Problema: Com aumento do número de cidades, o processo torna-se inviável, mesmo com supercomputadores EXEMPLO Computador que faz 1 bilhão de somas por segundo Locos Ordens Tempos 5 5!/ Insignificante 10 1.814.400 0,016 seg 15 653.837.184.000,547 horas 0 1, 165 10 18 73,4 anos 5 7, 7556 10 4 5.898.373.01,7 anos

PROBLEMA DO CAIXEIRO VIAJANTE Problema: Com aumento do número de cidades, o processo torna-se inviável, mesmo com supercomputadores EXEMPLO Computador que faz 1 bilhão de somas por segundo Locos Ordens Tempos 5 5!/ Insignificante 10 1.814.400 0,016 seg 15 653.837.184.000,547 horas 0 1, 165 10 18 73,4 anos 5 7, 7556 10 4 5.898.373.01,7 anos

ALGORITMOS ALTERNATIVOS 1 Comando TRY Ordena sub-ordem exaustivamente, e depois testa posição dos marcadores remanescentes, um a um Comando ORDER Idem, mas de forma automática (cuidado!) 3 Comando RIPPLE Verifica possíveis inversões entre marcadores próximos 4 Seriation 5 Rapid Chain Delineation 6 Branch and Bound 7 Simulated Annealing 8...

ALGORITMOS ALTERNATIVOS 1 Comando TRY Ordena sub-ordem exaustivamente, e depois testa posição dos marcadores remanescentes, um a um Comando ORDER Idem, mas de forma automática (cuidado!) 3 Comando RIPPLE Verifica possíveis inversões entre marcadores próximos 4 Seriation 5 Rapid Chain Delineation 6 Branch and Bound 7 Simulated Annealing 8...

ALGORITMOS ALTERNATIVOS 1 Comando TRY Ordena sub-ordem exaustivamente, e depois testa posição dos marcadores remanescentes, um a um Comando ORDER Idem, mas de forma automática (cuidado!) 3 Comando RIPPLE Verifica possíveis inversões entre marcadores próximos 4 Seriation 5 Rapid Chain Delineation 6 Branch and Bound 7 Simulated Annealing 8...

ALGORITMOS ALTERNATIVOS 1 Comando TRY Ordena sub-ordem exaustivamente, e depois testa posição dos marcadores remanescentes, um a um Comando ORDER Idem, mas de forma automática (cuidado!) 3 Comando RIPPLE Verifica possíveis inversões entre marcadores próximos 4 Seriation 5 Rapid Chain Delineation 6 Branch and Bound 7 Simulated Annealing 8...

ALGORITMOS ALTERNATIVOS 1 Comando TRY Ordena sub-ordem exaustivamente, e depois testa posição dos marcadores remanescentes, um a um Comando ORDER Idem, mas de forma automática (cuidado!) 3 Comando RIPPLE Verifica possíveis inversões entre marcadores próximos 4 Seriation 5 Rapid Chain Delineation 6 Branch and Bound 7 Simulated Annealing 8...

ALGORITMOS ALTERNATIVOS 1 Comando TRY Ordena sub-ordem exaustivamente, e depois testa posição dos marcadores remanescentes, um a um Comando ORDER Idem, mas de forma automática (cuidado!) 3 Comando RIPPLE Verifica possíveis inversões entre marcadores próximos 4 Seriation 5 Rapid Chain Delineation 6 Branch and Bound 7 Simulated Annealing 8...

ALGORITMOS ALTERNATIVOS 1 Comando TRY Ordena sub-ordem exaustivamente, e depois testa posição dos marcadores remanescentes, um a um Comando ORDER Idem, mas de forma automática (cuidado!) 3 Comando RIPPLE Verifica possíveis inversões entre marcadores próximos 4 Seriation 5 Rapid Chain Delineation 6 Branch and Bound 7 Simulated Annealing 8...

RAPID CHAIN DELINEATION (DOERGE E WEIR, 1996) A partir da matriz de frações de recombinação: 1 Inicie o primeiro grupo de ligação com o par de marcas com o menor ˆr O grupo de ligação é estendido com a adição de marcas remanescentes. Os terminais do grupo de ligação são candidatos à extensão da cadeia. As marcas com os menores ˆr são adicionadas uma a uma (somente ligações significativas). 3 Repetir o passo até que nenhum marcador possa ser adicionado à cadeia. 4 Iniciar o passo 1, com a obtenção de outra cadeia. Repetir os passos e 3. 5 Encerrar o processo quando não restarem marcas remanescentes, ou quando as restantes não estiverem significativamente ligadas a nenhuma outra.

RAPID CHAIN DELINEATION (DOERGE E WEIR, 1996) A partir da matriz de frações de recombinação: 1 Inicie o primeiro grupo de ligação com o par de marcas com o menor ˆr O grupo de ligação é estendido com a adição de marcas remanescentes. Os terminais do grupo de ligação são candidatos à extensão da cadeia. As marcas com os menores ˆr são adicionadas uma a uma (somente ligações significativas). 3 Repetir o passo até que nenhum marcador possa ser adicionado à cadeia. 4 Iniciar o passo 1, com a obtenção de outra cadeia. Repetir os passos e 3. 5 Encerrar o processo quando não restarem marcas remanescentes, ou quando as restantes não estiverem significativamente ligadas a nenhuma outra.

RAPID CHAIN DELINEATION (DOERGE E WEIR, 1996) A partir da matriz de frações de recombinação: 1 Inicie o primeiro grupo de ligação com o par de marcas com o menor ˆr O grupo de ligação é estendido com a adição de marcas remanescentes. Os terminais do grupo de ligação são candidatos à extensão da cadeia. As marcas com os menores ˆr são adicionadas uma a uma (somente ligações significativas). 3 Repetir o passo até que nenhum marcador possa ser adicionado à cadeia. 4 Iniciar o passo 1, com a obtenção de outra cadeia. Repetir os passos e 3. 5 Encerrar o processo quando não restarem marcas remanescentes, ou quando as restantes não estiverem significativamente ligadas a nenhuma outra.

RAPID CHAIN DELINEATION (DOERGE E WEIR, 1996) A partir da matriz de frações de recombinação: 1 Inicie o primeiro grupo de ligação com o par de marcas com o menor ˆr O grupo de ligação é estendido com a adição de marcas remanescentes. Os terminais do grupo de ligação são candidatos à extensão da cadeia. As marcas com os menores ˆr são adicionadas uma a uma (somente ligações significativas). 3 Repetir o passo até que nenhum marcador possa ser adicionado à cadeia. 4 Iniciar o passo 1, com a obtenção de outra cadeia. Repetir os passos e 3. 5 Encerrar o processo quando não restarem marcas remanescentes, ou quando as restantes não estiverem significativamente ligadas a nenhuma outra.

RAPID CHAIN DELINEATION (DOERGE E WEIR, 1996) A partir da matriz de frações de recombinação: 1 Inicie o primeiro grupo de ligação com o par de marcas com o menor ˆr O grupo de ligação é estendido com a adição de marcas remanescentes. Os terminais do grupo de ligação são candidatos à extensão da cadeia. As marcas com os menores ˆr são adicionadas uma a uma (somente ligações significativas). 3 Repetir o passo até que nenhum marcador possa ser adicionado à cadeia. 4 Iniciar o passo 1, com a obtenção de outra cadeia. Repetir os passos e 3. 5 Encerrar o processo quando não restarem marcas remanescentes, ou quando as restantes não estiverem significativamente ligadas a nenhuma outra.

RAPID CHAIN DELINEATION EXEMPLO Com base na matriz abaixo, ordene os marcadores usando o RCD m 1 m m 3 m 4 m 1 0, 030 0, 035 0, 04 m 0, 100 0, 15 m 3 0, 30 m 4

RAPID CHAIN DELINEATION EXEMPLO Com base na matriz abaixo, ordene os marcadores usando o RCD m 1 m m 3 m 4 m 1 0, 030 0, 035 0, 04 m 0, 100 0, 15 m 3 0, 30 m 4 Resp: m3 m1 m m4

ANÁLISE DE DADOS EXEMPLO Uso do R para construção de mapas