Universidade Federal de Minas Gerais Escola de Veterinária

Tamanho: px
Começar a partir da página:

Download "Universidade Federal de Minas Gerais Escola de Veterinária"

Transcrição

1 Universidade Federal de Minas Gerais Escola de Veterinária Busca or estruturas causais fenotíicas com a utilização de informações genômicas Rahael Rocha Wenceslau 04

2

3 Rahael Rocha Wenceslau Busca or estruturas causais fenotíicas com a utilização de informações genômicas Tese aresentada ao Programa de Pós- Graduação em Zootecnia da Escola de Veterinária da Universidade Federal de Minas Gerais como requisito arcial ara obtenção do grau de Doutor em Zootecnia Área de Concentração: Genética e Melhoramento Animal Prof. Orientador: Martinho de Almeida e Silva Belo Horizonte 04

4

5 Prof. Martinho de Almeida e Silva (Orientador) Prof. Aldrin Vieira Pires Prof. Idalmo Garcia Pereira Prof. José Aurélio Garcia Bergmann Prof. Robledo de Almeida Torres

6

7 À minha família, Dedico. There are more things in heaven and earth, Horatio, Than are dreamt of in your hilosohy. William Shakeseare. Hamlet. Act, scene 5, Hamlet to Horatio.

8

9 Obrigado, a Deus, à minha família, à Vivian Paula Silva Felie, ao Professor Martinho de Almeida e Silva, ao Professor Guilherme Jordão Magalhães Rosa, ao Professor Fabyano Fonseca e Silva, ao Bruno Dourado Valente, aos Professores Robledo de Almeida Torres, José Aurélio Garcia Bergman, Idalmo Garcia Pereira e Aldrin Vieira Pires, aos demais Professores da Escola de Veterinária da Universidade Federal de Minas Gerais, aos funcionários da Escola de Veterinária da Universidade Federal de Minas Gerais, aos colegas da Escola de Veterinária da Universidade Federal de Minas Gerais, aos meus amigos, à Universidade Federal de Minas Gerais, à University of Wisconsin Madison, à CAPES, CNPq e FAPEMIG. Muito obrigado a todos elos ensinamentos e aoio.

10

11 SUMÁRIO INTRODUÇÃO... CAPÍTULO REVISÃO DE LITERATURA REVISÃO DE LITERATURA... 3 REFERÊNCIAS BIBLIOGRÁFICAS... 5 ANEXOS CAPÍTULO BUSCA POR REDES CAUSAIS FENOTÍPICAS COM A UTILIZAÇÃO DE INFORMAÇÕES GENÔMICAS APLICADA À PRODUÇÃO ANIMAL RESUMO INTRODUÇÃO... 6 MATERIAL E MÉTODOS RESULTADOS E DISCUSSÃO CONCLUSÕES REFERÊNCIAS BIBLIOGRÁFICAS ANEXOS LISTA DE TABELAS TABELA CAPÍTULO Estatística dos coeficientes de arentesco estimados usando informações de edigree e de marcadores moleculares do tio SNP CAPÍTULO TABELA Coeficientes médios de arentesco de Wright e genômicos, endogamia média, e correlação entre elementos da matriz A e G obtidos de uma reetição de simulação escolhida ao acaso ara cada uma das três situações de simulação realizadas TABELA Avaliações realizadas e número de informações consideradas... 7 TABELA 3 Resultados do segundo asso do algoritmo IC na busca ela estrutura causal simulada utilizando a matriz de arentesco tradicional e genômica ara as 0 reetições realizadas... 8

12 LISTA DE FIGURAS CAPÍTULO FIGURA Exemlo de estrutura causal... 8 FIGURA Exemlo de uma estrutura causal entre cinco características fenotíicas e seus efeitos aditivos genéticos (u s) e residuais (e s) corresondentes... FIGURA 3 Estruturas causais ara três variáveis observadas, com resíduos indeendentes e efeitos genéticos aditivos correlacionados... 6 FIGURA 4 Estruturas recueradas elo algoritmo IC no trabalho de Valente et al. (00)... 8 FIGURA 5 Relação dos coeficientes de arentesco tradicionais e genômicos (Wolc et al., 0) CAPÍTULO FIGURA Freqüência alélica nas quatro últimas gerações de indivíduos de uma reetição de simulação tomada aleatoriamente ara cada uma das três estruturas oulacionais estudadas FIGURA Diagrama do modelo do qual os dados simulados foram obtidos FIGURA 3 Gráfico acíclico direcionado que reresenta a estrutura causal simulada entre as características e que se esera obter aós utilização do algoritmo IC FIGURA 4 Gráfico acíclico semi direcionado obtido aós o segundo asso do algoritmo IC que deve ser observado caso a estrutura causal correta sea recuerada FIGURA 5 Estruturas causais estatisticamente equivalentes resultantes do terceiro asso do algoritmo IC FIGURA 6 Estruturas causais obtidas mais observadas aós o segundo asso do algoritmo IC entre as dez reetições de cada situação... 79

13 INTRODUÇÃO A tentativa de conhecer a relação causal entre eventos subsequentes é deseo básico nas diversas áreas de conhecimento, assim como, nas tarefas cotidianas do ser humano. Frequentemente utiliza-se a exressão or quê ou e se tentando se referir à relação de causa de eventos ocorridos ou que aconteceriam caso houvesse intervenção externa no sistema de variáveis observadas. Na área da rodução animal, o conhecimento da estrutura causal existente entre os fenótios de características economicamente imortantes ossui imlicação direta na decisão da melhor maneira de agir e fazer intervenções diante de determinado sistema de rodução. Ainda nessa linha de raciocínio, ode-se imaginar um sistema de rodução de bovinocultura, de corte ou leite, em que características de rerodução, como a idade ao rimeiro arto ou o intervalo de artos aresentem grande valor econômico e relação causal com outras características de rodução, como, or exemlo, quilogramas de leite roduzidos ao longo da vida do animal ou a quantidade de quilogramas de carne roduzida. Práticas comuns no maneo rerodutivo, como a inseminação artificial ou a transferência de embriões são intervenções no sistema que odem fazer os valores fenotíicos das características rerodutivas se modificarem e, assim, causar mudanças indiretas, também, nas características de rodução. Caso a estrutura e a magnitude das relações de causa entre os fenótios seam conhecidas, as mudanças indiretas geradas nas características em virtude de ráticas, como as descritas anteriormente, odem ser revistas. Também, na área de melhoramento animal, o valor genético de um animal oderia ser redito diante dos dois sistemas distintos, com ou sem intervenção, mesmo antes da mesma ser raticada. Fato imortante, ois, ode haver diferenças significativas no ordenamento dos animais a serem selecionados ara rerodução de acordo com o sistema de rodução. Para obtenção da rede de relações causais entre características algumas metodologias foram desenvolvidas, dentre elas, o algoritmo Inductive Causation IC (Verma e Pearl, 990) cua utilização na área de rodução animal foi roosta or Valente et al. (00). Para a alicação do algoritmo é necessário obter a matriz de variância residual que é acessada a artir do auste de modelos mistos conhecidos no melhoramento animal. Nesse, a matriz de arentesco dos coeficientes de Wright (matriz A) é utilizada nas equações de resolução do modelo. Essa matriz exressa a semelhança genética entre os animais incluídos na avaliação, ou sea, mede a covariância entre as observações dos animais a artir do cálculo de uma semelhança genética eserada. Porém, uma vez que informações moleculares do tio SNP (Single

14 Nucleotide Polymorhism) esteam disoníveis, oderia ser formada uma matriz de arentesco realizada (matriz G), que demonstraria o verdadeiro comartilhamento genético entre os animais. A utilização dessa nova matriz oderia ser feita com o intuito de gerar informação mais segura e comleta ao modelo utilizado, uma vez que á contaria os efeitos da segregação indeendente dos alelos, além de evitar desvios atribuídos a erros de anotação de edigree. Diante das informações exostas até então, o resente trabalho roôs a extensão do estudo de Valente et al. (00), or meio da adição das informações genômicas afim de se obter melhores resultados na busca da estrutura causal existente entre fenótios. No rimeiro caítulo serão discutidos, em forma de revisão bibliográfica, assuntos imortantes relativos às metodologias utilizadas ao longo do trabalho, dentre eles: o Modelo de Equações Estruturais, o Algoritmo Inductive Causation, a formação e utilização da matriz de relacionamento genético genômico. Já, no segundo caítulo da tese será relatada a esquisa científica roriamente dita, com material e métodos, discussão dos resultados observados e conclusões.

15 3 CAPÍTULO REVISÃO DE LITERATURA. Inferência causal: modelos de equações estruturais, algoritmo IC e alicação na ciência animal Uma tarefa comum do homem é tentar encontrar uma exlicação coerente e satisfatória ara determinado conunto de observações, assim como roor relação entre elas. Essa relação ode ser descrita basicamente com duas diferentes visões, como medida de associação entre as variáveis ou com a existência de relação de causa-efeito entre elas. Hume, citado or Gillies (00), define causa como a ação existente de um obeto seguido or outro, em que caso sea encontrado um obeto similar ao rimeiro, ele deve estar seguido de um obeto similar ao segundo. O autor, ortanto, sugere que causa é uma relação de determinação. Outros conceitos de causa surgem, como, a causa não determinante, em que é ossível haver a associação de causa e efeito e que o rimeiro obeto sea causa de um segundo, mas não é necessária a resença do segundo obeto caso o rimeiro ocorra, invocando, ortanto, a resença de uma robabilidade de ocorrência, que ode ser vista como uma influência ou roensão. Sirtes et al. (000) define causa como sendo uma relação entre eventos articulares: alguma coisa acontece e causa alguma outra coisa a acontecer. Cada causa é um evento articular e cada efeito é um evento articular. Um evento A ode ter mais de uma causa, sendo nenhuma delas suficientes ara causar A e ode ser sobre determinado, ou sea, ter mais de uma causa suficiente ara que ele ossa ocorrer. Abandonada a teoria conceitual, tem-se na ordem rática, de modo geral, o conhecimento de causa com duas imortantes funções: ) ermitir rever resultados com base em observações; ) fornecer a caacidade de controle de eventos (Blaisdell et al., 006). Em estudos emíricos, a intenção fundamental é redizer efeitos de mudanças, sendo essas mudanças ocorridas de forma natural ou imostas deliberadamente. Na ciência animal, assim como em outras áreas de conhecimento e discilinas, o obetivo central dos estudos geralmente se refere à inferência dos efeitos causais. Por exemlo, esquisadores ligados à nutrição, rerodução e imunologia animal estudam fatores que têm efeito sobre a rodução

16 4 dos indivíduos, como, o nível nutricional da dieta sobre o eso de suínos, o eríodo luminoso sobre a maturidade sexual de aves e a qualidade de água sobre a incidência de doenças em eixes (Rosa e Valente, 0). Uma maneira de inferir efeitos de causa entre variáveis são os exerimentos aleatorizados. Esses exerimentos tentam controlar, or meio da casualização, todas as fontes de causa que não seam o obeto de estudo or meio de casualização das unidades exerimentais (animais, no caso da ciência animal) dentro dos gruos exerimentais e distribuição também ao acaso dos tratamentos ara esses gruos. Tais exerimentos controlados são ferramenta oderosa ara estudo de causalidade, ermite saber a existência de efeitos de tratamentos, assim como a magnitude desses efeitos (Rosa e Valente, 0). Porém, algumas críticas ainda são feitas na caacidade de se buscarem relações causais or meio de exerimentos. A rimeira seria com relação à caacidade de controle total de variáveis causais externas ao sistema de estudo. Por exemlo, imagine que o esquisador estaria interessado no fato de que inalar fumaça de cigarro causa câncer nos ulmões. Para demonstrar tal fato, foi realizado um exerimento inteiramente ao acaso, em que algumas essoas foram amostradas ao acaso ara fumar e outras ara não entrar em contato com o cigarro. Imagine agora que o esquisador não conhece que existe a resença de uma substância cancerígena no ael que embala o cigarro. Nesse caso, o ato de fumar e o câncer seriam estatisticamente deendentes, mesmo que inalar fumaça de cigarro sabidamente não cause câncer. Eles seriam deendentes orque existe um fator em comum entre eles. Dificilmente não existirá variável que foge do controle exerimental (Sirtes et al., 000). Em outras ocasiões, os exerimentos inteiramente ao acaso não são viáveis, or exemlo, em razão de imedimentos legais, éticos ou logísticos. Às vezes, também, os exerimentos devem ser realizados em condições extremamente esecíficas, o que dificulta a extraolação dos resultados ara condições reais (Rosa e Valente, 0). Uma alternativa aos dados exerimentais seria a utilização de dados observacionais. Na área de estudo da veterinária e zootecnia, esses dados são coletados rotineiramente a camo e reresentam imortante fonte de informação que odem ser usadas ara inferência causal entre características. Os resultados obtidos oderiam servir ara conhecimento dos efeitos causados or alteração no ambiente de criação, como or exemlo, mudança no maneo nutricional dos animais.

17 5 Aesar de não muito conhecidas, á existem ferramentas disoníveis ara estudo das relações causais entre variáveis com base em dados observacionais. Será descrito, a seguir, um algoritmo de busca de estruturas causais entre fenótios, a alicação de uma metodologia que torna ossível a medida de força da relação de causa entre variáveis, além de exemlos de utilização desses modelos na ciência animal. Antes de revisar algumas metodologias ara descrever relações de causas entre variáveis, haverá a tentativa de elucidar o significado de arâmetros usados frequentemente na área de estatística em contraste com a noção de causalidade.. Medidas de associações e causalidade Correlações são utilizadas ara descrever associação estatística entre duas variáveis. Podem ser obtidas, or exemlo, na área de melhoramento animal, or meio de modelos multicaracterísticas tradicionais na avaliação genética dos animais. O conhecimento considerando a associação entre variáveis é certamente imortante, e ode ser usado ara inferir quão rováveis são determinados eventos. No entanto, essa informação não é suficiente ara redizer como as robabilidades irão mudar como resultado de intervenções externas. Portanto, ara elucidar relações causais as correlações são de utilidade limitada. Isso é atribuído ao fato que correlações não somente confundem associações diretas e indiretas, mas também não são caazes de distinguir variáveis e covariáveis, e então, causa e efeito (Ogen- Rhein e Strimmer, 006). Segundo Rosa e Valente (0), um rovérbio conhecido na comunidade estatística é: correlation does not imly causation, traduzindo, correlação não imlica causalidade. A frase enfatiza o argumento de que o conhecimento da correlação entre duas variáveis não é suficiente ara descrever uma relação de causas entre elas. Diferentes tios de associações causais odem ser fontes de correlação entre duas variáveis, x e y. Por exemlo, uma correlação oderia surgir a artir do efeito causal de x em y, reresentado como x y, ou or um efeito causal de y em x, reresentado or x y, ou até como o efeito de outra variável, z, afetando x e y (x z y). Uma correlação observada entre x e y ode ser exlicada or esses três otenciais efeitos causais, ou sea, nenhuma das três hióteses ode ser confirmada simlesmente or meio do conhecimento da correlação entre as variáveis. Como visto o conhecimento de associação estatística isoladamente oferece ouca auda no laneamento de ráticas de maneo e na redição de efeitos de intervenções externas no sistema de rodução

18 6 animal. Considerando-se esta questão, ode-se dizer que existe muito mais a arender de observações do que simlesmente correlações e covariâncias entre variáveis. Portanto, obter valores que traduzem as relações causais é necessário (Pearl, 009).. Inferindo efeitos causais de dados observacionais A missão de se inferirem efeitos causais a artir de dados observacionais é semre muito desafiadora e olêmica. Uma das razões ara isso é que exige remissas adicionais comarada às inferências estatísticas tradicionais que não incororam significado causal. Entretanto, as informações oriundas desses dois tios de inferência são bem diferentes e não odem ser comaradas. Estatísticas tradicionais essencialmente descrevem a lausibilidade de determinado evento ocorrer, esse evento ode ser multivariado. Por outro lado, a informação causal ermite a descrição de como o valor de uma variável é influenciado elo valor de outras variáveis. A alicação rática disso é que também é ossível a redição de intervenções externas físicas na estrutura de relacionamento causal, o que ode ser muito útil no maneo de animais de rodução. Tal redição não é ossível de ser obtida de uma distribuição conunta desse mesmo conunto de variáveis (Sirtes et al., 000; Pearl et al., 009; Rosa e Valente, 0). Diferentes modelos como Redes Bayesianas (Bayesian Networks, BN) e o modelo de equações estruturais (Structural Equation Model, SEM) odem ser usados ara exressar relacionamentos causais entre diversas variáveis. O auste desses modelos ermite que sea feita a inferência de efeitos de causa a artir de dados observacionais e condicionais a uma estrutura conhecida a riori. A interretação causal derivada do auste de um modelo como, SEM ou BN, deende não aenas de remissas estatísticas, mas também de remissas causais. Por exemlo, inferências obtidas com o auste de BN assumem que a estrutura causal entre as variáveis é acíclica e que todas as variáveis que ossuem efeito causal em duas ou mais variáveis contidas em BN estão reresentadas em BN. Premissas idênticas odem ser alicadas em SEM e odem ser traduzidas como o uso de estruturas causais acíclicas e construção de uma matriz de covariância residual diagonal, o que é suficiente ara garantir que qualquer relação de recursividade resente sea identificável. No entanto, essa remissa não é obrigatória ara auste do modelo de equações estruturais, que ode reresentar relações simultâneas (de feedback) e considerar associações causadas or variáveis escondidas (hidden). No entanto, a identificabilidade do modelo não é garantida e deve ser verificada se essas características forem ermitidas (Gianola e Sorensen, 004). Em geral, a utilização de um desses modelos ara fazer inferências a reseito de relações de causa exige imortantes

19 7 remissas, como á citadas, esecialmente considerar que associações entre variáveis mensuradas não são confundidas ela existência de variáveis desconhecidas que aresentam efeitos causais em duas ou mais outras variáveis contidas no sistema. Alternativamente, assume-se elo menos que as trilhas (aths) que confundem a inferência causal e que estão escondidas são arcialmente conhecidas e que sea ossível a mensuração das variáveis dessas trilhas. Uma crítica à inferência causal baseada em dados observacionais é que não é ossível estar totalmente confiante de que não há fontes de confudimento ou que todas essas fontes estão controladas. Aesar de a crítica ser razoável, não significa que a busca or conhecimento mais arofundado da relação entre variáveis deve ser abandonada. Existem vários graus de conhecimento ou grau de confiança entre a absoluta certeza sobre a relação ou a absoluta ignorância. Além disso, métodos uramente estatísticos, como a realização de exerimentos inteiramente ao acaso, às vezes, não são alternativas, e, no mínimo, estudos com dados observacionais oderiam elucidar alguns asectos da relação entre variáveis (Rosa e Valente, 0)..3 Modelos de equações estruturais Os modelos multivariados ossuem grande imortância na genética alicada, evolucionária e quantitativa. No melhoramento animal, o relacionamento entre característica normalmente é estudado or meio do auste de modelos multicaracterísticas, estimando, or exemlo, arâmetros de covariância e correlação. Convencionalmente, a correlação genética é definida como a roorção da variância que duas características dividem em razão de causas genéticas, e isso indica o quanto que a influência genética em duas características é comum às duas. O conhecimento da correlação genética ode ser usado ara decisões de seleção e maximizar o ganho genético de rogramas de melhoramento (Rosa et al., 0). Uma alternativa ao tradicional modelo multicaracterísticas é o Modelo de Equações Estruturais (SEM), que ode ser alicado ara o estudo de relacionamentos entre fenótios dos tios recursivos ou simultâneos em sistema multivariados. A modelagem or estruturas causais foi desenvolvida rimeiramente or Wright (9) e Haavelmo (943) de forma que informações qualitativas de causa-efeito udessem ser combinadas com rocedimentos estatísticos ara rover medida quantitativa das relações causa-efeito entre variáveis de interesse. De acordo com os autores, a condição que faz a equação de regressão y =βx + e ser

20 8 estrutural, é que recisamente a conexão causal entre x e y é dada or β. Este último define a sensibilidade de E(y) às maniulações exerimentais de x (Pearl, 009). O modelo de equações estruturais roorciona técnica estatística ara estimar e testar relacionamentos funcionais entre características que não são reveladas elos modelos lineares adrões. Quando se austa o SEM ara um conunto de variáveis é necessário que se defina a riori ara cada variável o subconunto de variáveis remanescentes que ossuem efeito causal nele. Essa informação é chamada estrutura causal e ode ser reresentada or um gráfico direcionado em que as variáveis constituem vértices e as relações causais são reresentadas como linhas direcionadas (setas) entre os vértices. Por exemlo, considere o gráfico na Figura adatado de Rosa et al. (0). Figura. Exemlo de estrutura causal, em que y s reresentam medidas de três características fenotíicas, x s e e s reresentam variáveis exlanatórias conhecidas e fatores residuais que influem y s, resectivamente. O gráfico da Figura ode ser reresentado or um conunto de equações estruturais, dado or: y, =βx + e y, =λ y +β x + e y, 3 =λ3 y +λ3 y +β3x3 + e3 em que os β s são os arâmetros do modelos que reresentam os efeitos fixos das covariáveis x s em y s, e λ s são os coeficientes estruturais reresentando a magnitude dos efeitos causais entre y s. Em notação matricial o modelo de equação estrutural ode ser reresentado como, y =Λy + xβ + e, em que Λ é uma matriz quadrada com zeros na diagonal e com coeficientes estruturais λ ou zeros nos elementos fora da diagonal. y, x, β e e são vetores ou matrizes de observações, variáveis exógenas, arâmetros do modelo e resíduo, resectivamente. As equações demonstradas odem ser interretadas de forma que o lado esquerdo é determinado como uma função, geralmente linear, das variáveis do lado

21 9 direito. Além disso, o sinal de igualdade reresenta uma relação assimétrica definida como é determinado or, que difere do conceito adrão de igualdade (Gianola e Sorensen, 004; Pearl, 009; Rosa et al., 0; Rosa e Valente, 0)..4 SEM utilizado dentro do modelo misto em genética quantitativa O modelo de equações estruturais recebeu ouca atenção na genética quantitativa até recentemente. No entanto, vários sistemas biológicos oderiam ser estudados mais aroriadamente com o SEM do que os modelos lineares tradicionais. Por exemlo, animais com alta rodução de leite aresentam maior redisosição à incidência de doenças do úbere e, em contraartida, a resença de doenças tem efeito sobre a rodução de leite (Wu et al., 00). Gianola e Sorensen (004) aresentaram um modelo misto linear que ermite relações recursivas e de simultaneidade entre fenótios envolvidos em um sistema multivariado assumindo herança genética aditiva. Nesse modelo, uma ou mais variáveis aarecem como variáveis exlanatórias nas equações ara outras variáveis resostas. Eles demonstraram que os arâmetros estruturais que definem os sistemas recursivos e simultâneos têm consequência na interretação dos arâmetros genéticos. Desde que o trabalho foi ublicado, o interesse no modelo de equações estruturais têm aumentado, sendo alicado em estudos de diferentes esécies e características. Um modelo com uma esecífica estrutura causal e efeitos genéticos aditivos aleatórios ode ser escrito como: y =Λy + X β + u + e, i i i i em que y i é o vetor (t x ) de dados fenotíicos ara o obeto i; Λ é a matriz de coeficientes estruturais descrevendo a estrutura causal escolhida; X i β reresenta os efeitos das variáveis exógenas como regressões lineares, em que a matriz vetor dos coeficientes de regressão fixos. X i contém as covariáveis e β é um u i e e i são vetores (t x ) de efeitos genéticos aditivos e resíduos do modelo, resectivamente, que são ambos associados ao obeto i e são distribuídos, como, ui 0 G ~ N, ei , em que G Ψ 0 eψ 0 são as matrizes de 0

22 0 covariâncias genéticas aditivas e de resíduo, resectivamente. O modelo ara n animais ode ser, então, descrito como y = (Λ I n )y + Xβ + Zu + e, com u 0 G0 A 0 ~ N,, e 0 0 Ψ0 I n em que y, u e e são vetores de observações, efeitos genéticos aditivos e resíduos do modelo ordenados or característica e indivíduo dentro de característica, enquanto X e Z são matrizes de incidência dos efeitos β e u no vetor y. Esse modelo ode ser reescrito como [I tn (Λ I n )]y = Xβ + Zu + e, então um modelo equivalente reduzido ode ser obtido, ainda de acordo com Gianola e Sorensen (004), como, y = [I tn Λ I )] Xβ + [I Λ I )] Zu + [I Λ I )] e. n tn n A distribuição amostral resultada ara y dado os arâmetros de local e a matriz de covariância residual é: (y Λ, β,u,ψ tn { [I Λ I )] (Xβ + Zu),[I Λ I )] Ψ [I Λ I )]' } o ) ~ N tn n tn n o tn n, em que Ψ =Ψ o I n. Observa-se que no modelo reduzido, o sistema é resolvido ara as variáveis resosta. Assim, os arâmetros de local e disersão são transformados em arâmetros de um modelo multicaracterísticas adrão: y = (I em que, t Λ) X β +(I Λ) u +(I Λ) e =µ +u + e, i t i t i i µ i = (I t Λ) X iβ, ui = (I t Λ) ui e ei = (I t Λ) ei. µ i, u i e i i n e i são resectivamente vetores de efeitos fixos, efeitos genéticos aditivos e resíduos de um modelo que não considera elos funcionais entre as variáveis resostas. Adicionalmente, ode-se reresentar a distribuição conunta dos efeitos aleatórios do modelo multicaracterística adrão como: * * u 0 G i 0 ~ N *, e 0 0 i 0 *, com G R0 0 = (I t Λ) G0(I t Λ)' e R 0 = (I t Λ) Ψ 0 (I t Λ)'. Desta forma, SEM s odem ser descritos como rearametrizações do modelo multicaracterísticas simles. As duas formas aresentadas são equivalentes, uma vez que geram a mesma distribuição ara as variáveis resostas. Aesar de o modelo multicaracterísticas ser ustamente identificável, de forma que mudanças nos valores aramétricos resultem em mudança na distribuição conunta de y, o SEM carrega arâmetros extras em Λ, resultando em não identificabilidade da função de verossimilhança (Rosa et al., 0). É ossível, no entanto, fazer restrições no modelo ara ativar a identificabilidade dos arâmetros. Duas rinciais estratégias odem ser utilizadas: Formar

23 combinações lineares de arâmetros em uma mesma equação ou entre equações, ou fazer restrição à matriz de covariância residual, assumindo, or exemlo, que a matriz de covariância residual Ψ 0 sea zero (Wu et al., 00). Parâmetros de locação como efeitos genéticos aditivos e arâmetros de disersão como comonentes de variância e covariância genética são considerados tanto no modelo de equações estruturais quanto no modelo multicaracterísticas. Aesar da equivalência aresentada entre o modelo multicaracterísticas e o SEM totalmente recursivo (em que todas as entradas abaixo da diagonal ara Λ são definidas como arâmetros livres) deve-se tomar cuidado com as interretações desses arâmetros que se modificam de acordo com o modelo. Para exemlificar, considere um modelo recursivo em que A tem efeito causal em B. Sob modelo recursivo, a correlação genética reresenta a associação linear entre dois efeitos genéticos aditivos não observáveis, cada um influindo diretamente uma característica esecífica. Porém, esta não seria a única fonte de correlação genética caso o modelo multicaracterísticas fosse utilizado, uma vez que existe no modelo amostral utilizado uma associação indireta entre o efeito genético de A e o fenótio de B, mediada elo fenótio de A (o efeito genético de A ossui efeito sobre o fenótio de A, que or sua vez aresenta efeito causal sobre o fenótio de B). A correlação genética sob o modelo recursivo não considera esse efeito. Ao contrário, o modelo multicaracterísticas considera toda a associação de origem genética, sea ela indireta ou direta. Em razão deste fato, torna-se ossível que a correlação genética sea diferente de zero mesmo que os valores genéticos aditivos seam indeendentes no contexto recursivo. Adicionalmente, observa-se que o efeito genético aditivo de A, oderia ser considerado fonte de influência aenas da característica A, se o coeficiente estrutural fosse igual a zero (Gianola e Sorensen, 004). λ BA

24 Figura. Exemlo de uma estrutura causal entre cinco características fenotíicas e seus efeitos aditivos genéticos (u s) e residuais (e s) corresondentes. Os modelos de equações estruturais têm sido utilizados ara estudar relações simultâneas e recursivas entre fenótios em várias esécies e raças. Nos rimeiros trabalhos utilizando dados reais e SEM, de los Camos et al. (006a) e de los Camos et al. (006b) estudaram efeitos simultâneos e recursivos entre a rodução de leite e escores de células somáticas em vacas e cabras usando o modelo rerodutor. Os arâmetros foram estimados or meio de máxima verossimilhança e os modelos comarados or meio do critério BIC. Os resultados indicaram um efeito recursivo do escore sobre a rodução de leite, com evidência de que a associação negativa entre rodução de leite e saúde do úbere é mais rovável de ser atribuida ao efeito da infecção sobre a rodução de leite do que na direção contrária. Além desse resultado, os autores observaram relações simultâneas do efeito de escore de células somáticas entre as duas metades do úbere, esquerda e direita. Asecto que indica que a infecção não é restrita a somente um lado do úbere. Wu et al. (007) estenderam o modelo de Gianola e Sorensen (004) ara contabilizar relações heterogêneas entre rodução de leite e escore de células somáticas ara vacas de alta e baixa rodução. Diferentes efeitos recursivos e simultâneos foram austados ara as duas sub-oulações. Os resultados observados confirmaram efeito negativo direto do escore de células somáticas sobre a rodução de leite e equenos efeitos recírocos na direção oosta. Ainda, foi relatada diferença entre essas relações ara os dois gruos estudados. Os efeitos da saúde do úbere sobre a rodução foi maior ara as vacas com alta rodução de leite. Outro estudo utilizando SEM foi o de Varona et al. (007) que usaram um modelo recursivo ara analisar relações de causa entre o tamanho da leitegada e o eso ao nascer de leitões das raças Landrace e Yorkshire, assim como,

25 3 também, um modelo bi-característica tradicional. Eles reortaram diferenças marcantes entre as estimativas dos coeficientes estruturais entre as raças. Wu et al. (008) rouseram modelo hierárquico limiar-normal com recursividade e simultaneidade ara análise de relações entre características binárias e contínuas e utilizaram esse modelo ara estudar as características resença de mastite clínica e rodução de leite em vacas da raça Norwegian Red. Os rimeiros 80 dias de lactação foram divididos em três eríodos menores de 60 dias cada um, ara investigação do relacionamento dessas características ao longo da lactação. O modelo recursivo mostrou efeitos negativos dentro de cada eríodo da resença de mastite sobre a rodução de leite em todos os eríodos de lactação, e efeito ositivo da rodução de leite sobre a incidência de mastite clínica entre eríodos. Os resultados sugerem efeitos desfavoráveis da rodução na suscetibilidade à mastite e relações dinâmicas entre mastite e a rodução de leite ao longo da lactação..5 Busca or estruturas causais recursivas A inferência de efeitos causais entre variáveis se baseia no fato de que a estrutura causal entre elas é conhecida, ou sea, ara auste do SEM às observações que ertencem a um conunto de características, é necessário definir a riori a estrutura causal entre as variáveis estudadas. Como visto, essa estrutura ode ser vista como um gráfico direcionado ou ela simles definição de quais entradas vão ser consideradas livres na matriz Λ. A seleção da estrutura causal a ser utilizada se torna um desafio ao auste do SEM na medida em que o número de estruturas ossíveis aumenta consideravelmente quando se aumenta o número de variáveis no modelo. Desta forma a comaração exaustiva de modelos or critérios de comaração de modelos como o AIC ou o BIC é inviável. Os esquisadores até então se utilizavam de conhecimento a riori ara reduzir o número de hióteses causais a serem testadas. Essa informação a riori ode ser roveniente de situações exerimentais, conhecimento biológico das características estudadas ou até mesmo de uma sequência temoral em que os eventos ocorrem. Nos casos em que se admite que a relação entre as variáveis não sea conhecida, uma alternativa é utilizar algoritmos que ermitem exlorar esaços de estruturas causais, como SGS, PC e o IC (Verma e Pearl, 990). Metodologias como o algoritmo IC têm sido desenvolvidas ara exlorar a conexão entre estruturas causais recursivas e distribuições conuntas a fim de recuerar gráficos acíclicos direcionados (DAG) subacentes. Baseado em uma dada matriz de correlação, o algoritmo

26 4 questiona uma série de indeendências condicionais entre variáveis. Assumindo que essas indeendências refletem em d-searações (ver Anexo.) nos DAGs, o algoritmo retorna um gráfico arcialmente orientado como resultado que reresenta uma classe de estruturas causais comatíveis com as indeendências condicionais obtidas. Essa classe normalmente á é uma restrição muito grande do esaço de hióteses causais em relação ao esaço inicial (Sirtes et al., 000; Rosa et al., 0). Considerando um conunto V de variáveis aleatórias, o algoritmo IC ode ser descrito elos seguintes assos:. Para cada ar de variáveis a e b em V, rocurar or um conunto de variáveis S ab tal que a é indeendente de b dado S ab. Se a e b forem deendentes ara todos os ossíveis conuntos condicionais, conecte a e b com uma linha não direcionada. Esse asso resulta em um gráfico não-direcionado U. O obetivo aqui é obter um gráfico que esecifica variáveis adacentes que na estrutura causal subacente não são d- searadas (Anexo.), ortanto não são robabilisticamente indeendentes.. Para cada ar de variáveis não adacentes a e b com uma variável adacente c em comum em U (or exemlo, a c b), rocurar or um conunto de variáveis S ab que contém c de tal forma que a é indeendente de b dado S ab. Se não existir, então adicionar cabeça de setas em direção a c. Se o conunto existir então rossiga ara o róximo asso. O asso tem como obetivo orientar linhas com base na rocura de colliders, que são vértices nos gráficos no qual setas convergem de ambos os sentidos em uma trilha. Estruturas internas em um gráfico comostas or um collider e que sofrem influências causais de dois vértices não conectados são chamados de unshielded colliders (Sirtes, 000). Em tal estrutura, os ais são d-searado condicionalmente a elo menos um conunto de variáveis restantes no gráfico comleto, mas não se o vértice c ertence a este conunto. Condicionalmente a c, a trilha entre a e b or intermédio de c ermite o fluxo de deendência, não ocorrendo d- searação. A consequência observacional é a deendência robabilística entre ais não adacentes condicionalmente a todos os ossíveis conuntos de variáveis que contém o filho em comum. 3. No gráfico arcialmente orientado resultado, orientar o máximo de linhas ossíveis de forma que não resulte em formação de novos colliders ou em ciclos. Em adição, restrições nesse asso devem ser feitas com base em informação a riori.

27 5 As decisões sobre declarar ares de variáveis como condicionalmente deendentes ou não são baseadas em correlações arciais obtidas da amostra, que envolve algum grau de incerteza. Para considerar isso, decisões estatísticas devem ser tomadas testando hióteses de nulidade ou, na visão Bayesiana, usando intervalos de maior robabilidade ara essas correlações. O algoritmo IC é baseado na conexão entre a estrutura causal e a distribuição conunta e requer algumas remissas. Talvez a mais forte sea a de suficiência causal, ou sea, assume-se que toda variável que influencia duas ou mais variáveis dentro do conunto de variáveis estudadas á está contida no sistema. O resultado dessa remissa é a ausência de fontes de covariância residual entre as características. Como mencionado anteriormente, tal medida á é adotada nas alicações de SEM ara ermitir que o modelo sea identificável. Portanto, as remissas do algoritmo IC não são mais fortes do que a remissa do modelo de equações estruturais á utilizado (Rosa et al., 0)..6 Busca da estrutura causal no contexto de genética quantitativa Para o auste de modelos de equações estruturais vistos sem a resença de variáveis escondidas, os resíduos dos modelos são considerados indeendentes e os efeitos recursivos são utilizados ara descrever adrões de covariabilidade entre fenótios observados. No entanto, em modelos mistos, a covariância entre características odem ser atribuída à causa direta entre os fenótios ou ter origem genética, ou sea, os efeitos genéticos correlacionados odem ser fontes de confundimento na seleção da correta estrutura causal (Valente et al., 00; Rosa e Valente, 0). Na Figura 3 (adatada de Valente et al., 00) odem ser vistos cenários em que há relação de recursividade entre os fenótios, mas a conexão entre a distribuição conunta e a estrutura causal entre fenótios não ocorre em razão do confundimento causado ela associação entre os efeitos genéticos aditivos. Por exemlo, na mesma Figura, em 3a, os fenótios y e y não são marginalmente indeendentes. Nas outras figuras os mesmos fenótios não são indeendentes condicionalmente a y 3. No entanto, informações de marcadores moleculares e de arentesco odem ser utilizadas ara controlar esse confundimento.

28 6 Figura 3. Estruturas causais ara três variáveis observadas (y, y, y 3 ), com resíduos indeendentes (e, e, e 3 ) e efeitos genéticos aditivos correlacionados (u, u, u 3 ). Valente et al. (00) rouseram um método ara busca de estruturas causais acíclicas em que d-searações refletem indeendências condicionais na distribuição dos fenótios deois de considerar os efeitos genéticos aditivos. O modelo que considera os efeitos genéticos aditivos ode ser reresentado como, y = (I t Λ) X β +(I Λ) +(I Λ) i t i t matriz de covariância do vetor de observações ode ser descrita, como: Var(y )= (I Λ) i t G (I Λ)' +(I Λ) Ψ (I Λ)' 0 t t 0 t u e i, que imlica que a. Note que o rimeiro e o segundo termos do lado direito da equação corresondem, resectivamente, à matriz de covariância genética aditiva e residual obtidas de um modelo multicaracterísticas adrão que considera covariâncias genéticas e residuais entre características, mas não considera os efeitos causais entre os fenótios (Gianola e Sorensen, 004). A matriz de covariância de y i ode ser descrita como, Var(y i ui )= (I t Λ) Ψ 0(I t Λ)' = R0. Desta forma, estimativas de R 0 odem ser utilizadas ara selecionar a estrutura causal entre fenótios (Rosa et al., 00). No trabalho de Valente et al. (00) a matriz de covariância R 0 é obtida usando métodos MCMC (Markov Chain Monte Carlo), nos quais amostras são conhecidas a artir da distribuição a osteriori de R 0. As amostras são utilizadas ara obter a incerteza a reseito dessa matriz, enquanto consideram todos os outros arâmetros de um modelo multicaracterísticas reduzido. O método consiste em três estádios:

29 7 ) Austar o modelo multicaracterísticas e obter amostras da distribuição a osteriori de R 0. ) Alicar o algoritmo IC sobre as amostras a osteriori de R 0 ara tomar as decisões estatísticas exigidas. Esecificamente, ara cada ergunta acerca da indeendência entre as variáveis a e b dado um conunto de variáveis S e, imlicitamente, os efeitos genéticos: a) Obtenha a distribuição a osteriori da correlação arcial residual ρ a,b S. Tais correlações arciais são funções de R 0. Desta forma, suas distribuições a osteriori odem ser obtidas elo cômuto da correlação corresondente ara cada amostra utilizada ara reresentar a distribuição a osteriori de R 0. b) Obtenha o intervalo HPD 95% ara a distribuição a osteriori de ρ a,b S. c) Se o intervalo HPD contém 0, declare ρa,b S como nulo. Caso contrário, declare a e b como condicionalmente deendentes. 3) Austar o SEM utilizando a estrutura causal obtida (ou uma das estruturas observacionalmente equivalentes recueradas elo algoritmo IC). No mesmo trabalho, Valente et al. (00) usaram dados simulados ara validar a metodologia roosta mostrando que a estrutura causal verdadeira subacente, ode de fato, ser recuerada. Uma rimeira alicação do método comleto IC+SEM foi feita utilizando dados de codornas de corte or Valente et al. (0), que estudaram a relação de causa-efeito entre cinco características, eso da ave ao nascimento, eso aos 35 dias de idade, idade à maturidade sexual, eso médio do ovo e taxa de ostura. Foram feitas decisões estatísticas adotando diferentes intervalos HPD ara as correlações arciais. A estrutura causal encontrada foi comletada com a auda da informação temoral de exressão das características. Por exemlo, o fenótio de eso ao nascer é exresso anteriormente ao fenótio de eso aos 35 dias de idade e idade à maturidade sexual.

30 8 Figura 4. Estruturas recueradas elo algoritmo IC or Valente et al. (00).. Matriz dos coeficientes de arentesco genômica e seu uso na avaliação genética animal Com a disonibilidade de dados referentes a marcadores moleculares do tio SNP (single neucleotide olymorhism) metodologias de avaliação genética começaram a ser derivadas ara incluir informações de marcadores de DNA à avaliação genética animal. Talvez a forma mais natural de lidar com o novo roblema seria a substituição, nas equações de modelo misto de Henderson (984), da matriz dos coeficientes de arentesco estimados ela matriz de relacionamento genético realizado. Essa matriz refletiria a verdadeira roorção dos genes comartilhados entre os indivíduos, fator, que dentre outros, aumentaria a acurácia na redição dos valores genéticos. Reconhecendo a atual imortância da utilização da matriz de arentesco genômico, ou, como simlesmente é chamada, matriz G, serão abordados temas relativos à sua construção, às metodologias de incororação dessa matriz nas equações ara solução dos valores genômicos, assim como à sua utilização na rática dos rogramas de avaliação genética animal... Avaliação genética e matriz dos coeficientes de arentesco tradicional Em um modelo clássico de genética quantitativa ara características comlexas o valor fenotíico é controlado or um número infinito de genes, cada gene contendo um efeito infinitesimal, assim como, também, or efeitos não genéticos ou ambientais. Sob esse modelo não é ossível estabelecer o genótio de um indivíduo ara um loco esecífico e selecionar lantas ou animais com os alelos mais deseáveis. Consequentemente, a seleção é baseada na redição total dos efeitos dos genes que o indivíduo carrega, ou sea, seu valor genético. Os

31 9 modelos mistos exercem ael imortante na redição de valores genéticos de lantas e animais. Sob a remissa que os valores genéticos seguem distribuição normal multivariada com covariância genética igual a G*, melhores reditores lineares não viesados (BLUPs) odem ser usados ara calcular valores genéticos a artir de dados fenotíicos (Endelman e Jannink, 0). Esse modelo clássico é robusto e a seleção é efetiva mesmo quando o número de genes que controlam a característica é equeno (Goddard, 009). Admitindo que o modelo que exlica o fenótio de determinada característica em um indivíduo sea y = Xb + Za + e, as equações de modelo misto, descritas matricialmente como: X ' R Z' R X X Z' R X ' R Z Z + G ^ b X ' R ^ = a Z' R y, odem ser utilizadas ara a obtenção simultânea y ^ dos efeitos fixos e aleatórios, sendo a covariância genética estimada como, G = Aσ, em que A é a matriz dos coeficientes de arentesco dos animais ara os quais se retende obter valores genéticos. Incororando a matriz A ao sistema de equações ode-se fazer a ligação entre fenótios de diferentes indivíduos contidos em diferentes classes de efeitos fixos, assim, mesmo animais que não ossuem dados coletados odem ter reditos seus valores genéticos. A matriz A também roorciona um auste dessa redição ao ermitir que informações de arentes tenham esos diferentes de acordo com a magnitude do relacionamento genético entre os animais. a Coeficientes de arentesco corresondem à covariância genética existente entre animais relacionados, exressados relativamente e indeendente da característica considerada (Bomcke et al., 0). O coeficiente de arentesco entre dois indivíduos ode ser visto como a robabilidade de um gene amostrado aleatoriamente de um indivíduo ser idêntico or descendência a um gene homólogo também amostrado de forma aleatória do segundo indivíduo (Wright, 9; Malécot, 948). A robabilidade de que dois alelos são IBD (idênticos or descendência) deve ser definida com reseito a uma oulação base que ossui variância genética igual a σ a, ou sea, os dois alelos são originados de um mesmo ancestral na oulação base (Hayes et al., 009; Powell et al., 00; Endelman e Jannink, 0). Tradicionalmente a robabilidade que dois alelos são IBD é calculada a artir de um edigree conhecido, de tal forma que os animais no too do edigree (fundadores) formam naturalmente uma base oulacional (Powell et al., 00).

32 30 Aesar da seleção baseada nos melhores reditores lineares não viesados obtidos com a utilização da matriz A ter sido de grande valia ao melhoramento genético dos animais de rodução, algumas situações fazem com que a eserança redita da roorção do genoma que é idêntico or descendência entre dois indivíduos, dado o edigree, sea diferente da verdadeira roorção comartilhada. Isso ocorre, ois, o edigree normalmente se aresenta incomleto, rimeiro, orque existe uma edição dos dados de acordo com a data, em que os animais nascidos em éocas longínquas são cortados da avaliação, e, segundo, alguns animais que não ossuem edigree odem entrar na avaliação genética (Bomcke et al., 0). O afastamento entre o coeficiente de arentesco redito com dados de edigree e a roorção de alelos comartilhados realizada acontece, também, em razão da segregação mendeliana durante a formação dos gametas, o que resulta em variação da roorção do genoma que é IBD entre ares de animais que ossuem mesmo coeficiente de arentesco. Por exemlo, o coeficiente de arentesco redito entre irmãos-comletos é 0,5, sendo que essa redição aresenta desvio adrão de 0,04 em caso de esécies com 30 cromossomos com um Morgan de comrimento (Hayes et al., 009). Segundo VanRaden (008), a roorção de alelos que são idênticos or descendência, ou melhor, quando as redições ara os coeficientes odem variar, é deendente do número de locos que influenciam a característica. O autor ainda atesta que o desvio-adrão da ercentagem de alelos comartilhada redita ara irmãos-comletos é de 5%. Considerar essas equenas diferenças ode aumentar significativamente a confiança na redição dos coeficientes de arentesco, e consequentemente aumentar também a acurácia dos valores genéticos reditos. Além disso, maior diferenciação entre irmãos é ossível, e redução na seleção de indivíduos aarentados é eserada, á que os efeitos da segregação mendeliana são mais bem estimados. Como resultado, a endogamia média ao longo das gerações deve elevar mais lentamente do que com as avaliações tradicionais (Daetwyler et al., 007)... Matriz dos coeficientes de arentesco genômicos Com a disonibilidade de dados moleculares, informação de marcadores de DNA ara vários locos esalhados ao longo do genoma odem ser usados ara medir a similaridade de indivíduos e calcular a matriz de arentesco realizada com elementos que demonstram a verdadeira roorção do genoma em comum, sendo, ortanto, mais recisa que as informações de edigree. O arentesco genômico ode melhor estimar a roorção de segmentos cromossômicos comartilhados entre indivíduos uma vez que a obtenção de

33 3 genótios de alta densidade ermite a identificação de genes idênticos or estado (Forni et al., 0). Neati-Javaremi et al. (997) demonstraram que se os locos resonsáveis or uma característica forem conhecidos, os mesmos oderiam ser usados ara derivar a matriz de arentesco realizada e obter acurácia de redição dos valores genéticos maior comarada à utilização da matriz de arentesco tradicional. Porém, na rática a identificação de todos os QTLs referentes à variação de determinada característica é imrovável. Villanueva et al. (005) também demonstraram que a utilização da matriz de arentesco realizada ara obtenção de valores genéticos oderia incrementar a acurácia, mesmo quando os locos de características quantitativas não são conhecidos e o modelo subacente à característica é infinitesimal. Para tal, utilizaram de informações de edigree conhecido, exlorando informações de ligação, e obtiveram a matriz de arentesco ara indivíduos não relacionados dentro de uma mesma oulação. Outra maneira em que informações de marcadores de DNA odem ser utilizadas ara obtenção dos valores genéticos é a seleção genômica (Meuwissen et al., 00). Nesse método, informações de marcadores em alta densidade são utilizadas ara rastrear QTLs em desequilíbrio de ligação com eles. Os efeitos dos marcadores são então estimados e somados ara redizer o valor genético de cada animal (Goddard e Hayes, 007). Se houver grande quantidade de QTLs com efeitos normalmente distribuídos com variância constante entre eles, a seleção genômica se torna equivalente ao BLUP com incororação da matriz de arentesco realizada (G) no lugar da matriz A (Meuwissen et al., 00; Habier et al., 007; VanRaden, 008; Hayes et al., 009). A matriz de arentesco genômico ode ser calculada or diversos métodos utilizando dados de marcadores do tio SNP. VanRaden (008) aresentou três métodos utilizando a matriz M, que esecifica quais marcadores de alelos cada animal herdou. A dimensão de M é o número de indivíduos ( n ) elo número de locos ( m ). As equações odem incluir as informações de marcadores usando a matriz n x n, MM', ou, a matriz m x m, M' M. Se os elementos de M forem -, 0 e ara os locos, homozigoto, heterozigoto e o outro homozigoto, resectivamente, a diagonal MM' conta o número de locos homozigotos ara cada indivíduo, e os elementos fora da diagonal medem o número de alelos comartilhados entre os indivíduos aarentados. Já a matriz M' M conta o número de indivíduos homozigotos ara cada alelo na diagonal e o número de vezes que os alelos de diferentes

34 3 locos foram herdados elo mesmo indivíduo. Se P é matriz que contém as frequências dos alelos subtraídas or 0,5 e então multilicada or dois, como, ( 0,5), a subtração M P é igual a Z, que austa os efeitos dos alelos ara zero. Caso outros códigos ara definir o genótio dos diferentes locos forem utilizados, como, or exemlo, 0, e, a variância de W (genótios) não se altera, orém a eserança é modificada. Assim, a matriz P deve ser diferente de modo que os efeitos dos alelos continuem centrados em zero (Aguilar, 00; Gianola e de los Camos, 0). Mais informações são registradas no Anexo.3. As frequências alélicas utilizadas em P devem ser rovenientes da oulação base não selecionada ao invés daquela observada aós a seleção ou endogamia. Uma oulação base mais antiga ou mais recente ode gerar menores ou maiores coeficientes de arentesco ou modificar o grau de endogamia (VanRaden, 008). Como normalmente as frequências da oulação base em que não houve seleção são raramente disoníveis, Forni et al. (0) rouseram outros métodos de obter as frequências alélicas na montagem da matriz P, sendo esses, atribuir o valor 0,5 ara todos os marcadores, usar a média da frequência mínima dos alelos ara todos os locos ou a frequência observada dos alelos em cada SNP. A subtração de P em M dá mais crédito aos alelos raros do que aos alelos comuns quando se faz o cálculo dos relacionamentos genômicos, ou sea, quando a frequência dos alelos na oulação base é diferente de 0,5, os alelos menos frequentes contribuem mais ara a semelhança genética entre indivíduos do que aqueles alelos mais frequentes. Também, a endogamia genômica é maior se o indivíduo é homozigoto ara alelos raros do que homozigoto ara alelos comuns (VanRaden, 008; Forni et al., 0). i Para se obter a matriz de relacionamento genômico, o rimeiro método usa a fórmula: ZZ ' G = Σ i ( i ). A divisão or Σ ( ) i i faz a matriz G ser análoga à matriz A (mais detalhes no Anexo.). O coeficiente de endogamia genômico calculado ara o indivíduo é simlesmente G, e o arentesco genômico entre os indivíduos e K, que são análogos ao coeficiente de arentesco de Wright (9), são obtidos dividindo os elementos G k elo desvio adrão dos elementos da diagonal G e G kk. O segundo método ara obtenção de G esa os marcadores com as suas variâncias eseradas ao invés de somar as variâncias como na metodologia anterior, e então faz a divisão. G =

35 33 ZDZ, em que D é matriz diagonal com D ii = m [ ( )]. Esse modelo foi roosto anteriormente ara utilização em estudos de genética humana or Leutenegger et al. (003) e Amin et al. (007). i i O terceiro método demonstrado or VanRaden (008) não requer o conhecimento das frequências alélicas e ao invés disso austa os genótios or meio de uma regressão de MM' em A. O modelo é o seguinte: MM' = g 0 '+ga+ E, em que g 0 é o interceto e g é a inclinação. A matriz E inclui a diferença entre a fração de DNA em comum eserada e a realizada mais a mensuração do erro, ois sequências de DNA comletas não estavam disoníveis e aenas uma amostra de marcadores foram genotiados. A regressão foi austada considerando MM ' como variável deendente e A como indeendente orque A é o valor eserado de G e não o contrário. Entretanto, or causa dessa característica é necessário que os cálculos seam revertidos aós auste do modelo, usando a fórmula: MM' g 0( ' ) G =. As g estimativas de g 0 e g odem não ser óbvias, ois a variável deendente e indeendente são matrizes e não um vetor, mas as equações odem ser escritas com notação usando somas da seguinte maneira: n k A k k k A A k k g g 0 0 = k ( k ( MM MM ' ) ' ) k k A k. Forni et al. (0) ainda recordaram de dois outros métodos ara obtenção da matriz G. O rimeiro, descrito or Gianola et al. (009), escala a matriz ZZ de forma diferente levando em consideração a distribuição aleatória dos SNPs e suas frequências or meio de: ( 0 q0 ) G = ( M P)( M P)', em que m ( ) = α + β + + m m α + β α 0 = e q0 = 0 são a eserança α +β das frequências dos alelos; α e β são os arâmetros da distribuição beta austando a frequência alélica base; m é o número de marcadores SNP. O último método baseia-se na idéia de se obter uma matriz normalizada com a média dos elementos da diagonal igual a, o que ode ser conseguido com:

36 34 ( M P)( M P)' G =. O n da equação ode ser substituído ela soma de ( + F) de { traço[( M P)( M P)'} n todos os animais genotiados, sendo F o coeficiente de endogamia derivado do edigree. Diferente de uma matriz de arentesco tradicional, os valores dos elementos da diagonal da matriz odem ser menor que. Uma média dos elementos da diagonal igual a também ode ser obtida multilicando a matriz acima or uma constante. A matriz de relacionamento genômico é ositiva semi-definida, mas ode ser singular se o número de marcadores é limitado ou dois indivíduos aresentam mesmo genótio ara todos os marcadores. A matriz também não irá aresentar inversa caso o número de marcadores SNP for menor que o número de animais com genótio conhecido. Para evitar roblemas otenciais com a inversão de G, essa ode ser calculada como: G =λgorig +( λ)a, em que, G orig é a matriz G ura. Segundo VanRaden (008) o eso λ é relacionado à variância do erro em se estimar as verdadeiras orções do genoma comartilhadas em comum entre os indivíduos. Christensen e Lund (00) sugeriram que λ ode ser interretado como o eso relativo do efeito oligênico necessário ara exlicar a variância genética aditiva total, assim, λ = (σ a σ a +σ g, em que ) σ g é a variância exlicada elos marcadores. Aguilar et al. (00) relatam que a rincial influência do eso λ deve ser relacionada à roorção da variância genética aditiva exlicada ela informação genômica, o que or sua vez está relacionada à quantidade de marcadores e às quais animais têm genótio observado, dentre outros fatores. Porém, os mesmos autores aontaram diferenças equenas nos valores genéticos reditos dos animais quando o λ variou de 0,95 a 0,98. Christensen e Lund (00) sugeriram calcular o valor de λ or meio de função de verossimilhança considerando um conunto de diferentes valores ara este arâmetro. VanRaden (008) testou diferentes valores ara λ, que variaram de 0,90 a. O autor observou melhoria na acurácia das redições de aenas 0,000 or cento ao usar o eso igual a 0,95, que foi o maior ganho obtido em relação à utilização da matriz G ura. Ainda, segundo VanRaden (008), os elementos de G ossuem variância do erro de 0,5. Quando a menor frequência dos alelos for menor do que 0,5, ara que a informação m roveniente dos marcadores sea refletida de forma recisa, a fórmula 0,05 λ = 0,5 0,05 + m

37 35 ode ser usada e G deve receber maior eso que A ara m > 50 e quase todo o eso (>0,99) se m > Forni et al. (0) construíram diversas matrizes de arentesco, entre elas a A (tradicional), G05 (matriz segundo VanRaden (008) com frequência alélica utilizada igual a 0,5 ara todo marcador), GMF (como em VanRaden (008) utilizando a frequência mínima média ara todos os SNPs), GOF (de acordo com VanRaden (008) utilizando as frequências observadas), GOF* (como roosto or Gianola et al., 009) e GN (normalizada ara obter média dos elementos da diagonal igual a ). A comaração dos valores dos coeficientes de relacionamento genético contidos nessas matrizes ode ser observada na Tabela adatada do mesmo trabalho. Tabela. Estatística dos coeficientes de arentesco estimados usando informações de edigree e de marcadores moleculares do tio SNP Elementos da Diagonal Média Mínimo Máximo Variância A,000,000,075 0,00003 G05,53,78,46 0,00083 GMF,697,63,894 0,00073 GOF 0,936 0,837,8 0,0076 GOF* 0,505 0,436 0,663 0,0005 GN.00 0,895,34 0,000 Elementos de fora da diagonal Média Mínimo Máximo Variância A 0,03 0,000 0,600 0,007 G05 0,595 0,387,3 0,0060 GMF,0 0,8,654 0,0055 GOF 0,000-0,98,000 0,004 GOF* 0,000-0,05 0,540 0,00070 GN 0,000-0,,070 0,0075

38 36 Segundo os autores, eserava-se que a variância dos coeficientes de arentesco fossem maiores ara as matrizes genômicas, á que o arentesco genômico reflete a exata roorção de genes comartilhados enquanto o coeficiente de arentesco de Wright é uma redição. Porém, isso foi observado aenas nas matrizes GOF e GN. Ainda, ode ser visto que os elementos fora da diagonal das matrizes genômicas odem assumir valores negativos. Hayes et al. (009) exlicam que os coeficientes de arentesco são semre relativos à uma oulação base, assim subtraindo os valores dos elementos contidos em M ela frequência média dos alelos, faz com que os relacionamentos contidos em G assem a ser relativos à atual oulação. Consequentemente, o arentesco médio se aroxima de 0 e alguns elementos odem assumir valores negativos. A normalização que ocorre ara formação da matriz GN realmente gerou média dos elementos da diagonal igual a, assim como ocorre ara a matriz de arentesco tradicional. A média dos coeficientes de fora da diagonal nas matrizes GOF, GOF* e GN foi 0, similar à matriz A..3. Metodologias de utilização da matriz de arentesco genômica Um trabalho de grande imacto na área de melhoramento animal nos últimos anos foi escrito or Meuwissen et al. (00) que rouseram ela rimeira vez a seleção genômica e modelos que se adequam a ela. Entre os métodos descritos está o que os autores nomeiam de BLUP e que considera os efeitos de QTLs amostrados de uma distribuição normal com variância constante elos segmentos de cromossomas. Esta variância, bem como a variância residual, é considerada conhecida. Os efeitos dos marcadores são obtidos ela resolução das equações de modelos mistos (Henderson, 984). A demonstração do G-BLUP e RR-BLUP (Ridge Regression BLUP, Random regression BLUP) aresentada a seguir foi retirada de Gianola e De Los Camos (0). Considere o modelo: y i =µ + = x i β + ε i, em que y i é o fenótio do indivíduo i, µ é efeito comum a todos os indivíduos, x i são covariáveis (or exemlo, genótios de marcadores), β é o efeito da covariável e ε i é o resíduo do modelo. Em notação matricial o modelo é exresso como:

39 37 y = Xβ +ε, em que = { } y é um vetor de fenótios, X = { x,... } incidência ara o vetor de coeficientes de regressão resíduos do modelo. A densidade conunta de y e β é: y i,,x é uma matriz de β = (µµβ,... β )' e ε = { } é um vetor de y XX ' σ β + Iσ ε Xσ β ~ MVN 0,. Logo, Xβ também segue distribuição normal á que β X ' σ β Iσ β é uma soma de distribuições normais atribuídas aos efeitos dos marcadores. O BLUP ara esses efeitos é: E[ β y, σ ε ] = X ' σ β [ XX ' σ β + Iσ ε ] y = X '[ XX ' + λi ] y [Equação ], que é a média a ε i σε osteriori de β. Aqui, λ = σ β. A exressão acima é linear com reseito aos dados e é não viesada com reseito à média à riori, E ( β) = 0. Para confirmar isso se tira a eserança com reseito à y e têm-se E{ E[ β y, σ ε ]} = X '[ XX ' + λi ] E( y) e E[y] = 0, assim { E[β y,σ ]} = 0 E ε. Agora é derivada a eserança dos valores genéticos genômicos condicionais aos dados: E[ Xβ y, σ ] = XE[ β y, σ ] = XX '[ XX ' + λi] ε ε y = [ I + G ] y, em que G, a matriz dos genótios ara os marcadores nos diferentes indivíduos é XX. Esse é o G-BLUP (VanRaden, 008) ara redição dos valores genéticos a artir de informações moleculares. A exressão é também o melhor reditor ara os valores genômicos e é linear com reseito aos dados. Obtendo-se a eserança com relação aos fenótios, E{ [I +λg ]y} = [I +G ] E{ y} = 0 Então, está demonstrado o BLUP dos valores genéticos genômicos.. De forma generalizada a exressão de BLUP ara os efeitos dos marcadores mostrada acima é reescrita como, ^ [ X ' X + λ D] β RR = X ' Y [Equação ], em que λ é constante adicionada à diagonal da matriz dos coeficientes e D é uma matriz diagonal com 0 na rimeira entrada da diagonal (ara evitar o encurtamento da estimativa do interceto) nas demais entradas da diagonal, é o sistema de equações ara solução dos efeitos dos marcadores RR (Ridge σε Regression). Relembrando que ao considerar no sistema de equações acima λ = σ β, obtêm-se o BLUP (RR-BLUP) ara os efeitos de SNPs como roosto or Meuwissen et al. (00).

40 38 Adicionar uma constante à diagonal da matriz dos coeficientes de arentesco genômica faz com que essa deixe de ser singular e encurta as estimativas dos coeficientes de regressão que não são o interceto em direção a zero. Isso induz viés, mas reduz a variância dos estimadores. Em um roblema com grande número de arâmetros a serem estimados e com equeno número amostral, o quadrado médio do erro ode ser reduzido e redições mais acuradas são roduzidas (Gianola e de los Camos, 0). Aesar de λ ser constante ara todos os SNPs, diferenças nos encurtamentos surgem em razão da variação na frequência alélica dos marcadores (Moser et al., 009). Como demonstrado, as equações e roduzem estimativas equivalentes ara os efeitos dos marcadores, a rimeira necessita de inversão de uma matriz n x n, á a segunda da inversão de uma matriz x. Por levarem às mesmas estimativas, na literatura, o método G-BLUP normalmente é citado quando se desea redizer o valor genético genômico dos animais sem a necessidade de saber os efeitos dos marcadores, em contraartida o RR-BLUP é citado em trabalhos que deseam obter os efeitos dos SNPs. Aesar dos métodos descritos acima serem romissores, obter genótios de todos os indivíduos de uma oulação é imraticável or questões de custo e de logística, como or exemlo, descarte de animais (Legarra et al., 009). Predições genômicas dos valores genéticos odem ser obtidas estimando os efeitos dos marcadores ou usando o modelo de equações mistas com a adição da matriz de relacionamentos genômicos. Porém o sistema de equações roosto or VanRaden (008) rediz valores genômicos aenas ara animais com genótio conhecido ou necessita de metodologia com múltilas etaas ara obtenção de valores genéticos comostos elos dois tios de informação de relacionamento genético. Uma forma simles ara utilizar a metodologia tradicional de modelos mistos de Henderson e aroveitar todos os dados de fenótio, genótio e de edigree ao mesmo temo é fazer a modificação da matriz A, tal que essa inclua também informações de marcadores. Esse método é chamado de single-ste genomic BLUP - ssgblup (Legarra et al., 009; Misztal et al., 009; Aguilar et al., 00). O resultado é uma distribuição conunta dos valores genéticos dos animais genotiados e não genotiados com uma matriz edigree-genômica de relacionamentos genéticos, H, que transmite a informação genômica também ara a covariância entre todos os indivíduos sem genótio (Legarra et al., 009). A matriz H é reresentada como:

41 39 H A + A A ( G A ) = GA A A A A A G, em que A é a artição da matriz de arentesco tradicional ara animais não genotiados, A é relativa aos animais genotiados, A e A corresonde a arte da matriz A que indica os coeficientes de arentesco entre os animais com genótio e sem genótio, e G é a matriz de arentesco genômico. Christensen e Lund descreveram uma maneira fácil de obter a matriz equações: 0 0 H = A +. 0 G A G H, que será utilizada no sistema de.4. Resultados da utilização da matriz de relacionamento genômico VanRaden (008) descreveu diversas metodologias de cálculo da matriz G e comarou métodos ara redição dos valores genéticos genômicos. Por meio de simulação de estrutura oulacional e marcadores do tio SNP, o autor relatou acurácias, ou sea, correlação entre o valor genético redito e o valor genético simulado, maior ara as metodologias que utilizaram a matriz de relacionamento genômico. Em média houve um ganho na acurácia de 30 or cento com relação à utilização da matriz de arentesco tradicional. Utilizando os mesmos modelos do trabalho de 008, mas com dados reais de bovinos da raça holandesa, VanRaden et al. (009) relataram ganho na acurácia de redição do valor genético ara diversas características ao se utilizar a matriz G no sistema de equações de modelos mistos. Muitos métodos foram desenvolvidos com obetivo de acomodar as informações genômicas no modelo ara obtenção de efeitos de marcadores, fenótios futuros ou o valor genômico dos indivíduos. Talvez, outros métodos não citados até aqui, como, or exemlo, o Bayes B, tenham maior aelo teórico no sentido de que não ossuem a remissa do modelo infinitesimal ara o efeito dos marcadores, ortanto tem a caacidade de reconhecer que alguns SNPs tem efeito 0, á outros aresentam efeitos maiores. Porém, na rática, o que se vê até aqui é que não há grande diferença na acurácia de redição ara as diferentes metodologias genômicas. A incororação da informação de marcadores de DNA or meio da matriz de arentesco genômica é bastante viável, ois é de fácil entendimento e fácil execução

42 40 comutacional. Luan et al. (009) relataram semelhança na acurácia de redição de valores genômicos ara diversas características ao estudarem uma oulação de gado Norwegian Red utilizando chis de 5K. Wolc et al. (0) ara quantificar o otencial benefício da utilização da seleção genômica, comararam a acurácia dos valores genéticos, estimados ara diversas características em galinhas comerciais de ostura, obtida or diferentes métodos usando matriz de arentesco derivada de edigree ou a artir de informações de marcadores SNP. Nesse trabalho foi demonstrado que de modo geral as metodologias que são baseadas em informações genômicas aresentaram maior habilidade de redição do que a baseada em informações de edigree, rincialmente ao se utilizarem de dados de animais ainda ovens. Os autores ainda salientaram que tal diferença se deveu ao fato de haver grandes desvios com relação aos coeficientes de arentesco obtidos elos diferentes métodos (Figura 5). Nesse estudo, o G- BLUP suerou ligeiramente o método Bayes-C-Pi quanto à acurácia de redição dos valores genéticos. Figura 5. Relação dos coeficientes de arentesco tradicionais e genômicos (Wolc et al., 0). Hayes et al. (009) fizeram revisão de diversos exerimentos realizados nos Estados Unidos da América, Nova Zelândia, Austrália e Holanda, e relataram as acurácias dos valores genéticos genômicos obtidas. Esses exerimentos utilizaram oulações referência de 650 a touros de raças ara rodução de leite, que foram genotiados ara aroximadamente

43 marcadores do tio SNP. As acurácias observadas deenderam de diversos fatores, entre eles, a herdabilidade da característica, o número de touros na oulação referência e o método estatístico utilizado ara estimar os efeitos dos marcadores. Um achado comum, nos Estados Unidos, Nova Zelândia e Austrália, foi que o método GBLUP garantiu acurácias quase tão boas quanto às dos métodos mais comlexos. Os autores ainda concluíram que o método GBLUP é atrativo, ois, a única informação a riori exigida é a variância genética aditiva da característica. 3. Avaliação genômica elo método Single-Ste O desenvolvimento da genotiagem de alta densidade ara marcadores do tio SNP (single nucleotide olymorhism) favoreceu a utilização de informações moleculares ara melhoria genética dos animais de rodução. Meuwissen et al. (00) aresentaram métodos ara redição dos valores genéticos genômicos de animais, que acontecem em duas etaas: a) os efeitos dos marcadores são estimados usando fenótios e genótios de indivíduos que fazem arte da oulação de treinamento do modelo; b) os valores genéticos genômicos são reditos ara qualquer animal que aresenta genótio conhecido e que estão na oulação de validação. Essa metodologia de redição e seleção com base em informações genômicas de alta densidade é chamada seleção genômica. A seleção genômica ode ser realizada estimando efeitos individuais dos marcadores ou utilizando a metodologia BLUP com a adição da matriz de relacionamento genético genômico, G (VanRaden et al., 008). Normalmente, aenas fração dos animais da oulação é genotiada. Consequentemente, animais com genótio desconhecido não ossuem valores genéticos genômicos reditos, e suas informações fenotíicas e de edigree não são aroveitadas ara enriquecimento das estimativas dos efeitos dos SNPs. Já existe metodologia que une as informações de arentesco derivadas do edigree e dos marcadores. A seleção genômica or Single-Ste, que usa uma matriz de arentesco combinada ermite que em uma única avaliação seam consideradas todas informações de fenótios, genótios e edigree disoníveis sem limitações no modelo de análise (Legarra et al., 009; Misztal et al., 009; Aguilar et al., 00).

44 4 A seguir será aresentado o método single-ste genomic BLUP (ssgblup) e suas esecificidades. Adicionalmente, serão relatados ossíveis roblemas e resultados de avaliações genéticas que utilizaram a metodologia. 3.. Método Single-Ste Tradicionalmente, informações de edigree têm sido utilizadas ara estimar a herdabilidade e os efeitos genéticos ara características comlexas. Agora, á é viável gerar dados individuais genotíicos ara grande número de single nucleotide olymorhisms (SNP) distribuídos ao longo de todo o genoma. A disonibilidade de marcadores de alta densidade levou à introdução recente de métodos ara a seleção genômica. Esses modelos são normalmente baseados na estimativa simultânea de efeitos de marcadores, e a diferença entre eles é, em sua maioria, atribuída à distribuição a riori ara os efeitos dos SNPs (Mizstal et al., 009). Procedimentos eficientes comutacionalmente á existem mesmo ara grandes bancos de dados (Legarra e Misztal., 008). A redição dos valores genéticos genômicos ode ser feita com a simles substituição, no modelo de equações de Henderson (984), da matriz dos coeficientes de arentesco de Wright (A) ela matriz de relacionamento genômico (G) baseada em informações de marcadores. Vários autores citam ganhos na acurácia de redição dos valores genéticos ao adotar essa metodologia (VanRaden, 008; VanRaden et al., 009; Hayes et al., 009). Esse modelo assume distribuição normal ara os efeitos de marcadores com variância em comum entre eles, e, aesar de a remissa ser argumentável, na rática, creditar uma distribuição a riori mais comlexa resulta em ouco ganho (VanRaden et al., 009; Hayes et al., 009; Luan et al., 009; Wolc et al., 0). Ainda, a matriz de relacionamento genômico é fácil de interretar e maniular. Aesar do método G-BLUP roosto até então ser muito romissor ara o melhoramento genético animal, assume-se que todos os animais têm genótio conhecido. Porém, a genotiagem de uma oulação inteira não é viável, ois aresenta alto custo e difícil logística. Por exemlo, em suínos, é rovável que aenas os machos rerodutores ou candidatos à seleção seam genotiados (Christensen e Lund, 00). Como nem todos os animais odem ter genótios conhecidos, um rocedimento de dois ou três assos, multi-ste ou multile-stage, comumente é realizado. a) Primeiro, uma avaliação genética regular é feita, normalmente utilizando o modelo animal; b) Fenótios corrigidos são utilizados no segundo asso, em que a seleção assistida or marcadores é efetivamente

45 43 alicada e os efeitos dos marcadores são obtidos. Esses fenótios são DYD (daughter yield deviations) ou YD (yield deviation); c) São calculados os valores genéticos genômicos diretos ara os candidatos a seleção a artir dos efeitos dos marcadores estimados e dos genótios desses indivíduos; d) Por último, combinam-se as informações dos valores genéticos tradicionais e genômicos usualmente or meio da teoria do índice de seleção. Os assos b e c odem ser combinados em que as estimativas dos efeitos de marcadores são obtidas elo auste do modelo de equações mistas com utilização da matriz G de arentesco genômico (Meuwissen et al., 0). As vantagens do método multile-stage incluem não haver necessidade de mudanças às metodologias á conhecidas de avaliação genética e conter assos simles ara obtenção dos valores genéticos genômicos de animais ovens com genótio conhecido. As desvantagens incluem requerer arâmetros nos assos b e d, or exemlo, variâncias a riori e coeficientes ara o índice de seleção, erda de informação que reflete na diminuição de acurácia e viés atribuído à seleção. Além do mais, enquanto a utilização do modelo multicaracterísticas no asso a é ossível ara todos os animais, a avaliação no asso b utilizando o mesmo modelo não é óbvia e deve ser unicaracterística incororando aenas os animais genotiados. A utilização de arâmetros incorretos ara os assos b e d odem causar mudanças na redição de valores genéticos até mesmo de animais com alta acurácia (Misztal et al., 009). Quanto à erda de informação, vários roblemas existem na utilização de dados de DYD. Esses roblemas são esos (causados elo diferente número de informações or animal no arquivo original), viés (causado or seleção, or exemlo), acurácia (ara animais em rebanhos equenos) e colinearidade (a estimativa de YD ara duas vacas em um mesmo rebanho, or exemlo). Esses roblemas odem ofuscar os benefícios da seleção assistida or marcadores (Legarra et al., 009). Os atuais resultados ara avaliações genômicas com multile-ste não são conclusivos, enquanto a acurácia ara obtenção dos valores genéticos é maior comarada à utilização de aenas informações de edigree, elas também se mostram inflacionadas. A utilização de animais ovens com avaliação genômica torna ainda mais imortante obter métodos que alcancem alta acurácia e mínimo viés. A inflação nas avaliações genômicas faz com que ovens animais avaliados tenham uma vantagem sobre os animais velhos rovados or meio de teste de rogênie. Como visto anteriormente, os roblemas com a avaliação em múltilos estádios odem ser atribuídas à utilização de arâmetros incorretos e fortes remissas do método. Outra exlicação ara os resultados observados, até então, é a

46 44 genotiagem seletiva dos animais. Um roblema ainda mais sério é quando as seudoobservações são obremente definidas e aresentam baixa qualidade (Aguilar et al., 00). Uma ossibilidade ara lidar com os roblemas aontados e simlificar a atual estratégia seria fazer uma avaliação conunta utilizando todos os dados fenotíicos, genotíicos e de edigree. Uma medida oderia ser imutar marcadores ara animais sem genótios identificados via informações de marcadores e edigree dos outros animais, assim a análise oderia ser realizada aós imutação. No entanto essa alternativa seria difícil ara um banco de dados moderado e com grande número de marcadores desconhecidos. Misztal et al. (009), Legarra et al. (009) e Christensen e Lund (00) rouseram um método que incorora informação genômica dentro do asso a da avaliação multile-stage, resultando em um rocedimento de etaa única (single-ste). Isso ode ser alcançado ela modificação da matriz de arentesco A de modo que informação a reseito dos marcadores é acrescentada. Nos trabalhos citados, é formada a matriz H, que combina a matriz G de relacionamento dos animais genotiados, com a matriz dos coeficientes de arentesco de Wright, A, construída a artir de informações dos animais com genótio e sem genótio conhecido (Meuwissen et al., 0). Para o método G-BLUP, demonstra-se que os valores genéticos genômicos odem ser obtidos sem o cálculo dos efeitos dos marcadores, aenas incluindo a matriz G - nas equações do BLUP (Neati-Javaremi et al., 997; Meuwissen et al., 00; Habier et al., 007; VanRaden et al., 009). Similarmente, a matriz H - ode ser utilizada ara redição direta dos valores genéticos genômicos dos indivíduos. A metodologia single-ste rovê avaliação unificada, elimina várias remissas e oferece a oortunidade de cálculo mais acurado dos efeitos genômicos do que o rocedimento multile-ste (Aguilar et al., 00). Assuma um sistema de equações de modelo misto regular como utilizado em uma avaliação genética tradicional, or simlicidade considere aenas um efeito aleatório: y = Xb + Zu + e, em que y, é um vetor de dados, b é um vetor de efeitos fixos e u é um vetor de efeitos dos animais. Sob o modelo oligênico infinitesimal de herança var(u) = Aσ, a em que A é a matriz dos numeradores de arentesco baseada nas informações de edigree. Além disso, var(e) = Iσ e X e Z são matrizes de incidência. e

47 45 Misztal et al. (009) sugeriram que a matriz dos coeficientes de arentesco (A) ode ser modificada ara uma matriz (H) que acomode tanto as informações de edigree quanto as diferenças entre o arentesco calculado com base no edigree e com base nas informações dos marcadores ( H = A+ A : A H = A A ), de tal forma que, A 0 = A + G 0 0 G A, em que os índices subscritos e reresentam os animais não genotiados e genotiados, resectivamente. G é a matriz de arentesco genômico. A matriz descrita é simles, mas não é construída corretamente (Legarra et al., 009). Assumindo, or exemlo, que nenhum animal em G tem fenótio, então, de acordo com H, o valor genético redito ara os animais com genótio conhecido ( u ) seria u u = A A u, em que u é o valor genético redito ara os animais não genotiados e G, ortanto, não tem influencia sobre as redições (Aguilar et al., 00). O uso da matriz G deve otencialmente modificar a covariância dos ancestrais e descendentes dos animais genotiados. Por exemlo, se dois irmãos comletos aresentam relacionamento genômico de 0,6, utilizando aenas a matriz A, assume-se que o arentesco médio entre os seus filhos é de 0,5, quando na verdade seria 0,3 (Legarra et al., 009). Legarra et al. (009) sugeriram a derivação da distribuição conunta de u e u como (u,u )= (u u )(u ). A distribuição (u u ) é condicional ao edigree or meio da teoria do índice de seleção e roriedades da distribuição normal e (u ) é baseada aenas nas informações genômicas. A covariância da distribuição conunta de u e u é chamada de H, que reresenta a matriz da covariância entre os valores genéticos incluindo a informação genômica, sendo, ortanto: H H H H A = + A ( G A ) = H GA A A A A A A G G. Considerando A A = A A A, duas alternativas comutacionalmente eficientes são:

48 46 ( A ) + ( A H = A A H = A + 0 ) GA A ( A I I I GA ) ( A ) ( A ) G A A A 0 [ G A ][ I I ] 0 0 I G. e A inversa da matriz H aresentada or Aguilar et al. (00) e Christensen e Lund (00) é: H = A G A. Em que A é a inversa da matriz de arentesco tradicional aenas ara os indivíduos com genótio conhecido. Entretanto, essa nova fórmula aresenta um roblema, G é normalmente singular e não ode ser invertida sem assos adicionais. 3. A matriz G escalada Segundo Chen et al. (0), uma das reocuações que surgem ao alicar a seleção genômica utilizando a matriz de arentesco realizada é o viés. Esse viés tem sido relatado ara avaliação genômica or diversos autores (VanRaden, 009; Aguilar et al., 00; Forni et al., 0). Com viés, a comaração entre animais genotiados e sem genótio conhecido seria difícil. Esse viés ode ser causado arcialmente ela construção não adequada da matriz de relacionamento genômico. Tal matriz ode ser construída assumindo diferentes frequências alélicas, escalada ou ignorando alelos com frequência mínima. Mais detalhes sobre a formação da matriz G ode ser visto no item. dessa mesma revisão. Como visto em uma das seções anteriores a fórmula de H inclui a exressão G A, que é a diferença entre o coeficiente de arentesco genômico e de edigree. Caso G estea inflada ou de outro modo incomatível com A, a relação entre a informação roveniente dos marcadores e do edigree vai estar errada. Diferentes matrizes de relacionamento genômico odem levar a diferentes estimativas de valores genéticos, fato que ode ser atribuído à incorreta escala de G. Estudando gado holandês Aguilar et al. (00) observaram que a utilização de frequência igual ara os alelos na construção da matriz P resultou em maior acurácia e menor viés na redição dos valores genéticos genômicos. Já, Forni et al. (0) relataram melhores resultados com utilização da frequência alélica observada atual da oulação. No estudo de

49 47 Aguilar et al. (00), a acurácia do método single-ste foi deendente da escolha de G e do eso atribuído à diferença entre G e A. Com a escolha aroriada a metodologia foi suerior à da metodologia de estádios múltilos. Os autores ainda citam que uma razão ara a escolha de G ser fundamental é que as matrizes de relacionamento genético genômico e tradicional devem ser comatíveis em escala e estrutura. O eso da informação roveniente do edigree com relação à informação genômica deende de λ e ainda mais das diagonais de G - e A Críticas e novas metodologias A matriz H - ode ser usada ara obtenção direta dos valores genéticos genômicos. Nos trabalhos de Mizstal et al. (009), Legarra et al. (009), Aguilar et al. (00) e Christensen e Lund (00) é sugerida análise unificada com inclusão das informações de edigree e dos marcadores. Se adotarmos novamente os índices subscritos e ara, resectivamente, os animais com genótio conhecido e não genotiados, então, A, denota o bloco de A relativo aos animais genotiados e A relaciona os animais com genótio e sem genótio conhecido. Segundo Meuwissen et al. (0). Da equação, H H H H A = + A ( G A ) = H GA A A A A A A G, ode ser visto que os efeitos do G desvio de G em relação à A nos outros blocos da matriz H é calculado ela regressão dos animais não genotiados nos animais genotiados, or exemlo, A A. Isso é totalmente baseado nas informações de edigree, ainda que os marcadores ossam contribuir com informação ara essas regressões. Por exemlo, dois filhos de ais meio-irmãos aternos são genotiados e contém or chance muitos genes idênticos or descendência, então esses genes foram rovavelmente herdados do avô em comum, consequentemente a regressão deles no avô deveria ser aumentada. Outro roblema, de acordo com Meuwissen et al. (0), com a metodologia de single-ste é que o termo G A resulta em viés que ode ser diminuído introduzindo fatores de escala, como, G =λgorig +( λ)a. O obetivo do trabalho citado foi solucionar os dois roblemas aontados, e, ara tal, cinco métodos de utilização conunta de informações de marcadores e de arentesco foram comarados com base na acurácia da obtenção dos valores genéticos genômicos.

50 48 O rimeiro, á descrito, foi intitulado MLAC, ois foi sugerido or Mizstal et al. (009), Legarra et al. (009), Aguilar et al. (00) e Christensen e Lund (00). O otencial roblema do método MLAC é que A e G devem estar na mesma escala, senão haverá diferença entre G e A mesmo se os coeficientes de arentesco baseados nos marcadores e edigree forem os mesmos. Ambas matrizes são exressas relativas a uma oulação base (or exemlo, uma oulação original em que todos os animais são considerados não aarentados) mesmo se uma base real ara G ossa ser definida. A idéia geral do segundo método é recalcular a matriz G (G*) usando o coeficiente de endogamia da oulação calculado a artir de A e os coeficientes de arentesco e de endogamia dos animais obtidos de G. Isso vai fazer com que a endogamia geral da oulação de G* se torna a mesma de A enquanto as estimativas de arentesco e endogamia dos indivíduos seam relativas ao nível de G. A endogamia total do indivíduo i é: Gii = Ast +( Ast )Fis +, em que A st é a média dos elementos da diagonal de A menos, F is é o coeficiente de endogamia do animal relativo à endogamia média da oulação base ( F st ) e G ii é o elemento da diagonal de G escalado com a endogamia base mudada ara a endogamia de A. Similarmente, os elementos de fora da diagonal também são escalados usando os mesmos valores de A st e * F st, Gi = [ Ast + ( Ast ) ϕ is ], em que ϕ is é o arentesco entre os indivíduos e i relativo à endogamia base F, ϕ = G / F )/( F ). st is ( i st st Esse método com correção ara a base oulacional foi chamado MLAC b (Meuwissen et al., 0). Um roblema que foi citado e atinge os métodos MLAC e MLAC b é que a roagação da mudança de A ara G feita a artir do bloco ara os outros blocos da matriz H é feita or coeficientes de regressão baseados aenas em informações de edigree. O terceiro método, FG, foi roosto or Fernando e Grossman (989), e combina informações de edigree e de marcadores aroveitando a análise de ligação (linkage analysis). A alicação do método FG resulta em uma matriz de relacionamento entre os alelos aternos e maternos ara todos os animais e, ortanto, ossui quatro elementos ara cada animal i. Esses quatro elementos são somados e divididos or ara se obter a matriz de arentesco na escala correta G FGK ara todos os loci K. A média dos elementos ara cada loco foi obtida, que or sua vez resultou na matriz geral G FG.

51 49 Outro método aresentado or Meuwissen et al. (0) foi o LDLA (Linkage Desiquilibrium Linkage Analysis), que combina as duas últimas metodologias em uma só, nos seguintes assos: ) Calcular a matriz G FG de Fernando e Grossman. ) Calcular a matriz G baseada nos marcadores tal como em MLAC, mas obter G* austando G à mesma base oulacional de G FG. Notar que esse auste é o mesmo do método MLAC b, orém com a imortante diferença de utilizar os elementos da diagonal de G FG ao invés dos coeficientes de A ara obter a nova endogamia base. 3) Utilizar o método MLAC b ara combinar a matriz dos marcadores G* com a matriz G FG afim de construir H LDLA e H. No método LDLA, a matriz G FG substitui A na formação de H e os fatores de roagação dos efeitos de substituição de G* or G FG são, G G FG FG que ela está contida em G FG. LDLA. Essas regressões contabilizam a informação dos marcadores uma vez Os coeficientes de arentescos obtidos com a utilização de G ou G* contêm erros de estimativas orque um número finito de SNPs é usado. No método LDLA b, melhor estimativa de G* é obtida regredindo G* de volta à matriz A, de tal forma que, ^ * * G = A + b( G A) = bg + ( + b) A. Então, LDLA b é o mesmo de LDLA, mas G ^ é usado ao invés de G, e * Cov( Gt, G*) b =, em que Cov() e Var() denotam a covariância e variância entre Var( G*) os coeficientes de arentesco fora da diagonal e * G t é o verdadeiro arentesco. O método LDLA b atingiu melhores acurácias e com aenas um equeno viés quando a herdabilidade da característica estudada foi 0,. Sob a situação em que os arentes foram genotiados e a rogênie continha aenas informações de fenótio e edigree, todos os modelos aresentaram resultados similares, o que era revisto em razão do coeficiente de arentesco entre os ais e os filhos não ser afetado ela informação de marcadores dos ais. Na situação em que a rogênie foi genotiada, os genótios dos filhos devem ser usados ara estimar os relacionamentos genéticos entre os animais acima no edigree. Nessa situação, ficou claro que o método MLAC b é mais viesado e sua acurácia é reduzida de modo que sea menor que a acurácia dos métodos LDLA e LDLA b. Para essa situação o método LDLA b claramente aresenta o melhor resultado. Os autores aesar de indicar a utilização desse método, á que ele faz melhor uso das informações dos marcadores, ressaltam que ele é

52 50 comutacionalmente mais esado, ois é necessário o cálculo das robabilidades de segregação dos alelos, a inversão da matriz G FG e a obtenção do coeficiente de regressão b. Gao et al. (0), ao estudarem uma oulação de touros da raça holandesa, comararam quatro métodos de seleção genômica: o G-BLUP simles sem auste da matriz G ara o efeito oligênico; o G-BLUP como roosto or VanRaden (008) incluindo uma orção da variância exlicada or A na formação da matriz G; o método de single-ste como descrito or Legarra et al. (009) e Aguilar et al. (00); e o método single-ste, em que a matriz G é escalada de forma que a média dos elementos da diagonal e fora da diagonal da matriz de arentesco genômico sea igual à média dos elementos corresondentes da matriz de arentesco tradicional ara os animais que contém genótio conhecido. Os autores observaram que os métodos de single-ste odem aumentar a acurácia e reduzir o viés das redições genômicas. O método de single-ste com o auste adicional obteve resultados levemente sueriores à metodologia original relativos à acurácia e ao viés. O método single-ste ermite que diversos modelos alicados na avaliação genética tradicional ossam ser adatados à metodologia com inclusão de informações moleculares. Aguilar et al. (0) aresentaram a avaliação multicaracterística no contexto single-ste. Para isso utilizaram a taxa de conceção em três arições como características diferentes correlacionadas. A ouca disonibilidade de dados e a baixa herdabilidade fizeram com que os coeficientes de determinação e de regressão observados fossem também baixos. A adição de informações genômicas ao modelo aroximadamente dobrou o coeficiente de regressão e reduziu o viés das estimativas de valor genético. A utilização do modelo multicaracterísticas em relação ao unicaracterística trilicou a acurácia das estimativas dos valores genéticos genômicos ara a taxa de conceção na rimeira arição. O estudo mostrou a imortância de se utilizarem todas as informações disoníveis no aumento da caacidade de redição de valores genéticos, rincialmente, quando se tratam de características de baixa herdabilidade.

53 5 REFERÊNCIAS BIBLIOGRÁFICAS AGUILAR, I.; MISZTAL, I.; JOHNSON D. L. et al. Hot toic: A unified aroach to utilize henotyic, full edigree, and genomic information for genetic evaluation of Holstein final score. J. Dairy Sci. 93:743 75, 00. AGUILAR, I.; MISZTAL, I.; TSURUTA, S.; et al. Multile trait genomic evaluation of concetion rate in Holsteins. J. Dairy Sci. 94: 6 64, 0. AMIM, N.; van DUIJN, C.M.; AULCHENKO, YS. A genomic background based method for associantion analysis in related individuals. Plos One,, 0. CHEN, C.Y.; MISZTAL, I.; AGUILAR, I.; et al. Effect of different genomic relationshi matrices on accuracy and scale. J. Anim. Sci., 89: , 0. DAETWYLER, H. D.; VILLANUEVA, B.; BIJMA, P.; WOOLLIAMS, J. A. Inbreeding in genome-wide selection. J. Anim. Breed. Genet., 4: , 007. DE LOS CAMPOS, G.; GIANOLA, D.; BOETTCHER, P.; MORONI, P. A structural equation model for describing relationshis between somatic cell score and milk yield in dairy goats. J. Anim. Sci. 84:934-94, 006. DE LOS CAMPOS, G.; GIANOLA, D.; HERINGSTAD, B. A structural equation model for describing relationshis between somatic cell score and milk yield in first-lactation dairy cows. J. Dairy Sci. 89: , 006. ENDELMAN, J. B.; JANNINK, J. Shrinkage estimation of the realized relationshi matrix. G3, vol.,, , 0. FERNANDO, R. L.; GROSSMAN, M. Marker-assisted selection using best linear unbiased Prediction. Genet. Sel. Evol.,, , 989. FORNI, S.; AGUILAR, I.; MISZTAL, I. Different genomic relationshi matrices for singleste analysis using henotyic, edigree and genomic information. Genet. Sel. Evol., 43,, 0. GAO, H.; CHRISTENSEN, O.F.; MADSEN, P.; et al. Comarison on genomic redictions using three GBLUP methods and two single-ste blending methods in the Nordic Holstein oulation. Genetics Selection Evolution, 44: 8, 0. GIANOLA D.; DE LOS CAMPOS G. A. Course: Statistical methods for genome-enabled selection. May 6-0, 0. GIANOLA, D.; DE LOS CAMPOS G. A.; HILL, W. G. et al. Additive genetic variability and the Bayesian alhabet. Genetics, 83: , 009. GIANOLA, D.; SORENSEN, D. Quantitative genetic models for describing simultaneous and recursive relationshis between henotyes. Genetics, 67:407-44, 004.

54 5 GILLIES, D. Causality, Proensity, and bayesin networks. Synthese, 3 (-): 63-88, 00. GODDARD M. Genomic selection: rediction of accuracy and maximization of long term resonse. Genetica, 36:45-57, 009. GODDARD, M. E.; HAYES, B. J. J. Anim. Breed. Genet., 4, , 007. GODDARD, M. E.; HAYES, B. J.; MEUWISSEN, T. H. E. (0) Using the genomic relationshi matrix to redict the accuracy of genomic selection. J. Anim. Breed. Genet., 8, HAAVELMO, T.: The statistical imlications of a system of simultaneous equations. Econometrica, :-, 943. HABIER, D.; FERNANDO, R. L.; DEKKERS, J. C. M. The imact of genetic relationshi information on genome-assisted breeding values. Genetics, 77: , 007. HAYES, B. J.; BOWMAN, P. J.; CHAMBERLAIN, A. J.; GODDARD, M. E. Invited review: Genomic selection in dairy cattle: Progress and challenges. J. Dairy Sci. 9: , 009. HAYES, B. J.; VISSCHER, P. M.; GODDARD, M. E. Increased accuracy of artificial selection by using the realized relationshi matrix. Genet Res, 9:47-60, 009. HENDERSON C. R. Alications of linear models in animal breeding. University of Guelh, Guelh, 984. HENDERSON, C. R. A simle method for comuting the inverse of a numerator relationshi matrix use in rediction of breeding values. Biometrics, 3: 69 83, 976. LEGARRA, A.; AGUILAR, I.; MISZTAL, I. A relationshi matrix including full edigree and genomic information. J. Dairy Sci., 9: , 009. LEGARRA, A.; MIZSTAL, I. Technical note: Comuting strategies in genome-wide selection. J. Dairy Sci., 9: , 008 LEUTENEGGER, A. L.; PRUM, B.; GENIN, E. et al. Estimation of the inbreeding coefficient through use of genomic data. Am. J. Hum. Genet., 73: 56 53, 003. LUAN T.; WOOLLIAMS, J. A.; LIEN, S. et al. The accuracy of genomic selection in Norwegian Red Cattle assessed by cross-validation. Genetics, 83: 9-6, 009. MALECOT, G. Les mathematiques de l heredite. Masson et Cie, Paris, France, 948. MEUWISSEN, T. H.; HAYES, B. J.; GODDARD. M. E. Prediction of total genetic value using genome-wide dense marker mas. Genetics, 57:89 89, 00.

55 53 MEUWISSEN, T.H.E.; LUAN, T.; WOOLLIAMS, J.A. The unified aroach to the use of genomic and edigree information in genomic evaluations revisited. J. Anim. Breed. Genet., 8: , 0. MOSER, G.; TIER, B. ; CRUMP, R. E. et al. A comarision of five methods to redict breeding values of dairy bulls from genome-wide SNP markers. Genetics Selection Evolution, 4:56, 009. NEJATI-JAVAREMI, A.; SMITH, C.; GIBSON, J. P. Effect of total allelic relationshi on accuracy of evaluation and resonse to selection. J. Anim. Sci., 75: , 997. OPGEN-RHEIN, R.; STRIMMER, K. From correlation to causation networks: a simle aroximate learning algorithm and its alication to high-dimensional lant gene exression data. BMC System Biology, : 37, 007. PEARL, J.: Causality: Models, Reasoning and Inference. edition. Cambridge, UK: Cambridge University Press; 009. POWELL, J. E.; VISSCHER, P. M.; GODDARD, M. E. Reconciling the analysis of IBD and IBS in comlex trait studies. Nat. Genet., : , 00. ROSA, G.J.M.; VALENTE, B.D. Breeding and Genetics Symosium: Inferring causal effects from observational data in livestock. Journal of Animal Science, 9: , 0. ROSA, G.J.M.; VALENTE, B.D.; DE LOS CAMPOS, G.; et al. Inferring causal henotye Networks using structural equation models. Genetics Selection Evolution, 43:6, 0. SPIRTES, P.; GLYMOUR, C.; SCHEINES, R. Causation, Prediction and Search. edition. Cambridge, MA: MIT Press; 000. VALENTE, B.D.; ROSA, G.J.M.; DE LOS CAMPOS, G.; ET AL. Searching for recursive causal structures in multivariate genetic mixed models. Genetics, 85: , 00. VALENTE, B.D.; ROSA, G.J.M.; SILVA, M.A.; et al. Searching for henotyic causal networks involving comlex traits: na alication to Euroean quail. Genetics Selection Evolution, 43: 37, 0. VANRADEN, P. M. Efficient methods to comute genomic redictions. J. Dairy Sci., 9: , 008. VANRADEN, P. M.; VAN TASSELL, C. P.; WIGGANS, G. R. Invited review: Reliability of genomic redictions for North American Holstein bulls. J. Dairy Sci. 9: 6 4, 009. VARONA, L.; SORENSEN, D.; THOMPSON, R. Analysis of litter size and average litter weight in igs using recursive model. Genetics, 77:79-799, 007. VERMA, T., PEARL, P. Equivalence and synthesis of causal models. In Proceedings of the 6th Conference on Uncertainty in Artificial Intelligence. Volume 6. Cambridge, MA; 990:0-7, Rerinted in Uncertainty in Artificial Intelligence, 6: 55:68, Elsevier, Amsterdam.

56 54 VILLANUEVA B.; PONG-WONG R.; FERNANDEZ J.; TORO M. A. Benefits from marker-assisted selection under an additive olygenic genetic model. J. Anim. Sci., 83, , 005. WOLC, A.; STRICKER, C.; ARANGO, J. et al. Breeding value rediction for roduction traits in layer chickens using edigree or genomic relationshis in a reduced animal model. Genetics Selection Evolution, 43:5, 0. WRIGHT, S. Coefficients of inbreeding and relationshi. Am. Naturalist, 56: , 9. WRIGHT, S. Correlation and causation. J. Agric. Res., 0: , 9. WU, X-L.; HERINGSTAD, B.; GIANOLA, D. Bayesian structural equation models for inferring relationshis between henotyes: a review of methodology, identifiability, and alications. J. Anim. Breed. Genet., 7:3-5, 00. WU, X-L.;,HERINGSTAD, B.; CHANG, Y.M.; et al. Inferring relationshis between somatic cell score and milk yield using simultaneous and recursive models. J. Dairy Sci., 90: , 007. WU, X-L.; HERINGSTAD, B.; GIANOLA, D. Exloration of lagged relationshis between mastitis and milk yield in dairy cows using a Bayesian structural equation Gaussian-threshold model. Genetics Selection Evololution, 40: , 008.

57 55 Anexo.. D-Searação Uma estrutura causal recursiva ode ser reresentada or um gráfico acíclico direcionado (DAG), que é comosto or um conunto de variáveis (vértices) conectadas or linhas direcionadas (setas). Os ares de vértices conectados reresentam uma relação de efeito causal. Uma trilha na estrutura causal é uma sequência de vértices conectados. Marginalmente, existe um fluxo de deendência entre variáveis nos extremos da trilha, a menos que exista uma variável collider (variável com setas convergindo ara ela). Essas variáveis bloqueiam o fluxo de deendência em uma trilha, o que faz com que as variáveis a e b na estrutura a c b seam indeendentes, or exemlo. Condicionar a uma variável que não está em um dos extremos da trilha troca o estado de deendência considerando o fluxo através dela. Neste caso, uma variável collider ermitiria o fluxo de deendência. Duas variáveis em um DAG são ditas ser d-searadas condicionalmente a um sub-conunto S de variáveis remanescentes, se não existem caminhos entre a e b tal que todos os vértices contidos neles ermitem fluxo de deendência. Sob algumas remissas, as d-searações em uma estrutura causal resultam em indeendência na distribuição conunta de y. Isso ode ser usado ara guiar a seleção de estruturas causais que é comatível com a distribuição conunta dos dados (Sirtes et al., 000; Pearl, 009; Rosa et al., 0). Anexo.. Codificação, eserança e variância dos genótios A seguinte exlicação ode ser encontrada em Gianola e de los Camos (0). A variável aleatória W denota o genótio em um loco bialélico, ara identificação dos alelos resentes ode-se utilizar códigos ara os ossíveis genótios, como, or exemlo: W(aa) = -, W(Aa) = 0, W (AA) = (codificação ) ou W(aa) = 0, W (Aa) = e W(AA) = (codificação ) As eseranças e variâncias de W sob equilíbrio de Hardy-Weinberg são: ) Para a rimeira codificação: (W)= E HW q = ( q)=µ Var HW (W)= E(x ) E (x)= + q ( q) = q

58 56 ) Para a segunda codificação: E HW ( W ) = + q = ( + q ) = Var HW ( W ) = 4 + q 4 = q Pode-se notar que a codificação não altera a variância dos genótios, mas a média se modifica. Os desvios em relação à média e os desvios adronizados também são invariantes, como ode ser visto a seguir: W E(W) codificação : W E(W) codificação ( q)= + q = 0 0 ( q)= q = ( q)= + q = ( ) W E(W) W q Anexo.3. Relação entre a escala da matriz G e A Segundo Gianola e de los Camos (0), sob as remissas de distribuição normal dos efeitos genéticos aditivos, variância homogênea atribuída aos diferentes edaços de cromossomo, mesmo mecanismo de amostragem dos efeitos genéticos ao longo das gerações e de linearidade, o BLUP de um sinal (f) que simboliza Xβ ode ser descrito, como: y = f + e = Xβ + e, em que X é fixo, f ~ N (0, Var ( f ) e Var ( f ) = XX ' Var( β ). BLUP( f ) I + ( XX') = σ e Var( β) y. Esse reditor se transforma no BLUP descrito or VanRaden (008): ^ BLUP( g) I + G = σ Var( β ) V e marcadores, HW y, em que

59 57 HW marcadores V X X X E X X E X G, *' * ) ( ))' ( ))( ( ( = = = e a matriz de incidência dos genótios é centrada usando informações de frequência alélica. Para se obterem fenótios futuros basta inverter a fórmula: ^, ) ( g V Var G I y marcadores HW e + = β σ. Pode-se também estimar os efeitos dos marcadores utilizando a teoria clássica do BLUP sob normalidade: y XX I XX X e ^ ') ( ) ' ( ' + = β σ σ β. Portanto, ^ ^ ) ' ( ' g XX X = β e ^ ^ X β g =. X é a matriz que identifica os genótios dos animais ara os diferentes locos (no Anexo. acima são aresentados diferentes códigos ara os elementos de X). Assim, = = = = = = n n x x x x x x x XX '. Sob equilíbrio Hardy-Weinberg, = = = i = i = i ) q ( + q )= (x E )+ Var(x = x E e = = = = = + = + = i q q x E x E x x Cov x x E ) ( ) ( ) ( ) ( φ, em que φ é o relacionamento genético aditivo entre dois indivíduos. Seguindo, = = = = = = = = = = = = = n n n q q q q a simétrica q q q q a q q a q q XX E, 3 ) (... ) (.... ) (. ) (. ) ( ) ( ') ( Igualmente, se os elementos x são centrados:

60 58 E E a. a n ( e... {[ ][ ]} =.... X E X = nx ) X E( X nx )' q A q =. simétrica. an, n = [ X E(X )][ X E(X )'] nx = q nx = A. Então, a matriz de arentesco genômica é: E G = [ X E( X )][ X E( X )'] = nx ( ) nx X * X*' = V marcadores, HW, que é a realização do rocesso. Se o rocesso está em equilíbrio Hardy-Weinberg, então a sua eserança é: E [ X E(X )][ X E(X )'] nx = q de 0,5, mas esse oderia ser maior ou menor. nx = A. Por exemlo, esera-se que ai e filho tenham arentesco

61 59 CAPÍTULO Busca or estruturas causais fenotíicas com a utilização de informações genômicas Resumo: Obetivou-se com o estudo utilizar informações de marcadores moleculares ara se obter estrutura causal entre fenótios or meio do algoritmo Inductive Causation (IC), e comarar a inserção da matriz dos coeficientes de arentesco de Wright e da matriz de relacionamento genético genômico em equações multivariadas de modelos mistos a fim de se recuerar a rede causal fenotíica. Para tal, foram feitas simulações de três estruturas oulacionais que se diferiram elo número de indivíduos selecionados or geração e elo tamanho da rogênie originada a artir de cada ar de indivíduos formado ara rerodução, o que influenciou os níveis de arentesco e endogamia. Foram obtidos na simulação os fenótios, genótios e informações de edigree, necessários ara as análises. O algoritmo IC foi utilizado ara a busca da estrutura causal simulada. As inserções das matrizes de arentesco clássica e genômica no modelo multicaracterísticas ara obtenção das amostras a osteriori das (co)variâncias residuais, que são utilizadas como entrada do algoritmo, foram comaradas com base no gráficos acíclicos direcionados obtidos. Para cada situação, variouse o número de observações de edigree, genótios e fenótios utilizadas nas análises. As diferentes formas de matrizes e a quantidade variável de fenótios foram utilizadas a fim de saber a necessidade quantitativa de informações ara se obter a correta estrutura causal entre as características, e também ara avaliar a sensibilidade dos métodos frente à quantidade de informação disonível. A fim de se buscar redes causais fenotíicas or meio do algoritmo IC, a inserção da matriz de relacionamento genético genômico no método, de acordo com os gráficos acíclicos direcionados observados e obtidos ara as inúmeras reetições de simulação, aresenta vantagens quando comarada à utilização da matriz de arentesco tradicional, rincialmente, em situações esecíficas com estrutura oulacional formada or indivíduos com alto grau de arentesco e endogâmicos, ou ainda, quando há escassez de informações fenotíicas e de arentesco. Palavras-chave: algoritmo Inductive Causation, causalidade, matriz dos coeficientes de arentesco de Wright, matriz de relacionamento genético genômico, redes causais fenotíicas, simulação

62 60 Abstract: It was aimed to use molecular markers information to obtain causal structure between henotyes by means of the Inductive Causation (IC) algorithm, and to comare the insertion of the Wright s coefficients matrix and the genomic relationshi matrix in multivariate mixed model equations in order to recover the henotye causal network. For such goal, it was made a simulation of three different oulation structures that distinguish each other by the number of selected individuals er generation and the number of rogeny of each air of individuals formed for reroduction, what influenced the levels of arenthood and endogamy. It was obtained henotyes, genotyes and edigree information necessary for analyzes. The IC algorithm was imlemented for the search of the simulated causal structure. The incororation of the classic and genomic relationshi matrices in the multile trait models for the achievement of the residual (co)variances osterior distributions that are used as the algorithm inut was comared by means of the obtained acyclic semi-directed grahs. For each scenario, it was used different number of observations from edigree, genotyes and henotyes in the analyzes. The different matrices and number of henotyes were used in order to know the quantitative necessity of information to obtain the correct causal structure between traits, as well as, to evaluate the sensibility of such methods under the available information. In order to search causal structures between henotyes using the IC algorithm, the insertion of the genomic relationshi matrix in the method, according to the observed directed acyclic grahs obtained for several simulation reetitions, shows advantages when comared to the traditional relationshi matrix, esecially in secific scenarios where the oulation structure is comosed by highly related and endogamic individuals, or when there is a lack of henotye and edigree information. Keywords: causality, genomic relationshi matrix, Inductive Causation algorithm, henotye causal networks, simulation, Wright s coefficients relationshi matrix

63 6 INTRODUÇÃO A causalidade ode ser definida como uma relação de eventos articulares, em que um rimeiro evento ocorre e causa um segundo evento a acontecer (Sirtes, 000). Em outras alavras, existe causalidade quando um evento secundário é, elo menos em arte, determinado ela existência de um evento rimário. A erceção do relacionamento causal em um sistema de variáveis oderia gerar informação mais oderosa do que a obtenção de arâmetros de associação linear simles entre características, como, or exemlo, a correlação. O conhecimento da causalidade ermite quantificar resultados que são consequências de intervenções externas, rovendo a habilidade de controle de eventos futuros (Blaisdell et al., 006; Pearl, 009; Valente et al., 03b). Esecificamente na área da rodução animal, na qual é muito imortante o laneamento de ráticas de maneo, é de grande interesse a redição dos efeitos de mudanças alicadas ao sistema, como, or exemlo, o efeito do nível nutricional de diferentes dietas sobre características de rodução ou o efeito da qualidade da água sobre a incidência de doenças (Rosa & Valente, 0). Ainda, em melhoramento animal, o auste de modelos que consideram relações causais, como, o Modelo de Equações Estruturais (SEM), culmina em informações adicionais aos modelos clássicos. Por exemlo, ode ser feita a redição de valores genéticos esecíficos ara diferentes cenários frente à modificação da rede causal fenotíica. Um cenário em que isso se alica seria quando há a fixação do valor de uma característica or meio de intervenções externas ao sistema, como em casos de ráticas de maneos rerodutivos ou ao se abater o animal a certa idade (Valente et al., 03b). Existem basicamente dois meios elos quais a magnitude do relacionamento causal entre características fenotíicas ode ser estimada. Um, é o uso de exerimentos delineados, em que todas as fontes de variação fenotíica são controladas or casualização e o obeto de estudo é isolado como a causa de uma característica articular. O segundo se dá a artir da utilização de dados observacionais coletados a camo, que é o caso da maioria dos dados disoníveis em estudos de rodução e melhoramento genético animal. Embora, a rimeira ferramenta ossa ser vista como mais controlada e simles que a segunda, ela não é semre uma reresentação fidedigna de um cenário real ou não ode ser realizada or causa de reocuações éticas e logísticas.

64 6 A modelagem causal com base em dados observacionais foi aresentada or Wright (9) e Haavelmo (943) de uma maneira em que a qualidade da informação causa-efeito oderia ser combinada com rocedimentos estatísticos a fim de roorcionar uma medida quantitativa do relacionamento entre as características de interesse. No modelo, uma ou mais variáveis odem aarecer como variáveis exlanatórias nas equações da variável resosta, a qual ode ser causa de outras variáveis, reresentando relacionamentos simultâneos ou recursivos. Por esse motivo, o Modelo de Equações Estruturais oderia ser uma alternativa ao tradicional modelo multicaracterísticas (MTM). Em genética e melhoramento animal, essa metodologia não recebeu muita atenção até que Gianola e Sorensen (004) adataram o SEM ao contexto das Equações de Modelos Mistos considerando herança genética. Desde então, o interesse no SEM têm aumentado e vários estudos foram ublicados usando dados de diferentes esécies e características (de Los camos et al., 006a; de Los camos et al., 006b; Varona et al., 007; Wu et al., 008; Valente et al., 0). A inferência de efeitos causais or meio do SEM assume que a estrutura causal real entre características é conhecida, ou sea, é necessário que se defina a riori a estrutura causal entre as características de interesse ao se austar o modelo. Aarentemente essa remissa ode ser cumrida ela comaração exaustiva de todos os modelos de todas as ossíveis estruturas or algum critério, como, o AIC (Akaike, 974) ou o BIC (Schwartz, 978). Entretanto, o número de ossíveis estruturas causais é grande e seria muito laborioso comará-las. Ainda, o número de estruturas ossíveis aumenta consideravelmente com o aumento da quantidade de variáveis no sistema (Verma & Pearl, 990; Pearl, 000; Valente et al., 00). Uma alternativa, como rimeiramente foi utilizada or muitos autores (de Los camos et al., 006a; de Los camos et al., 006b; Varona et al., 007; Wu et al., 008), é a ré-seleção de algumas estruturas a serem comaradas usando o conhecimento a riori sobre a biologia das características, informações obtidas de exerimentos ou, até mesmo, a sequência temoral de exressão dos fenótios. Em casos em que não se admite o conhecimento do relacionamento entre os fenótios, oderiam ser usados alguns algoritmos que exloram o esaço de estruturas causais, como, o algoritmo Inductive Causation - IC (Verma & Pearl, 990). Tal metodologia foi desenvolvida ara recuerar Gráficos Acíclicos Direcionados (DAGs), que reresentam estruturas causais recursivas entre variáveis, or meio da distribuição conunta dos dados. Um gráfico causal ode ser interretado como uma família de modelos causais dos quais relacionamentos causais qualitativos odem ser deduzidos. Aesar de não aresentar informação quantitativa sobre o efeito de uma variável sobre outra, os gráficos odem ser

65 63 muito eficientes em reresentar indeendências condicionais entre variáveis que necessariamente seguem uma estrutura causal que as originam (Valente et al., 03a). A utilização do algoritmo IC na área da genética e melhoramento animal foi roosta or Valente et al. (00), deois disso, alguns estudos á têm usado a metodologia ara obtenção de redes causais entre fenótios e osterior utilização do Modelo de Equações Estruturais (Valente et al., 0, Bouwman et al., 04). Esse algoritmo utiliza a matriz de (co)variância residual do clássico modelo multicaracterísticas, reviamente austado, visando fazer decisões estatísticas. Mais esecificamente, são utilizadas distribuições a osteriori das correlações residuais arciais entre ares de variáveis ara determinar deendência condicional entre elas. Considerando isso, é lausível afirmar que a adição de informações que gerem redições sobre as (co)variâncias residuais mais recisas oderia enriquecer o desemenho ara a busca da verdadeira estrutura causal existente. Tal ganho ode ser alcançado, or exemlo, ela adição de informações moleculares no modelo de redição quando o fato de ossuir somente os dados de edigree e de fenótios não é suficiente. Com a atual disonibilidade de informações de marcadores de DNA ara muitos locos esalhados ao longo do genoma, ode ser construída a matriz de relacionamento genético genômico (matriz G), na qual os elementos mostram a verdadeira roorção do genoma comartilhado ara medir a similaridade entre indivíduos. Essa matriz é considerada mais recisa do que a matriz de coeficientes de arentesco tradicional construída a artir de dados de edigree (matriz A), uma vez que a última reroduz aenas a exectativa de comartilhamento de alelos (VanRaden et al., 008; Forni et al., 0). Uma consideração adicional é que a falta e erros de dados de edigree, que comumente ocorrem em anotações de observações obtidas a camo, odem ser suerados ela genotiagem de toda a oulação de interesse, assim a rede fenotíica causal oderia ser de toda forma recuerada. Obetivou-se com o estudo utilizar informações de marcadores moleculares ara se obter estrutura causal entre fenótios or meio do algoritmo Inductive Causation. Assim como, comarar a inserção da matriz de arentesco clássica e da matriz de relacionamento genético genômico em equações multivariadas de modelos mistos a fim de se recuerar a rede causal fenotíica.

66 64 MATERIAL E MÉTODOS Simulação Para se obterem amostras dos fenótios, assim como, dos genótios e do edigree dos indivíduos, informações necessárias ara a construção da matriz dos coeficientes de arentesco tradicional (matriz A) e a matriz de relacionamento genético genômico (matriz G), algumas simulações foram realizadas usando o rograma R (códigos essoais). Foram feitas 0 reetições de simulação ara cada uma das três diferentes estruturas oulacionais estudadas, as quais se diferiam elo número de indivíduos selecionados or geração e elo tamanho da rogênie originada a artir de cada ar de indivíduos formado ara rerodução, o que também influencia o arentesco entre os animais da oulação e o grau de endogamia. Para cada simulação foi gerado um genoma com 30 cromossomos de Morgan cada, os quais continham 0 locos bi-alélicos equidistantes que foram designados como QTLs utativos e foram flanqueados or 70 marcadores do tio olimorfismos de nucleotídeos simles (SNPs) em cada lado. Assim, somou-se um total de 300 QTLs e aroximadamente SNPs igualmente distribuídos ao longo do genoma. A comosição de cada um dos cromossomos ode ser reresentada, como: M,..., M 70, Q, M,..., M 70, Q,..., Q 0, M,..., M 70. Em que, M i é um marcador e Q i é um QTL. No início da simulação foram comutadas 000 gerações de evolução da oulação (t a t 000 ) sob seleção e acasalamento ao acaso com tamanho de oulação de 00 indivíduos, sendo considerados 50 indivíduos de cada sexo. O balanço da frequência gênica foi definido or mutação, em uma taxa de.5 x 0-3 or loco e or geração, e ela recombinação gênica (crossing-over), com robabilidade de ocorrência deendente da distância entre locos, de forma a se ermitir criar desequilíbrio de ligação entre os alelos. Todos os alelos na geração base foram fixados como 0 e deois mutados ara de acordo com a robabilidade de mutação. Como resultado, cerca de 99 or cento dos locos estavam segregando ao final das 000 gerações. Como eserado, a distribuição da frequência alélica teve a forma de U (Figura ). Aós 000 gerações foi feita uma exansão da oulação or meio de acasalamento fatorial entre cada um dos 50 machos da última geração e 0 fêmeas escolhidas ao acaso. Para então, formação de gerações (g a g ) com 500 indivíduos em cada, os quais tiveram a

67 65 informação de arentesco (edigree) armazenada. O genótio e fenótio dos indivíduos das últimas quatro gerações (g 8 a g ) também foram salvos. Nas simulações não houve sobreosição das gerações. A artir da geração g cessou-se a mutação, ortanto, assaram a atuar sobre a frequência alélica aenas as forças de recombinação gênica e seleção. No Anexo. está exosta arte do código que é comum ara todos os cenários oulacionais desenvolvidos e que reresenta a evolução das rimeiras 00 gerações, como descrito acima. A maneira com que as gerações g a g evoluíram deendeu do número de animais amostrados e acasalados aleatoriamente ara originar a róxima geração e do número de rogênie ara cada casal formado. Situação: Para a rimeira estrutura oulacional simulada, machos e fêmeas de cada uma das gerações g a g 0 foram aleatoriamente escolhidos e acasalados ao acaso ara roduzir 500 descendentes or geração. Assim, os números de ais, irmãos comletos e meio-irmãos or indivíduo oderiam variar entre as reetições feitas, sendo eserado que o relacionamento genético entre os indivíduos sea fraco e existente rincialmente or conta da relação aifilho em seguidas gerações. Situação : Na segunda estrutura oulacional, ara cada geração, cinco machos e 00 fêmeas foram escolhidos aleatoriamente e acasalados em esquema fatorial a fim de gerar os indivíduos da róxima geração, assim a maior fonte de informação de relacionamento genético entre os indivíduos é roveniente de famílias de meio-irmãos e o arentesco médio eserado entre os indivíduos é maior que o do cenário anterior. Situação 3: Para a terceira estrutura oulacional, dois machos e 5 fêmeas foram amostrados e acasalados ao acaso, roduzindo 0 indivíduos or casal formado. Nessa situação, cada um dos indivíduos das diferentes gerações teria arentesco com vários meio-irmãos e nove irmãos-comletos, o que causa magnitudes de coeficiente de arentesco e de endogamia média ainda maior que no segundo cenário.

68 66 Figura. Freqüência alélica nas quatro últimas gerações de indivíduos de uma reetição de simulação tomada aleatoriamente ara cada uma das três estruturas oulacionais estudadas.

Rememorando. Situação-problema 5. Teorema do Limite Central. Estatística II. Aula II

Rememorando. Situação-problema 5. Teorema do Limite Central. Estatística II. Aula II UNIVERSIDADE FEDERAL DE RONDÔNIA CAMPUS DE JI-PARAN PARANÁ DEPARTAMENTO DE ENGENHARIA AMBIENTAL Rememorando Estatística II Aula II Profa. Renata G. Aguiar 1 Figura 7 Distribuição de uma amostra (n = 150).

Leia mais

Cap. 6. Definição e métodos de resolução do problema de valores de fronteira

Cap. 6. Definição e métodos de resolução do problema de valores de fronteira Ca. 6. Definição e métodos de resolução do roblema de valores de fronteira 1. Pressuostos 2. Formulação clássica do roblema de elasticidade linear 2.1 Condições no interior 2.2 Condições de fronteira 2.3

Leia mais

Outras Técnicas que Utilizam o Escore de Propensão

Outras Técnicas que Utilizam o Escore de Propensão Técnicas Econométricas ara Avaliação de Imacto Outras Técnicas que Utilizam o Escore de Proensão Rafael Perez Ribas Centro Internacional de Pobreza Brasília, 28 de maio de 2008 Introdução O Escore de Proensão

Leia mais

Noções de Testes de Hipóteses

Noções de Testes de Hipóteses Noções de Testes de Hióteses Outro tio de roblema da Inferência Estatística é o de testar se uma conjectura sobre determinada característica de uma ou mais oulações é, ou não, aoiada ela evidência obtida

Leia mais

Aprendizagem de Dados Simbólicos e/ou Numéricos. Francisco Carvalho

Aprendizagem de Dados Simbólicos e/ou Numéricos. Francisco Carvalho Arendizagem de Dados Simbólicos e/ou Numéricos Francisco Carvalho Inut n objetos formando uma artição em m classes cada objeto é descrito or variáveis modais de semântica robabilística. Objetivo Descrever,

Leia mais

Teste de hipóteses para médias e proporções amostrais

Teste de hipóteses para médias e proporções amostrais Teste de hióteses ara médias e roorções amostrais Prof. Marcos Pó Métodos Quantitativos ara Ciências Sociais Hiótese estatística Hiótese é uma exlicação rovisória roosta ara um fenômeno, assível de ser

Leia mais

Passos lógicos. Texto 18. Lógica Texto Limitações do Método das Tabelas Observações Passos lógicos 4

Passos lógicos. Texto 18. Lógica Texto Limitações do Método das Tabelas Observações Passos lógicos 4 Lógica ara Ciência da Comutação I Lógica Matemática Texto 18 Passos lógicos Sumário 1 Limitações do Método das Tabelas 2 1.1 Observações................................ 4 2 Passos lógicos 4 2.1 Observações................................

Leia mais

1 LIMITES FUNDAMENTAIS NA TEORIA DA INFORMAÇÃO

1 LIMITES FUNDAMENTAIS NA TEORIA DA INFORMAÇÃO LIMITES FUNDAMENTAIS NA TEORIA DA INFORMAÇÃO O trabalho de Shannon sobre a teoria da informação, ublicado em 948, estabelece a base teórica ara que sistemas de comunicações seam eficientes e confiáveis.

Leia mais

Teste de hipóteses para médias e proporções amostrais

Teste de hipóteses para médias e proporções amostrais Teste de hióteses ara médias e roorções amostrais Prof. Marcos Pó Métodos Quantitativos ara Ciências Sociais Questão rática Abrir a lanilha Alunos MQCS_16-18 e calcular a média, o desvio adrão e o tamanho

Leia mais

APOSTILA DE MÉTODOS QUANTITATIVOS

APOSTILA DE MÉTODOS QUANTITATIVOS UNIVERSIDADE FEDERAL DO PARÁ ASSESSORIA DE EDUCAÇÃO A DISTÂNCIA INSTITUTO DE CIÊNCIAS SOCIAIS APLICADAS ESPECIALIZAÇÃO EM GESTÃO EMPRESARIAL NA MODALIDADE SEMIPRESENCIAL APOSTILA DE MÉTODOS QUANTITATIVOS

Leia mais

INSTITUTO SUPERIOR DE AGRONOMIA ESTATÍSTICA E DELINEAMENTO 9 de Janeiro, 2017 PRIMEIRO EXAME Uma resolução possível

INSTITUTO SUPERIOR DE AGRONOMIA ESTATÍSTICA E DELINEAMENTO 9 de Janeiro, 2017 PRIMEIRO EXAME Uma resolução possível INSTITUTO SUPERIOR DE AGRONOMIA ESTATÍSTICA E DELINEAMENTO 9 de Janeiro, 2017 PRIMEIRO EXAME 2016-17 Uma resolução ossível I A tabela tem contagens de borboletas (de segunda esécie) ingeridas elos ássaros,

Leia mais

Modelos para Regressão. Modelos lineares. Exemplo. Método de regressão linear

Modelos para Regressão. Modelos lineares. Exemplo. Método de regressão linear Modelos ara Regressão Pretende-se arender a redizer o valor de uma variável (atributo) numérica. Os atributos (ou variáveis) usados como entrada ara o algoritmo de arendizagem dizem-se reditores odendo

Leia mais

Teste de hipóteses para médias e proporções amostrais

Teste de hipóteses para médias e proporções amostrais Teste de hióteses ara médias e roorções amostrais Prof. Marcos Pó Métodos Quantitativos ara Ciências Sociais Questão rática Abrir a lanilha Alunos MQCS_16-18 e calcular a média, o desvio adrão e o tamanho

Leia mais

Redes Neurais e Sistemas Fuzzy

Redes Neurais e Sistemas Fuzzy Conceitos básicos de redes neurais recorrentes Redes eurais e Sistemas Fuzzy Redes eurais Recorrentes A Rede de Hofield A suressão do ruído numa memória auto-associativa linear ode ser obtida colocando-se

Leia mais

BUSCA POR ESTRUTURAS CAUSAIS NO CONTEXTO DE MODELOS MISTOS EM GENÉTICA QUANTITATIVA

BUSCA POR ESTRUTURAS CAUSAIS NO CONTEXTO DE MODELOS MISTOS EM GENÉTICA QUANTITATIVA BRUNO DOURADO VALENTE BUSCA POR ESTRUTURAS CAUSAIS NO CONTEXTO DE MODELOS MISTOS EM GENÉTICA QUANTITATIVA Tese apresentada ao Programa de Pós-Graduação em Zootecnia da Escola de Veterinária da Universidade

Leia mais

A partir da árvore correta (a da direita), deduz-se o espaço de estados

A partir da árvore correta (a da direita), deduz-se o espaço de estados .. SOLUÇÕES PARA EXERCÍCIOS DA SEÇÃO. 77. Soluções ara exercícios da Seção. Solução do Exc. 1. O certo é começar a solução com a construção do modelo roailístico do exerimento aleatório enunciado. E a

Leia mais

3 Propagação em ambientes abertos na faixa GHz

3 Propagação em ambientes abertos na faixa GHz 3 Proagação em ambientes abertos na faixa 10-66 GHz Na faixa de freqüências de oeração entre 10 e 66 GHz, a existência de visada direta é muito imortante ara viabilizar a comunicação de sistemas sem fio

Leia mais

AA-220 AERODINÂMICA NÃO ESTACIONÁRIA

AA-220 AERODINÂMICA NÃO ESTACIONÁRIA AA- AERODINÂMICA NÃO ESTACIONÁRIA Introdução e conceitos básicos da teoria Prof. Roberto GIL Email: gil@ita.br Ramal: 648 1 AERODINÂMICA NÃO ESTACIONÁRIA Objetivo: Partir das equações de Navier-Stokes

Leia mais

4 Cargas Dinâmicas 4.1 Introdução

4 Cargas Dinâmicas 4.1 Introdução 4 Cargas Dinâmicas 4.1 Introdução Carregamentos dinâmicos, or definição, são carregamentos em que a magnitude, a direção e a osição odem variar ao longo do temo. Consequentemente, as resostas da estrutura,

Leia mais

Redes Neurais. Redes Neurais Recorrentes A Rede de Hopfield. Prof. Paulo Martins Engel. Memória associativa recorrente

Redes Neurais. Redes Neurais Recorrentes A Rede de Hopfield. Prof. Paulo Martins Engel. Memória associativa recorrente Redes eurais Redes eurais Recorrentes A Rede de Hofield Memória associativa recorrente A suressão do ruído numa memória auto-associativa ode ser obtida colocando-se uma função de limiar na saída de um

Leia mais

DISTRIBUIÇÃO DE PROBABILIDADES BINOMIAL. Para cada um dos lançamentos, há dois resultados distintos, ou probabilidades elementares:

DISTRIBUIÇÃO DE PROBABILIDADES BINOMIAL. Para cada um dos lançamentos, há dois resultados distintos, ou probabilidades elementares: DISTRIBUIÇÃO DE PROBABILIDADES BIOMIAL onsiderem-se dois lançamentos de uma moeda honesta. Seja a variável aleatória X=nº de caras saídas, em que os ossíveis valores de X são 0 (saída de duas coroas),

Leia mais

Parâmetros do Hidrograma Unitário para bacias urbanas brasileiras

Parâmetros do Hidrograma Unitário para bacias urbanas brasileiras RBRH Revista Brasileira de Recursos Hídricos Porto Alegre RS ABRH Vol 8 n.2 abr/jun) 195-199. 2003 Parâmetros do Hidrograma Unitário ara bacias urbanas brasileiras Carlos E. M. Tucci Instituto de Pesquisas

Leia mais

FICHA de AVALIAÇÃO de MATEMÁTICA A 12.º Ano de escolaridade Versão.1

FICHA de AVALIAÇÃO de MATEMÁTICA A 12.º Ano de escolaridade Versão.1 FICHA de AVALIAÇÃO de MATEMÁTICA A.º Teste.º Ano de escolaridade Versão. Nome: N.º Turma: Professor: José Tinoco 6//08 Evite alterar a ordem das questões Nota: O teste é constituído or duas artes Caderno

Leia mais

Um Modelo Híbrido para Previsão de Produção de Petróleo

Um Modelo Híbrido para Previsão de Produção de Petróleo Um Modelo Híbrido ara Previsão de Produção de Petróleo Francisca de Fátima do Nascimento Silva Programa de Pós-Graduação em Ciência e Engenharia de Petróleo - PPGCEP fatima@ccet.ufrn.br Adrião Duarte Dória

Leia mais

3. ANÁLISE DE DADOS EXPERIMENTAIS

3. ANÁLISE DE DADOS EXPERIMENTAIS 3. AÁLISE DE DADOS EXPEIMETAIS 3. Introdução. Todo dado eerimental deve ser analisado através de algum tio de rocedimento. Um bom eerimentalista deve fazer todo o esforço ossível ara eliminar todos os

Leia mais

A IMAGEM ENTROPIA-COERÊNCIA NA DETECÇÃO DE VARIAÇÕES ENTRE IMAGENS SAR RAFAEL ZANDONÁ SCHNEIDER DAVID FERNANDES

A IMAGEM ENTROPIA-COERÊNCIA NA DETECÇÃO DE VARIAÇÕES ENTRE IMAGENS SAR RAFAEL ZANDONÁ SCHNEIDER DAVID FERNANDES Anais XI SBSR, Belo Horizonte, Brasil, 05-0 abril 003, INPE,. 8-88. A IMAGEM ENTROPIA-COERÊNCIA NA DETECÇÃO DE VARIAÇÕES ENTRE IMAGENS SAR RAFAEL ZANDONÁ SCHNEIDER DAVID FERNANDES Instituto Tecnológico

Leia mais

PROTOCOLO PARA ESTIMAR ERROS DE DISCRETIZAÇÃO EM CFD: VERSÃO 1.1. Carlos Henrique Marchi. Curitiba, UFPR, setembro de 2005.

PROTOCOLO PARA ESTIMAR ERROS DE DISCRETIZAÇÃO EM CFD: VERSÃO 1.1. Carlos Henrique Marchi. Curitiba, UFPR, setembro de 2005. PROTOCOLO PARA ESTIMAR ERROS DE DISCRETIZAÇÃO EM CFD: VERSÃO. Carlos Henrique Marchi Curitiba, FPR, setembro de 2005. O objetivo deste rotocolo é adronizar o rocesso de Verificação de soluções numéricas

Leia mais

UNIVERSIDADE CATÓLICA PORTUGUESA Faculdade de Ciências Económicas e Empresariais. Microeconomia

UNIVERSIDADE CATÓLICA PORTUGUESA Faculdade de Ciências Económicas e Empresariais. Microeconomia UNIVERSIDADE CATÓLICA PORTUGUESA Faculdade de Ciências Económicas e Emresariais icroeconomia Licenciatura em Administração e Gestão de Emresas 3 de Novembro de Fernando Branco Eame de Finalistas Gabinete

Leia mais

Cadeias de Markov. 1. Introdução. Modelagem e Simulação - Cadeias de Markov

Cadeias de Markov. 1. Introdução. Modelagem e Simulação - Cadeias de Markov Cadeias de Markov. Introdução Nestas notas de aula serão tratados modelos de robabilidade ara rocessos que evoluem no temo de maneira robabilística. Tais rocessos são denominados rocessos Estocásticos...

Leia mais

Cadeias de Markov. Andrei Andreyevich Markov (*1856, Ryazan, Russia; 1922, São Petersburgo, Russia).

Cadeias de Markov. Andrei Andreyevich Markov (*1856, Ryazan, Russia; 1922, São Petersburgo, Russia). Cadeias de Markov Andrei Andreyevich Markov (*856, Ryazan, Russia; 9, São etersburgo, Russia). Acreditar é mais fácil do que ensar. Daí existirem muito mais crentes do que ensadores. - Bruce Calvert .

Leia mais

COMPARAÇÃO DE MÉTODOS PARA TESTE DE BIGAUSSIANIDADE

COMPARAÇÃO DE MÉTODOS PARA TESTE DE BIGAUSSIANIDADE COMPARAÇÃO DE MÉTODOS PARA TESTE DE BIGAUSSIANIDADE Jorge Kazuo YAMAMOTO 1 & Li CHAO (1) Deartamento de Geologia Sedimentar e Ambiental, Instituto de Geociências, USP. Rua do Lago, 56 Cidade Universitária.

Leia mais

Definição das variáveis principais consideradas no Programa Richardson 4.0

Definição das variáveis principais consideradas no Programa Richardson 4.0 Definição das variáveis rinciais consideradas no Prorama Richardson 4 ) Ordens verdadeiras real*6dimension(:)allocatable :: V! ordens verdadeiras do erro verdadeiro character*5dimension(:)allocatable ::

Leia mais

ESCOAMENTO ANUAL 1 DISTRIBUIÇÃO ESTATÍSTICA

ESCOAMENTO ANUAL 1 DISTRIBUIÇÃO ESTATÍSTICA ESCOAMENTO ANUAL 1 DISTRIBUIÇÃO ESTATÍSTICA O escoamento anual numa secção de um rio tem essencialmente uma natureza aleatória não sendo ortanto ossível rever deterministicamente os seus valores futuros

Leia mais

matematicaconcursos.blogspot.com

matematicaconcursos.blogspot.com Professor: Rômulo Garcia Email: machadogarcia@gmail.com Conteúdo Programático: Teoria dos Números Exercícios e alguns conceitos imortantes Números Perfeitos Um inteiro ositivo n diz-se erfeito se e somente

Leia mais

Situação-problema 3. Situação-problema 3. Situação-problema 3. Situação-problema 3. Distribuição Amostral da Proporção.

Situação-problema 3. Situação-problema 3. Situação-problema 3. Situação-problema 3. Distribuição Amostral da Proporção. UNIVERSIDADE FEDERAL DE RONDÔNIA CAMPUS DE JI-PARANÁ DEPARTAMENTO DE ENGENHARIA AMBIENTAL Situação-roblema 3 Estatística II Profa. Renata Gonçalves Aguiar Suonha que uma indústria tenha feito uma esquisa

Leia mais

O Mistério dos Chocalhos

O Mistério dos Chocalhos O Mistério dos Chocalhos Cláudia Peixoto IME-USP O objetivo desta oficina é introduzir os conceitos de amostragem e estimação. Para tanto iremos utilizar um objeto idealizado ela MTEMTEC (htt://matemateca.ime.us.br/).

Leia mais

FICHA de AVALIAÇÃO de MATEMÁTICA A 12.º Ano de escolaridade Versão.4

FICHA de AVALIAÇÃO de MATEMÁTICA A 12.º Ano de escolaridade Versão.4 FICHA de AVALIAÇÃO de MATEMÁTICA A.º Teste.º Ano de escolaridade Versão.4 Nome: N.º Turma: Professor: José Tinoco 6//08 Evite alterar a ordem das questões Nota: O teste é constituído or duas artes Caderno

Leia mais

Angela Fontana Marques

Angela Fontana Marques DOI: 0.405/actascitechnol.v3i.88 Alicação da análise multivariada na infraestrutura e no desemenho das escolas úblicas do Ensino Fundamental e Médio ertencentes ao Núcleo Regional de Educação de Paranavaí

Leia mais

Coeficiente de heterogeneidade do solo e tamanho de parcela

Coeficiente de heterogeneidade do solo e tamanho de parcela Coeficiente de heterogeneidade do solo 105 Coeficiente de heterogeneidade do solo e tamanho de arcela Sueli Martins de Freitas Alves (1) e José Carlos Serahin () (1) Universidade Estadual de Goiás, Unidade

Leia mais

MADEIRA arquitetura e engenharia

MADEIRA arquitetura e engenharia Voltar MADEIRA arquitetura e engenharia Modelo ara Análise Global de Estruturas de Madeira com Avaliação de Forças Localizadas em inos Deformáveis nº 4 artigo3 Eng. Civil rof. Dr. Francisco A. Romero Gesualdo

Leia mais

Distribuição de uma proporção amostral

Distribuição de uma proporção amostral Distribuição de uma roorção amostral Estatística II Antonio Roque Aula 4 Exemlo Ilustrativo: Suonha que se saiba que em uma certa oulação humana uma roorção de essoas igual a = 0, 08 (8%) seja cega ara

Leia mais

Escola Secundária/3 da Sé-Lamego Ficha de Trabalho de Matemática Ano Lectivo 2003/04 Probabilidade condicionada; acontecimentos independentes 12.

Escola Secundária/3 da Sé-Lamego Ficha de Trabalho de Matemática Ano Lectivo 2003/04 Probabilidade condicionada; acontecimentos independentes 12. Escola Secundária/ da Sé-Lamego Ficha de Trabalho de Matemática no Lectivo 00/0 Probabilidade condicionada; acontecimentos indeendentes º no Nome: Nº: Turma: Demonstre que se e são acontecimentos indeendentes,

Leia mais

ADRIANO MENDONÇA SOUZA

ADRIANO MENDONÇA SOUZA ADRIANO MENDONÇA OUZA COMPONENTE PRINCIPAI APLICAÇÃO NA REDUÇÃO DE VARIÁVEI ECONÔMICA PARA O ETUDO DE ÉRIE TEMPORAI DIERTAÇÃO DE METRADO anta Maria, R BRAIL 993 UNIVERIDADE FEDERAL DE ANTA MARIA CENTRO

Leia mais

Capítulo 7 - Wattímetros

Capítulo 7 - Wattímetros Caítulo 7 - Wattímetros 7. Introdução Os wattímetros eletromecânicos ertencem à uma classe de instrumentos denominados instrumentos eletrodinâmicos. Os instrumentos eletrodinâmicos ossuem dois circuitos

Leia mais

11. Equilíbrio termodinâmico em sistemas abertos

11. Equilíbrio termodinâmico em sistemas abertos Equilíbrio termodinâmico em sistemas abertos Em um sistema aberto definimos o equilíbrio termodinâmico quando este sistema encontra-se simultaneamente em equilíbrio térmico, equilíbrio mecânico e equilíbrio

Leia mais

RESISTÊNCIA DOS MATERIAIS 2 Marcel Merlin dos Santos

RESISTÊNCIA DOS MATERIAIS 2 Marcel Merlin dos Santos 03/11/017 RESISTÊNIA DOS MATERIAIS Marcel Merlin dos Santos TENSÃO EM EIXOS QUE SE DEVE À ARGA AXIAL E À TORÇÃO Ocasionalmente os eios circulares são submetidos a efeitos combinados de carga aial e torção.

Leia mais

Probabilidades e Estatística

Probabilidades e Estatística Deartamento de Matemática Probabilidades e Estatística LEAN, LEE, LEGI, LERC, LMAC, MEAer, MEAmbi, MEBiol, MEEC, MEMec o semestre 011/01 1 o Teste B 1/04/01 11:00 Duração: 1 hora e 30 minutos Justifique

Leia mais

Algoritmos genéticos: alguns experimentos com os operadores de cruzamento ( Crossover ) para o problema do caixeiro viajante assimétrico

Algoritmos genéticos: alguns experimentos com os operadores de cruzamento ( Crossover ) para o problema do caixeiro viajante assimétrico Algoritmos genéticos: alguns exerimentos com os oeradores de cruzamento ( Crossover ) ara o roblema do caixeiro viajante assimétrico Anderson Freitas Silva (DIE/UFPI) cadfreitas@yahoo.com.br Antonio Costa

Leia mais

3. Modelos Constitutivos

3. Modelos Constitutivos 3. Modelos Constitutivos A comlexidade envolvida no estudo da deformação de solos e rochas é um dos grandes desafios da engenharia. No entanto, aesar da diversidade desse comortamento, observações exerimentais

Leia mais

Um catalisador heterogêneo é aquele que está em uma fase diferente da do sistema reacional. Focaremos nossa aula em sistemas de gás e sólido.

Um catalisador heterogêneo é aquele que está em uma fase diferente da do sistema reacional. Focaremos nossa aula em sistemas de gás e sólido. ula: 32 Temática: Catálise Heterogênea Um catalisador heterogêneo é aquele que está em uma fase diferente da do sistema reacional. Focaremos nossa aula em sistemas de gás e sólido. catálise heterogênea

Leia mais

INFLUÊNCIA DA IDADE MATERNA SOBRE OS RESULTADOS PERINATAIS

INFLUÊNCIA DA IDADE MATERNA SOBRE OS RESULTADOS PERINATAIS INFLUÊNCIA DA IDADE MATERNA SOBRE OS RESULTADOS PERINATAIS MILLENA CAVALCANTI MONTEIRO ROGÉRIA MÁXIMO DE LAVÔR GUÊDIJANY HENRIQUE PEREIRA MARIA JUSSIANY GONÇALVES DE ABRANTES MARIA DO CARMO ANDRADE DUARTE

Leia mais

FICHA de AVALIAÇÃO de MATEMÁTICA A 12.º Ano de escolaridade Versão.3

FICHA de AVALIAÇÃO de MATEMÁTICA A 12.º Ano de escolaridade Versão.3 FICHA de AVALIAÇÃO de MATEMÁTICA A.º Teste.º Ano de escolaridade Versão. Nome: N.º Turma: Professor: José Tinoco 6//08 Evite alterar a ordem das questões Nota: O teste é constituído or duas artes Caderno

Leia mais

Intercruzamento em uma população de soja derivada de um retrocruzamento e perspectivas de melhoramento

Intercruzamento em uma população de soja derivada de um retrocruzamento e perspectivas de melhoramento Intercruzamento em uma oulação de soja derivada de um retrocruzamento e ersectivas de melhoramento Larissa Pereira de Castro 1, Guilherme José Farias, Marco ntonio cevedo Barona 3, José Manoel Colombari-Filho

Leia mais

GRUPO X GRUPO DE ESTUDO DE SOBRETENSÕES E COORDENAÇÃO DE ISOLAMENTO GSC

GRUPO X GRUPO DE ESTUDO DE SOBRETENSÕES E COORDENAÇÃO DE ISOLAMENTO GSC SNPTEE SEMINÁRIO NACIONAL DE PRODUÇÃO E TRANSMISSÃO DE ENERGIA ELÉTRICA GSC-7 9 a 24 Outubro de 23 Uberlândia - Minas Gerais GRUPO X GRUPO DE ESTUDO DE SOBRETENSÕES E COORDENAÇÃO DE ISOLAMENTO GSC INFLUÊNCIA

Leia mais

5 Ferramentas de analise

5 Ferramentas de analise 5 Ferramentas de analise 5.. Função Janela ara a Transformada de Fourier Sabe-se que a transformada de Fourier de um sinal finito da margem a esúrios no domínio da freqüência, conecidos como vazamento

Leia mais

DETERMINAÇÃO E ANÁLISE DE DESEMPENHO DO MODELO APT - ARBITRAGE PRICING THEORY - NO MERCADO DE CAPITAIS BRASILEIRO

DETERMINAÇÃO E ANÁLISE DE DESEMPENHO DO MODELO APT - ARBITRAGE PRICING THEORY - NO MERCADO DE CAPITAIS BRASILEIRO DETERMINAÇÃO E ANÁLISE DE DESEMPENHO DO MODELO APT - ARBITRAGE PRICING THEORY - NO MERCADO DE CAPITAIS BRASILEIRO Autores: Luiz Maranhão de Mello e Carlos Patrício Samanez Resumo Utilizando as cotações

Leia mais

Análise da Aquisição de Equipamentos Médicos Utilizando Redes Neurais Artificiais

Análise da Aquisição de Equipamentos Médicos Utilizando Redes Neurais Artificiais Análise da Aquisição de Equiamentos Médicos Utilizando Redes Neurais Artificiais Ernesto F. F. Ramírez 1, Saide J. Calil 1 Deto. de Engenharia Elétrica (DEEL), Centro de Tecnologia e Urbanismo (CTU), Universidade

Leia mais

EST 55 - AEROELASTICIDADE. Aerodinâmica Não Estacionária Introdução e conceitos básicos da teoria

EST 55 - AEROELASTICIDADE. Aerodinâmica Não Estacionária Introdução e conceitos básicos da teoria EST 55 - AEROELASTICIDADE Aerodinâmica Não Estacionária Introdução e conceitos básicos da teoria 1 AERODINÂMICA NÃO ESTACIONÁRIA Das equações de Navier-Stokes ara a equação otencial linearizada: Escoamentos

Leia mais

Programação de um semáforo usando o método do grau de saturação

Programação de um semáforo usando o método do grau de saturação Programação de um semáforo usando o método do grau de saturação Luis Vilanova * Introdução O cálculo do temo de ciclo e dos temos de verde através do método do grau de saturação constitui excelente ferramenta

Leia mais

Estudo da influência dos índices de severidade na segurança de um Sistema Eléctrico de Energia

Estudo da influência dos índices de severidade na segurança de um Sistema Eléctrico de Energia Estudo da influência dos índices de severidade na segurança de um Sistema Eléctrico de Energia C. I. Faustino Agreira, C. M. Machado Ferreira, J. A. Dias Pinto e F. P. Maciel Barbosa 2 Deartamento de Engenharia

Leia mais

1ª PROVA ICIN 1º/2015

1ª PROVA ICIN 1º/2015 ENE/FT/UnB Deartamento de Engenharia Elétrica Faculdade de Tecnologia Universidade de Brasília Prof. Adolfo Bauchsiess Laboratório de Automação e Robótica 63848 INTRODUÇÃO AO CONTROLE INTELIGENTE NUMÉRICO

Leia mais

Aula # 8 Vibrações em Sistemas Contínuos Modelo de Segunda Ordem

Aula # 8 Vibrações em Sistemas Contínuos Modelo de Segunda Ordem UNIVERSIDADE DE SÃO PAULO ESCOLA DE ENGENHARIA DE SÃO CARLOS DEPARTAMENTO DE ENGENHARIA MECÂNICA Laboratório de Dinâmica SEM 504 DINÂMICA ESTRUTURAL Aula # 8 Vibrações em Sistemas Contínuos Modelo de Segunda

Leia mais

Lista de exercícios Micro III 26/08/2009. Monopólio. Exs. do Tirole: 1.1 p.67, 1.2 p. 67, 1.3 p. 68, 1.4 p. 69, 1.5 p. 71, 1.6 p.

Lista de exercícios Micro III 26/08/2009. Monopólio. Exs. do Tirole: 1.1 p.67, 1.2 p. 67, 1.3 p. 68, 1.4 p. 69, 1.5 p. 71, 1.6 p. Lista de exercícios Micro III 6/08/009 Prof. Afonso A. de Mello Franco Neto Exs. do Mas-Colell:.B. a.b.0 Monoólio Exs. do Tirole:..67,.. 67,.3. 68,.4. 69,.5. 7,.6.7 ) Suonha que um monoolista roduz dois

Leia mais

ONS - Rua da Quitanda, o. andar - Centro - CEP: Rio de Janeiro - RJ - Telefone : (21)

ONS - Rua da Quitanda, o. andar - Centro - CEP: Rio de Janeiro - RJ   - Telefone : (21) GOP/03 a 6 de Outubro de 00 Caminas - São Paulo - Brasil GRUPO IX ESTUDO DE OPERAÇÃO DE SISTEMAS ELÉTRICOS PREVISÃO DE VAZÕES DE LONGO PRAZO UTILIZANDO REDES NEURAIS Mêuser Valença Teresa Bernarda Ludermir

Leia mais

X Congresso Brasileiro de Engenharia Química Iniciação Científica

X Congresso Brasileiro de Engenharia Química Iniciação Científica Blucher Chemical Engineering Proceedings Dezembro de 2014, Volume 1, Número 1 X Congresso Brasileiro de Engenharia Química Iniciação Científica Influência da esquisa em Engenharia Química no desenvolvimento

Leia mais

out II - Algoritmo Back-Propagation II - Algoritmo BackPropagation II - Algoritmo Back-Propagation Modelo de Rede Neural com Multiplas Camadas

out II - Algoritmo Back-Propagation II - Algoritmo BackPropagation II - Algoritmo Back-Propagation Modelo de Rede Neural com Multiplas Camadas Modelo de Rede Neural com Multilas Camadas SCE 5809 REDES NEURAIS REDE NEURAL DO TIPO MULTI- CAMADAS Profa Inut First Hidden Second Roseli Hidden Romero Outut II - Algoritmo Bac-Proagation Out(x) = g(

Leia mais

QUALIDADE DA ENERGIA ELÉTRICA DO CONSUMIDOR RURAL COM CONDUTOR NÃO CONVENCIONAL.

QUALIDADE DA ENERGIA ELÉTRICA DO CONSUMIDOR RURAL COM CONDUTOR NÃO CONVENCIONAL. QUALIDADE DA ENERGIA ELÉRICA DO CONSUMIDOR RURAL COM CONDUOR NÃO CONVENCIONAL. EIXEIRA, Rodrigo Rosa; SANOS, Euler Bueno dos. Escola de Engenharia Elétrica e de Comutação Laboratório de Máquinas Eseciais

Leia mais

Exames Nacionais. Prova Escrita de Matemática A 2009 VERSÃO Ano de Escolaridade Prova 635/1.ª Fase. Grupo I

Exames Nacionais. Prova Escrita de Matemática A 2009 VERSÃO Ano de Escolaridade Prova 635/1.ª Fase. Grupo I Exames Nacionais EXAME NACIONAL DO ENSINO SECUNDÁRIO Decreto-Lei n. 7/00, de 6 de Março Prova Escrita de Matemática A. Ano de Escolaridade Prova 6/.ª Fase Duração da Prova: 0 minutos. Tolerância: 0 minutos

Leia mais

Secção 5. Equações lineares não homogéneas.

Secção 5. Equações lineares não homogéneas. Secção 5 Equações lineares não omogéneas Farlow: Sec 36 a 38 Vimos na secção anterior como obter a solução geral de uma EDO linear omogénea Veremos agora como resoler o roblema das equações não omogéneas

Leia mais

Algoritmos Distribuídos Introdução

Algoritmos Distribuídos Introdução Algoritmos Distribuídos Introdução Antonio Alfredo Ferreira Loureiro loureiro@dcc.ufmg.br htt://www.dcc.ufmg.br/~loureiro Este material está baseado no caítulo 3 do livro Distributed Systems, second edition,

Leia mais

OTIMIZAÇÃO DA PRODUÇÃO VIA SEQÜÊNCIAS DE NÍVEIS NUTRICIONAIS PARA FASE DE CRECHE EM SUÍNOCULTURA

OTIMIZAÇÃO DA PRODUÇÃO VIA SEQÜÊNCIAS DE NÍVEIS NUTRICIONAIS PARA FASE DE CRECHE EM SUÍNOCULTURA OTIMIZAÇÃO DA PRODUÇÃO VIA SEQÜÊNCIAS DE NÍVEIS NUTRICIONAIS PARA FASE DE CRECHE EM SUÍNOCULTURA Janete Pereira Amador Universidade Federal de Santa Maria a99699@aluno.ufsm.br João Eduardo da Silva Pereira

Leia mais

Seleção de variáveis categóricas utilizando análise de correspondência e análise procrustes

Seleção de variáveis categóricas utilizando análise de correspondência e análise procrustes Acta Scientiarum (4):86-868, 999. ISSN 45-684. Seleção de variáveis categóricas utilizando análise de corresondência e análise rocrustes Terezinha Aarecida Guedes*, Ivan Ludgero Ivanqui, Ana Beatriz Tozzo

Leia mais

5 Teoria de opções reais 5.1. Avaliação de projetos via FCD vs. ROV

5 Teoria de opções reais 5.1. Avaliação de projetos via FCD vs. ROV 5 Teoria de oções reais 5.1. Avaliação de rojetos via FCD vs. ROV A avaliação de rojetos de investimentos é uma questão estratégica ara toda cororação atualmente. Cada vez mais uma decisão é tomada em

Leia mais

Gestão de Riscos e Investimentos

Gestão de Riscos e Investimentos VAR e diversificação Normalmente, investimos simultaneamente em dois ou mais ativos Ou estamos exostos simultaneamente a dois ou mais fatores de risco VAR e diversificação (Cont.) Os fatores de risco são

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ

UNIVERSIDADE FEDERAL DO PARANÁ UNIVERSIDADE FEDERAL DO PARANÁ BACHARELADO EM ESTATÍSTICA ANÁLISE MULTIVARIADA COMO FERRAMENTA DE GERENCIAMENTO DE FORNECEDORES VISANDO UM RELACIONAMENTO COM VANTAGEM COMPETITIVA Curitiba 009 Ivane Carneiro

Leia mais

Aula 2 Uma breve revisão sobre modelos lineares

Aula 2 Uma breve revisão sobre modelos lineares Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar

Leia mais

MATEMÁTICA Professores: Adriano, Andrey, Aurélio e Rodrigo Comentário Geral Prova bem abrangente como todos os anos, mas com dois detalhes que

MATEMÁTICA Professores: Adriano, Andrey, Aurélio e Rodrigo Comentário Geral Prova bem abrangente como todos os anos, mas com dois detalhes que MTEMÁTIC rofessores: driano, ndrey, urélio e Rodrigo Comentário Geral rova bem abrangente como todos os anos, mas com dois detalhes que chamaram a atenção. rimeiro a ausência de uma questão de trigonometria

Leia mais

MATEMÁTICA 3 MÓDULO 1. Lógica. Professor Renato Madeira

MATEMÁTICA 3 MÓDULO 1. Lógica. Professor Renato Madeira MATEMÁTICA 3 Professor Renato Madeira MÓDULO 1 Lógica SUMÁRIO 1. Proosição. Negação 3. Conectivos 4. Condicionais 4.1. Relação de imlicação 4.. Relação de equivalência 5. Álgebra das roosições 6. Quantificadores

Leia mais

CONFIABILIDADE DE ESTACAS EMPREGANDO MÉTODO DE ESTIMATIVAS PONTUAIS

CONFIABILIDADE DE ESTACAS EMPREGANDO MÉTODO DE ESTIMATIVAS PONTUAIS Revista Persectivas Online: Exatas & Engenharias Janeiro de 018, Vol.8, nº 0,. 13-4 ISSN: 36-885X (Online) DOI: 10.54/885x800181300 CONFIABILIDADE DE ESTACAS EMPREGANDO MÉTODO DE ESTIMATIVAS PONTUAIS Aline

Leia mais

2 Modelagem da casca cilíndrica

2 Modelagem da casca cilíndrica odelagem da casca cilíndrica As cascas cilíndricas odem ser definidas como um coro cuja distância de qualquer onto interno deste coro a uma suerfície de referência (usualmente a suerfície média da casca)

Leia mais

Um Estudo Teórico para Generalização do Método de Coates a 3D e sua Aplicação em Otimização da Recuperação na Lavra por Câmaras e Pilares

Um Estudo Teórico para Generalização do Método de Coates a 3D e sua Aplicação em Otimização da Recuperação na Lavra por Câmaras e Pilares Mecânica das Rochas ara Recursos Naturais e Infraestrutura SBMR 04 Conferência Esecializada ISRM 09-3 Setembro 04 CBMR/ABMS e ISRM, 04 Um Estudo Teórico ara Generalização do Método de Coates a 3D e sua

Leia mais

Algoritmos de Inteligência de Enxames por Colônia de Formigas na Análise de Indicadores Ambientais de Bacias Hidrográficas

Algoritmos de Inteligência de Enxames por Colônia de Formigas na Análise de Indicadores Ambientais de Bacias Hidrográficas Algoritmos de Inteligência de Enxames or Colônia de Formigas na Análise de Indicadores Ambientais de Bacias Hidrográficas Samuel Ghellere, Gabriel Felie, Maicon B. Palhano, Ruano M. Pereira, Kristian Madeira,

Leia mais

MÉTODOS DE SELEÇÃO. Professor: Dr. Alexandre Leseur dos Santos Mestranda: Lurdes Rodrigues Estágio em Docência I Disciplina: Melhoramento Genético

MÉTODOS DE SELEÇÃO. Professor: Dr. Alexandre Leseur dos Santos Mestranda: Lurdes Rodrigues Estágio em Docência I Disciplina: Melhoramento Genético MÉTODOS DE SELEÇÃO 1 Professor: Dr. Alexandre Leseur dos Santos Mestranda: Lurdes Rodrigues Estágio em Docência I Disciplina: Melhoramento Genético 2 MÉTODOS DE SELEÇÃO INTRODUÇÃO A seleção pode ser realizada

Leia mais

Conjunto de Valores. A Função de Probabilidade (fp)

Conjunto de Valores. A Função de Probabilidade (fp) Prof. Lorí Viali, Dr. viali@mat.ufrgs.br htt://www.mat.ufrgs.br/~viali/ Bernoulli Binomial Binomial Negativa ou Pascal Geométrica Hiergeométrica Uniforme Poisson Eerimento Qualquer um que corresonda a

Leia mais

9º ENTEC Encontro de Tecnologia: 23 a 28 de novembro de 2015

9º ENTEC Encontro de Tecnologia: 23 a 28 de novembro de 2015 9º ENTEC Encontro de Tecnologia: a 8 de novembro de 05 CRITÉRIO DE VON MIE EM O UO DA TENÕE NORMAI PRINCIPAI Iago Porto Almeida Borges¹; Roberta Bastos de Oliveira²; Eliane Regina Flôres Oliveira³,, Universidade

Leia mais

Exemplo: para o tipo de entidade Empregado, Exemplo: para o tipo de entidade fraca Dependente,

Exemplo: para o tipo de entidade Empregado, Exemplo: para o tipo de entidade fraca Dependente, Entidade Para cada tio de entidade E no esquema ERE, crie uma relação R que inclua todos os atributos simles de E. Inclua também os atributos simles comonentes de um atributo comosto de E na relação R.

Leia mais

TÉCNICAS DE AGRUPAMENTO CLUSTERING

TÉCNICAS DE AGRUPAMENTO CLUSTERING ISSN Nº: 1983-168 TÉCNICS DE GRUPMENTO CLUSTERING utores: Istvan aroly asznar, PhD Professor Titular da FGV e Presidente da IBCI Bento Mario Lages Gonçalves, MSc Consultor Senior da IBCI CLUSTERING 1-

Leia mais

Análise de componentes principais com dados pluviométricos no estado do Ceará

Análise de componentes principais com dados pluviométricos no estado do Ceará Análise de comonentes rinciais com dados luviométricos no estado do Ceará Maytê Duarte Leal Coutinho, Michelyne Duarte Leal Coutinho, José Ivaldo B. de Brito Aluno de mestrado da Universidade Federal de

Leia mais

Parâmetros do Hidrograma Unitário para Bacias Urbanas Brasileiras

Parâmetros do Hidrograma Unitário para Bacias Urbanas Brasileiras Parâmetros do Hidrograma Unitário ara Bacias Urbanas Brasileiras Carlos E. M. Tucci Instituto de Pesquisas Hidráulicas - Universidade Federal do Rio Grande do Sul Porto legre - RS - tucci@ih.ufrgs.br Recebido:

Leia mais

14 MODELO DE DECISÃO DA TEORIA DAS RESTRIÇÕES

14 MODELO DE DECISÃO DA TEORIA DAS RESTRIÇÕES 14 MODELO DE DECISÃO DA TEORIA DAS RESTRIÇÕES A artir da remissa da teoria das restrições de ue a emresa oera semre com algum tio de restrição, neste caítulo é abordado o rocesso geral de tomada de decisão

Leia mais

VIGAS. Figura 1. Graus de liberdade de uma viga no plano

VIGAS. Figura 1. Graus de liberdade de uma viga no plano VIGS 1 INTRODUÇÃO viga é um dos elementos estruturais mais utiliados em ontes, assarelas, edifícios rincialmente ela facilidade de construção. Qual a diferença entre a viga e a barra de treliça? Uma viga

Leia mais

-- INSTRUÇÕES -- Elementos de Probabilidade e Estatística U.C de Junho de Duração da prova: 2 horas mais 30 minutos de tolerância.

-- INSTRUÇÕES -- Elementos de Probabilidade e Estatística U.C de Junho de Duração da prova: 2 horas mais 30 minutos de tolerância. Ministério da Ciência, Tecnologia e Ensino Suerior U.C. 037 Elementos de Probabilidade e Estatística de Junho de 0 -- INSTRUÇÕES -- O estudante deverá resonder à rova na folha de onto, reencher o cabeçalho

Leia mais

3 Conceitos básicos relacionados à estrutura a termo da taxa de juros

3 Conceitos básicos relacionados à estrutura a termo da taxa de juros 3 Conceitos básicos relacionados à estrutura a termo da taxa de juros Antes de adentrarmos na descrição teórica da ETTJ e de alguns de seus modelos é imortante que clarifiquemos algumas das definições

Leia mais

Transformação dos dados. Analise de Componentes Principais - PCA

Transformação dos dados. Analise de Componentes Principais - PCA Transformação dos dados Tratamento nos dados Redução de Dimensionalidade Dados centrados na média e variância xm = /n Σ i=n x i x i = ( x i - xm)/σ (centrados na média) Escalamento ela variância ( quando

Leia mais

SIMULADO. 05) Atribuindo-se todos os possíveis valores lógicos V ou F às proposições A e B, a proposição [( A) B] A terá três valores lógicos F.

SIMULADO. 05) Atribuindo-se todos os possíveis valores lógicos V ou F às proposições A e B, a proposição [( A) B] A terá três valores lógicos F. 01) Considere as seguintes roosições: P: Está quente e Q: Está chovendo. Então a roosição R: Se está quente e não está chovendo, então está quente ode ser escrita na forma simbólica P..( Q) P, em que P..(

Leia mais

AULA 8: TERMODINÂMICA DE SISTEMAS GASOSOS

AULA 8: TERMODINÂMICA DE SISTEMAS GASOSOS LCE-00 Física do Ambiente Agrícola AULA 8: TERMODINÂMICA DE SISTEMAS GASOSOS Neste caítulo será dada uma introdução ao estudo termodinâmico de sistemas gasosos, visando alicação de seus conceitos aos gases

Leia mais

Roteiro-Relatório da Experiência N o 7

Roteiro-Relatório da Experiência N o 7 . COMPOETES DA EQUIPE: UIVERSIDADE DO ESTADO DE SATA CATARIA - UDESC Roteiro-Relatório da Exeriência o 7 O TRASFORMADOR ALUOS OTA 3 4 Prof.: Celso José Faria de Araújo 5 Data: / / : hs. OBJETIVOS:.. Verificar

Leia mais

SISTEMA DE CONTROLE ADAPTATIVO PARA UM SISTEMA PRODUTIVO CONTÍNUO. O CASO DA CURVA POLINOMIAL DE CRESCIMENTO DE SUÍNOS TIPO CARNE.

SISTEMA DE CONTROLE ADAPTATIVO PARA UM SISTEMA PRODUTIVO CONTÍNUO. O CASO DA CURVA POLINOMIAL DE CRESCIMENTO DE SUÍNOS TIPO CARNE. SISTEMA DE CONTROLE ADAPTATIVO PARA UM SISTEMA PRODUTIVO CONTÍNUO. O CASO DA CURVA POLINOMIAL DE CRESCIMENTO DE SUÍNOS TIPO CARNE. João Eduardo da Silva Pereira Universidade Federal de Santa Maria jes@ccne.ufsm.br

Leia mais

DETERMINANTES DOS DIFERENCIAIS DE SALÁRIOS NO MERCADO DE TRABALHO FORMAL DO ESTADO DE MINAS GERAIS NO PERÍODO

DETERMINANTES DOS DIFERENCIAIS DE SALÁRIOS NO MERCADO DE TRABALHO FORMAL DO ESTADO DE MINAS GERAIS NO PERÍODO 1 DETERMNANTES DOS DFERENCAS DE SALÁROS NO MERCADO DE TRABALHO FORMAL DO ESTADO DE MNAS GERAS NO PERÍODO 1991-2001 Aline Cristina da Cruz 1 Sara Rezende Moss 2 Resumo - Este artigo aresenta resultados

Leia mais