ISSN Dezembro, Métodos estatísticos na seleção genômica ampla

Documentos relacionados
sendo classificado como modelo de primeira ordem com (p) variáveis independentes.

ANOVA Modelos de Efeitos Aleatórios

Indice de Gini. Como existem N (N 1 ) / 2 pares distintos, o Gini corresponde a :

NOTA: ESCREVA AS RESPOSTAS COMO FRAÇÕES OU COM 4 CASAS DECIMAIS NOTA 2: O FORMULÁRIO ESTÁ NO FINAL DA PROVA

Capítulo 8. (d) 1) 0,5 2) 1,0 3) 0,5 4) 0 5) 2/3 6) 1/2. Problema 02. (a) (b)

TÓPICOS. Teoria dos residuos. Classificação de singularidades. Teorema dos resíduos.

Estimação dos Estados da Cadeia de Markov de um MMPP(2)

Raciocínio-Lógico (Receita Federal 2009 Prova 1 - Gabarito 1):

Leonardo da Vinci ( ), artista, engenheiro e cientista italiano

O Modelo Logístico Aplicado a Estudos Epidemiológicos

NÚMEROS COMPLEXOS. Podemos definir o conjunto dos números complexos como sendo o conjunto dos números escritos na forma:

IND 1115 Inferência Estatística Semestre turma B Teste 2 10/06/2005 GABARITO

( )( ) ( ) 2 2 ( ) ( ) 2. Questões tipo exame. Pág θ =. θ =, logo. Portanto, 1.1. ( ) 2. = θ 4.º Q, ou. = θ, tem-se.

GABARITO DA SEGUNDA PROVA DE PTC-2433 TEORIA DAS COMUNICAÇÕES II - 19/10/2015

3. VARIÁVEIS ALEATÓRIAS

CAPÍTULO 9 CORRELAÇÃO E REGRESSÃO

30/09/2015. Distribuições. Distribuições Discretas. p + q = 1. E[X] = np, Var[X] = npq DISTRIBUIÇÃO BINOMIAL. Contínuas. Discretas

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

Problemas. Regressão Linear Múltipla. Ajuda a encontrar relações Ceteris Paribus entre variáveis; Melhora o ajuste ao dados; Maior flexibilidade.

Seleção Genômica Ampla (GWS) via Modelos Mistos (REML/BLUP), Inferência Bayesiana (MCMC), Regressão Aleatória Multivariada e Estatística Espacial

MODELOS DE REGRESSÃO PARA DADOS DE CONTAGEM. O modelo log-linear de Poisson

Modelos com Variáveis Dependentes Qualitativas. Prob(Y = 1) = F(β X) probabilidade de um indivíduo com determinadas características X trabalhar

1 Introdução. Figura 1.1: Crescimento do número de transistores para processadores Intel e Lei de Moore. Fonte: Wikipédia.

3 Metodologia de solução

y z CC2: na saída do reator: z = 1: 0. Pe dz Os valores característicos do problema são as raízes de: Da Pe 0 Pe Pe

Resolver problemas com amostragem aleatória significa gerar vários números aleatórios (amostras) e repetir operações matemáticas para cada amostra.

3. Termodinâmica dos Gases. Modelos:

Apontamentos de Análise de Sinais

Regressão Simples. Parte III: Coeficiente de determinação, regressão na origem e método de máxima verossimilhança

Em termos da fração da renda total da população recebida por cada pessoa, na distribuição dual temos. pessoas

sen( x h) sen( x) sen xcos h sen hcos x sen x

C5 C O termo geral do desenvolvimento de A( x ) é. Assim, vem: Número de casos possíveis: 6 C

Capítulo 2. Problema 01. intervalar. Problema 02. (a) Freqüência Proporção Porcentagem. 100 f i

O He Líquido. e α N V. Caso de 1 mol de He em CNTP:

Estatística Clássica

Avaliação da qualidade do ajuste

A B LM. A onde Y Y ; P. P P, no PONTO. T o que provocará um C 0. T 0 desloca curva IS para a direita IS IS

Análise de regressão

MODELOS DE REGRESSÃO PARA DADOS BINÁRIOS

Anexo III Temperatura equivalente de ruído, Figura de ruído e Fator de mérito para estações de recepção (G/T)

Variáveis aleatórias Conceito de variável aleatória

(1) Raízes n-ésimas. r cos. nϕ = θ + 2kπ; k = 0, 1, 2, 3, 4,... ρ n cos nϕ = r cos θ ρ n = r ρ= (r) 1/n. Portanto:

MAURÍCIO KOUBAY DO AMARAL APLICAÇÃO DA ESTATÍSTICA MULTIVARIADA NA ANÁLISE DAS OBRIGAÇÕES CONDICIONAIS DO PROGRAMA BOLSA FAMÍLIA

ESTRATÉGIA ROBUSTA DE CONTRATAÇÃO DE ENERGIA ELÉTRICA PARA DISTRIBUIDORAS

Deformações devidas a carregamentos verticais

XXXI Olimpíada Brasileira de Matemática GABARITO Primeira Fase

Distribuições Amostrais. Estatística. 8 - Distribuições Amostrais UNESP FEG DPD

Capítulo 5 Transformadas de Fourier

REGRESSÃO LINEAR 05/10/2016 REPRESENTAÇAO MATRICIAL. Y i = X 1i + 2 X 2i k X ni + i Y = X + INTRODUÇÃO SIMPLES MÚLTIPLA

7 Análise de covariância (ANCOVA)

Contabilometria. Prof.: Patricia Maria Bortolon, D. Sc.

Boltzmann como boa aproximação das distribuições quânticas = 1. ε 2 ε

7 Teoria da Detecção e da Estimação em Problemas de Telecomunicações

O EFEITO DO NÚMERO DE PONTOS DA QUADRATURA DE GAUSS NA ANÁLISE NUMÉRICA DA PROTEÇÃO TÉRMICA POR ABLAÇÃO

Inferência Estatística e Aplicações I. Edson Zangiacomi Martinez Departamento de Medicina Social FMRP/USP

Econometria: 3 - Regressão Múltipla

1 Eliminação gaussiana com pivotamento parcial

Testes não-paramétricos

4 Modelos de Fronteira Estocástica

Regressao Simples. Parte II: Anova, Estimação Intervalar e Predição

4 Critérios para Avaliação dos Cenários

Copyright LTG 2013 LTG/PTR/EPUSP

ESTIMATIVA: é o valor numérico obtido para o estimador numa certa amostra.

2. Método estático que considera a contribuição do solo

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Estimação Pontual

TÓPICOS. Sinais contínuos e sinais discretos. Função impulso unitário discreto.

Estudo de diversidade populacional: efeito da taxa de mutação

x n = n ESTATÍSTICA STICA DESCRITIVA Conjunto de dados: Organização; Amostra ou Resumo; Apresentação. População

1 1 2π. Área de uma Superfície de Revolução. Área de uma Superfície de Revolução

NOTAS DE AULA DA DISCIPLINA CE076. ], T 2 = conhecido como T 2 de Hotelling

Modelo de Regressão Simples

Deformações devidas a carregamentos verticais

A trajetória sob a ação de uma força central inversamente proporcional ao quadrado da distância

Análise de dados industriais

Aula 10. Antes de iniciarmos o estudo das ondas iônicas em plasmas, faremos uma breve revisão de fenômenos acústicos num gás neutro e aquecido.

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

PADRÃO DE RESPOSTA. Pesquisador em Informações Geográficas e Estatísticas A I PROVA 7 GESTÃO DA QUALIDADE

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou. experimental.

Técnicas Não Paramétricas

3 Solução Analítica Exata para Viga Infinita no Caso Linear

MEDIDAS DE TENDÊNCIA CENTRAL I

(1) no domínio : 0 x < 1, : constante não negativa. Sujeita às condições de contorno: (2-a) (2-b) CC2: 0

Tópicos Extras 2ª parte. Análise de Correlação e Regressão

SIMULAÇÃO NUMÉRICA DE ESCOAMENTOS INCOMPRESSÍVEIS BIFÁSICOS DE FLUIDOS NÃO-NEWTONIANOS E IMISCÍVEIS EM MEIOS POROSOS VIA MÉTODO DOS ELEMENTOS FINITOS

Estudos Preliminares de Identificação de um Sistema de Frenagem para Trens Metropolitanos de Tração Elétrica

Confiabilidade Estrutural

Dados Experimentais. Isto é chamado de experimento controlado. Uma das vantagens

Estatística Multivariada Normal Multivariada Função densidade conjunta e contorno de probabilidade

Em muitas situações duas ou mais variáveis estão relacionadas e surge então a necessidade de determinar a natureza deste relacionamento.

Reconhecimento de Padrões. Reconhecimento de Padrões

Cap. 7. Princípio dos trabalhos virtuais

Faculdade de Economia Universidade Nova de Lisboa EXAME DE CÁLCULO I. Ano Lectivo º Semestre

O delineamento amostral determina os processos de seleção e de inferência do valor da amostra para o valor populacional.

Departamento de Matemática e Ciências Experimentais Curso de Educação e Formação Tipo 6 Nível 3

Exercícios de Cálculo Numérico - Erros

UNIVERSIDADE ESTADUAL PAULISTA JUSSARA MALLIA ZACHI

Aula 9. Aula de hoje. Aula passada. Self-normalized Importance Sampling Gerando amostras complicadas Variância amostral Simulação

Equações Diferenciais Lineares

SERGIO LUIZ SCHUBERT SEVERO AQUAMETRIA POR MICROONDAS: DESENVOLVIMENTO DE TRANSDUTOR EM MICROFITA

Novo Espaço Matemática A 12.º ano Proposta de Teste [janeiro ]

Transcrição:

ISSN 1980-3958 Dzmbro, 011 19 Métodos statístcos a slção gômca ampla

ISSN 1980-3958 Dzmbro, 011 Emprsa Braslra d Psqusa Agropcuára Embrapa Florstas Mstéro da Agrcultura, Pcuára Abastcmto Documtos 19 Métodos statístcos a slção gômca ampla Marcos Do Vlla d Rsd Fabyao Fosca Slva José Marclo Sorao Vaa Luíz Alxadr Ptrll Márco Frado Rbro Rsd Jr. Patrco Muñoz dl Vall Embrapa Florstas Colombo, PR 011

Embrapa Florstas Estrada da Rbra, Km 111, Guaratuba, 83411-000, Colombo, PR - Brasl Caxa Postal: 319 Fo/Fax: (41 3675-5600 www.cpf.mbrapa.br sac@cpf.mbrapa.br Comtê Local d Publcaçõs Prsdt: Patríca Póvoa d Mattos Scrtára-Excutva: Elsabt Marqus Oada Mmbros: Álvaro Fgurdo dos Satos, Atoo Aparcdo Carpazz, Clauda Mara Braco d Frtas Maa, Dalva Luz d Quroz, Gulhrm Schll Schuhl, Luís Cláudo Marahão Frouf, Marlc Cordro Garrastazu, Sérgo Gaad Suprvsão dtoral: Patríca Póvoa d Mattos Rvsão d txto: Mauro Marclo Brté Normalzação bblográfca: Fracsca Rasch Edtoração ltrôca: Mauro Marclo Brté Capa: Mauro Marclo Brté 1 a dção Vrsão dgtal (011 Todos os drtos rsrvados A rprodução ão-autorzada dsta publcação, o todo ou m part, costtu volação dos drtos autoras (L o 9.610. Dados Itracoas d Catalogação a Publcação (CIP Embrapa Florstas Métodos statístcos a slção gômca ampla [rcurso ltrôco] / Marcos Do Vlla d Rsd... [t al.]. Dados ltrôcos - Colombo : Embrapa Florstas, 011. (Documtos / Embrapa Florstas, ISSN 1980-3958 ; 19 Sstma rqurdo: Adob Acrobat Radr. Modo d acsso: World Wd Wb. <http://www.cpf.mbrapa.br/publca/srdoc/dcos/doc19.pdf> Título da pága da wb (acsso m 10 abr. 01. 1. Métodos statístcos.. Mdção. 3. Mlhoramto vgtal 4. Mlhoramto amal. 5. Marcador gétco. I. Rsd, Marcos Do Vlla d. II. Slva, Fabyao Fosca. III. Vaa, José Marclo Sorao. IV. Ptrll, Luíz Alxadr. V. Rsd Júor, Márco Frado Rbro. VI. Muñoz dl Vall, Patrco. VII. Sér. CDD 631.5 (1. d. Embrapa 011

Autors Marcos Do Vlla d Rsd Estatístco, Doutor, Psqusador da Embrapa Florstas marcos.do@ufv.br Fabyao Fosca Slva Zootcsta, Doutor, Profssor da UFV fabyaofosca@ufv.br José Marclo Sorao Vaa Eghro Agrôomo, Doutor, Profssor da UFV jmsvaa@ufv.br Luíz Alxadr Ptrll Eghro Agrôomo, Doutor, Profssor da UFV ptrll@ufv.br Márco Frado Rbro Rsd Jr. Eghro Florstal, Mstr, Estudat a Uvrsdad da Flórda mrsd@ufl.du Patrco Muñoz Dl Vall Eghro Florstal, Mstr, Estudat a Uvrsdad da Flórda pmuoz@ufl.du

Aprstação A slção gômca ampla (GWS aumta a fcêca rapdz do mlhoramto gétco. Essa tcologa fudamta-s a prdção d fótpos com bas a ltura d marcadors gétcos uso d métodos prdtvos. Exstm város métodos para aplcação a GWS. O prst documto cotmpla mas d uma dza dsss métodos cotmplado a tora, a computação a aplcação a dados smulados. Assm, su cotúdo é abragt pod srvr como um gua mportat para os usuáros da GWS. Washgto L. E. Magalhãs Chf d Psqusa Dsvolvmto

Sumáro Dscrção gérca dos métodos d slção gômca ampla (GWS...9 Métodos d stmação palzada...16 Métodos d Estmação baysaa (BaysA, BaysB, Fast BaysB, BaysCπ, BaysDπ...6 Lasso baysao Lasso baysao Mlhorado (BLASSO IBLASSO...40 Rgrssão Krl Hlbrt Spacs (RKHS...51 Rgrssão va quadrados mímos parcas (PLSR...58 Rlação tr RR-BLUP, BLASSO IBLASSO...60 Aáls smultâa d dvíduos gotpados ão gotpados va GBLUP...67 Aáls d assocação gômca ampla (GWAS...7 Assocação gômca ampla (GWAS m humaos...77 Comparação tr 1 métodos d slção gômca ampla...84 Psos das marcas os dfrts métodos frquêcas alélcas...89 Formas d paramtrzação da matrz d cdêca gotípca...91

Imputação d gótpos marcadors...93 Aumto a fcêca sltva do mlhoramto d platas amas...97 Rfrêcas...100

Métodos statístcos a slção gômca ampla Marcos Do Vlla d Rsd Fabyao Fosca Slva José Marclo Sorao Vaa Luíz Alxadr Ptrll Márco Frado Rbro Rsd Jr. Patrco Muñoz dl Vall Dscrção gérca dos métodos d slção gômca ampla (GWS Os studos d assocação gômca ampla (Gom Wd Assocato Studs - GWAS slção (ou stmação gômca ampla (Gom Wd Slcto - GWS são mportats o mlhoramto gétco d amas platas também a gétca humaa. No mlhoramto gétco, a GWS aumta a fcêca rapdz do procsso sltvo. Em gétca humaa, as frramtas da GWS propcam a mdca prsoalzada ou mdca gômca (WRAY, 005; WRAY t al., 007; GODDARD t al., 009; CAMPOS t al., 010; MAKOWSKY t al., 011, a qual fudamta-s a prdção d fótpos com bas a ltura d marcadors gétcos uso d métodos prdtvos. As prdçõs gradas são usadas a dagos, prvção tratamto das doças. Um método dal para GWS dv cotmplar três atrbutos: ( acomodar a arquttura gétca do carátr m trmos d gs d pquos grads ftos suas dstrbuçõs; ( ralzar a rgularzação do procsso d stmação m prsça d multcolardad grad úmro d marcadors, usado para sso stmadors do tpo shrkag; ( ralzar a slção d covarávs (marcadors qu aftam a caractrístca m aáls.

10 Métodos statístcos a slção gômca ampla O problma prcpal da GWS é a stmação d um grad úmro d ftos a partr d um lmtado úmro d obsrvaçõs também as colardads advdas do dsqulíbro d lgação tr os marcadors. Os stmadors do tpo shrkag ldam adquadamt com sso, tratado os ftos d marcadors como varávs alatóras stmado-os smultaamt (Rsd t al., 008. Os prcpas métodos para a GWS podm sr dvddos m três grads classs: rgrssão xplícta, rgrssão mplícta rgrssão com rdução dmsoal. Na prmra class, dstacam-s os métodos RR-BLUP, LASSO (Last Absolut Shrkag ad Slcto Oprator, Rd Elástca (Elastc Nt EN, BaysA BaysB, dtr outros. Na class d rgrssão mplícta, ctam-s os métodos RKHS (Rproducg Krl Hlbrt Spacs, qu é um método sm-paramétrco, assm como o método d rds uras (GIANOLA; CAMPOS, 009 rgrssão krl ão paramétrca va modlos adtvos gralzados (GIANOLA t al., 006. Dtr os métodos d rgrssão com rdução dmsoal, dstacam-s o d quadrados mímos parcas d compots prcpas. A Tabla 1 lustra os métodos para GWS.

Métodos statístcos a slção gômca ampla 11 Tabla 1. Classfcação dos Métodos para GWS. Class Famíla Método Atrbutos Rgularzação, Arquttura RR-BLUP/GWS gétca homogêa, Slção drta d covarávs Rgularzação, Arquttura LASSO gétca homogêa, Slção drta d covarávs Rgrssão xplícta Métodos d stmação palzada (Rgrssão lar Métodos d stmação baysaa (Rgrssão ão lar EN RR-BLUP- Ht/GWS BaysA BaysB Fast BaysB BaysCπ Rgularzação, Arquttura gétca homogêa, Slção drta d covarávs Rgularzação, Arquttura gétca flxívl, Slção drta d covarávs Rgularzação, Arquttura gétca flxívl, Slção drta d covarávs Rgularzação, Arquttura gétca flxívl, Slção drcoada d covarávs Rgularzação, Arquttura gétca flxívl, Slção drcoada d covarávs Rgularzação, Arquttura

1 Métodos statístcos a slção gômca ampla Rgrssão xplícta Rgrssão mplícta Rgrssão com rdução dmsoal Métodos d stmação baysaa (Rgrssão ão lar BaysDπ BLASSO IBLASSO Rgrssão Krl RKHS Rds uras Quadrados mímos parcas Compots prcpas gétca homogêa, Slção drta d covarávs Rgularzação, Arquttura gétca flxívl, Slção drta d covarávs Rgularzação, Arquttura gétca flxívl, Slção drta d covarávs Rgularzação, Arquttura gétca flxívl, Slção drta d covarávs Os métodos d rgrssão mplícta são dvddos m dos grupos: ( métodos d stmação palzada (RR-BLUP, LASSO, EN, RR-BLUP-Ht; ( métodos d stmação baysaa (BaysA, BaysB, Fast BaysB, BaysCπ, BaysDπ, BLASSO, IBLASSO outros (Tabla 1. Os stmadors palzados são obtdos como solução para um problma d otmzação, m qu a fução objtvo (fução cujo valor é mmzado ou maxmzado, dpddo do problma objtvo é dfda plo balaço tr prcsão do ajust (soma d quadrado dos rsíduos complxdad

Métodos statístcos a slção gômca ampla 13 do modlo (compot d palzação. Os métodos d stmação palzada dfrm d acordo com as fuçõs d palzação usadas, as quas produzm dfrts graus d shrkag. Ess curtamto prv a suprparamtrzação pod coduzr à rdução do rro quadrátco médo d stmação. Os métodos baysaos stão assocados a sstmas d quaçõs ão lars as prdçõs ão lars podm sr mlhors quado os ftos d Quattatv trat loc (QTL ão são ormalmt dstrbuídos, dvdo à prsça d gs d ftos maors. As prdçõs lars assocadas ao RR-BLUP assumm qu todos os marcadors com msma frquêca alélca cotrbum gualmt para a varação gétca (ausêca d gs d ftos maors. Na stmação baysaa, o curtamto das stmatvas dos ftos do modlo é cotrolado pla dstrbução a pror assumda para sss ftos. Dfrts prors duzm a dfrts curtamtos. Os métodos d stmação palzada os baysaos podm sr com (BaysB, Fast BaysB,BaysCπ, BaysDπ, LASSO, BLASSO, IBLASSO ou sm (RR-BLUP, EN, RR-BLUP-Ht, BaysA slção drta d covarávs. Os métodos baysaos são suprors quado a dstrbução dos ftos dos QTL é lptocúrtca (curtos postva, dvdo à prsça d gs d grads ftos. Com dstrbução ormal dos ftos dos QTL, o método RR-BLUP é gualmt fct. Comparaçõs tr os métodos d prdção d valors gétcos gômcos têm sdo ralzadas. Muwss t al. (001 cocluíram pla suprordad tórca do método BaysB, o qual mostrou-s lgramt supror ao RR- BLUP. Etrtato, o autor smulou os dados gotípcos sgudo a msma dstrbução a pror mprgada o procsso d stmação. Isso coduzu a acurácas mas lvadas por ss método, as quas podm ão sr

14 Métodos statístcos a slção gômca ampla ralístcas a prátca, s a dstrbução ral assocada aos ftos gétcos dfrr da dstrbução a pror assumda a aáls. Comparado métodos baysaos, Habr t al. (011 rlataram qu o método BaysA mostrou-s supror a maora das stuaçõs, mas hum dos métodos baysaos são claramt suprors m todas as stuaçõs. Etrtato, BaysB, BaysCπ BaysDπ aprstam a vatagm d propcar formação sobr a arquttura gétca do carátr quattatvo dtfcar as posçõs d QTL por modlagm da frquêca d Sgl uclotd polymorphsm( SNP ão ulos. Também Mrod t al. (010 cocluíram pla suprordad do BaysA Fast BaysB sobr o BaysB. O método Fast BaysB fo dsvolvdo por Muwss t al. (009, vsado dmur o tmpo d computação do método BaysB, orgalmt mplmtado va smulação stocástca por mo d procdmto Mot Carlo Cada d Markov (MCMC. Esss autors drvaram um stmador ão MCMC por mo d tgração aalítca. Ess método aproxma bm o método orgal é muto mas rápdo. Mrod t al. (010 obtvram, a prátca, uma lgra suprordad do Fast BaysB sobr o BaysB. Os métodos BaysA RR-BLUP m assocação com um método d slção d marcadors propcam também formação sobr a arquttura gétca do carátr quattatvo. E ssa slção d covarávs pod sr fta por mo da GWAS a postror (GWAS-PSE, coform dtalhado m tópco sgut também plo ordamto do módulo dos ftos stmados d marcadors. Com dstrbução xpocal poucos ftos com valor zro, o mlhor stmador dos ftos alélcos é domado

Métodos statístcos a slção gômca ampla 15 LASSO (TIBSHIRANI, 1996. Etrtato, com mutos ftos com valor zro, o LASSO ão é adquado. Usa t al. (009 compararam o LASSO com BLUP BaysA mprgado 156 SNPs sgfcatvos. As acurácas obtdas foram das ords d 0,89, 0,75 0,84, rspctvamt. Assm, o LASSO é uma boa opção quado s usa um úmro lmtado d marcadors. Gozalz-Rco t al. (008 compararam o método ão paramétrco ou sm-paramétrco Rproducg Krl Hlbrt Spacs (RKHS com a rgrssão baysaa RR- BLUP m trmos d fcêca a slção gômca. Cocluíram qu o método da rgrssão RKHS aprstou mlhor capacdad prdtva do qu os dmas. Espaço d Hlbrt (Hlbrt Spacs é um cocto muto usado m físca statístca (físca quâtca ou mcâca statístca (mcâca quâtca assocado ao tma tropa, ou mdda d dsordm ou mprvsbldad d um sstma (SALINAS, 005. Também são mprstados da físca statístca os cohcmtos da dstrbução d Gbbs, usados a mplmtação da aáls baysaa. Métodos d rgrssão com rdução dmsoal rgrssão va quadrados mímos parcas (PLSR rgrssão va compots prcpas (PCR foram avalados por Solbrg t al. (009. Cocluíram qu sss são mas smpls rápdos computacoalmt, porém mos acurados qu o BaysB, com acurácas da ordm d 0,68 (PLSR PCR 0,84 (BaysB. Um procdmto BLASSO mlhorado (IBLASSO ou Improvd Baysa Lasso fo proposto por Lgarra t al. (011. O IBLASSO aprsta capacdad prdtva supror ao BLASSO smlar ao RR-BLUP-Ht BaysA com dstrbuçõs a pror ão formatvas para os ftos alatóros compots d varâca.

16 Métodos statístcos a slção gômca ampla Com bas o xposto os rsultados d ltratura rlatados, vrfca-s qu a class dos métodos d rgrssão xplícta, o BaysA, o LASSO baysao Mlhorado (IBLASSO o RR-BLUP são os métodos favortos quado o modlo polgêco ftsmal s aplca. Na prsça d gs d grad fto, o método RR-BLUP cssta sr modfcado d forma a prmtr htrogdad d varâca gétca tr locos; sso gra o método RR-BLUP-Ht. Adcoalmt, os métodos BaysA, RR-BLUP RR-BLUP-Ht csstam sr complmtados com a slção d covarávs por mo d alguma forma d GWAS. As varâcas gétcas d cada loco, cssáras o método RR-BLUP-Ht, podm sr stmadas va os métodos BaysA (por mo d MCMC ou IBLASSO. O prst documto cotmpla os métodos BaysA, BaysB, Fast BaysB, BaysCπ, BLASSO, IBLASSO, RR- BLUP, RR-BLUP-Ht, MCMC-BLUP, PLSR, RKHS. Esss métodos propcam, m dtrmadas stuaçõs, os três atrbutos dsjávs d acomodação da arquttura gétca do carátr, rgularzação da stmação slção d covarávs. Métodos d stmação palzada Em um problma d rgrssão tm-s qu a varávl dpdt y é dada como fução d uma varávl prdtora (x vtor d rros alatóros (, sgudo o modlo y = ' x +. No cotxto da slção gômca df-s x como um vtor d gótpos marcadors codomats gralmt codfcados como 0, 1 ou, d acordo com o úmro d cópas d um dos allos do loco marcador, é dfdo como um vtor d cofcts d rgrssão qu cotmplam os ftos dos marcadors o

Métodos statístcos a slção gômca ampla 17 carátr fotípco y, va dsqulíbro d lgação com os gs qu o cotrolam. Usado spraça codcoal, a quação d rgrssão é dada por: yˆ = ' ˆ x = E(y x Isso mplca qu ˆ = E( x, y = [ p( p( y, x d ]/[ p( p( y, x d ] m qu p( é a fução dsdad d probabldad d p(y,x é a fução d vrossmlhaça d y. Assm, a prdção d y dpd d p(, ou sja, da dstrbução dos ftos (va LD com os QTLs dos marcadors. Essa dstrbução pod sr tratada como formação ou dstrbução a pror o cotxto baysao ou como varávl alatóra o cotxto frqutsta. S ~ N( 0,, ˆ é BLUP d ŷ é BLUP d y. Isto mplca qu os ftos d todos os marcadors são tomados da msma dstrbução. Altratvamt, pod sr assumdo N( ~ 0, qu, m qu é tomado d uma dstrbução qu-quadrado vrtda, sgudo o foqu baysao. Nss caso, sso mplca qu grad úmro d marcadors aprsta ftos pquos poucos marcadors aprstam ftos grads. Ess método BLUP para os cofcts d rgrssão é domado rgrssão alatóra ou rgrssão d cumra (Rdg rgrsso (RR-BLUP. Os cofcts d rgrssão

18 Métodos statístcos a slção gômca ampla rdg são dfdos como aquls qu mmzam a soma d quadrados palzada dada por: N ( 1 / N (y j xj + λrr(t, m qu λ RR é o j = 1 parâmtro d palzação (assocado ao shrkag ou parâmtro rdg, é o úmro d marcadors N é o úmro d dvíduos. O prmro trmo da quação é a soma d quadrados dos rsíduos da rgrssão (mdda da falta d ajust do modlo o sgudo trmo é a palzação, a qual dpd da magtud dos cofcts d rgrssão va. Por mo da fução d palzação, = 1 um grad valor d λ cra um maor custo para d grad valor, lvado-o a colhr mas. Ocorr tão a mmzação da soma d quadrados dos rsíduos, sujta à rstrção = 1 otmzação coduz a = 1 t. A solução para ss problma d ˆ RR(tI] 1 = [X' X + λ X' y. Outro método rlacoado é o LASSO, qu comba shrkag (rgularzação com slção d varávs volv o sgut problma d otmzação, va N mmzação d ( 1 / N (y j xj + λl, m qu = 1 j = 1 é a soma dos valors absolutos dos cofcts d rgrssão. As soluçõs m qu os cofcts d rgrssão s dstacam d zro sofrm palzação. Ocorr tão a mmzação da soma d quadrados dos rsíduos, sujta a rstrção = 1 = 1 t. O compot λ L = 1

Métodos statístcos a slção gômca ampla 19 rgularza a rgrssão sm palzar muto. O parâmtro d suavzação λ L cotrola a tsdad da rgularzação. Para computação do Lasso, Tbshra (1996 propôs o método d programação quadrátca, o qual é muto complxo. A scolha do λ L é d captal mportâca, pos o msmo fluca o tamaho do grupo d marcadors slcoados. À mdda qu λ L td a zro a solução covrg para método d rgrssão fxa va quadrados mímos (FR-LS, ou sja, para ˆ = (X' X 1 X' y. Nss caso, ão há slção d covarávs a prdção tora-s stávl. Valors muto altos d λ L rduzm muto os valors dos cofcts d rgrssão. Para cômputo d λl d forma otmzada, Usa t al. (009 propusram o algortmo da rgrssão d âgulo mímo (LARS assocado a um passo d valdação cruzada. O LASSO pod sr mplmtado também va abordagm baysaa, m qu λ BL cotrola a prcsão da dstrbução a pror atrbuída aos cofcts d rgrssão. Dos atrbutos mportats d um método statístco d rgrssão ou modlo d prdção são a acuráca prdtva a capacdad d trprtação. O método d quadrados mímos falha os dos aspctos. É um método ão vsado, mas pod aprstar stmatvas com alta varâca, portato, ão aprsta mímo rro quadrátco médo m alta acuráca. O método RR aprsta pquo vés alta acuráca prdtva propcada plo shrkag, o qual rgularza a stmação mlhora a stabldad da solução. Ambos os métodos ão produzm modlos trprtávs, pos ão slcoam covarávs. Um trcro método, domado slção d subcojuto d covarávs (como o Garrot d Brma produz modlos trprtávs, porém, com muta varabldad os rsultados, pos s trata d um procsso dscrto. O

0 Métodos statístcos a slção gômca ampla método Lasso fo proposto para coclar sss dos atrbutos dsjávs (acuráca prdtva capacdad d trprtação. Portato, matém a stabldad da RR produz modlos trprtávs (pos produz algus cofcts qu são xatamt zro como o método d Brma. Coform Tbshra (1996, os três métodos podm sr assm comparados: a. Stuação d pquo úmro d grads ftos (cotrol gétco por poucos gs d grads ftos: Garrot d Brma é mlhor, sgudo por Lasso RR. b. Stuação d modrado úmro d modrados ftos: Lasso é mlhor, sgudo por RR Garrot d Brma. c. Stuação d grad úmro d pquos ftos (cotrol gétco por mutos gs d pquos ftos: RR é mlhor por pqua margm, sgudo por Lasso Garrot d Brma. Dtalhs dos métodos d stmação palzada a. Rgrssão Rdg (RR-BLUP O método RR gômco fo proposto por Whttakr t al. (000. Fução objtvo a sr mmzada: ˆ RR = argm N j (y j = 1 xj + λ RR = 1

Métodos statístcos a slção gômca ampla 1 Fução d palzação, rstrção ou rgularzação: λ RR = 1 Solução para os cofcts d rgrssão: ˆ RR(tI] 1 = [X' X + λ X' y Solução para os ftos gétcos adtvos (a dos dvíduos: aˆ = X ˆ = X[X' X + λ Caractrístcas: RR (ti] 1 X' y - Matém todas as covarávs, coduzdo a modlos complxos. - Produz bos rsultados para o caso d mutos marcadors d pquos ftos. - Prv problma d multcolardad (qu coduzra a stmatvas mprcsas tr marcadors corrlacoados. - Rgrssa os cofcts d prdtors corrlacoados gualmt a drção d zro d cada um. - = 1 é a orma d palzação m. - Quato maor o valor d lambda (parâmtro d stoa ou complxdad, qu rgula a força da palzação ou shrkag, maor o curtamto.

Métodos statístcos a slção gômca ampla - S lambda é stmado por REML, a RR tora-s BLUP tm-s o método RR-BLUP λ RR = / = / = /( / = ( 1 h /(h / = ( 1 h a Q / Q m RR a h = ( + λ, m qu = p ( 1 p ou Q Q úmro d QTL, od h corrspod à hrdabldad do carátr, a a varâca rsdual. é a varâca gétca adtva do carátr Q Q /(h é - S a matrz d partsco A for computada va formação d marcadors utlzada o método BLUP fotípco tradcoal, tm-s o método domado GBLUP ou BLUP gômco, qu é quvalt ao RR-BLUP m trmos da prdção dos ftos adtvos a. Assm, tm-s para o GBLUP: 1 a = [Z Z + A ( 1 ˆ / a ] y, m qu Z é a matrz d cdêca dos dvíduos y é vtor d fótpos corrgdos para os ftos fxos. A = (XX' /[ p ( 1 p ], m qu p é a frquêca d um dos allos do loco X* rfr-s à matrz X corrgda para suas médas m cada loco (p. Tm-s tão a quvalêca a = X ˆ 1 ˆ = X[X' X + λ (ti] X' y = [Z Z + A b. LASSO Fução objtvo a sr mmzada: RR 1 ( / a ] 1 y.

Métodos statístcos a slção gômca ampla 3 N ˆ L = argm (y j xj + λl j = 1 = 1 Fução d palzação: λ L = 1 Caractrístcas: - Matém as covarávs mas sgfcatvas rmov as dmas. - é a orma d palzação m (com bas m = 1 valors absolutos d duz sparsdad a solução, coduzdo a slção d covarávs shrkag, smultaamt. L λ - = 1 rgularza o ajust d quadrados mímos rgrssa algus cofcts a zro. Essa formulação do rgularzador faz com qu o Lasso rgrss d forma mas fort qu o RR-BLUP, coduzdo algus cofcts a zro. - Istávl com dados d alta dmsão, pos ão pod slcoar mas covarávs ( do qu do qu o tamaho amostral (N, ss caso, slcoa arbtraramt um mmbro d um grupo d covarávs altamt corrlacoadas. - Não possu a proprdad oráculo ou d rtdão, qu s rfr a cofcts ão zro asstotcamt

4 Métodos statístcos a slção gômca ampla ão vsados, ormaldad asstótca slção cosstt d covarávs à mdda qu N tdm a fto. - O método Lasso adaptatvo fo proposto vsado atgr a proprdad oráculo, mas matém a stabldad com dados d alta dmsão. c. Rd lástca (EN Fução objtvo a sr mmzada: N ˆ = argm (y j xj + λen α +( 1 α j = 1 = 1 = 1 Fução d Palzação: λ λ EN α +( 1 α ou = EN = 1 1 = 1 q EN Caractrístcas: - S α = 0, EN = LASSO ou s q = 1, EN = LASSO. - S α = 1, EN = RR ou s q =, EN = RR. - S 1 q tm-s EN. - α vara tr 0 1 λ é maor qu 0. - Usa duas palzaçõs: a orma d palzação do Lasso para a slção d covarávs a orma d palzação da

Métodos statístcos a slção gômca ampla 5 RR para stablzar a solução (quado as covarávs são altamt corrlacoadas mlhorar a prdção. - O comportamto é smlhat ao Lasso, mas é robusta à xtrma colardad tr as covarávs. - Prmt slcoar um úmro d covarávs maor qu o tamaho da amostra (N. - Não possu a proprdad oráculo. - O método Rd lástca adaptatva fo proposto vsado atgr a proprdad oráculo do Lasso adaptatvo a robustz do método EN à xtrma colardad tr as covarávs (ZOU; HASTIE, 005. d. Rgrssão Rdg com htrogdad d varâcas tr locos marcadors (RR-BLUP-Ht Solução para os cofcts d rgrssão: ˆ 1 RR (ti] h = [X' X + λ X' y - É smlar ao RR-BLUP, mas msmo para marcas d msma frquêca, rgrssa os cofcts d rgrssão dfrtmt a drção d zro. - Os fators d palzação dos marcadors o sstma d quaçõs d modlo msto são dados plos lmtos λ do vtor λ RR, m qu rfr-s ao loco. h - Os lmtos λ RR podm sr obtdos va os métodos baysaos ou REML usados para cômputo do método RR-BLUP-Ht. RR

6 Métodos statístcos a slção gômca ampla BaysA Métodos d Estmação baysaa (BaysA, BaysB, Fast BaysB, BaysCπ, BaysDπ O método BaysA proposto por Muwss t al. (001 produz rsultados smlars ao método BLUP com varâcas htrogêas, pos as varâcas dos sgmtos cromossômcos dfrm para cada sgmto são stmadas sob ss modlo, cosdrado a formação combada dos dados (fução d vrossmlhaça da dstrbução a pror para stas varâcas. Nst caso, o modlo é ajustado por mo d uma abordagm baysaa com strutura hrárquca m dos ívs. Os ftos dos marcadors são assumdos como amostras d uma dstrbução ormal com méda zro varâca d cada marcador dada por uma dstrbução qu-quadrado vrsa scaloada, coform aprstado a sgur: ~ N( 0, χ ~ (ν,s m qu ν é o úmro d graus d lbrdads S é o parâmtro da scala d dstrbução. Tm-s qu a dstrbução margal a pror dos ftos gétcos dos marcadors, ν, S, tm dstrbução t d Studt uvarada, ou sja, ν,s ~ t( 0, ν,s. Assm, sta formulação rsulta a modlagm dos ftos dos marcadors como amostras d uma dstrbução t d Studt.

Métodos statístcos a slção gômca ampla 7 O valor d S pod sr drvado com bas o valor sprado d uma varávl alatóra com dstrbução ququadrado vrtda scaloada. Essa spraça matmátca S ν é dada por E( =. Assm, o parâmtro d scala é ν E( (ν dado por S =. Etão, para os ftos ν S ν gétcos dos marcadors tm-s E( = ν S E( (ν = ν a = E( S. A spraça E(. Assm, p ( 1 p = 1 (ν a = ν p( 1 p = 1 quval a, m qu ν = 4,01 ou 4,, coform Muwss t al. (001, a é a varâca gétca adtva do carátr p é a frquêca alélca do marcador. Muwss t al. (001 cosdraram S = 0,00 ou 0,049. Isto dscrv uma dstrbução modradamt lptocúrtca. Qualqur valor maor qu 4 pod sr usado para ν. Valors mors ou guas a 4 toram -s a pror flat (ão formatva.

8 Métodos statístcos a slção gômca ampla Para os ftos rsduas tm-s S E( (ν = ν E( = ~. Assm, ~ é um valor a pror d. A spraça E( S S ν E( = ν ~ (ν ~ = = ν quval ( 4. 4.., m qu Assumdo ~ N(0,, m qu é tomado d uma dstrbução qu-quadrado vrtda, sgudo o foqu baysao, sso mplca qu grad úmro d marcadors aprsta ftos pquos poucos marcadors aprstam ftos grads. O uso d uma mstura d dstrbuçõs ormal qu-quadrado vrtda coduz a uma dstrbução t para, portato, com maor pco m zro uma cauda mas loga qu a dstrbução ormal. Est método pod sr mplmtado va amostragm d Gbbs, para obtção dssa formação combada ou da dstrbução a postror das varâcas. Os métodos assocados a modlos hrárqucos baysaos (BaysA B por mo d suas formulaçõs m trmos dos hprparâmtros propcam varâcas spcífcas para cada marcador. RR-BLUP são fuçõs lars dos dados rgrssam as stmatvas com o msmo rro padrão (msmas frquêcas alélcas tamaho amostral pla msma quatdad. Prors Gaussaas coduzm a shrkag homogêo através dos marcadors. Os métodos baysaos são fuçõs ão lars dos dados rgrssam ftos mors mas do qu os maors, ou sja, admtm maors hrdabldads para os maors ftos.

Métodos statístcos a slção gômca ampla 9 O shrkag homogêo ão é dsjávl, pos algus marcadors stão lgados a QTLs outros ão stão. Mas assumdo uma dstrbução a pror t scaloada ou dupla xpocal para os ftos d marcadors tm-s os métodos BaysA BLASSO, rspctvamt, os quas produzm shrkag spcífcos d acordo com o tamaho do fto da varâca do marcador. Além das dstrbuçõs cosdradas para os ftos alatóros o modlo lar frqutsta para a vrossmlhaça do vtor d obsrvaçõs, a abordagm baysaa rqur atrbuçõs para as dstrbuçõs a pror dos ftos compots d varâca. Essas dstrbuçõs podm sr formatvas, coform acma, ou ão formatvas. Dstrbução a pror ão formatva ou uform pod sr atrbuída a sss compots, rfltdo cohcmto a pror vago. Para os compots d varâca, dstrbuçõs χ vrtdas podm sr cosdradas como pror, cosdrado υ = - S = 0, a dstrbução χ s tora uform, portato, ão formatva. A vatagm d usar dstrbução qu-quadrado vrtda como pror para os compots d varâca rfr-s ao fato d qu, com dados com dstrbução ormal, a dstrbução a postror é também uma qu-quadrado vrtda. Cosdr o sgut modlo: y = 1u + X +, od: y : vtor d dados fotípcos. u : méda gral. : vtor d ftos gétcos adtvos (alatóros d marcadors.

30 Métodos statístcos a slção gômca ampla : vtor d rros. 1,X : matrzs d cdêca qu assocam u aos dados fotípcos (y. Cosdra-s, calmt, qu a dstrbução codcoal dos dados u, é ormal multvarada:, (1 ~,, I X N y µ µ +, od I é a matrz dtdad a varâca rsdual. Os parâmtros d trss para frêcas são:, μ,. Para coduzr a aáls baysaa, tora-s cssáro spcfcar as dstrbuçõs a pror para,. Isto já fo ralzado atrormt. Dfdas stas dstrbuçõs, pod-s agora scrvr a dstrbução cojuta a postror dos parâmtros do modlo.,,, (,,, (,,, ( y p p y p µ µ α µ,,, ( ( ( ( ( y p p p p p µ µ = Cosdrado a dstrbução a pror dos compots d varâca como uma qu-quadrado scaloada vrtda, tm-s qu a dstrbução cojuta a postror pod sr rscrta: + + + + + + 1 1 ' ( xp 1 ( ' 1 ( xp,,, ( N S S X y X y y p υ υ υ υ µ µ α µ Para mplmtação do GS, dv-s drvar todas as dstrbuçõs codcoas a postror a partr da

Métodos statístcos a slção gômca ampla 31 dstrbução cojuta a postror. A dstrbução codcoal a postror d é dada por uma qu-quadrado vrtda scaloada por S + ' com graus d lbrdad υ, ou sja P( = χ (υ,s + '. Não s pod usar ssa dstrbução a postror drtamt para stmar, pos la é codcoal aos ftos qu são dscohcdos. Assm, a técca d amostragm d Gbbs, basada m dstrbuçõs a postror codcoal a todos os outros ftos, é usada para stmar os ftos suas varâcas. Etão, para obtção da formação combada da dstrbução a pror da vrossmlhaça dos dados, ou sja, para obtção da dstrbução a postror dos ftos gétcos dos marcadors, adota-s o procdmto d smulação stocástca (método Mot Carlo cadas d Markov MCMC domado amostragm d Gbbs. Em trmos mas smpls, o algortmo da amostragm d Gbbs pod sr aprstado d forma rsumda, coform Muwss t al. (001 Rsd (008: 1. Forcr os valors cas dos parâmtros d locação dsprsão do modlo. Ests valors cas podm sr calculados através d procdmtos padrõs tas como a stmação d compots d varâca por REML ou quadrados mímos. Cosdrado a méda gral µ como úco fto fxo, pod-s calcular µ como a méda artmétca das obsrvaçõs. O vtor dos ftos d marcadors dv sr calzado com um úmro postvo d pqua magtud.. Atualzar para o -ésmo marcador, amostrado-

3 Métodos statístcos a slção gômca ampla o da dstrbução codcoal complta P( = χ (υ,s + ' com υ g = 4, S calculado coform a xprssão acma. 3. Dados µ, calcular os valors d va = ( y 1µ X, m qu X = [X1 X X3...] é a matrz d cdêca para os ftos d marcadors. Etão, atualz a varâca rsdual por mo da amostragm d χ (N, '. 4. Amostrar, d uma dstrbução ormal com méda ' ' (1 y 1 X varâca /N, a méda gral, dada a atualzada varâca rsdual. 5. Amostrar, d uma dstrbução com méda X ' j y X X ' j ' j X j X j=0 + X / 1 ' j u varâca ' /(X X + /, todos os ftos d j j marcadors j dado a amostragm mas rct da méda,, m qu Xj é o vtor colua d X com ftos j. No caso, j=0 quval a com fto j gualado a zro. 6. Rptr os passos d ( a (5 até qu s obtha a covrgêca da cada. D mara gérca, a aáls baysaa os sguts passos dvm sr adotados: ( spcfcação das dstrbuçõs a pror para os ftos compots d

Métodos statístcos a slção gômca ampla 33 varâca; ( spcfcação da fução d vrossmlhaça para o vtor d obsrvaçõs (dstrbução codcoal dos dados: ( obtção das dstrbuçõs cojutas a postror para os ftos compots d varâca; (v obtção das dstrbuçõs codcoas a postror para os ftos compots d varâca; (v margalzação das dstrbuçõs codcoas a postror para os ftos compots d varâca. A margalzação aalítca é pratcamt mpossívl. Assm, têm sdo usados métodos MCMC, como o amostrador d Gbbs, qu atua por mo d amostragm atualzação d dstrbuçõs codcoas. BaysB O método BaysB aprsta as msmas suposçõs qu o BaysA para uma fração π dos SNPs assum qu (1 - π dos SNPs aprsta ftos ulos. Um problma dss método é a scolha da fração π. Com a slção d covarávs basada o módulo d sus ftos stmados, os dos métodos tdm a s quvalr. Na prátca, o BaysA tm s mostrado supror ao BaysB com π gual a 0,66 (HABIER t al., 011; MRODE t al., 010. Para os ftos dos QTLs, o método BaysB usa uma dstrbução a pror com alta dsdad m = 0 dstrbução qu-quadrado vrtda para > 0. Assm, cosdra qu m mutos locos ão xst varação gétca, ou sja, ão stão sgrgado. Assm, a dstrbução a pror quval a ~ χ ( υ, S com probabldad π = 0 com probabldad (1 - π, m qu π dpd da taxa d mutação do g. As quatdads υ = 4,34 S = 0,049 usadas por Muwss t al. (001 produzm a méda varâca d,dado qu

34 Métodos statístcos a slção gômca ampla > 0. Tas quatdads também dpdm dos ftos mutacoas prcsam sr stmadas a prátca. A dstrbução a pror do método BaysA ão tm um pco d dsdad m = 0. Uma vz qu ão é possívl uma amostragm d = 0, o método da amostragm d Gbbs ão pod sr usado o método BaysB, pos ão mov sobr todo o spaço d amostragm. Assm, o algortmo d Mtropols-Hastgs dv sr usado. Ess método rsolv ss problma por mo da amostragm smultâa d. O amostrador d Mtropols-Hastgs cosst m grar amostras squcas como mo d aproxmar uma dstrbução da qual ão há como amostrar drtamt. Tal amostrador pod amostrar drtamt d qualqur dstrbução d probabldad f(x, dsd qu a dsdad m x possa sr calculada. Dtalhs da mplmtação dss algortmo são aprstados por Sors Gaola (00 Chb Grbrg (1995. A amostragm smultâa d é ralzada da y dstrbução P(, y = P(. P(, y, m qu y* dota o vtor d dados corrgdo para os ftos fxos para todos os ftos gétcos, xcto. Essa xprssão dca qu s dv amostrar d P( y * sm codcoar m (m cotrast com o método BaysA m sguda amostrar d P(, y codcoal a y*, como o método BaysA. A dstrbução P( y ão pod sr xprssa a forma d uma dstrbução cohcda tão dv-s usar o algortmo MH para amostrar ssa dstrbução. A

Métodos statístcos a slção gômca ampla 35 dstrbução a pror p( é usada como dstrbução auxlar para sugrr atualzaçõs para a cada d MH. Os métodos baysaos torcamt propcam acurácas mas altas porqu forçam mutos ftos d sgmtos cromossômcos a valors próxmos a zro (BaysA ou a zro (BaysB as stmatvas dos ftos dos dmas sgmtos cromossômcos são rgrssadas d acordo com uma quatdad dtada plas dstrbuçõs a pror dos ftos d QTL. BaysCπ Gaola t al. (009 fazm uma aáls crítca dos métodos assocados a modlos hrárqucos baysaos (BaysA B spcfcamt m rlação às suas formulaçõs m trmos dos hprparâmtros qu propcam varâcas spcífcas para cada marcador. Sgudo os autors hum dos métodos prmt o aprdzado baysao sobr ssas varâcas para prossgur para log das prors. Em outras palavras, os hprparâmtros da pror para ssas varâcas smpr trão fluêca a xtsão do shrkag produzdo os ftos dos marcadors. O usuáro do método pod cotrolar a quatdad d shrkag apas arbtraramt, por mo da varação os parâmtros υ S (assocados à dstrbução qu-quadrado vrtda. Sgudo os autors, o método BaysB ão é bm formulado o cotxto baysao. Isto porqu dsgar a pror qu = 0, ão coduz cssaramt a = 0, coform tção orgal d Muwss t al. (001, m qu é o fto gétco do loco. Sugr tão qu o stado zro sja spcfcado o âmbto dos ftos ão o das varâcas. Assm, à probabldad d mstura Π podra sr atrbuída uma dstrbução a pror Bta. Surg tão, o método

36 Métodos statístcos a slção gômca ampla BaysC qu é vatajoso prmt spcfcar uma dstrbução a pror para Π, prmtdo a modlagm da dstrbução dupla xpocal. Város outros métodos baysaos foram propostos (BaysCπ BaysDπ, coform Habr t al., 011, todos ls com o propósto d prmtr o aprdzado baysao. Habr t al. (011 rlataram qu o método BaysA mostrou-s supror a maora das stuaçõs, mas qu hum dos métodos baysaos são claramt suprors dtr ls; trtato o BaysB, BaysDπ spcalmt o BaysCπ aprstam a vatagm d propcar formação sobr a arquttura gétca do carátr quattatvo dtfcar as posçõs d QTL por modlagm da frquêca d SNP ão ulos. No método BaysC uma varâca comum é spcfcada para todos os locos. Adcoalmt, π é tratada como uma cógta com dstrbução a pror uform (0,1 caractrzado o método BaysCπ, qu quval tão ao método RR-BLUP com slção d covarávs mplmtado va MCMC. Também s π é gual a 1os métodos BaysCπ RR-BLUP são guas (s prors vagas são usadas. A modlagm d π é muto trssat para a aáls d assocação. A maora das marcas ão stá m dsqulíbro d lgação com os gs. Assm, é cssára a slção d um grupo d marcas qu stá m assocação com o carátr. O método BaysB dtrma π subjtvamt. Usado a varávl dcadora δ os métodos BaysCπ BaysDπ modlam os ftos gétcos adtvos como a j = = 1 x j δ, m qu = ( 0,1. A dstrbução d δ δ = (δ1... δ é bomal com probabldad π. Ess modlo

Métodos statístcos a slção gômca ampla 37 d mstura é mas parcmooso do qu o método BaysB. Sgudo a hrarqua do modlo, uma dstrbução dv sr postulada para π dv sr uma Bta (LEGARRA t al., 011. S δ = 1, ão há slção d marcas o método tora-s o RR-BLUP mplmtado va MCMC (RR-BLUP baysao. Para o caso da dstrbução Bta com parâmtros α, tm-s: - S α = 0 = 0: há problma a stmação, pos a dstrbução Bta tora-s mal dfda. - S α = 1 = 1: tm-s uma dstrbução Uform m π. - S α = 1 = 10 10 : tm-s π próxmo d zro a maora das marcas trá fto zro. - S α = 10 8 = 10 10 : tm-s π quas fxado m 0,01 m toro d 1% das marcas trá fto. BaysDπ O método BaysDπ matém varâcas spcífcas para cada loco modla π como uma varávl alatóra. O método BaysD dfr do BaysA BaysB por cosdrar o parâmtro d scala das prors qu-quadrado vrtdas para as varâcas spcífcas para cada loco como uma cógta com dstrbução a pror Gama (1,1. Como o dscohcdo parâmtro d scala é comum a todos os locos as formaçõs d todos os locos cotrbum para a sua postror por mo dsta para as postrors das varâcas spcífcas d cada loco. Adcoalmt, π é tratado como uma cógta com dstrbução a pror Uform (0,1 produzdo os métodos

38 Métodos statístcos a slção gômca ampla BaysCπ BaysDπ. Em cotrast, π é gual a um o BaysA pod sr da ordm d 0,01 o BaysB (HABIER t al., 011. Uma comparação tr os métodos baysaos é aprstada a Tabla. Tabla. Comparação tr os métodos baysaos. Método Modlo para os ftos gétcos Parâmtros qu stma Método s π = 1 BaysDπ a j = = 1 x j δ, δ,, π BaysD BaysCπ a j = x j δ =1, π δ,, BaysC BaysC a j = = 1 x j δ, δ, RR-BLUP baysao ( δ = 1 BaysB a j = x j δ =1, δ, BaysA BaysA a j = x j =1, - RR-BLUP a j = x j =1, -

Métodos statístcos a slção gômca ampla 39 Fast BaysB O método Fast BaysB fo dsvolvdo por Muwss t al. (009 vsado dmur o tmpo d computação do método BaysB. Esss autors drvaram um algortmo d spraça codcoal tratva (ICE para stmar por mo d tgração aalítca. Os sguts passos dvm sr adotados. a Calcular as obsrvaçõs ajustadas,, qu são corrgdas para os ftos d todos os outros marcadors, usado a xprssão yˆ = y x j ˆ. Estmar a statístca sufct Yˆ ' ' = (x y (x x ˆ N = N. j j / j b Calcular ˆ = E[ Y ], qu é usado para atualzar a solução para o marcador. A xprssão para cômputo d ˆ = E[ Y ] usa a fução Dlta Drac é aprstada por Muwss t al. (009. A aturza aproxmada do algortmo ICE é dvda ao fato d y Y ão srm cohcdos sm srm stmados. Erros d stmação m yˆ Yˆ ocorrm dvdo a rros d stmação os ftos ˆ j dos outros marcadors. / y j j

40 Métodos statístcos a slção gômca ampla Lasso baysao Lasso baysao Mlhorado (BLASSO IBLASSO Os Lassos baysaos são vatajosos m rlação aos métodos baysaos d Muwss t al. (001 por srm asstotcamt lvrs d formação a pror. O parâmtro λ pod sr stmado dos própros dados plos métodos MCMC (ss algortmo pod sr mplmtado usado formação a pror vaga MCEM (ss algortmo EM ão rqur formação a pror. Os métodos BaysA BaysB rqurm a dsgação d dstrbuçõs a pror para a varâca d cada marcador. Adcoalmt algus métodos baysaos rqurm a stmação d π. Nos Lassos ão xst π uma dstrbução cotrolada porλ é dclarada para toda a colção d varâcas dos locos marcadors. No método Lasso orgal, uma moda cojuta é stmada spra-s qu a maora dos marcadors tham ftos xatamt gual a zro (USAI t al., 009. No Lasso baysao são stmadas médas a postror, produzdo valors muto pquos, mas ão zro. E médas a postror são o crtéro ótmo para slção (LEGARRA t al., 011. No Lasso orgal a solução admt até (N-1 cofcts d rgrssão ão ulos, m qu N é o úmro d dvíduos. O Lasso baysao rlaxa ssa rstrção, possvlmt produzdo um modlo mas acurado. A formulação baysaa do Lasso (BLASSO clu um trmo d varâca comum para modlar ambos os trmos, os rsíduos os ftos gétcos dos marcadors (PARK; CASELLA, 008; CAMPOS t al., 009b. Lgarra t al. (011 propusram o método BLASSO mlhorado (IBLASSO, o qual usa dos trmos d varâca, um para modlar os rsíduos outro para modlar os ftos

Métodos statístcos a slção gômca ampla 41 gétcos dos marcadors. Esss trmos s adquam aos coctos d varação dóga xóga o cotxto dos modlos mstos, coform Sgr t al. (011. Isso também é cort com a tora da gétca quattatva, qu prcoza a dcomposção da varação fotípca m varação gétca rsdual. Uma comparação tr os três métodos Lassos, o RR-BLUP o RR-BLUP-Ht é aprstada a Tabla 3.

4 Métodos statístcos a slção gômca ampla Tabla 3. Caractrístcas dos três métodos Lassos. Método Modlo Varâca d cada marcador Varâca gétca adtva Parâmtro d forma y = 1u + X + LASSO p( λ ~ ~ MVN(0, I y = 1u + X + = 1, λ = ( λ / xp( λ ( λ / xp[( λ ~ MVN(0, I - - - BLASSO p(, λ = ( λ / xp[( λ / ] p( τ ~ N(0, D ; dag( D = τ... τ ; 1 Var = ( ( / λ = τ Var ( = m a = p( 1 p = 1 ( / λ λ = ( / p( τ λ = ( λ / xp( λ τ 1 /. y = 1u + X + ~ MVN(0, I IBLASSO RR-BLUP λ, p( τ ~ p(τ λ= ( λ / xp[( λ / ] (λ ~ N( 0, D; dag(d= ( τ... τ / xp( λ y = 1u + X + ~ MVN( 0, I 1 τ / Var( = / λ Var = = τ ( Var ( = ~ MVN( 0, I m a = p( 1 p a = 1 m = p ( 1 p = 1 / λ λ λ = = ( / /

43 Métodos statístcos a slção gômca ampla Tabla 3. Cotuação. Método Modlo Varâca d cada marcador Varâca gétca adtva Parâmtro d forma RR-BLUP-Ht y = 1u + X + ~ MVN( 0, I λ,τ ~ MVN( 0, D Var( = = τ - -

44 Métodos statístcos a slção gômca ampla IBLASSO A paramtrzação do IBLASSO é quvalt ao do LASSO orgal d Tbshra (1996, porém, a mplmtação é baysaa. Outra dfrça rfr-s ao fato d qu a paramtrzação do LASSO orgal assum qu a matrz d cdêca X fo padrozada. O IBLASSO ão assum sso. Essa dfrça pod sr obsrvada a dscrção dos modlos aprstada a Tabla 3. A gualdad a paramtrzação advém da comparação tr os trmos (λ / (λ /. Somt a proporção (λ / é utlzada a prátca, portato, λ ão podm sr stmados sparadamt. Assm, o λ d Tbshra quval a (λ / do IBLASSO é, sscalmt, uma mdda da varação gétca dos marcadors a população. D forma quvalt, o modlo do IBLASSO podra sr scrto m trmos d, rtrado λ. A forma da dstrbução dos ftos das marcas é dtrmada plo parâmtro d forma λ, qu é rlacoado à varação gétca dos marcadors por mo da xprssão Var ( = / λ.essa rlação dota qu λ dsmpha papl smlar ao vrso da varâca os modlos sob ormaldad. O parâmtro λ pod sr stmado por MCMC ou máxma vrossmlhaça margal (MCEM ou REML. A stmação por MCEM vta o uso d supr-pror para λ (PARK; CASELLA, 008. Partdo-s da rlação al., 009, tm-s = p ( 1 p (GIANOLA t a m = 1 m = 1 a = p( 1 p / λ, m qu varâca gétca adtva. Uma vz qu a varâca a é a

Métodos statístcos a slção gômca ampla 45 gétca adtva do carátr é gralmt cohcda a pror (d outros studos, uma formação a pror para λ pod sr dada por m λ = p( 1 p / a. Etrtato, os = 1 modlos hrárqucos baysaos propramt dtos (caso dos Lassos baysaos ão dos métodos baysaos d Muwss formação a pror é atrbuída aos hprparâmtros ( λ compots d varâca, por xmplo d forma qu a fluêca dssa formação dsaparc asstotcamt. O modlo gérco do Lasso é da forma: y = 1u + X + ~ MVN( 0, I p(,λ = (λ / xp[( λ / ] Essa dstrbução xpocal do Lasso para coadua bm com a dstrbução obsrvada para os ftos gétcos dos locos d um carátr quattatvo(goddard, 009. Com dos compots d varâca ( tora-s: y = 1u + X + ~ MVN( 0, I λ, ~ (λ / xp[( λ / ] o modlo Notado-s a quvalêca com o modlo d Tbshra, tm-s:

46 Métodos statístcos a slção gômca ampla λ ~ (λ / xp[( λ Usado uma formulação m trmos d um modlo hrárquco aumtado, cludo um compot d varâca xtra τ assocado a cada loco marcador, tm-s: p( τ p(τ λ= ~ N( 0, D; dag(d= τ1... τ (λ / xp( λ τ / Assm, tm-s: Var( = = τ A mplmtação prátca dss modlo va amostrador d Gbbs é aprstada a sgur, coform Lgarra t al. (011. A dstrbução a pror d cosst d uma qu-quadrado vrtda com 4 graus d lbrdad. A dstrbução a pror para λ pod sr dlbradamt vaga, como uma uform tr 0 1.000.000. As dstrbuçõs codcoas a postror compltas são aprstadas a sgur. u dmas ~ N( 1' (y X /11, ' 1/11 ' ~ dmas N(x ' (y ~ ~ μ X ~ 1 / LHSI, 1/ LHSI, m qu LHS = x' x~ + τ x é a lha d X corrspodt ao fto ~ dca todas as varávs ~, xcto ~.

τ dmas IG (λ Gama Ivrtda. λ ~ 1/ ( /, λ ( / τ Métodos statístcos a slção gômca ampla 47, m qu IG rfr-s a dmas G m,, m qu G rfr-s a Gama ~ com parâmtro d forma gual ao úmro m d marcas parâmtro d scala gual a ~ / τ. ( ' ~ ~ + S, + N dmas χ 4 dvíduos varâca rsdual. BLASSO O modlo é da forma, m qu N é o úmro d S é a scala da dstrbução a pror da y = 1u + X + ~ MVN( 0, I λ, ~ (λ / xp[( λ / ] Usado uma formulação m trmos d um modlo hrárquco aumtado tm-s: p( τ ~ N(0, D ; dag( D = τ... τ p( τ λ = ( λ / xp( λ τ 1 1 / Assm, tm-s qu a varâca gétca m cada loco marcador é dada por = τ.

48 Métodos statístcos a slção gômca ampla As dstrbuçõs codcoas a postror compltas são coform dscrto para o IBLASSO, porém com as sguts modfcaçõs: LHS = x ' x τ dmas dmas χ ~ + τ IG (λ ~ 1/ ( /, λ ~ ~ 1 ~ ( ' D + ' ~ ~ + S, + m + N 4 Essa últma dstrbução codcoal mostra qu os ftos d marcadors são a prátca cosdrados como psudo rsíduos o BLASSO. GBLUP com htrogdad d varâcas O método GBLUP ou BLUP gômco pod também sr mplmtado cosdrado a htrogdad d varâca tr marcadors. Nss caso, a matrz A é dada por A = ( X * DX * ' /[ p (1 p ], m qu p é a frquêca d um dos allos do loco X* rfr-s à matrz X corrgda para suas médas m cada loco (p. A matrz D é dada por dag(d = (τ1... τ os lmtos τ podm sr obtdos plos métodos IBLASSO, BLASSO, BaysA, BaysB, tc. Essa abordagm aprsta também os sguts potos favorávs: ( prmt a aáls smultâa d dvíduos gotpados ão gotpados; ( prmt o cômputo drto da acuráca sltva va vrsão da matrz dos cofcts das quaçõs d modlo msto; ( a matrz D pod sr stmada m apas uma amostra da população sr usada m toda a população d slção m váras graçõs.

Métodos statístcos a slção gômca ampla 49 Comparação tr dstrbuçõs assumdas para os ftos gétcos os dfrts métodos Na Tabla 4 são aprstadas as dstrbuçõs assumdas para os ftos gétcos d marcadors os dfrts métodos d GWS. Tabla 4. Dstrbuçõs assumdas para os ftos gétcos d marcadors os dfrts métodos d GWS. Método Dstrbução a pror dos ftos Dstrbução a pror das varâcas Dstrbução a postror RR-BLUP (baysao Normal com varâca comum qu-quadrado vrtda ão formatva qu-quadrado vrtda BaysA Normal com htrogdad d varâcas tr marcas (t dado pror ququadrado para as varâcas qu-quadrado vrtda (quval ao BaysB com π = 1 qu-quadrado vrtda BaysB Normal com htrogdad d varâcas tr marcas, méda zro varâca fta (t dado pror ququadrado para as varâcas Mstura d dstrbuçõs 0 com probabldad (1-π ququadrado vrtda com probabldad π qu-quadrado vrtda BaysCπ Mstura d dstrbuçõs 0 ormal com varâca comum (t dado pror qu-quadrado para as varâcas qu-quadrado vrtda, π com dstrbução Uform tr 0 1 Lassos Expocal Dupla Expocal Dupla Gama Ivrtda

50 Métodos statístcos a slção gômca ampla A Fgura 1 lustra as formas das dstrbuçõs ormal (RR- BLUP xpocal (LASSO. Dsdad Fgura 1. Dsdads das dstrbuçõs ormal (curva potlhada xpocal dupla (curva cha, ambas com médas guas a zro varâcas guas à udad. Obsrva-s qu a dsdad a pror utlzada o LASSO Baysao aprsta maor massa d dsdad o valor zro caudas mas robustas, xrcdo maor curtamto sobr cofcts d rgrssão próxmos d 0 mor curtamto sobr cofcts d rgrssão dstats d zro.

Métodos statístcos a slção gômca ampla 51 Rgrssão Krl Hlbrt Spacs (RKHS Os métodos rgrssão krl ão paramétrca va modlos adtvos gralzados (GIANOLA t al., 006, rgrssão sm-paramétrca RKHS (Rproducg Krl Hlbrt Spacs (GIANOLA; KAAM, 008 d rds uras prtcm à class d rgrssão mplícta são métodos ão paramétrcos ou sm-paramétrcos. Esss métodos são uma altratva para o ajust d modlos com mutas traçõs pstátcas d domâca. Gozalz-Rco t al. (008 compararam métodos ão paramétrcos (RKHS, rgrssão baysaa RR-BLUP m trmos d fcêca a slção gômca. Cocluíram qu o método da rgrssão RKHS (Rproducg Krl Hlbrt Spacs aprstou mlhor capacdad prdtva do qu os dmas. Ess método quval ao BLUP modlo amal com a matrz d partsco substtuída plos krls. O método sm-paramétrco RKHS parc tr maor capacdad prdtva quado aplcado a dados ras (GIANOLA t al., 009, sm fazr forts suposçõs a pror. Rgrssõs ão paramétrcas são rprstaçõs fucoas tr um grad úmro d covarávs uma varávl dpdt, grado uma strutura mos paramtrzada, com mos suposçõs com facldad para acomodar ftos d traçõs. As fuçõs d krl podm sr usadas m métodos ão paramétrcos para stmar dsdads a partr d uma amostra (BISHOP, 006. A rgrssão d Naradaya-Watso (NWR aplcado o krl bomal para stmação da fução do valor alélco tm sdo usada para mplmtação do modlo ão paramétrco usado a tora do modlo

5 Métodos statístcos a slção gômca ampla adtvo (HASTIE; TIBSHIRANI, 1986; GIANOLA t al., 006. Est método aprsta rsultado smlar ao do RR- BLUP, sdo qu o NWR dpd do fator d alsamto o RR-BLUP dpd do fator d shrkag. RKHS Modlo O modlo gérco para o fótpo é dado por y j = u + g(x j + j, m qu: yj é o fótpo do dvíduo j; u é a méda do carátr m studo; j é o rro alatóro g(xj é uma fução dscohcda qu rlacoa os gótpos marcadors (covarávs com os fótpos (varávl dpdt. A fução g(x é dfda por y p( y, x dy g( x = E( y x =. p( x Fução objtvo a sr mmzada: ˆ RKHS N = arg m [( j Fução d palzação y j u g( x ] + h g( x H }. h g( x, m qu h é o parâmtro d suavzação g ( x é H H a orma d g(x m um spaço d Hlbrt, a qual duz rgularzação, cuja força é dtada por h. Caractrístcas No spaço fto d Hlbrt, procura-s a fução g(x qu mmz a soma d quadrados palzada

SS [ g( x] + ssa mmzação é dada por: Métodos statístcos a slção gômca ampla 53 N = [( y j u g( x ] h g( x. A solução para H j N 0 + jk( x x j= 1 g( x = α α, m qu αj são cofcts dscohcdos (com total quvalt ao úmro N d dvíduos gotpados k(x-xj é o krl d rprodução, cuja scolha df o spaço d Hlbrt m qu s dará a mmzação da soma d quadrados. A rgularzação ralzada produz os modlos d rgrssão RKHS um mor úmro d parâmtros do qu m outros métodos. Na RKHS uma colção d fuçõs ras é mplctamt dfda pla scolha d um krl d rprodução, k(x,xj. Esta fução mapa pars d gótpos m úmros ras. Sob uma prspctva baysaa o krl d rprodução df corrlaçõs a pror tr as avalaçõs da fução (valors gétcos m pars d gótpos (Cor[g(x,g(xj]. A scolha do krl é fudamtal a spcfcação do modlo a RR pod sr rprstada como rgrssõs RKHS. D mara gral, os krls são scolhdos por algortmos d forma a maxmzar a prformac do modlo, maxmzado a capacdad prdtva. Uma grad vardad d krls é avalada é slcoado aqul qu é ótmo sgudo o crtéro d slção do modlo (aqul qu maxmza a capacdad prdtva (CAMPOS t al., 009a. A capacdad prdtva a população d valdação é a capacdad d prvr futuras obsrvaçõs. Na população d stmação é uma mdda da qualdad do ajustamto tr os dados d tramto o modlo. Na rgrssão RKHS a strutura d covarâca é proporcoal a uma matrz d krl K, dada por Cov(g,gj KRKHS(x,xj, m qu x,xj são vtors d gótpos }

54 Métodos statístcos a slção gômca ampla marcadors para os dvíduos j, K(.,. é uma fução postva dfda avalada os gótpos marcadors. Uma grad vatagm da RKHS é qu o modlo é rprstado m trmos d N cógtas, fato qu é uma grad vatagm computacoal quado é muto maor qu N. Nos modlos d rgrssão xplcta a RKHS, as fuçõs bas (fuçõs das covarávs usadas para costrur a rgrssão, por xmplo, polômos para rgrssar fótpos m marcadors são dfdas a pror sto mpõ rstrçõs os padrõs qu podm sr capturados plos métodos. No método d rds uras as fuçõs bas usadas são frdas dos própros dados sso cofr grad flxbldad a ss método. Porém, há o rsco d suprparamtrzação a trprtação dos parâmtros ão é trval. A suprparamtrzação sgfca qu a capacdad prdtva a população d stmação aprsta boa prformac mas ão a aprsta a população d valdação (m dados qu ão foram usados para ajustar o modlo (CAMPOS t al., 009a; 009b. O modlo pod tão sr xpaddo da sgut forma: y j = u + g(x j + j j N y = u + α k(x x j= 1 j + j, m qu α 0 faz part d u. Em trmos vtoras, tm-s: y = 1u +T(hα +, m qu:

Métodos statístcos a slção gômca ampla 55 t t. T ( h =.. t 1 ( h ( h ( h, t ( h = 1 [ kh ( x x1 kh ( x x... kh ( x x ] α' =... 1 [α1 α α ] Assumdo α j ~ N( 0, α qu os compots d varâca h são cohcdos, têm-s as quaçõs d modlo msto para obtção das soluçõs d u α : j 1'1 T ( h1' T ( h'1 uˆ 1' y = T ( h' T ( h + I ˆ α T ( h' y α Após a scolha do parâmtro d suavzação h, pod-s obtr stmatvas REML para os compots d varâca. O parâmtro d suavzação h pod sr α dtrmado va valdação cruzada ou va abordagm baysaa, atrbudo-s dstrbuçõs a pror própras para todos os parâmtros do modlo (GIANOLA; CAMPOS, 009. O modlo KRHS pod sr também assm spcfcado: y = 1u + Khα +, m qu u é uma costat, Kh é a matrz postva dfda d krls, dpdt do parâmtro d suavzação h; α é um vtor cotdo cofcts ão paramétrcos qu são assumdos com dstrbução ormal 1 α j ~ N (0, K h α, com α rprstado a rcíproca do

56 Métodos statístcos a slção gômca ampla parâmtro d alsamto ( α 1 = λ. Os rsíduos têm dstrbução ormal com matrz d covarâca R=I solução para α é dada por [ K + I ] ˆ α α = y. Os fótpos são prdtos por d * h h. A * y ˆ = uˆ1 + αˆ, od uma lha * * * K tm a forma K = [ K ( x x ], com K ( x x t h sdo o krl tr o gótpo do dvíduo o grupo d valdação o gótpo do dvíduo j o grupo d stmação. RKHS com fto polgêco Nss caso, o fto gétco d um dvíduo j é dado plo modlo g j = p j + α j, m qu p j é a rgrssão sobr o pdgr α j é a rgrssão sm-paramétrca sobr os marcadors. Na RKHS, a suposção é d qu α = (α,α,... 1 α é um procsso gaussao com méda ula fução d covarâca proporcoal a um krl d rprodução, KRKHS(x,xj, avalada os gótpos marcadors, m qu x xj são vtors d gótpos marcadors para os dvíduos j. A dstrbução a pror cojuta d p, α compots d varâca assocados p, é dada por: α j K h h j p ( u, α, p,, α, p df, S, df α, S α, df p, Sf p α N( α 0, K RKHS N( p 0, A α p x χ ( df, S χ ( df α α, S α χ ( df p p, S p