Quadrados mínimos parciais uni e multivariado aplicados na seleção genômica para características de carcaça em suínos



Documentos relacionados
Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

NOTA II TABELAS E GRÁFICOS

TEORIA DE ERROS * ERRO é a diferença entre um valor obtido ao se medir uma grandeza e o valor real ou correto da mesma.

Correção para estrutura de população baseada em análise de covariância via autovetores da matriz de parentesco genômico

PARTE Apresente as equações que descrevem o comportamento do preço de venda dos imóveis.

Ministério da Educação. Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Cálculo do Conceito Preliminar de Cursos de Graduação

5.1 Seleção dos melhores regressores univariados (modelo de Índice de Difusão univariado)

Professor Mauricio Lutz CORRELAÇÃO

PROJEÇÕES POPULACIONAIS PARA OS MUNICÍPIOS E DISTRITOS DO CEARÁ

CENTRO UNIVERSITÁRIO DO LESTE DE MINAS GERAIS - UnilesteMG

Introdução à Análise de Dados nas medidas de grandezas físicas

Variabilidade Espacial do Teor de Água de um Argissolo sob Plantio Convencional de Feijão Irrigado

1.UNIVERSIDADE FEDERAL DE VIÇOSA, VIÇOSA, MG, BRASIL; 2.UNIVERSIDADE FEDERAL DE GOIÁS, GOIANIA, GO, BRASIL.

Análise de Regressão

Nota Técnica Médias do ENEM 2009 por Escola

Cálculo do Conceito ENADE

Regressão e Correlação Linear

CAPÍTULO 1 Exercícios Propostos

Sistemas Robóticos. Sumário. Introdução. Introdução. Navegação. Introdução Onde estou? Para onde vou? Como vou lá chegar?

Covariância e Correlação Linear

7. Resolução Numérica de Equações Diferenciais Ordinárias

CAPÍTULO VI Introdução ao Método de Elementos Finitos (MEF)

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

Associação entre duas variáveis quantitativas

RAE-eletrônica ISSN: Escola de Administração de Empresas de São Paulo. Brasil

Aplicando o método de mínimos quadrados ordinários, você encontrou o seguinte resultado: 1,2

PLANEJAMENTO DE EXPERIMENTOS E OTIMIZAÇÃO DE SISTEMAS MISTOS

Estatística stica Descritiva

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

CÁLCULO DO ALUNO EQUIVALENTE PARA FINS DE ANÁLISE DE CUSTOS DE MANUTENÇÃO DAS IFES

Análise Fatorial F 1 F 2

UNIVERSIDADE PRESBITERIANA MACKENZIE CCSA - Centro de Ciências Sociais e Aplicadas Curso de Economia

Probabilidade e Estatística. Correlação e Regressão Linear

Introdução e Organização de Dados Estatísticos

Análise do Retorno da Educação na Região Norte em 2007: Um Estudo à Luz da Regressão Quantílica.

Despacho Econômico de. Sistemas Termoelétricos e. Hidrotérmicos

Objetivos da aula. Essa aula objetiva fornecer algumas ferramentas descritivas úteis para

2 ANÁLISE ESPACIAL DE EVENTOS

O migrante de retorno na Região Norte do Brasil: Uma aplicação de Regressão Logística Multinomial

IV - Descrição e Apresentação dos Dados. Prof. Herondino

Apostila de Estatística Curso de Matemática. Volume II Probabilidades, Distribuição Binomial, Distribuição Normal. Prof. Dr. Celso Eduardo Tuna

REGRESSÃO LOGÍSTICA. Seja Y uma variável aleatória dummy definida como:

Avaliação da Tendência de Precipitação Pluviométrica Anual no Estado de Sergipe. Evaluation of the Annual Rainfall Trend in the State of Sergipe

Universidade Salvador UNIFACS Cursos de Engenharia Cálculo IV Profa: Ilka Rebouças Freire. Integrais Múltiplas

MAPEAMENTO DA VARIABILIDADE ESPACIAL

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA CE 071 ANÁLISE DE REGRESSÃO LINEAR. Cesar Augusto Taconeli

Distribuição de Massa Molar

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

IX CONGRESSO BRASILEIRO DE ENGENHARIA E CIÊNCIAS TÉRMICAS. 9th BRAZILIAN CONGRESS OF THERMAL ENGINEERING AND SCIENCES

MODELOS DE REGRESSÃO PARAMÉTRICOS

3ª AULA: ESTATÍSTICA DESCRITIVA Medidas Numéricas

Influência dos Procedimentos de Ensaios e Tratamento de Dados em Análise Probabilística de Estrutura de Contenção

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

Fast Multiresolution Image Querying

Identidade dos parâmetros de modelos segmentados

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

ALTERNATIVAS E COMPARAÇÕES DE MODELOS LINEARES PARA ESTIMAÇÃO DA BIOMASSA VERDE DE Bambusa vulgaris NA EXISTÊNCIA DE MULTICOLINEARIDADE

Uso dos gráficos de controle da regressão no processo de poluição em uma interseção sinalizada

Energia de deformação na flexão

CQ110 : Princípios de FQ

1. CORRELAÇÃO E REGRESSÃO LINEAR

DELINEAMENTOS EXPERIMENTAIS

REGRESSÃO NÃO LINEAR 27/06/2017

PLANILHAS EXCEL/VBA PARA PROBLEMAS ENVOLVENDO EQUILÍBRIO LÍQUIDO-VAPOR EM SISTEMAS BINÁRIOS

Prof. Lorí Viali, Dr.

Estimativa da Incerteza de Medição da Viscosidade Cinemática pelo Método Manual em Biodiesel

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária.

3 A técnica de computação intensiva Bootstrap

Análise Econômica da Aplicação de Motores de Alto Rendimento

CORRELAÇÃO E REGRESSÃO

4 Critérios para Avaliação dos Cenários

Elaboração: Fevereiro/2008

reducing income disparities in Brazil and the Northeast and Southeast regions of the country, showing that the fight against social inequalities

Contabilometria. Aula 8 Regressão Linear Simples

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

Análise multivariada do risco sistemático dos principais mercados de ações da América Latina: um enfoque Bayesiano

CURSO ON-LINE PROFESSOR: VÍTOR MENEZES

ROGÉRIO ALVES SANTANA. AVALIAÇÃO DE TÉCNICAS GEOESTATÍSTICAS NO INVENTÁRIO DE POVOAMENTOS DE Tectona grandis L.f.

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

Método para aplicação de gráficos de controle de regressão no monitoramento de processos

Escolha do Consumidor sob condições de Risco e de Incerteza

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

Expressão da Incerteza de Medição para a Grandeza Energia Elétrica

Elaboração: Novembro/2005

O problema da superdispersão na análise de dados de contagens

Capítulo 1. Exercício 5. Capítulo 2 Exercício

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

Palavras-chaves: Gráficos de controle, ambiente R, análise estatística multivariada

Controlo Metrológico de Contadores de Gás

Y X Baixo Alto Total Baixo 1 (0,025) 7 (0,175) 8 (0,20) Alto 19 (0,475) 13 (0,325) 32 (0,80) Total 20 (0,50) 20 (0,50) 40 (1,00)

3 Algoritmos propostos

Regressão Linear Simples by Estevam Martins

Equações Simultâneas

CALIBRAÇÃO DE UM MULTI-FILTER ROTATING SHADOWBAND RADIOMETER A PARTIR DA TÉCNICA LANGLEY PLOT E DO MÉTODO GERAL

Modelo Multi-Estado de Markov em Cartões de Crédito. Daniel Evangelista Régis Rinaldo Artes

Estimativa da fração da vegetação a partir de dados AVHRR/NOAA

são os coeficientes desconhecidos e o termo ε (erro)

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Transcrição:

Cênca 1642 ural, Santa Mara, v.43, n.9, p.1642-1649, set, 2013 Azevedo et al. ISSN 0103-8478 Quadrados mínmos parcas un e multvarado aplcados na seleção genômca para característcas de carcaça em suínos Un and multvarate partal least squares appled to genomc selecton for carcass trats n pgs Camla Ferrera Azevedo I Fabyano Fonseca e Slva I Marcos Deon lela de ezende II Luz Alexandre Peternell I Smone Elza Facone Gumarães III Paulo Sávo Lopes III ESUMO A prncpal contrbução da genétca molecular é a utlzação dreta das nformações de DNA no processo de dentf cação de ndvíduos genetcamente superores. Sob esse enfoque, dealzou-se a seleção genômca ampla (Genome Wde Selecton - GWS), a qual consste na análse de marcadores SNPs (Sngle Nucleotde Polymorphsms) amplamente dstrbuídos no genoma. Devdo a esse grande número de SNPs, geralmente maor que o número de ndvíduos genotpados, e à alta colneardade entre eles, métodos de redução de dmensonaldade são requerdos. Dentre estes, destaca-se o método de regressão va Quadrados Mínmos Parcas (Partal Least Squares - PLS), que além de soluconar tas problemas, permte uma abordagem multvarada, consderando múltplos fenótpos. Dante do exposto, objetvouse aplcar e comparar a regressão PLS unvarada (UPLS) e multvarada (MPLS) na GWS para característcas de carcaça em uma população F 2 de suínos Pau Comercal. Os resultados evdencaram a superordade do método MPLS, uma vez que este proporconou maores valores de acuráca em relação à abordagem unvarada. Palavras-chave: seleção genômca, redução de dmensonaldade, análse multvarada. ABSTACT The man contrbuton of molecular genetcs s the drect use of DNA nformaton to dentfy genetcally superor ndvduals. Under ths approach, genome-wde selecton (GWS) can be used wth ths purpose. GWS conssts n analyzng of a large number of SNP markers wdely dstrbuted n the genome, and due to the fact that the number of markers s much larger than the number of genotyped ndvduals and also to the fact that such markers are hghly correlated specal statstcal methods, lke Partal Least Squares (PLS), are wdely requred. Thus, the am of ths paper was to propose an applcaton of Un (UPLS) and Multvarate (MPLS) Partal Least Squares regresson to GWS of carcass trats n an F 2 (Pau commercal) pg populaton. The results showed that MPLS method provded most accurate genomc breedng values estmates than unvarate method. Key words: genomc selecton, dmensonalty reducton, multvarate analyss. INTODUÇÃO O prncpal atratvo da genétca molecular em prol do melhoramento anmal é a utlzação dreta das nformações provenentes do DNA no processo de dentfcação de ndvíduos genetcamente superores. Dante de novas classes de marcadores moleculares, como o SNP (Sngle Nucleotde Polymorphsms), MEUWISSEN et al. (2001) dealzaram a seleção genômca ampla (Genome Wde Selecton - GWS), a qual vsa o aumento da acuráca de seleção por meo da utlzação de um grande número de marcadores amplamente dstrbuídos no genoma. Devdo à alta densdade de marcadores, é possível assumr que alguns deles estejam em desequlíbro de lgação com QTLs (Quanttatve Trat Loc), possbltando sua utlzação dreta na estmação do valor genétco dos ndvíduos, nclusve os não fenotpados. No âmbto da seleção genômca, I Departamento de Estatístca, Centro de Cêncas Exatas, Unversdade Federal de çosa (UF), Avenda P.H. olfs, s/nº, 36570-000, UF, çosa, Mnas Geras, Brasl. Emal: camla.azevedo@ufv.br. Autor para correspondênca. II Embrapa Florestas, Departamento de Engenhara Florestal, UF, çosa, Mnas Geras, Brasl. III Departamento de Zootecna, Centro de Cêncas Exatas, UF, çosa, Mnas Geras, Brasl. ecebdo 20.08.12 Aprovado 31.03.13 Devolvdo pelo autor 09.07.13 C-2012-0713.1

Quadrados mínmos parcas un e multvarado aplcados na seleção genômca... 1643 a aplcação prátca dessas nformações é um desafo, pos geralmente não é possível a utlzação adequada de métodos tradconas baseados em quadrados mínmos (Least Squares) para estmar o efeto de cada SNP no fenótpo, uma vez que geralmente o número de marcadores é maor que o número de anmas genotpados (alta dmensonaldade) e alguns marcadores são altamente correlaconados (multcolneardade) devdo ao desequlíbro de lgação. Dessa forma, métodos estatístcos baseados na redução de dmensonaldade são requerdos. Dentre estes, destaca-se o método de regressão va Quadrados Mínmos Parcas (Partal Least Squares - PLS), que além de soluconar esses problemas, também permte uma abordagem multvarada, consderando múltplos fenótpos, a qual não pode ser mplementada dretamente em métodos tradconas de seleção genômca, tas como Bayes A, Bayes B e LASSO Bayesano, devdo à complexdade desses métodos. Na sunocultura moderna, as característcas de carcaça são mportantes por estarem dretamente relaconadas com as exgêncas do mercado consumdor (OSA et al.,2008; ZANGEONIMO et al., 2009), o qual tende a optar pela baxa deposção de gordura. Porém, em programas de melhoramento, essa tendênca deve ser contemplada smultaneamente com outras varáves, tas como rendmento e comprmento de carcaça. Assm, estmatvas do mérto genétco dos ndvíduos, consderando ou não nformações genômcas, geralmente, são estmadas com maor acuráca, quando provenentes de análses que consderam smultaneamente todas essas característcas, ou seja, sob um enfoque multvarado (SILA et al., 2011). Embora alguns trabalhos envolvendo seleção genômca para característcas de carcaça em suínos já tenham sdo publcados (FONTANESI et al., 2010; UIMAI et al., 2011), até o momento não há relatos na lteratura a respeto de abordagens multvaradas. Dante do exposto, o presente trabalho teve por objetvo utlzar e comparar o método PLS un e multvarado na seleção genômca para característcas de carcaça (espessuras de toucnho, bacon e rendmentos de carcaça) em uma população F 2 de suínos (Pau Comercal), utlzando um panel de marcadores SNPs. MATEIAL E MÉTODOS Os dados fenotípcos e de marcadores utlzados no presente estudo são provenentes da Granja de Melhoramento de Suínos do Departamento de Zootecna da Unversdade Federal de çosa, em çosa, Mnas Geras, Brasl, no período de novembro de 1998 a julho de 2001. Os dados fenotípcos foram corrgdos para os efetos fxos de sexo, lote e presença do gene halotano e desrregressados (ESENDE et al.,2010). Neste expermento, a população F 2 é composta de 345 suínos provenentes do cruzamento de dos varrões da raça naturalzada braslera Pau, com 18 fêmeas de lnhagem desenvolvda na UF, pelo acasalamento de anmas de raça comercal (Landrace Large Whte Petran). Os detalhes dos procedmentos utlzados, cuja extração do DNA fo realzada no Laboratóro de Botecnologa Anmal do DZO da UF, podem ser encontrados em PEIXOTO et al. (2006). A genotpagem fo realzada va tecnologa Golden Gate/era Code, no Laboratóro de Genétca Anmal (LGA), Embrapa ecursos Genétcos e Botecnologa (CENAGEN), Brasíla, DF, conforme descrto por HIDALGO et al. (2011). Os marcadores SNPs estão dstrbuídos da segunte forma nos cromossomos de Sus scrofa: SSC1 (56), SSC4 (54), SSC7 (59), SSC8 (31), SSC17 (25), totalzando assm 237 marcadores dentfcados para os anmas F2. Esses marcadores foram obtdos apenas em regões nas quas se observaram a presença QTL em estudos prévos (HIDALGO et al., 2011) nessa mesma população, caracterzando assm um mapeamento fno apenas em regões cromossômcas de nteresse, o que explca o número reduzdo de marcadores utlzados. As característcas analsadas foram espessuras de toucnho meddas medatamente após a últma costela na lnha dorso-lombar (ETUC); a 6,5 cm da lnha dorso-lombar (ETO); entre a últma e a penúltma vértebra lombar (ETUL);menor espessura na regão acma da últma vértebra lombar, na lnha dorso-lombar (ETL); espessura de bacon (EBACON); comprmento de carcaça pelo método de classfcação amercano (MLC) e rendmento de carcaça (CAC). Quadrados Mínmos Parcas Multvarados (Multvarate Partal Least Squares MPLS) consstem na obtenção de estmadores para Y,...,Y a partr de as varáves dependentes 1 n componentes T ( = 1,...,p ), que são combnações lneares das varáves explcatvas X 1,...,Xm (marcadores). Sob esse enfoque, a equação de predção é expressa por: em que Yk, (1) é o vetor de dados fenotípcos da

1644 Azevedo et al. característca k (k 1,...,n ), k são os coefcentes provenentes da regressão entre Y e os componentes T ( = 1,...,p ) e e é o vetor de resíduos. A prncpal característca do MPLS é que a correlação de qualquer par de componentes gual a zero, soluconando os problemas de multcolneardade. Generalzando, suponha que já foram determnados e T ( 1), j para j = 1,...,m k para k = 1,...,n. Por defnção, (+1)j é o resíduo provenente da regressão entre k T e j e (+1)k é o resíduo provenente da regressão entre k e T expressos, respectvamente, por: (+1)j = j -{t'v j (t't )}T (2), (+1)k = k -{t'r k (t't )}T, (3) em que t é o vetor de valores de de valores de T, v j é o vetor j, r k é o vetor de valores de t' v j (t' t ) e t' r k regressão. Se =1, k, (t' t ) os coefcentes da 1j é a varável centrada de ( 1j = Xj -X j, para j = 1,...,m ) e a varável centrada de Y k ( 1k k k 1k X j é =Y -Y, para k = 1,...,n ). O processo é repetdo sucessvamente a fm de obter as matrzes (+1) =(r (+1)1,...,r(+1)n ) e (+1) =(v (+1)1,...,v(+1)m). Assm, utlzando as matrzes (+1) e (+1), um novo vetor, u +1, deve ser determnado por meo da multplcação +1c+1, sendo c +1 o autovetor correspondente ao autovalor ' '. Segundo GATHWAITE T de +1 +1 +1 +1 (1994), geralmente, defne-se o componente +1 como sendo uma méda ponderada dada por: m T = w bˆ, (4) (+1) (+1)j (+1)j (+1)j j=1 em que w (+1)j var( (+1)j) = (v'(+1)j v (+1)j) (n-1) é o peso, e ˆb (+1)j = v' (+1)j u (+1) (v'(+1)j v (+1)j) é a estmatva do coefcente de regressão entre e (+1)j. U(+1) O método é repetdo para obter os componentes T (+2), T (+3),..., T p, os quas são regreddos para cada Y k e esses componentes, assm por meo do método dos quadrados mínmos ordnáros (Ordnary Least Squares OLS), são determnados os coefcentes do modelo (1), obtendo a segunte equação de predção:, (5) sendo Ŷ k o vetor de estmatvas do valor genômco dos ndvíduos para a característca k. Os coefcentes assocados aos componentes na equação (5) não possuem nterpretação bológca, porém é possível estmar os coefcentes assocados às varáves orgnas (efetos dos marcadores) combnando os modelos (5) e (4). Dessa forma, tem-se:, (6) em que W é a matrz de pesos, ˆB é matrz cujos elementos são os coefcentes provenentes da ^ regressão de U em relação a j e é o vetor de ^ coefcentes k. A prncpal dferença entre o MPLS e o método Quadrados Mínmos Parcas Unvarado (Unvarate Partal Least Squares - UPLS) está no modo como u +1 é construído. No método UNPLS, é o vetor de resíduos provenentes da regressão entre Y (únca varável dependente) e os componentes T ( = 1,...,p ). Enquanto no método MPLS aplca-se uma regressão entre cada varável Y k (váras varáves dependentes) e os componentes T ( = 1,...,p ) e u +1 é vsto como uma combnação lnear entre os vetores de resíduos. Como qualquer análse de regressão múltpla, um passo mportante na execução do MPLS e UPLS é a determnação do número ótmode componentes (novas varáves regressoras, T, = 1,...,p, caracterzadas como combnações

Quadrados mínmos parcas un e multvarado aplcados na seleção genômca... 1645 lneares dos marcadores SNPs) que devem ser ncluídos na equação (5). Neste estudo, o número ótmo de componentes, utlzados para a predção dos valores genômcos, fo escolhdo como sendo o número mínmo que establzasse a curva do coefcente de determnação ( 2 ) em relação aos componentes. A população F 2 de suínos fo dvdda em três populações dstntas, cada qual com 115 ndvíduos. Assm, duas dessas populações foram assumdas como população de trenamento e utlzadas para obter os efetos dos marcadores SNPs. A outra população, denomnada de valdação, fo utlzada para avalar a concordânca entre valores genétcos predtos va estmatvas provenentes da população de trenamento e fenótpos corrgdos observados. A acuráca obtda para cada método fo calculada por meo da segunte expressão 2 (ESENDE et al., 2010): rqq, ˆ ryy, ˆ hsm, sendo 2 h a herdabldade da segregação mendelana sm 2 2 2 2 dada por h sm = 0,5h [0,5h +(1-h )] e h 2 a herdabldade do caráter, estmada pelo método EML. Esses valores de acuráca também foram comparados com acurácas esperadas, determnadas conforme equação proposta por ESENDE (2008), na qual esses valores esperados são funções do tamanho efetvo da população, do tamanho dos cromossomos (em Morgans), do número de locos e da herdabldade de cada característca. Em posse do melhor método para cada característca, os efetos dos marcadores foram estmados e padronzados, consderando toda a população F 2 de suínos fazendo uso da equação (6). A partr dessas nformações, o Manhattan plot fo construído, sendo que cada ponto representa um SNP, com o exo X mostrando sua localzação no cromossomo e o exo Y a magntude de seu efeto. Nesses gráfcos, a opção pelo módulo dos efetos padronzados no exo Y dz respeto ao fato de não ter sdo utlzadas regressões smples para detectar efeto sgnfcatvo de cada marcador, o que resultara em p-valores a serem usados nesse exo. Todas as análses realzadas foram mplementadas no software lvre ( DEELOPMENT COE TEAM, 2010), utlzando a função plsr do pacote pls. ESULTADOS E DISCUSSÃO Conforme apresentado, optou-se pelo número mínmo de varáves latentes que establzasse a curva do coefcente de determnação ( 2 ) do modelo, que, neste trabalho, fo de 50 componentes (Fgura 1), portanto, uma redução de 79% na dmensonaldade em relação às varáves regressoras orgnas ( X j, j=1,...,m), uma vez que 50 componentes correspondem a 21% do número total de varáves orgnas (237 SNPs). Esse número de componentes fo deal para todas as característcas, uma vez que a varação explcada pela regressão fo em torno de 80% ao se especfcar tal número de componentes, porém, para a característca CAC no MPLS, talvez um número superor de componentes seja requerdo devdo ao comportamento lnear crescente (Fgura 1b). As acurácas obtdas por meo do método MPLS bem como pelo UPLS, para cada característca de carcaça, são apresentadas na fgura 2. A superordade do MPLS quanto à predção do valor genétco genômco é evdente, tendo em vsta que a efcênca matemátca méda do MPLS fo de mas de cem por cento sobre o método UPLS. Esses resultados são ntutvamente esperados, sso porque o MPLS captura de forma realístca a natureza das característcas, consderando as correlações entre elas. Sob o enfoque da seleção genômca, embora não exstam relatos na lteratura a respeto da utlzação dos métodos UPLS e MPLS em melhoramento de suínos, em outras espéces, o método UPLS já fo utlzado, e, de alguma forma, os valores de acuráca reportados para ele podem fornecer uma dea a respeto da efcênca desse método. MOSE et al. (2009) realzou um estudo de comparação entre cnco métodos para dados de gado letero, sendo que o UPLS mostrou acuráca de 0,42, não dferndo dos outros métodos utlzados. SOLBEG et al. (2009) realzaram um estudo fazendo uso também do método UPLS e observou 0,46 de acuráca, também bastante semelhantes àqueles proporconados pelos outros métodos utlzados. As acurácas esperadas e estmadas por cada um dos métodos utlzados são apresentadas na fgura 2. Nota-se que o método MPLS mostrou uma dferença méda (0,07) menor que aquela apresentada pelo método UPLS (0,24), evdencando que gerou estmatvas de acuráca mas próxmas daquelas calculadas por meo de parâmetros específcos dessa população F2. Nota-se também que, para as varáves MLC e ETO, o método MPLS mostrou valores de acuráca maores que os esperados, stuação esta que não fo observada para nenhuma varável ao se

1646 Azevedo et al. Fgura 1 - Curvas do coefcente de determnação (2), determnadas pelos métodos (a) UPLS e (b) MPLS, em relação ao número de componentes para as característcas de carcaça.

Quadrados mínmos parcas un e multvarado aplcados na seleção genômca... 1647 Fgura 2 - Acurácas obtdas por meo do método MPLS e UPLS para característcas de carcaça. consderar o método UPLS. Portanto, dante de tas resultados, é possível nferr que o método MPLS é mas aproprado para seleção genômca que o método UPLS em stuações envolvendo város fenótpos, naturalmente correlaconados (Tabela 1), tas como esses referentes a avalações de carcaça em suínos. As estmatvas das correlações genétcas (Tabela 1) entre espessura de toucnho e a característca comprmento de carcaça obtveram valores negatvos (-0,38 a -0,57), o que garante a efcênca na seleção. As espessuras de toucnho apresentaram correlações genétcas postvas com o rendmento de carcaça (0,27 a 0,33). Além dsso, essas característcas são altamente correlaconadas entre s e com a espessura de bacon (0,46 a 0,74), conforme encontrado por MENDONÇA et al. (2012), utlzando esse mesmo conjunto de dados, porém sob o enfoque de modelos mstos com nclusão da matrz de parentesco. A dentfcação de marcadores de grandes efetos é de suma mportânca para a GWS, pos possblta determnar a posção desses SNPs, a fm de verfcar a exstênca de QTLs que afetam o caráter quanttatvo nessas regões. Assm, uma vez que o método MPLS apresentou melhores resultados, a dentfcação dos marcadores de maores efetos fo realzada por meo das estmatvas dos parâmetros do modelo de regressão (efetos de SNPs), contemplado pelo mesmo método. Em posse do melhor método para cada característca e a fm de facltar tal dentfcação, os gráfcos Manhattan foram confecconados e estão dspostos na fgura 3. De forma geral, os marcadores de maor relevânca na característca CAC se encontram no prmero terço do cromossomo 7, tal como EANS et al. (2004) encontrou um QTL sgnfcatvo para suínos de lnhagem comercal. Enquanto que para as outras característcas, esses SNPs se encontram no terço ntermedáro (MLC, ETUL e ETO) e no terço fnal (ETUC e ETL) do cromossomo 1, concordando com os resultados reportados por BEECKMANN et al. (2003) e OHE et al. (1998) para suínos das raças Meshan, Petran e European Wld Boar; e provenentes do cruzamento Meshan Whte, respectvamente. CONCLUSÃO O método mas efcente para a estmação do valor genétco genômco é o MPLS, o qual, por contemplar todos os fenótpos smultaneamente, resulta em maor acuráca. O marcadores SNPs de maor efeto dentfcados por este método estão localzados em regões cromossômcas prevamente relatadas em outros estudos, como regões relaconadas à presença de QTLs que afetam característcas de carcaça em suínos. Tabela 1 - Estmatvas das correlações genétcas, entre as característcas, dos valores genétcos genômcos dos ndvíduos. Caract. CAC MLC ETUC ETUL ETL ETO EBACON CAC 1-0,61±0,01 0,31±0,02 0,31±0,03 0,27±0,01 0,33±0,03 0,14±0,02 MLC 1-0,57±0,02-0,38±0,03-0,57±0,01-0,56±0,02-0,55±0,02 ETUC 1 0,53±0,04 0,65±0,02 0,73±0,04 0,57±0,03 ETUL 1 0,51±0,02 0,58±0,05 0,46±0,04 ETL 1 0,76±0,02 0,64±0,01 ETO 1 0,74±0,04 EBACON 1 CAC = rendmento de carcaça (%); MLC = comprmento de carcaça pelo Método Amercano (cm); ETUC = espessura de toucnho medatamente após a últma costela, na lnha dorso-lombar (mm); ETUL = espessura de toucnho medda entre a últma e a penúltma vértebra lombar (mm); ETL= menor espessura de toucnho na regão acma da últma vértebra lombar, na lnha dorso-lombar (mm); ETO = espessura de toucnho medda medatamente após a últma costela, a 6,5cm da lnha dorso-lombar (mm); EBACON= espessura de bacon (mm).

1648 Azevedo et al. Fgura 3 - Manhattan plot dos efetos de marcadores padronzados estmados por meo do método MPLS.

Quadrados mínmos parcas un e multvarado aplcados na seleção genômca... 1649 EFEÊNCIAS BEECKMANN, P. et al. Lnkage and QTL mappng for Sus scrofa chromosome 1. Journal of Anmal Breedng and Genetcs, v.120, p.1-10, 2003. Dsponível em: <http://www.anmalgenome. org/ QTLdb/references/ISU0007.pdf>. Acesso em: 10 ma. 2012. do: 0.1046/j.0931-2668.2003.00418.x. EANS, G.J. et al. Identfcaton of quanttatve trat loc for producton trats n commercal pg populatons. Genetcs, v.164, p.621-627, 2003. Dsponível em: <http://www.genetcs.org/ content/164/2/621.full.pdf> Acesso em: 20 ma. 2012. FONTANESI, L. et al. The IGF2 ntron3-g.3072g>a polymorphsm s not the only SSC2p mutaton affectng meat producton and carcass trats n pgs: evdences from the effects of a cathepsn D (CTSD) gene polymorphsm. Journal of Anmal Scence, v.88, n.7, p.:2235-2245,2010. Dsponível em: <http://www.anmal-scence.org/content/early/2010/04/09/ jas.2009-2560>. Acesso em: 10 ma. 2012. do: 10.2527/ jas.2009-2560. GATHWAITE, P.H. An nterpretaton of partal least squares. Journal of the Amercan Statstcal Assocaton, v.89, p.122-127, 1994. HIDALGO, A.M. et al. Fne mappng and sngle nucleotde polymorphsm effects estmaton on pg chromossomes 1,4,7,8,17 and x. p.31, 2011. Dssertaton of Genetcs and Breedng - Unversty Federal of çosa, çossa, MG. MENDONÇA, P.T. et al. Estmação de parâmetros genétcos de uma população F2 de suínos. evsta Braslera de Saúde e Produção Anmal, v.13, p.330-343, 2012. Dsponível em: <http:// revstas.ufba.br/ndex.php/rbspa/artcle/vewartcle/2199>. Acesso em: 20 ma. 2012. MEUWISSEN, T.H.E. et al. Predcton of total genetc value usng genome wde dense marker maps. Genetcs, v.157, p.1819-1829, 2001. Dsponível em: <http://www.genetcs.org / content/157/4/1819.full>. Acesso em: 08 ago. 2011. MOSE, G. et al. A comparson of fve methods to predct genomc breedng values of dary bulls from genome-wde SNP markers. Genetcs Selecton Evoluton, v.41, p.41-53, 2009. Dsponível em: <http://www.gsejournal.org/content/41/1/56>. Acesso em: 05 abr. 2012. do:10.1186/1297-9686-41-56. PEIXOTO, J.O. et al. Assocatons of leptn gene polymorphsms wth producton trats n pgs. Journal of Anmal Breedng and Genetcs, v.123, p.378-383, 2006. DEELOPMENT COE TEAM. : a language and envronment for statstcal computng. ena: Foundaton for Statstcal Computng, 2010. p. 409. ESENDE, M.D.. Genômca quanttatva e seleção no melhoramento de plantas perenes e anmas. Colombo: Embrapa Florestas, 2008. 330p. ESENDE, M.D.. et al. Computação da seleção genômca ampla (GWS). Colombo: Embrapa Florestas, 2010. 79p. OHE, G.A. et al. Identfcaton of quanttatve trat loc affectng carcass composton nswne: I. Fat deposton trats. Journal of Anmal Scence, v.76, p.47-54, 1998. Dsponível em: <http://naldc. nal.usda.gov/download/12904/pdf>. Acesso em: 13 de jun 2012. OSA, A.F. et al. Característcas de carcaça de suínos de três lnhagens genétcas em dferentes dades ao abate. Cênca ural, v.38, p.1718-1724, 2008. SILA, F.F. et al. Three-step Bayesan factor analyss appled to QTL detecton n crosses between outbred pg populatons. Lvestock Scence, v.142, p.210-215, 2011. SOLGEG, T.. et al. educng dmensonalty for predcton of genome-wde breedng values. Genetcs Selecton Evoluton, v.41, p.29, 2009. Dsponível em: <http://www. gsejournal.org / content/41/1/29>. Acesso em: 01 de jun 2012. do:10.1186/1297-9686-41-29. UIMAI, P. et al. Whole-genome SNP assocaton analyss of reproducton trats n the Fnnsh Landrace pg breed. Genetcs Selecton Evoluton, v.43, p.42, 2011. ZANGEONIMO, M.G. et al. Desempenho e característcas de carcaça de suínos dos 20 aos 50kg recebendo rações com reduzdo teor de proteína bruta e dferentes níves de lsna dgestível verdadera. Cênca ural, v.39, p.1507-1513, 2009.