I Workshop em Inteligência Computacional e Aprendizado Estatístico Aplicados à Agropecuária
|
|
- Afonso Weber Godoi
- 5 Há anos
- Visualizações:
Transcrição
1 I Workshop em Inteligência Computacional e Aprendizado Estatístico Aplicados à Agropecuária Camila Ferreira Azevedo Professora Departamento de Estatística - UFV camila.azevedo@ufv.br 1
2 Colaboradores: 2
3 Um pouco sobre Seleção e Associação Genômica O que ocasiona a diferença entre os indivíduos? 3
4 Informações Fenotípicas y = 1,5 3,0 5,0 Informações Moleculares X =
5 Seleção Genômica (GWS) Associação Genômica (GWAS) Estimar o efeito de todos os marcadores simultaneamente no fenótipo: y = X መβ Identificar os indivíduos geneticamente com base no seu valor genômico estimado. Calcular medidas de acurácia e viés e estimar parâmetros genéticos de interesse (variância genética e herdabilidade). Identificar regiões cromossômicas relevantes não considerando significância estatística. Geralmente, os marcadores são estimados um a um ou por meio de regiões. Identificar variantes causais no genoma de um grande número de indivíduos para descobrir associações estatísticas significativas (pvalor) entre os marcadores e os fenótipos. Investigar as regiões cromossômicas em que estas variantes significativas se encontram e relacioná-las com funções biológicas acessando banco de dados genômicos. 5
6 Mas o que os procedimentos estatísticos da GWS e da GWAS tem em comum? Manipulação de bancos de dados de alta dimensionalidade A aplicação prática dessas metodologias é um desafio. Os softwares estatísticos existentes apresentam: Interfaces complicadas; Requerem conhecimento de linguagens de programação; Licença de uso. 6
7 SOFTWARE R R é uma linguagem e também um ambiente de desenvolvimento integrado para análises estatísticas e gráficos. Vantagens: Software livre ( Suporta a manipulação de grandes conjuntos de dados; Composto por módulos denominados de pacotes, os quais contemplam funções para análises estatísticas; Funções otimizadas; Geralmente, os pacotes estão associados a artigos científicos. 7
8 SOFTWARE R Desvantagens: Requerem o desenvolvimento de linhas de comando; Desafio para os usuários leigos e sem formação na área de programação. 8
9 O processo de programação do GenomicLand segue as principais diretrizes: Interface com o software R, permitindo o uso dos principais pacotes deste software; Interface intuitiva e de fácil acesso aos usuários; Permita que o usuário utilize todos os procedimentos estatísticos necessários para uma abordagem completa de seleção e associação genômica sem a necessidade de utilização de outro software. 9
10 10
11 GenomicLand Fase de teste e de sugestões; Sistemas Operacionais testados: Windows (7, 10 e Vista) Linux (Ubuntu) Estará disponível em breve para download no site do LICAE: O usuário necessita de ter o R instalado e os pacotes listados. 11
12 ARQUIVOS DE DADOS Identificação dos indivíduos Fenótipos Efeitos Fixos Efeitos aleatórios Marcadores codificados em 0, 1 e 2 12
13 13
14 Controle de Qualidade 14
15 Controle de Qualidade Elimina-se os marcadores que tiverem MAF Valor definido; Elimina-se os marcadores que tiverem Call Rate Valor definido; Elimina-se os marcadores que tiverem suas frequências observadas desviando-se das esperadas pelo Equilíbrio de Hardy- Weinberg conforme o nível de significância desejado. Imputação pela média do marcador conforme o tipo (SNP ou DArT). 15
16 HELP 16
17 Outputs 17
18 Outputs i. Arquivo de frequências alélicas e Gráfico da MAF: Todos os arquivos são salvos em formato csv e separados por virgula. 18
19 Outputs ii. Arquivo de Call Rate e arquivo de marcadores após a limpeza: 19
20 Componentes Principais da Matriz G 20
21 HELP 21
22 ARQUIVOS DE DADOS Identificação dos indivíduos Efeitos Fixos Efeitos Aleatórios Fenótipos Marcadores 22
23 Outputs 23
24 Outputs i. Matriz de Parentesco Genômico (G): Parentesco entre os 24
25 Outputs ii. Componentes Principais (scores) da matriz G 25
26 Outputs iii. Gráfico dos dois primeiros Componentes Principais (scores) da matriz G 26
27 ARQUIVOS DE DADOS Identificação dos indivíduos População Fenótipos Efeitos Fixos Efeitos Aleatórios Marcadores 27
28 Outputs 28
29 Outputs iii. Gráfico dos dois primeiros Componentes Principais (scores) da matriz G 29
30 30
31 Modelos Mistos Genômico (G-BLUP) O modelo linear misto para valores genéticos genômicos aditivos (u a ), valores genéticos genômicos devido a desvios de dominância (u d ), valores genéticos genômicos epistáticos aditivo aditivo (u e ) é apresentado a seguir: y = Xb + Sf + Zu a + Zu d + Zu i + e Fenótipos Efeitos Fixos Efeitos Aleatórios Efeitos aleatórios epistáticos (ad ad) Efeitos aleatórios devido à dominância Efeitos aleatórios aditivos 31
32 Modelos Mistos Genômico (G-BLUP) As equações de modelo misto para predizer os valores genéticos aditivos, devido a dominância e epistáticos: X X X S X Z X Z X Z S X S S + I σ e 2 σ r 2 S Z S Z S Z Z X Z S Z Z + G a 1 σ e 2 σ a 2 Z Z Z Z Z X Z S Z Z Z Z + G d 1 σ e 2 σ d 2 Z Z Z X Z S Z Z Z Z Z Z + G i 1 σ e 2 σ i 2 b መf u a u d u i = X y S y Z y Z y Z y em que G a é a matriz de parentesco aditiva, G d é a matriz de parentesco devido à dominância e G i é a matriz de parentesco devido à epistasia. 32
33 33
34 ARQUIVOS DE DADOS Identificação dos indivíduos Fenótipos Efeitos Fixos Efeitos aleatórios Marcadores codificados em 0, 1 e 2 34
35 Help 35
36 Outputs 36
37 Outputs por Fold Parte aditiva Total Parte devido à dominância 37
38 Parte aditiva Outputs Total Parte devido à dominância Medidas de qualidade de ajuste 38
39 39
40 Métodos Bayesianos Os métodos bayesianos são baseados no Teorema de Bayes para variáveis aleatórias. Sendo assim, tem-se: P θ Y = P Y θ P(θ) P(Y) = P Y θ P(θ) θ P(Y, θ)dθ = θ P Y θ P(θ) P Y θ P θ dθ em que θ é o parâmetro e Y os dados. Em termos de proporcionalidade, P θ Y P Y θ P(θ) Posteriori Verossimilhança Priori
41 Métodos Bayesianos Os métodos também são baseados em um modelo linear, no entanto, este modelo a nível de marcadores, ou seja: y = Xb + Zf + Wm a + Sm d + e Fenótipos Efeitos Fixos (Sistemáticos) Efeitos Aleatórios Efeitos aleatórios devido à dominância Efeitos aleatórios aditivos Para todos os efeitos acima é assumido uma distribuição de probabilidade, uma vez que são desconhecidos!! 41
42 Diferença entre os Métodos Bayesianos Regressão Ridge Bayesiana: m ai ~N(0, σ 2 ma ) e m di ~N(0, σ 2 md ) 2 BayesA: m ai ~N(0, σ mai 2 ) e m di ~N(0, σ mdi ) 2 BayesB: m ai ~πn 0, σ mai 2 m di ~πn 0, σ mdi 2 + (1 π)n(0, σ mai =0) 2 + (1 π)n(0, σ mdi =0) Determinado subjetivamente BayesCπ: m ai ~π a N 0, σ2 ma + (1 π a )N(0, σ2 ma = 0) 2 2 m di ~π d N 0, σ md + (1 π d )N(0, σ md = 0) Variável aleatória BLASSO: m ai λ a ~DE 0, σ λ a e m di λ a ~DE 0, σ λ d
43 43
44 ARQUIVOS DE DADOS Identificação dos indivíduos Fenótipos Efeitos Fixos Efeitos aleatórios Marcadores codificados em 0, 1 e 2 44
45 Help 45
46 Outputs 46
47 Outputs 47
48 Outputs por Fold Parte aditiva 48
49 Outputs Parte aditiva Medidas de qualidade de ajuste Apresenta também as cadeias para os efeitos de marcadores, para a variância e para a média. 49
50 50
51 Métodos de Redução de Dimensionalidade Os métodos também são baseados em um modelo linear, no entanto, este modelo a nível de marcadores pode somente conter efeitos fixos, ou seja: y = Xb + Wm a + e Fenótipos Efeitos Fixos y = Tβ + e Efeitos fixos aditivos Os métodos de redução de dimensionalidade são baseados em variáveis latentes, denominados componentes. 51
52 Métodos de Redução de Dimensionalidade Componentes: T i = a 1 x 1i + a 2 x 2i + + a p x pi Efeitos fixos ambientais + b 1 w 1i + b 2 w 2i + + b n w ni Efeitos fixos aditivos A questão é: Determinar estes coeficientes a e b!! Isso é que vai diferenciar os métodos. PCR: Extraem os componentes que maximizam a Var(T). PLS: Extraem os componentes que maximizam a Cov(T, Y). ICR: Extraem os componentes que maximizam a independência entre eles. 52
53 ARQUIVOS DE DADOS Identificação dos indivíduos Fenótipos Efeitos Fixos Marcadores codificados em 0, 1 e 2 53
54 Help 54
55 Outputs 55
56 Outputs Três critérios para determinar o número de componentes a serem incluídos no modelo. 56
57 Help 57
58 Outputs 58
59 59
60 Aprendizado de máquinas Árvore de regressão: Um método de análise de dados que recursivamente particiona dados em conjuntos, cada um dos quais é simplesmente modelado usando métodos de regressão. Nós internos SNP597 < SNP1957 < SNP1711 < SNP512 < 1.5 SNP1686 < SNP1150 < 0.5 SNP900 < Nós terminais ou folhas da árvore SNP1148 < SNP1589 < 0.5 SNP87 < SNP1003 < 1.5 SNP139 <
61 Aprendizado de máquinas Bagging: Procedimento com a finalidade de reduzir a variância de um método estatístico de aprendizagem. Para aplicar o bagging às árvores de regressão, simplesmente construímos B árvores de regressão usando B amostras de treinamento bootstrap e tiramos a média das predições resultantes. Random Forest: Muito similar ao bagging, no entanto, força as divisões das árvores a considerarem apenas um subconjunto de preditores. Isso leva a: i) Variável mais importante não estará sempre no topo; ii) Árvores diferentes; iii) Predições menos correlacionadas; iv) Maior redução da variabilidade.
62 ARQUIVOS DE DADOS Identificação dos indivíduos Fenótipos Efeitos Fixos Marcadores codificados em 0, 1 e 2 62
63 Help 63
64 Outputs 64
65 65
66 Associação genômica via marcas únicas A ideia é estimar um a um efeito de cada marcador no fenótipo e após a estimação verificar por meio de testes de hipótese se este efeito é significativo. Sendo assim, y = 1μ + Wm i + e Fenótipos Média Assume que o marcador afetará o caráter apenas se ele estiver em LD com o suposto QTL. Efeito fixo do i-ésimo marcador 66
67 ARQUIVOS DE DADOS Identificação dos indivíduos Fenótipos Marcadores codificados em 0, 1 e 2 67
68 Help 68
69 Outputs 69
70 Outputs i. Arquivo com o p-valor e q valor dos testes de hipótese e a proporção de explicação de cada marcador. 70
71 Outputs 71
72 Outputs 72
73 Perspectivas futuras: Sugestões do usuário: Atualizar o software com as sugestões do usuário para facilitar a sua utilização; Utilizar o software na disciplina de EST732 (Métodos Estatísticos na Seleção Genômica); Atualizar o software periodicamente com métodos inovadores. 73
74 AGRADECIMENTOS 74
75 Obrigada pela Atenção! 75
Árvores de decisão e seus refinamentos na predição genômica da resistência à ferrugem alaranjada em café arábica
Árvores de decisão e seus refinamentos na predição genômica da resistência à ferrugem alaranjada em café arábica Ithalo Coelho de Sousa ithalo.coelho@gmail.com Programa de Pós-Graduação em Estatística
Leia maisPredição genômica de caracteres quantitativos por meio de Redes Neurais Artificias
Universidade Federal de Viçosa Predição genômica de caracteres quantitativos por meio de Redes Neurais Artificias Isabela de Castro Sant Anna Supervisor: Moysés Nascimento Laboratório de Inteligência Computacional
Leia maisTécnicas computacionais em probabilidade e estatística II
Técnicas computacionais em probabilidade e estatística II Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco AULA 1: Problemas Computacionais em Inferência Estatística.
Leia maisModelos de regressão para dados correlacionados. Cibele Russo
Modelos de regressão para dados correlacionados Cibele Russo cibele@icmc.usp.br ICMC USP Mini-curso oferecido no Workshop on Probabilistic and Statistical Methods 28 a 30 de janeiro de 2013 Cibele Russo
Leia maisApresentação... Prefácio...
SUMÁRIo Apresentação... Prefácio... V VII Capítulo 1 Melhoramento de Fruteiras... 1 Capítulo 2 ANÁLISE de VARIÂNCIA: PROGÊNIES, CLONES E MEDIDAS REPETIDAs... 7 2.1 Experimentação Adequada... 7 2.2 Teste
Leia maisAvaliação genética. Os pais não transmitem o seu genótipo aos descendentes e sim uma amostra aleatória de genes.
Avaliação genética Eistem duas formas clássicas de se promover mudanças na constituição genética da população: seleção e sistemas de acasalamento. Seleção é a escolha de animais que serão pais da próima
Leia maisMÉTODOS DE SELEÇÃO. Professor: Dr. Alexandre Leseur dos Santos Mestranda: Lurdes Rodrigues Estágio em Docência I Disciplina: Melhoramento Genético
MÉTODOS DE SELEÇÃO 1 Professor: Dr. Alexandre Leseur dos Santos Mestranda: Lurdes Rodrigues Estágio em Docência I Disciplina: Melhoramento Genético 2 MÉTODOS DE SELEÇÃO INTRODUÇÃO A seleção pode ser realizada
Leia maisNOÇÕES DE GENÉTICA QUANTITATIVA
NOÇÕES DE GENÉTICA QUANTITATIVA 5 INTRODUÇÃO As características genéticas a serem melhoradas em uma espécie agrícola, podem ser de dois tipos: caracteres qualitativos ou caracteres quantitativos. Os caracteres
Leia maisCC-226 Aula 07 - Estimação de Parâmetros
CC-226 Aula 07 - Estimação de Parâmetros Carlos Henrique Q. Forster - Instituto Tecnológico de Aeronáutica 2008 Estimação de Parâmetros Para construir o classificador bayesiano, assumimos as distribuições
Leia maisDistribuições Amostrais e Estimação Pontual de Parâmetros
Distribuições Amostrais e Estimação Pontual de Parâmetros ESQUEMA DO CAPÍTULO 7.1 INTRODUÇÃO 7.2 DISTRIBUIÇÕES AMOSTRAIS E TEOREMA DO LIMITE CENTRAL 7.3 CONCEITOS GERAIS DE ESTIMAÇÃO PONTUAL 7.3.1 Estimadores
Leia maisTACG GWAS utilizando Random Forest: estudo de caso em bovinos de corte
TACG GWAS utilizando Random Forest: estudo de caso em bovinos de corte Roberto H. Higa Juiz de Fora, 2 a 6 de setembro de 2013 Sumário» Introdução» Random Forest» Estudo com dados simulados» Estudo de
Leia maisEstudo comparativo da Teoria Bayesiana: Aplicação de métodos bayesianos a dados genéticos Taís Aparecida ALVARENGA1 Márcio BALESTRE2
Estudo comparativo da Teoria Bayesiana: Aplicação de métodos bayesianos a dados genéticos Taís Aparecida ALVARENGA 1 Márcio BALESTRE 2 RESUMO: O presente trabalho consiste na aplicação da teoria bayesiana
Leia maisMELHORAMENTO GENÉTICO. Seleção Genômica
MELHORAMENTO GENÉTICO Seleção Genômica Claudio Nápolis Costa Zootª, Ph.D. Melhoramento Animal Coronel Pacheco - MG AGENDA Informar sobre o estudo do genoma bovino; Apresentar a sua aplicação nos Programas
Leia maisCap. 4 - Estimação por Intervalo
Cap. 4 - Estimação por Intervalo Amostragem e inferência estatística População: consiste na totalidade das observações em que estamos interessados. Nº de observações na população é denominado tamanho=n.
Leia maisμ = σ 2 g = 50.1 ApoE e colesterol em uma população canadense ε ε ε Genóti po Freq. H-W
ApoE e colesterol em uma população canadense μ= 174.6 σ 2 p = 732.5 Freqüência relativa 2/3 Genóti po P 173.8 161.4 183.5 136.0 178.1 180.3 Colesterol total no soro (mg/dl) Passo 1: Calcular o fenótipo
Leia maisEconometria em Finanças e Atuária
Ralph S. Silva http://www.im.ufrj.br/ralph/especializacao.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Maio-Junho/2013 Motivação Motivação Por
Leia maisEstudo da diversidade com sequências de DNA
Estudo da diversidade com sequências de DNA estudo do DNA por sequenciação extracção de DNA PCR do fragmento desejado sequenciação estudo do DNA por sequenciação sequenciação 1 2 3 indivíduo A indivíduo
Leia maisAnálise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda
Leia maisInferência Estatistica
Inferência Estatistica Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Modelos e Inferência Um modelo é uma simplificação da realidade (e alguns
Leia maisRESOLUÇÃO Nº 01/2016
Legislações Complementares: Resolução Nº 02/2016 Colegiado DEst Resolução Nº 03/2016 Colegiado DEst Resolução Nº 01/2017 Colegiado DEst RESOLUÇÃO Nº 01/2016 O Departamento de Estatística, tendo em vista
Leia maisMOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel
MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 e 16 Introdução à probabilidade (eventos,
Leia maisUniversidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Objetivo Dada M classes ω 1, ω 2,..., ω M e um
Leia maisRalph S. Silva
ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S Silva http://wwwimufrjbr/ralph/multivariadahtml Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Revisão:
Leia maisInteligência Artificial
Inteligência Artificial Aula 14 Aprendizado de Máquina Avaliação de s Preditivos (Classificação) Hold-out K-fold Leave-one-out Prof. Ricardo M. Marcacini ricardo.marcacini@ufms.br Curso: Sistemas de Informação
Leia maisEstimação e Testes de Hipóteses
Estimação e Testes de Hipóteses 1 Estatísticas sticas e parâmetros Valores calculados por expressões matemáticas que resumem dados relativos a uma característica mensurável: Parâmetros: medidas numéricas
Leia maisCentro Internacional de Pobreza (PNUD/IPEA) Fabio Veras Soares. Estimação do Impacto de Múltiplos Tratamentos e do. Escore de Propensão Generalizado
Estimação do Impacto de Múltiplos Tratamentos e do Efeito Dosagem: Escore de Propensão Generalizado Fabio Veras Soares Centro Internacional de Pobreza (PNUD/IPEA) Vimos nas aulas anteriores que o escore
Leia maisCoeficiente de determinação R 2 no modelo de regressão linear normal
Coeficiente de determinação R 2 no modelo de regressão linear normal Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 81531 990, Brasil email: lucambio@ufpr.br
Leia maisVariação ambiental Poligenes
Fenótipo é qualquer característica mensurável. Genótipos Mendelianos são sempre discretos, mas fenótipos podem ser discretos ou contínuos. Ronald A. Fisher Encerrou toda oposição séria ao Mendelismo, e
Leia maisp(x) Note que 1/p(x), que não depende de θ, funciona como uma constante normalizadora
Capítulo 1 Introdução A informação que se tem sobre uma quantidade de interesse θ é fundamental na Estatística. O verdadeiro valor de θ é desconhecido e a idéia é tentar reduzir este desconhecimento. Além
Leia maisAnálise de Regressão Linear Simples e
Análise de Regressão Linear Simples e Múltipla Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução A análise de regressão estuda o relacionamento entre uma variável
Leia maisA Metodologia de Box & Jenkins
A Metodologia de Box & Jenins Aula 03 Bueno, 0, Capítulo 3 Enders, 009, Capítulo Morettin e Toloi, 006, Capítulos 6 a 8 A Metodologia Box & Jenins Uma abordagem bastante utilizada para a construção de
Leia maisMOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel
MOQ 13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 3 4 5 6 7 8 9 10 11 1 13 14 15 e 16 Introdução à probabilidade (eventos,
Leia maisMinera c ao de Dados Aula 6: Finaliza c ao de Regress ao e Classifica c ao Rafael Izbicki 1 / 33
Mineração de Dados Aula 6: Finalização de Regressão e Classificação Rafael Izbicki 1 / 33 Como fazer um IC para o risco estimado? Vamos assumir que ( X 1, Ỹ1),..., ( X s, Ỹs) são elementos de um conjunto
Leia maisModelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados
Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados Erica Castilho Rodrigues 23 de Maio de 207 Introdução 2 3 Vimos como encontrar o EMV usando algoritmos numéricos. Duas possibilidades:
Leia maisEconometria. Econometria MQO MQO. Resíduos. Resíduos MQO. 1. Exemplo da técnica MQO. 2. Hipóteses do Modelo de RLM. 3.
3. Ajuste do Modelo 4. Modelo Restrito Resíduos Resíduos 1 M = I- X(X X) -1 X Hipóteses do modelo Linearidade significa ser linear nos parâmetros. Identificação: Só existe um único conjunto de parâmetros
Leia maisINTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA
INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA APLICAÇÃO NO CONTROLE DE QUALIDADE DE FÁRMACOS MÓDULO 05 Unidade Universitária de Ciências Exatas e Tecnológicas UnUCET Anápolis 1 2 MÓDULO 05 CALIBRAÇÃO MULTIVARIADA
Leia maisDistribuições Amostrais e Estimação Pontual de Parâmetros
Distribuições Amostrais e Estimação Pontual de Parâmetros - parte I 2012/02 1 Introdução 2 3 4 5 Objetivos Ao final deste capítulo você deve ser capaz de: Entender estimação de parâmetros de uma distribuição
Leia maisRoteiro. PCC142 / BCC444 - Mineração de Dados Classicadores Bayesianos. Representação dos Dados. Introdução
Roteiro PCC142 / BCC444 - Mineração de Dados Classicadores Bayesianos Introdução Representação dos Dados Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto
Leia maisPREVISÃO. Prever o que irá. acontecer. boas decisões com impacto no futuro. Informação disponível. -quantitativa: dados.
PREVISÃO O problema: usar a informação disponível para tomar boas decisões com impacto no futuro Informação disponível -qualitativa Prever o que irá acontecer -quantitativa: dados t DEI/FCTUC/PGP/00 1
Leia maisMAE0524: Análise Bayesiana de Dados
MAE0524: Análise Bayesiana de Dados Aula 4: Introdução ao Pensamento Bayesiano Gualberto Segundo Agamez Montalvo Instituto de Matemática e Estatística - USP 25 de fevereiro de 2016 G.S. Agamez Montalvo
Leia maisModelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência
Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência Erica Castilho Rodrigues 12 de Agosto 3 Vimos como usar Poisson para testar independência em uma Tabela 2x2. Veremos
Leia maisIntervalos de Confiança
Intervalos de Confiança Carla Henriques e Nuno Bastos Departamento de Matemática Escola Superior de Tecnologia de Viseu Carla Henriques e Nuno Bastos (DepMAT) Intervalos de Confiança 2010/2011 1 / 33 Introdução
Leia maisDisciplina de Modelos Lineares Professora Ariane Ferreira
Disciplina de Modelos Lineares 2012-2 Regressão Logística Professora Ariane Ferreira O modelo de regressão logístico é semelhante ao modelo de regressão linear. No entanto, no modelo logístico a variável
Leia maisPREDIÇÃO SIMULTÂNEA DOS EFEITOS DE MARCADORES MOLECULARES E SELEÇÃO GENÔMICA AMPLA EM CAJUEIRO 1
840 PREDIÇÃO SIMULTÂNEA DOS EFEITOS DE MARCADORES MOLECULARES E SELEÇÃO GENÔMICA AMPLA EM CAJUEIRO 1 JOSÉ JAIME VASCONCELOS CAVALCANTI 2, MARCOS DEON VILELA DE RESENDE 3, FRANCISCO HERBETH COSTA DOS SANTOS
Leia maisModelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência
Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência Erica Castilho Rodrigues 12 de Agosto Introdução 3 Vimos como usar Poisson para testar independência em uma Tabela 2x2.
Leia maisMAE0229 Introdução à Probabilidade e Estatística II
Exercício Entre jovens atletas, um nível alto de colesterol pode ser considerado preocupante e indicativo para um acompanhamento médico mais frequente. Suponha que são classificados como tendo taxa de
Leia maisQuantitativos + Qualitativos 17/03/2016. Variabilidade Genética Como surgem as variações genéticas? Mutações! Controle Genética e Herdabilidade
17/03/016 UNIVERSIDADE DE SÃO PAULO ESCOLA SUPERIOR DE AGRICULTURA LUIZ DE QUEIROZ DEPARTAMENTO DE GENÉTICA LGN0313 Melhoramento Genético Controle Genética e Herdabilidade Prof. Fernando Angelo Piotto
Leia maisUma Avaliação do Erro Tipo II no Uso do Teste t-student
Uma Avaliação do Erro Tipo II no Uso do Teste t-student Cleber Giugioli Carrasco Thiago Santana Lemes 1 Unidade Universitária de Ciências Exatas e Tecnológicas, Universidade Estadual de Goiás, UnUCET/UEG,
Leia maisMétodos Estatísticos
Métodos Estatísticos 8 Inferência Estatística stica Estimação de Parâmetros Média Referencia: Estatística Aplicada às Ciências Sociais, Cap. 9 Pedro Alberto Barbetta. Ed. UFSC, 5ª Edição, 22. Estimação
Leia maisMapas de Ligação e de. Marcadores Moleculares a Programas de Melhoramento
Mapas de Ligação e de Desequilíbrio, Identificação de QTL e Integração de Marcadores Moleculares a Programas de Melhoramento de Alógamas Prof. José Marcelo Soriano Viana DBG/UFV População (Geração 0) Fragmentos
Leia maisUtilização da Genômica na Seleção de suínos
Utilização da Genômica na Seleção de suínos Fabyano Fonseca e Silva Prof. Associado - Dep Zootecnia UFV Melhoramento Animal Estatística Genômica e Bioinformática DZO - UFV Santa Maria-RS, 07/09/2015 Colaboradores
Leia maisPor que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas
Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os
Leia maisModelos Bayesianos. Ernesto F. L. Amaral Magna M. Inácio
1 Modelos Bayesianos Ernesto F. L. Amaral Magna M. Inácio 09 de dezembro de 2010 Tópicos Especiais em Teoria e Análise Política: Problema de Desenho e Análise Empírica (DCP 859B4) Objetivos 2 Apresentar
Leia maisGANHO GENÉTICO NA CULTURA DA SOJA. Ivan Schuster
GANHO GENÉTICO NA CULTURA DA SOJA Ivan Schuster Considerações iniciais Ganho Genético ou Ganho por Seleção Diferencial de Seleção (DS): DS = X S - X P Ganho de seleção (GS), ou ganho genético: GS = DSh
Leia maisStela Adami Vayego DEST/UFPR
Testes de hipóteses não paramétricos Os métodos não-paramétricos fazem poucas suposições sobre a natureza das distribuições dos dados. Não exige que as distribuições nas populações sejam normais, nem são
Leia maisInferência Bayesiana
Inferência Bayesiana Joaquim Neto joaquim.neto@ufjf.edu.br www.ufjf.br/joaquim_neto Departamento de Estatística - ICE Universidade Federal de Juiz de Fora (UFJF) Versão 3.0 Joaquim Neto (UFJF) ICE - UFJF
Leia mais3. Considere uma amostra aleatória de tamanho 7 de uma normal com média 18. Sejam X e S 2, a média e a variância amostral, respectivamente.
1 Universidade de São Paulo Escola Superior de Agricultura Luiz de Queiroz Departamento de Ciências Exatas Professores: Clarice Demétrio, Roseli Leandro e Mauricio Mota Lista 3- Distribuições Amostrais-
Leia maisEstatística aplicada ao Melhoramento animal
Qual é a herdabilidade para uma característica? Qual é a variabilidade de desempenho para essa característica? Selecionando para a característica X, característica Y será afetada? Como predizer os valores
Leia maisDistribuições Amostrais - Tamanho da Amostra
Distribuições Amostrais - Tamanho da Amostra Prof. Eduardo Bezerra Inferência Estatística 21 de Setembro de 2018 Eduardo Bezerra (CEFET/RJ) Tamanho da Amostra 1 / 10 Motivação Suponha que queremos estimar
Leia maisEconometria. Econometria ( ) O modelo de regressão linear múltipla. O modelo de regressão linear múltipla. Aula 2-26/8/2010
Aula - 6/8/010 Econometria Econometria 1. Hipóteses do Modelo de RLM O modelo de regressão linear múltipla Estudar a relação entre uma variável dependente e uma ou mais variáveis independentes. Forma genérica:
Leia maisMODELO DE DECISÃO PARA ESCOLHA DE PORTFOLIO DE INVESTIMENTOS
MODELO DE DECISÃO PARA ESCOLHA DE PORTFOLIO DE INVESTIMENTOS Rodrigo José Pires Ferreira UFPE Cx. Postal 7462, Recife PE, 50.630-970 rodrigo@ufpe.br Adiel Teixeira de Almeida Filho UFPE Cx. Postal 7462,
Leia maisGenética Quantitativa I Capítulo 11. Seleção
Genética Quantitativa I Capítulo 11. Seleção Profa. Dra. Sandra Aidar de Queiroz Departamento de Zootecnia FCAV UNESP Outubro de 2012 A resposta e sua predição Mudanças nas propriedades genéticas da população:
Leia maisMétodos Quantitativos para Ciência da Computação Experimental
Métodos Quantitativos para Ciência da Computação Experimental Revisão Virgílio A. F. Almeida Maio de 2008 Departamento de Ciência da Computação Universidade Federal de Minas Gerais FOCO do curso Revisão
Leia maisDistribuições Amostrais e Estimação Pontual de Parâmetros
Distribuições Amostrais e Estimação Pontual de Parâmetros OBJETIVOS DE APRENDIZAGEM Depois de um cuidadoso estudo deste capítulo, você deve ser capaz de: 1.Explicar os conceitos gerais de estimação de
Leia maisAprendizagem Bayesiana
Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Aprendizagem Bayesiana David Menotti www.inf.ufpr.br/menotti/ci171-182 Aprendizagem Bayesiana Agenda Introdução Teorema de Bayes
Leia maisCONHECIMENTOS ESPECÍFICOS
CONHECIMENTOS ESPECÍFICOS 2003 2004 2005 2006 2007 2008 2009 2010 X 39,0 39,5 39,5 39,0 39,5 41,5 42,0 42,0 Y 46,5 65,5 86,0 100,0 121,0 150,5 174,0 203,0 A tabela acima mostra as quantidades, em milhões
Leia maisCap. 8 - Intervalos Estatísticos para uma Única Amostra
Intervalos Estatísticos para ESQUEMA DO CAPÍTULO 8.1 INTRODUÇÃO 8.2 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL, VARIÂNCIA CONHECIDA 8.3 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA DISTRIBUIÇÃO
Leia maisUniversidade Federal do Pará Instituto de Tecnologia ESTATÍSTICA APLICADA. Campus de Belém Curso de Engenharia Mecânica
Universidade Federal do Pará Instituto de Tecnologia ESTATÍSTICA APLICADA Plano da Disciplina Campus de Belém Curso de Engenharia Mecânica 1 IDENTIFICAÇÃO Nome da disciplina: Estatística Aplicada I Código
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Modelos gráficos probabilísticos Redes bayesianas Modelos gráficos probabilísticos Os modelos gráficos probabilísticos utilizam representações diagramáticas das distribuições de
Leia maisRafael Izbicki 1 / 38
Mineração de Dados Aula 7: Classificação Rafael Izbicki 1 / 38 Revisão Um problema de classificação é um problema de predição em que Y é qualitativo. Em um problema de classificação, é comum se usar R(g)
Leia maisPor quê? Variação ambiental Poligenes. Variação ambiental Poligenes. Normas de Reação. Fenótipo é qualquer característica mensurável.
Fenótipo é qualquer característica mensurável. A grande maioria de fenótipos não tem categorias discretas e não tem um gene que seja necessário e suficiente para explicar sua variação Genótipos Mendelianos
Leia maisRESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO
RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO Regressão simples: desvantagem de apenas uma variável independente explicando y mantendo ceteris paribus as demais (ou
Leia maisLucas Santana da Cunha e 30 de julho de 2018 Londrina
Lucas Santana da Cunha email: lscunha@uel.br http://www.uel.br/pessoal/lscunha/ 25 e 30 de julho de 2018 Londrina 1 / 18 Já se discutiu a diferença entre estimador e parâmetro: População Amostra Média
Leia mais4 Modelos Lineares Generalizados
4 Modelos Lineares Generalizados Neste capítulo, serão apresentados arcabouços teóricos dos modelos lineares generalizados (MLGs) e como casos particulares desses modelos são aplicáveis ao problema da
Leia maisMÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL
MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL Pedro Henrique Bragioni Las Casas Pedro.lascasas@dcc.ufmg.br Apresentação baseada nos slides originais de Jussara Almeida e Virgílio Almeida
Leia maisTratamento Estatístico de Dados em Física Experimental
Tratamento Estatístico de Dados em Física Experimental Prof. Zwinglio Guimarães o semestre de 06 Tópico 7 - Ajuste de parâmetros de funções (Máxima Verossimilhança e Mínimos Quadrados) Método da máxima
Leia maisUniversidade Federal do Pará Instituto de Tecnologia. Plano da Disciplina. Campus de Belém Curso de Engenharia Mecânica
Universidade Federal do Pará Instituto de Tecnologia Campus de Belém Curso de Engenharia Mecânica 1. IDENTIFICAÇÃO Nome da disciplina: Estatística Aplicada I Código da disciplina: EN07048 Nome do professor:
Leia maisEstudo da Variabilidade Genética com Apoio do R
Estudo da Variabilidade Genética com Apoio do R Joanlise Marco de Leon Andrade UNB Júlia Maria Pavan Soler IME/USP Suely Ruiz Giolo Dest/UFPR Mariza de Andrade - Mayo Clinic, Rochester, USA Dogma da Biologia:
Leia maisModelagem em Experimentos Mistura-Processo para Otimização de Processos Industriais 15
Modelagem em Experimentos Mistura-Processo para Otimização de Processos Industriais 15 1 Introdução Na indústria moderna há uma contínua busca da otimização dos níveis de produção e da melhoria da qualidade
Leia maisTestes de Hipótese para uma única Amostra - parte II
Testes de Hipótese para uma única Amostra - parte II 2012/02 1 Teste para média com variância conhecida 2 3 Objetivos Ao final deste capítulo você deve ser capaz de: Testar hipóteses para média de uma
Leia maisAnálise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda
Leia maisAnálise de regressão linear simples. Diagrama de dispersão
Introdução Análise de regressão linear simples Departamento de Matemática Escola Superior de Tecnologia de Viseu A análise de regressão estuda o relacionamento entre uma variável chamada a variável dependente
Leia maisDELINEAMENTO INTEIRAMENTE CASUALIZADO. Profª. Sheila Regina Oro
DELINEAMENTO INTEIRAMENTE CASUALIZADO Profª. Sheila Regina Oro Delineamento experimental Para planejar um experimento é preciso definir os tratamentos em comparação e a maneira de designar os tratamentos
Leia maisMétodos Computacionais para inferência estatística
Métodos Computacionais para inferência estatística Wagner Hugo Bonat LEG: Laboratório de Estatística e Geoinformação Universidade Federal do Paraná 30 de julho de 2012 Bonat et. al (LEG/UFPR) MCIE 30 de
Leia maisESTATÍSTICA COMPUTACIONAL
ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Motivação Por exemplo, queremos analisar a série
Leia maisCLASSIFICADORES BAEYSIANOS
CLASSIFICADORES BAEYSIANOS Teorema de Bayes 2 Frequentemente, uma informação é apresentada na forma de probabilidade condicional Probabilidade de um evento ocorrer dada uma condição Probabilidade de um
Leia maisImplementação do Best Linear Unbiased Prediction (BLUP) em Python para avaliação genética animal
78 Resumos Expandidos: XI Mostra de Estagiários e Bolsistas... Implementação do Best Linear Unbiased Prediction (BLUP) em Python para avaliação genética animal Caio Augusto C. Volpato 1 Roberto Hiroshi
Leia maisAPLICAÇÃO DE MARCADORES MOLECULARES NA HIBRIDAÇÃO DE EUCALIPTO
IV WORKSHOP EM MELHORAMENTO FLORESTAL APLICAÇÃO DE MARCADORES MOLECULARES NA HIBRIDAÇÃO DE EUCALIPTO ANTONIO MARCOS ROSADO Eng. Florestal CENIBRA RAFAEL SIMÕES TOMAZ Doutorando em Genética e Melhoramento
Leia maisDefinição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.
1. Inferência Estatística Inferência Estatística é o uso da informção (ou experiência ou história) para a redução da incerteza sobre o objeto em estudo. A informação pode ou não ser proveniente de um experimento
Leia maisAvanços no entendimento da relação entre genótipo e fenótipo através de marcadores genéticos
Avanços no entendimento da relação entre genótipo e fenótipo através de marcadores genéticos Gabriel Rodrigues Alves Margarido Orientador: Antonio Augusto Franco Garcia SUMÁRIO 2 SUMÁRIO 1. Introdução
Leia maisIntervalos de Confiança
Intervalos de Confiança Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução Estimar o consumo médio de um automóvel, estimar o tempo médio que um funcionário leva a aprender uma
Leia maisCapítulo 2. Distribuições de Probabilidade Estimativas de parâmetros e tempos-atéfalha. Flávio Fogliatto
Capítulo 2 Distribuições de Probabilidade Estimativas de parâmetros e tempos-atéfalha Flávio Fogliatto 1 Ajustes de distribuições Em estudos de confiabilidade, dados são amostrados a partir de uma população
Leia maisModelos Lineares Generalizados - Verificação do Ajuste do Modelo
1 Modelos Lineares Generalizados - Verificação do Ajuste do Modelo Erica Castilho Rodrigues 9 de Abril de 2015 2 3 Função Deviance Podemos ver o ajuste de um modelo a um conjunto de dados como: uma forma
Leia mais3 Modelo Matemático Definições Iniciais. Denote-se, em geral, o desvio-padrão do processo por σ = γσ 0, sendo σ 0 o
Modelo Matemático 57 3 Modelo Matemático Este trabalho analisa o efeito da imprecisão na estimativa do desvio-padrão do processo sobre o desempenho do gráfico de S e sobre os índices de capacidade do processo.
Leia maisInferência Estatística:
Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística Inferência Estatística: Princípios de Bioestatística decidindo na presença de incerteza Aula 8: Intervalos
Leia maisINTRODUÇÃO INTRODUÇÃO INTRODUÇÃO 15/05/2014. Baixa produtividade. Variação na qualidade da carne. ±7,5 milhões de empregos
Mil toneladas de equivalente-carcaça 15/05/2014 UNIVERSIDADE DE SÃO PAULO FACULDADE DE ZOOTECNIA E ENGENHRIA DE ALIMENTOS DEPARTAMENTO DE ZOOTECNIA Mapeamento Amplo de Marcadores Moleculares para Característica
Leia maisDistribuição Amostral e Estimação Pontual de Parâmetros
Roteiro Distribuição Amostral e Estimação Pontual de Parâmetros 1. Introdução 2. Teorema Central do Limite 3. Conceitos de Estimação Pontual 4. Métodos de Estimação Pontual 5. Referências População e Amostra
Leia mais