Ajuste do modelo de regressão linear: Inferência Bayesiana, aspectos computacionais e seleção de variáveis.
|
|
- Lorenzo Brezinski Amarante
- 6 Há anos
- Visualizações:
Transcrição
1 Ajuste do modelo de regressão linear: Inferência Bayesiana, aspectos computacionais e seleção de variáveis. João Daniel Nunes Duarte a, Vinícius Diniz Mayrink b a Estudante de Graduação, joaodaniel@ufmg.br b Professor Adjunto, Departamento de Estatística, UFMG, vdm@est.ufmg.br Introdução O crescente desenvolvimento computacional tem contribuído para expandir o uso da regressão. Construir uma regressão linear é em geral um procedimento iterativo, onde etapas de inclusão/remoção de variáveis são cumpridas até que um bom ajuste para o conjunto de dados seja alcançado. Este desenvolvimento computacional também permitiu que novas técnicas fossem consideradas; por exemplo, nas últimas décadas temos a utilização de métodos MCMC para gerar valores da distribuição a posteriori em uma abordagem Bayesiana para modelos estatísticos. Ver Gamerman e Migon (1999). Neste trabalho iremos explorar diversos aspectos do ajuste de modelos de regressão linear tomando como base o ponto de vista Bayesiano. Inicialmente, investigaremos o comportamento do método Gibbs Sampling, em termos de autocorrelação das cadeias, diante de diferentes esquemas de amostragem que agrupam os parâmetros em blocos. Além disso, iremos assumir misturas como distribuições a priori para os coeficientes, buscando assim realizar a seleção de variáveis no contexto de regressão múltipla. Neste caso, diferentes configurações de misturas são considerandas, o que inclui: (i) componente cuja distribuição é degenerada em zero e (ii) componentes Gaussianas com diferentes magnitudes de variâncias. Em uma análise hierárquica, exploramos também distintas distribuições a posteriori para a probabilidade relacionada a cada componente das misturas propostas. As análises são desenvolvidas para dados simulados e reais e os resultados do ajuste Bayesiano são comparados com aqueles obtidos através da inferência clássica. 1. Inferência Bayesiana e o MCMC Grande parte dos cálculos de distribuições a posteriori envolve integrais de ordem elevada, o que impõe dificuldades computacionais. Visando simplificar esta tarefa, foram desenvolvidos diversos algoritmos que aproximam estes cálculos. O método Monte Carlo Markov Chain (MCMC) está envolvido em grande parte destes algoritmos ver Gamerman e Lopes (2006) inclusive no que utilizamos no trabalho: o Gibbs Sampler. Seu funcionamento é simples. Primeiro, obtemos todas as distribuições condicionais completas a distribuição de um parâmetro condicional em todos os outros parâmetros envolvidos. Estas distribuições devem ser conhecidas, pois o próximo passo é amostrar de uma delas, atribuindo valores iniciais aos outros parâmetros. Amostrase de todas elas utilizando os valores gerados das distribuições condicionais completas de cada parâmetro. O primeiro passo é concluído quando se tiver amostrado um valor de cada parâmetro. Este passo é repetido até que as cadeias de valores amostrados para os parâmetros tiverem convergido. Para mais informações ver Albert (2007). A inferência é feita utilizando a parte da cadeia posterior à convergência. Por tanto, para estimar os parâmetros, removemos o pedaço da cadeia an- 13 a Escola de Modelos de Regressão 24 a 27 de fevereiro de 2013
2 terior à sua convergência, que chamamos de burnin. Utilizamos o R para realizar os cálculos de MCMC, e geramos um programa com diversas opções, que serão explicadas na seção seguinte; como estimação individual ou em blocos, e com ou sem seleção de variáveis. 2. Modelo de regressão linear Da mesma forma que aplicamos a Inferência Bayesiana na estimação dos parâmetros de uma distribuição Normal, podemos utilizá-la para inferir os parâmetros de um modelo linear. O foco do trabalho é explorar as possibilidades da Inferência Bayesiana nesse tipo de modelo. Podemos construir e estimar o modelo linear de duas maneiras, como mostramos a seguir Amostragem individual dos coeficientes Existem duas maneiras de se escrever o modelo linear. Uma delas apresenta os coeficientes separadamente, assim como as covariáveis. A outra agrupa os coeficientes em um vetor, e as covariáveis em uma matriz, que denominamos matriz de experimento. Se considerarmos a primeira forma do modelo linear, aonde cada coeficiente aparece separadamente, para realizar os cálculos de distribuição a posteriori, vamos chegar a uma fórmula de parâmetro a posteriori para cada um deles. Desta forma, no MCMC, vamos amostrar cada coeficiente separadamente de uma distribuição univariada Amostragem conjunta dos coeficientes Utilizando a forma conjunta, os coeficientes do modelo ficam agrupados em um vetor. O cálculo dos parâmetros a posteriori também resultará em um vetor, e no MCMC, vamos amostrar os coeficientes de uma única distribuição multivariada. O cálculo da variância a posteriori continua sendo feito de uma distribuição separada. Ele não foi incluso no bloco, junto com os coeficientes, pois sua distribuição a priori e sua verossimilhança pertencem à outra família de distribuições: a Gama Inversa. Portanto, na estimação dos parâmetros utilizando o MCMC, enquanto no caso individual vamos ter que amostrar de uma distribuição Normal para cada coeficiente, no caso conjunto vamos amostrar os coeficientes a posteriori de uma Normal multivariada, e a variância de uma Gama Inversa, independente do número de coeficientes Estimação dos parâmetros Vamos estimar os parâmetros a partir das cadeias geradas pelo MCMC. Essa estimação deve levar em conta apenas a parte da cadeia posterior à sua convergência. Ou seja, devemos desconsiderar o burn-in da cadeia. Para identificar o ponto de convergência, precisamos analisar o gráfico da cadeia. Isso pode se tornar muito trabalhoso se o número de parâmetros for elevado. Uma alternativa é plotar a imagem de uma matriz contendo nas linhas os parâmetros e nas colunas as iterações do MCMC. Desta forma, podemos identificar de maneira visual, e em um único gráfico, o ponto inicial que devemos considerar. column beta_2 beta_1 beta_ row Figura 1: Gráfico da matriz de simulação. A variação de cor indica que o parâmetro ainda não convergiu. Definido este ponto, podemos escolher medidas para realizar a estimação, como a média ou a mediana, e calcular os valores estimados dos parâmetros
3 2.4. Comparação dos esquemas de amostragem: Autocorrelação Os diferentes esquemas de amostragem apresentados levam a cadeias com propriedades diferentes. A amostragem individual apresenta uma autocorrelação muito maior entre as observações na cadeia, que na amostragem conjunta. Utilizamos uma medida de autocorrelação para calcular o tamanho efetivo das cadeias. Esta medida foi utilizada por Mayrink (2009). O tamanho efetivo calculado representa a massa de dados útil da cadeia, ou seja, descontando a autocorrelação presente nos dados. Ele é calculado dividindo-se o tamanho da amostra pelo dn eff, apresentado abaixo: ACF Lag dn eff = L ˆρ i, i=1 onde ˆρ i é a autocorrelação estimada para o lag i. Calculamos essa medida para os dois esquemas de amostragem, utilizando dados simulados. O tamanho efetivo utilizando a amostragem individual foi próximo de 10% do total da amostra, enquanto que para a amostragem conjunta esse valor ficou em próximo de 90%. Isso mostra que a autocorrelação é realmente menor na amostragem conjunta. ACF Seleção de variáveis Lag É comum a prática da seleção de variáveis em modelos lineares, principalmente naqueles com muitas covariáveis. Na inferência Clássica, diversos procedimentos, com critétios de seleção diferentes, já foram propostos para este problema que é trabalhoso; em geral, as covariáveis são removidas uma a uma, e medidas de qualidade do modelo são usadas para decidir quais covariáveis devem entrar e quais devem ficar fora. A Inferência Bayesiana permite que automatizemos esse processo, atribuindo uma mistura de distribuições a priori, de forma que a variável pode ter coeficiente zero (não fazer parte do modelo), ou ter uma determinada distribuição. As estimativas de probabilidades das misturas vão indicar se as variáveis entram ou não no modelo. Figura 2: Gráficos de ACF para as cadeias de um parâmetro. Superior cadeia amostrada individualmente, inferior cadeia amostrada cojuntamente Misturas a priori com componente degenerada Uma maneira de construir as misturas a priori é utilizando uma componente degenerada. Neste caso, a mistura terá uma componente com probabilidade p que terá distribuição a priori Normal, e outra componente, com probabilidade 1 p, que terá distribuição degenerada em zero. β (1 p)δ 0 (β) + (p)n(0, τ) A estimativa a posteriori da probabilidade p 3
4 irá indicar a presença ou ausência da variável no modelo. Quando geramos de uma mistura com componente degenerada, vamos estar forçando um valor, quando esta componente for utilizada. Ou seja, vamos encontrar o valor exato do zero na cadeia diversas vezes Misturas a priori com componentes Gaussianas Outra possibilidade é utilizar uma mistura com as duas componentes Normais. Uma componente será a mesma componente Normal do caso anterior, de onde iremos amostrar se acreditamos que a variável está presente no modelo. A outra componente Normal, terá uma variância muito pequena, de forma que seus valores não serão exatamente zero, mas estarão muito próximos dele. β (1 p)n(0, τ 0 ) + (p)n(0, τ 1 ) Neste caso, teremos dois tipos de valores nas cadeias: (i) valores gerados da componente que indica a presença da variável, e estarão espalhados em torno do valor real; e (ii) valores gerados da componente que indicam a ausência da variável no modelo, e estarão espalhados bem próximos do zero Estimação e comparação Para realizar a estimação dos parâmetros utilizando a seleção de variáveis, vamos precisar verificar quais variáveis entram e quais ficaram de fora do modelo. Para isso, vamos precisar estimar as probabilidades de cada mistura. Caso ela seja maior que 0.5, vamos considerar que entrou no modelo, e para fazer sua inferência, vamos excluir da cadeia os valores que representam o zero da mistura. Caso ela seja menor que 0.5, vamos considerar que não entrou no modelo, e o valor do parâmetro é zero. 4. Dados reais Para a análise de dados reais, vamos utilizar a base Hald, disponível no pacote BAS do R, que foi proposto por Hald (1952) e analisado por Draper e Smith (1981). A variável resposta foi transformada, sendo subtraida da média. Isso foi feito para que não fosse preciso atribuir uma a priori para o intercepto que não fosse centrada em zero. O método stepwise utilizando o modelo linear clássico indicou dois candidatos a melhor modelo: Y X1 + X2 e Y X1 + X4. As variáveis X2 e X4 são muito correlacionadas, e por isso é razoável que esses dois modelos apresentem comportamento semelhante. O método de seleção de variáveis automático proposto utilizando o modelo Bayesiano indicou que as variáveis que devem entrar no modelo são X1 e X4, concordando com o método stepwise. Como o stepwise considerou este modelo um dos melhores, adotamos ele para comparação com o Bayesiano. A Tabela 1 mostra algumas medidas comparativas entre os dois modelos. Medida Clássico Bayesiano SSR R R 2 ajustado Tabela 1: Medidas comparativas entre os modelos lineares clássico e Bayesiano. Podemos ver que o desempenho do modelo Bayesiano foi superior ao modelo clássico, tanto pela medida da soma dos quadrados dos resíduos (SSR), como pelo R 2. Acrescentamos ainda a favor do modelo Bayesiano o fato de que a seleção de variáveis foi feita de forma automática. 5. Conclusões Analisando dados simulados, concluímos que a amostragem conjunta apresenta uma autocorrelação muito inferior à amostragem individual. Entretanto, gerar de uma distribuição multivariada envolve operações matriciais que tornam o processo lento computacionalmente. Deve-se definir, para cada caso, se a prioridade é a baixa autocorrelação, ou o gasto computacional inferior, para se eleger a melhor forma de amostrar. A analise dos dados reais nos mostrou que o uso de misturas a priori para selecionar as 4
5 variáveis do modelo de forma automática demonstrou um bom desempenho, igualando-se aos métodos clássicos de seleção de variáveis, como o stepwise. Podemos perceber através das medidas de qualidade do modelo, que não existe um ganho na capacidade preditiva. Entretanto, o ganho vem na forma de novas ferramentas, como: (i) a possibilidade de adicionar conhecimento prévio ao modelo através das distribuições a priori; (ii) a seleção automática de variáveis através do uso de misturas nas distribuições a priori; sem que haja perda da capacidade preditiva do modelo. Referências Albert, J., Bayesian Computation with R. UseR! Springer New York. Draper, N. R., Smith, H., Applied Regression Analysis, 2nd Edition. Wiley, New York. Gamerman, D., Lopes, H. F., Markov Chain Monte Carlo: Stochastic Simulation for Bayesian Inference, 2nd Edition. CRC Text in Statistical Science. Chapman & Hall. Gamerman, D., Migon, H. S., Statistical Inference: An Integrated Approach, 1st Edition. CRC Text in Statistical Science Series. Chapman & Hall. Hald, A., Statistical Theory with Engineering Applications. Wiley, New York. Mayrink, V. D. Gamerman, D., On computational aspects of bayesian spatial models: Influence of the neighboring structure in the efficiency of mcmc algorithms. Computational Statistics 24 (4),
Influencia de Distribuições a priori na Analise Bayesiana em dados de contagem
Influencia de Distribuições a priori na Analise Bayesiana em dados de contagem Olinda Fátima dos Santos 1 Carla Regina Guimarães Brighenti 1 1-Introdução A utilização de informação a priori em inferência
Leia maisDisciplina de Modelos Lineares
Disciplina de Modelos Lineares 2012-2 Seleção de Variáveis Professora Ariane Ferreira Em modelos de regressão múltipla é necessário determinar um subconjunto de variáveis independentes que melhor explique
Leia maisESTATÍSTICA COMPUTACIONAL
ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Introdução Solução de equações não lineares
Leia maisTécnicas computacionais em probabilidade e estatística II
Técnicas computacionais em probabilidade e estatística II Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco Métodos de Monte Carlo baseados em Cadeias de Markov:
Leia maisGibbs Sampler para ANOVA e Misturas
Gibbs Sampler para ANOVA e Misturas Renato Assunção - DCC, UFMG Outubro de 014 1 Modelo ANOVA: componentes de variância Suponha que temos K grupos ou classes. Em cada grupo, temos um certo número de dados
Leia maisPredição do preço médio anual do frango por intermédio de regressão linear
Predição do preço médio anual do frango por intermédio de regressão linear João Flávio A. Silva 1 Tatiane Gomes Araújo 2 Janser Moura Pereira 3 1 Introdução Visando atender de maneira simultânea e harmônica
Leia maisModelos de regressão para dados correlacionados. Cibele Russo
Modelos de regressão para dados correlacionados Cibele Russo cibele@icmc.usp.br ICMC USP Mini-curso oferecido no Workshop on Probabilistic and Statistical Methods 28 a 30 de janeiro de 2013 Cibele Russo
Leia maisRESOLUÇÃO Nº 01/2016
Legislações Complementares: Resolução Nº 02/2016 Colegiado DEst Resolução Nº 03/2016 Colegiado DEst Resolução Nº 01/2017 Colegiado DEst RESOLUÇÃO Nº 01/2016 O Departamento de Estatística, tendo em vista
Leia maisSeleção de Variáveis e Construindo o Modelo
Seleção de Variáveis e Construindo o Modelo Seleção de modelos candidatos A idéia é selecionar um conjunto menor de variáveis explanatórias de acordo com algum(s) critério(s), e assim selecionar o modelo
Leia maisA Bayesian Reassessment of Nearest-Neighbor Classification (2009)
A Bayesian Reassessment of Nearest-Neighbor Classification (2009) Cucala, Marin, Robert e Titterington André Yoshizumi Gomes (IME/USP) Seminário ministrado no Insper 5 de fevereiro de 2016 O método knn
Leia maisCoeficiente de determinação R 2 no modelo de regressão linear normal
Coeficiente de determinação R 2 no modelo de regressão linear normal Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 81531 990, Brasil email: lucambio@ufpr.br
Leia maisESTATÍSTICA COMPUTACIONAL
ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Inferência com dimensão variável Modelos com
Leia maisRalph S. Silva
ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S Silva http://wwwimufrjbr/ralph/multivariadahtml Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Revisão:
Leia maisESTATÍSTICA COMPUTACIONAL
ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Escolha de modelos Até aqui assumimos que z
Leia maisDisciplina de Modelos Lineares Professora Ariane Ferreira
Disciplina de Modelos Lineares 2012-2 Regressão Logística Professora Ariane Ferreira O modelo de regressão logístico é semelhante ao modelo de regressão linear. No entanto, no modelo logístico a variável
Leia maisUniversidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Objetivo Dada M classes ω 1, ω 2,..., ω M e um
Leia mais( ) Estimação do valor em risco (VaR) de uma carteira de ativos através de método bayesiano. α, é definido como:
Estimação do valor em risco (VaR) de uma carteira de ativos através de método bayesiano Orlando V. Sampaio Jr. (POLI-USP) orlando.sampaio@gmail.com Celma de Oliveira Ribeiro (POLI-USP) celma@usp.br André
Leia maisUNIVERSIDADE FEDERAL DO ESPÍRITO SANTO Centro de Ciências Exatas Departamento de Estatística
Vitória, 08 de novembro de 2017 O DEST da Universidade Federal do Espírito Santo informa que estarão abertas as inscrições para provimento de cargos de Professor do Magistério Superior do Quadro Permanente
Leia maisUNIVERSIDADE FEDERAL DE OURO PRETO PRÓ REITORIA DE GRADUAÇÃO. Código: EST011 Departamento: Unidade: DEPARTAMENTO DE ESTATÍSTICA
PROGRAMA DE DISCIPLINA Disciplina: PROCESSOS ESTOCÁSTICOS Código: EST011 Departamento: Unidade: DEPARTAMENTO DE ESTATÍSTICA INSTITUTO DE CIÊNCIAS EXATAS E BIOLÓGICAS Carga Horária Semanal Teórica Prática
Leia maisRESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO
RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO Regressão simples: desvantagem de apenas uma variável independente explicando y mantendo ceteris paribus as demais (ou
Leia maisMetropolis-Hastings. Renato Assunção DCC - UFMG
Metropolis-Hastings Renato Assunção DCC - UFMG Amostrador de Gibbs Pros: Método geral para amostrar de distribuição condicional p( y) Quase qualquer distribuição (condicoes de regularidade para convergência
Leia maisInferência Bayesiana para testes acelerados "step-stress" simples com dados de falha sob censura tipo II e distribuição Gama
Inferência Bayesiana para testes acelerados "step-stress" simples com dados de falha sob censura tipo II e distribuição Gama Karlla Delalibera Chagas pósmac, Unesp Presidente Prudente, Brasil karlladelalibera@gmail.com
Leia maisInferência Bayesiana Exata para Processos de Cox Level-Set
Inferência Bayesiana Exata para Processos de Cox Level-Set Bárbara da Costa Campos Dias 1 Flávio Bambirra Gonçalves 2 Resumo Este trabalho propõe uma metodologia de inferência exata para processos de Cox
Leia maisMarkov Switching Models. Profa. Airlane Alencar. Depto de Estatística - IME-USP. lane. Ref: Kim e Nelson (1999) e Hamilton (1990)
Markov Switching Models Profa. Airlane Alencar Depto de Estatística - IME-USP www.ime.usp.br/ lane Ref: Kim e Nelson (1999) e Hamilton (1990) 1 Objetivo Mudança nos parâmetros de um modelo de regressão
Leia maisUm modelo com erros assimétricos para dados contábeis
Um modelo com erros assimétricos para dados contábeis Matheus Bertolo Guerrero 1 Maria Luiza Maes 1 Gilvania de Sousa Gomes 2 Daniela Pereira de Silva Gomes 2 José Waldemar da Silva 1 1 Introdução A Demonstração
Leia maisCC-226 Aula 07 - Estimação de Parâmetros
CC-226 Aula 07 - Estimação de Parâmetros Carlos Henrique Q. Forster - Instituto Tecnológico de Aeronáutica 2008 Estimação de Parâmetros Para construir o classificador bayesiano, assumimos as distribuições
Leia maisAnálise do crescimento vegetal por meio de modelo não linear via regressão isotônica
Análise do crescimento vegetal por meio de modelo não linear via regressão isotônica Adriana Matheus da Costa Sorato 1 Thalita Kelen Leal do Prado 2 Augusto Ramalho de Morais 2 1 Introdução O estudo do
Leia maisAnálise de Regressão Linear Simples e
Análise de Regressão Linear Simples e Múltipla Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução A análise de regressão estuda o relacionamento entre uma variável
Leia maisaula ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES
ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES 18 aula META Fazer com que o aluno seja capaz de realizar os procedimentos existentes para a avaliação da qualidade dos ajustes aos modelos. OBJETIVOS Ao final
Leia maisXIX CONGRESSO DE PÓS-GRADUAÇÃO DA UFLA 27 de setembro a 01 de outubro de 2010
PROPOSTA DE APLICAÇÃO DA ANÁLISE DE VARIÂNCIA COM MODELO AUTOREGRESSIVO PARA ANÁLISE DE VARIEDADES DE TRIGO (Triticum aestivum L.) DIOGO FRANCISCO ROSSONI¹, MARIELE VILELA BERNARDES PRADO², JAIR ROCHA
Leia maisAULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012
1 AULA 09 Regressão Ernesto F. L. Amaral 17 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução à
Leia maisUniversidade Federal da Bahia Programa de Pós Graduação em Engenharia Elétrica
Universidade Federal da Bahia Programa de Pós Graduação em Engenharia Elétrica Disciplina: Processamento Estatístico de Sinais (ENG A83) Prof.: Eduardo Simas eduardo.simas@ufba.br Tema: Verificação da
Leia maisétodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA
étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UNIVERSIDADE DE JOÃO DEL-REI PRÓ-REITORIA DE PESQUISA CENTRO
Leia maisComparação entre intervalos de confiança calculados com métodos bootstrap e intervalos assintóticos
Comparação entre intervalos de confiança calculados com métodos strap e intervalos assintóticos Selene Loibel Depto. de Estatística, Matemática Aplicada e Computação, IGCE, UNESP, Rio Claro, SP E-mail:sloibel@rc.unesp.br,
Leia maisUtilizando a função auto.arima em modelos de séries temporais
Utilizando a função auto.arima em modelos de séries temporais Erasnilson Vieira Camilo 1 2 Marina Rodrigues Maestre 1 Rick Anderson Freire Mangueira 1 Elias Silva de Medeiros 1 Cristian Villegas 1 1 Introdução
Leia maisAGA Análise de Dados em Astronomia I 8. Inferência Bayesiana e MCMC
1 / 1 AGA 0505- Análise de Dados em Astronomia I 8. Inferência Bayesiana e MCMC Laerte Sodré Jr. 1o. semestre, 2018 2 / 1 Inferência Bayesiana inferência bayesiana consideremos um conjunto de dados D que
Leia maisAula 17. Aula de hoje. Aula passada. Problemas Monte Carlo na moda Caminho trilhado Desafios à frente Avaliação
Aula 17 Aula passada Otimização Caixeiro viajante Hill Climbing Distribuição de Boltzman Simulated Annealing De volta ao caixeiro Aula de hoje Problemas Monte Carlo na moda Caminho trilhado Desafios à
Leia maisMetodologia de inversão
6 Metodologia de inversão Nesta tese, a transformação de velocidades em pressão de poros é encarada como um problema de inversão. Pela natureza do problema, essa transformação apresenta caráter não único
Leia maisSME0820 Análise de Regressão 1º/2014
Mário de Castro mcastro@icmc.usp.br Sala 4-240, telefone 3373-6631 Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/~cibele Sala 3-113, telefone 3373-6606 SME0820 Análise de Regressão 1º/2014 Site
Leia maisTécnicas computacionais em probabilidade e estatística II
Técnicas computacionais em probabilidade e estatística II Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco AULA 1: Problemas Computacionais em Inferência Estatística.
Leia maisAnálise Dialélica de Linhagens de Milho com Enfoque Bayesiano
XXIX CONGRESSO NACIONAL DE MILHO E SORGO - Águas de Lindóia - 26 a 30 de Agosto de 2012 Análise Dialélica de Linhagens de Milho com Enfoque Bayesiano Marlon Mathias Dacal Coan 1, Lucas Rafael de Souza
Leia maisO USO DE MODELOS DE REGRESSÃO LOGÍSTICA PARA AVALIAÇÃO DO PROBLEMA DE EVASÃO DE ALUNOS NO CURSO DE QUÍMICA INDUSTRIAL DA UNUCET-UEG
O USO DE MODELOS DE REGRESSÃO LOGÍSTICA PARA AVALIAÇÃO DO PROBLEMA DE EVASÃO DE ALUNOS NO CURSO DE QUÍMICA INDUSTRIAL DA UNUCET-UEG Robson de Souza Vieira 1 ; Rogério Silva Pimentel 1 ; Emerson Wruck 2
Leia maisMÉTODOS DE ESTIMAÇÃO PARA RISCOS COMPETITIVOS
UNIVERSIDADE FEDERAL DE SÃO CARLOS- DEPARTAMENTO DE ESTATÍSTICA MÉTODOS DE ESTIMAÇÃO PARA RISCOS COMPETITIVOS Agatha S. Rodrigues UFSCar - DEs UNIVERSIDADE FEDERAL DE SÃO CARLOS- DEPARTAMENTO DE ESTATÍSTICA
Leia maisSME0803 ANÁLISE DE REGRESSÃO 1º/2011
SME0803 ANÁLISE DE REGRESSÃO 1º/2011 Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/~cibele Sala 3-160, ramal 8174 CoteiaWIKI: http://wiki.icmc.usp.br/index.php/sme-260 OBJETIVO DO CURSO Introduzir
Leia maisSIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL 8 a 11 de novembro de 2002, Rio de Janeiro/RJ A PESQUISA OPERACIONAL E AS CIDADES
INFERÊNCIA BAYESIANA VIA SIMULAÇÃO ESTOCÁSTICA COM IMPLEMENTAÇÃO NO PROGRAMA WINBUGS Néli Maria Costa Mattos, D.C. Instituto Militar de Engenharia (IME) Pça Gen Tibúrcio 80 Urca Rio de Janeiro RJ CEP 22290-270
Leia maisInferência Bayesiana na distribuição Normal
Inferência Bayesiana na distribuição Normal Diego Ignacio Gallardo Mateluna Instituto de Matemática e Estatística Universidade de São Paulo Março, 2012 Distribuição Normal: Inferência da variância com
Leia maisAnálise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda
Leia mais4 Modelos Lineares Generalizados
4 Modelos Lineares Generalizados Neste capítulo, serão apresentados arcabouços teóricos dos modelos lineares generalizados (MLGs) e como casos particulares desses modelos são aplicáveis ao problema da
Leia maisEstudo sobre decodificação iterativa usando códigos de treliça
Revista de Engenharia e Pesquisa Aplicada, Volume 2, Número 1, 2016 Estudo sobre decodificação iterativa usando códigos de treliça Souza, I. M. M. Escola Politécnica de Pernambuco Universidade de Pernambuco
Leia maisAULAS 21 E 22 Análise de Regressão Múltipla: Estimação
1 AULAS 21 E 22 Análise de Regressão Múltipla: Estimação Ernesto F. L. Amaral 28 de outubro e 04 de novembro de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Cohen, Ernesto, e Rolando Franco. 2000. Avaliação
Leia maisProcedimento Complementar para Validação de Métodos Analíticos e Bioanalíticos usando Análise de Regressão Linear
Procedimento Complementar para Validação de Métodos Analíticos e Bioanalíticos usando Análise de Regressão Linear Rogério Antonio de Oliveira 1 Chang Chiann 2 1 Introdução Atualmente, para obter o registro
Leia maisAnálise Bayesiana de Dados - Aula 1 -
Análise Bayesiana de Dados - Aula 1 - Márcia D Elia Branco Universidade de São Paulo Instituto de Matemática e Estatística www.ime.usp.br/ mbranco - sala 295-A - Paradigmas Bayesiano Introdução Fazer inferência
Leia maisAnálise e Previsão de Séries Temporais Aula 1: Introdução às séries temporais. Eraylson Galdino
Análise e Previsão de Séries Temporais Aula 1: Introdução às séries temporais egs@cin.ufpe.br Agenda Séries Temporais: Definições Exemplos Modelos simples com média zero: Ruído I.I.D Processo Binário Random
Leia mais3 Filtro de Kalman Discreto
3 Filtro de Kalman Discreto As medidas realizadas por sensores estão sujeitas a erros, como pode ser visto no Capítulo 2. Os filtros são aplicados aos sinais medidos pelos sensores para reduzir os erros,
Leia maisInferência Bayesiana - Aula 1 -
Inferência Bayesiana - Aula 1 - Márcia D Elia Branco Universidade de São Paulo Instituto de Matemática e Estatística www.ime.usp.br/ mbranco - sala 295-A - Paradigmas Bayesiano Introdução Fazer inferência
Leia maisSELEÇÃO DE VARIÁVEIS
SELEÇÃO DE VARIÁVEIS objetivo incluir tantas covariáveis quantas forem necessárias para auxiliar na predição do modelo? (1) buscar o menor subconjunto de covariáveis capaz de explicar adequadamente a variação
Leia maisUtilização de modelos marginais na análise de dados longitudinais irregulares em relação ao tempo
Utilização de modelos marginais na análise de dados longitudinais irregulares em relação ao tempo César Gonçalves de Lima 1 Michele Barbosa 2 Valdo Rodrigues Herling 3 1. Introdução Dados longitudinais
Leia maisCORRELAÇÃO E REGRESSÃO. Modelos Probabilísticos para a Computação Professora: Andréa Rocha. UNIVERSIDADE FEDERAL DA PARAÍBA Dezembro, 2011
CORRELAÇÃO E REGRESSÃO CORRELAÇÃO E REGRESSÃO Modelos Probabilísticos para a Computação Professora: Andréa Rocha UNIVERSIDADE FEDERAL DA PARAÍBA Dezembro, 2011 CORRELAÇÃO Introdução Quando consideramos
Leia maisEstatística Aplicada II. } Regressão Linear
Estatística Aplicada II } Regressão Linear 1 Aula de hoje } Tópicos } Regressão Linear } Referência } Barrow, M. Estatística para economia, contabilidade e administração. São Paulo: Ática, 007, Cap. 7
Leia maisCE071 - Análise de Regressão Linear
CE071 - Análise de Regressão Linear Cesar Augusto Taconeli 30 de maio, 2018 Cesar Augusto Taconeli CE071 - Análise de Regressão Linear 30 de maio, 2018 1 / 21 Aula 7 - Regressão linear com covariáveis
Leia maisMETÓDOS DE REGRESSÃO KERNEL
METÓDOS DE REGRESSÃO KERNEL George Cavalcanti de Albuquerque Júnior 1; Getúlio José Amorim do Amaral 2 1 Estudante do Curso de Estatística - CCEN UFPE; E-mail: gcdaj1@de.ufpe.br, 2 Docente/pesquisador
Leia maisIntrodução à estatística univariada através da linguagem R
Introdução à estatística univariada através da linguagem R 1. Profesores Professora Doutora Maite Mascaró (mmm@ciencias.unam.mx) (Universidad Nacional Autónoma de México) Doutora Marta Rufino (marta.m.rufino@gmail.com)
Leia maisSME0820 Análise de Regressão 1º/2013
Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/~cibele Sala 3-113, ramal 73-6606 Mariana Cúri mcuri@icmc.usp.br http://www.icmc.usp.br/~mcuri Sala 4-211, ramal 73-8175 SME0820 Análise de Regressão
Leia maisCONHECIMENTOS ESPECÍFICOS
CONHECIMENTOS ESPECÍFICOS 2003 2004 2005 2006 2007 2008 2009 2010 X 39,0 39,5 39,5 39,0 39,5 41,5 42,0 42,0 Y 46,5 65,5 86,0 100,0 121,0 150,5 174,0 203,0 A tabela acima mostra as quantidades, em milhões
Leia maisIntrodução ao modelo de Regressão Linear
Introdução ao modelo de Regressão Linear Prof. Gilberto Rodrigues Liska 8 de Novembro de 2017 Material de Apoio e-mail: gilbertoliska@unipampa.edu.br Local: Sala dos professores (junto ao administrativo)
Leia maisPROGRAMA DE ENSINO DE DISCIPLINA Matriz Curricular - Resolução UNESP nº. 158, de 05/12/2012.
PROGRAMA DE ENSINO DE DISCIPLINA Matriz Curricular - Resolução UNESP nº. 158, de 05/12/2012. Unidade Universitária: Curso: Engenharia de Bioprocessos e Biotecnologia Departamento Responsável: Departamento
Leia maisi j i i Y X X X i j i i i
Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão
Leia maisUMA ABORDAGEM BAYESIANA PARA ANÁLISE DE DADOS INTERVALARES
UMA ABORDAGEM BAYESIANA PARA ANÁLISE DE DADOS INTERVALARES Ana Cláudia Oliveira de MELO Ronei Marcos de MORAES Marinho Gomes de ANDRADE FILHO RESUMO: Neste trabalho é abordado o problema de avaliação da
Leia mais6 Geração de Cenários
6 Geração de Cenários O planejamento do setor elétrico para operações hidrotérmicas de longo prazo de cada subsistema, atualmente, está fundamentado na avaliação dos resultados da simulação de diversos
Leia maisInferência Bayesiana
Inferência Bayesiana Joaquim Neto joaquim.neto@ufjf.edu.br www.ufjf.br/joaquim_neto Departamento de Estatística - ICE Universidade Federal de Juiz de Fora (UFJF) Versão 3.0 Joaquim Neto (UFJF) ICE - UFJF
Leia maisFundação Oswaldo Cruz Escola Nacional de Saúde Pública Departamento de Epidemiologia. Estatística espacial. Áreas
Fundação Oswaldo Cruz Escola Nacional de Saúde Pública Departamento de Epidemiologia Estatística espacial Áreas Áreas Na análise de áreas o atributo estudado é em geral resultando de uma contagem ou um
Leia maisPlanejamento de Experimentos
Planejamento de Experimentos 1 6.4 Os Modelos fatoriais 2 k : o caso geral. O modelo estatístico para um plano 2 k inclui k ( k 2 ( k ) ) efeitos principais efeitos de interação de ordem 2 efeitos de interação
Leia maisModelagem do comportamento da variação do índice IBOVESPA através da metodologia de séries temporais
Modelagem do comportamento da variação do índice IBOVESPA através da metodologia de séries temporais João Eduardo da Silva Pereira (UFSM) jesp@smail.ufsm.br Tânia Maria Frighetto (UFSM) jesp@smail.ufsm.br
Leia maisANÁLISE CLÁSSICA E BAYESIANA PARA MODELOS DE EQUAÇÕES SIMULTÂNEAS
ANÁLISE CLÁSSICA E BAYESIANA PARA MODELOS DE EQUAÇÕES SIMULTÂNEAS Josimar VASCONCELOS 1 Eufrázio de Souza SANTOS 2 Moacyr CUNHA FILHO 2 RESUMO: O presente artigo busca uma nova modelagem para o método
Leia maisME613 - Análise de Regressão
ME613 - Análise de Regressão Parte 12 Gráficos de Regressão Parcial Samara F. Kiihl - IMECC - UNICAMP file:///users/imac/documents/github/me613-unicamp/me613-unicamp.github.io/aulas/slides/parte12/parte12.html#1
Leia maisEconometria em Finanças e Atuária
Ralph S. Silva http://www.im.ufrj.br/ralph/especializacao.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Maio-Junho/2013 Modelos condicionalmente
Leia maisAula 2 Uma breve revisão sobre modelos lineares
Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar
Leia maisMétodos Computacionais para inferência estatística
Métodos Computacionais para inferência estatística Wagner Hugo Bonat LEG: Laboratório de Estatística e Geoinformação Universidade Federal do Paraná 30 de julho de 2012 Bonat et. al (LEG/UFPR) MCIE 30 de
Leia maisUniversidade Federal do Rio Grande do Norte. Métodos Computacionais Marcelo Nogueira
Universidade Federal do Rio Grande do Norte Métodos Computacionais Marcelo Nogueira Método de Jacobi Método iterativo: produz uma sequencia de soluções,,,, que aproximam a solução do sistema a partir de
Leia mais5 Filtro de Kalman Aplicado ao Modelo de Schwartz e Smith (2000)
5 Filtro de Kalman Aplicado ao Modelo de Schwartz e Smith (2000) A primeira parte deste capítulo, referente à passagem dos modelos estocásticos para as equações do Filtro de Kalman, já foi previamente
Leia maisSéries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9
em Econometria Departamento de Economia Pontifícia Universidade Católica do Rio de Janeiro Aula 9 Data Mining Equação básica: Amostras finitas + muitos modelos = modelo equivocado. Lovell (1983, Review
Leia mais12/06/14. Estatística Descritiva. Estatística Descritiva. Medidas de tendência central. Medidas de dispersão. Separatrizes. Resumindo numericamente
Resumindo numericamente Para resumir numericamente dados quantitativos o objetivo é escolher medidas apropriadas de locação (``qual o tamanho dos números envolvidos?'') e de dispersão (``quanta variação
Leia maisEstudo da prevalência da tuberculose: uso de métodos bayesianos. Study of the prevalence of tuberculosis using Bayesian methods.
Estudo da prevalência da tuberculose: uso de métodos bayesianos Study of the prevalence of tuberculosis using Bayesian methods Resumo Neste artigo, apresentamos estimadores bayesianos para a prevalência
Leia maisAULA 07 Regressão. Ernesto F. L. Amaral. 05 de outubro de 2013
1 AULA 07 Regressão Ernesto F. L. Amaral 05 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas
Leia maisÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2
COMO USAR ESTE LIVRO ÍNDICE PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 Variáveis, Populações e Amostras 1.1. VARIÁVEIS ESTATÍSTICAS E ESCALAS DE MEDIDA 27 1.2. POPULAÇÃO VS. AMOSTRA
Leia maisRegressão linear múltipla
Regressão linear múltipla Universidade Estadual de Santa Cruz Ivan Bezerra Allaman Introdução A regressão múltipla é uma generalização da regressão simples, visto que, há mais de uma variável explicativa
Leia maisESTATÍSTICA COMPUTACIONAL
ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário (bootstrap) Este método foi proposto por Efron
Leia mais4 O Filtro de Kalman
4 O Filtro de Kalman O filtro de Kalman se caracteriza como uma ferramenta estatística eficiente de estimação, pois minimiza o erro quadrático. Sua aplicação é feita quando o modelo está descrito na forma
Leia maisRalph S. Silva
ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S. Silva http://www.im.ufrj.br/ralph/multivariada.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Agradecimentos
Leia maisComparação de Modelos Bayesianos na Análise de Dados de Contagem de CD4. Emílio A. C. Barros Jorge Alberto Achcar
Comparação de Modelos Bayesianos na Análise de Dados de Contagem de CD4 Emílio A. C. Barros Jorge Alberto Achcar Faculdade de Medicina de Ribeirão Preto-USP Introdução Dados longitudinais de Contagem na
Leia mais4 Conceitos Básicos de Estatística Bayesiana e Simulação Estocástica
4 Conceitos Básicos de Estatística Bayesiana e Simulação Estocástica 4. Elementos de inferência Bayesiana Gamerman [34] define que tanto o modelo Bayesiano quanto o freqüentista trabalham na presença de
Leia maisSistemas de Equações Lineares
Capítulo 3 Sistemas de Equações Lineares Um sistema com n equações lineares pode ser escrito na forma : ou na forma matricial onde com a 1,1 x 1 + a 1,2 x 2 + + a x n = b 1 a 2,1 x 1 + a 2,2 x 2 + + a
Leia maisSELEÇÃO DE VARIÁVEIS
SELEÇÃO DE VARIÁVEIS objetivo incluir tantas covariáveis quantas forem necessárias para auxiliar na predição do modelo? (1) buscar o menor subconjunto de covariáveis capaz de explicar adequadamente a variação
Leia maisMedida de Risco via Teoria de Valores Extremos. Análise de Risco (8) R.Vicente
Medida de Risco via Teoria de Valores Extremos Análise de Risco (8) R.Vicente 1 Resumo EVT: Idéia geral Medidas de risco Teoria de Valores Extremos (EVT) Distribuição de Máximos Distribuição de Exceedances
Leia maisFatores Socioeconômicos Determinantes no Desempenho dos Participantes do ENEM Vitor Luiz Cooke Vieira Cesop/Unicamp
Fatores Socioeconômicos Determinantes no Desempenho dos Participantes do ENEM 200 Vitor Luiz Cooke Vieira Cesop/Unicamp O ENEM - Exame Nacional do Ensino Médio - introduziu um novo conceito de avaliação
Leia maisRegressão Linear - Parte I
UFPE - Universidade Federal de Pernambuco Curso: Economia Disciplina: ET-406 Estatística Econômica Professor: Waldemar Araújo de S. Cruz Oliveira Júnior Regressão Linear - Parte I 1 Introdução Podemos
Leia maisIntrodução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística
Introdução ao Planejamento e Análise Estatística de Experimentos Capítulo 3 Introdução à Probabilidade e à Inferência Estatística Introdução ao Planejamento e Análise Estatística de Experimentos Agora,
Leia maisAULA 03 Análise de regressão múltipla: estimação
1 AULA 03 Análise de regressão múltipla: estimação Ernesto F. L. Amaral 17 de julho de 2013 Análise de Regressão Linear (MQ 2013) www.ernestoamaral.com/mq13reg.html Fonte: Cohen, Ernesto, e Rolando Franco.
Leia maisA Metodologia de Box & Jenkins
A Metodologia de Box & Jenins Aula 03 Bueno, 0, Capítulo 3 Enders, 009, Capítulo Morettin e Toloi, 006, Capítulos 6 a 8 A Metodologia Box & Jenins Uma abordagem bastante utilizada para a construção de
Leia mais