Inferência baseada em Verossimilhança para o modelo de regressão Poisson



Documentos relacionados
Estimador de Máxima Verossimilhança Estudo de Caso - Regressão Poisson

Construção de modelos: 1 estimativa dos parâmetros que melhor ajustam os modelos aos dados, 2 selecionar aqueles modelos que tem o melhor ajuste

Métodos de Monte Carlo

A distribuição Weibull-Poisson

Cláudio Tadeu Cristino 1. Julho, 2014

2 Modelo para o Sistema de Controle de Estoque (Q, R)

Departamento de Matemática - UEL Ulysses Sodré. Arquivo: minimaxi.tex - Londrina-PR, 29 de Junho de 2010.

Capítulo 3 Modelos Estatísticos

Função de Verossimilhança

Inferência Estatística

Aula 04 Método de Monte Carlo aplicado a análise de incertezas. Aula 04 Prof. Valner Brusamarello

CADERNO DE ATIVIDADES UMA PROPOSTA METODOLÓGICA PARA O ESTUDO DAS EQUAÇÕES DIFERENCIAIS ORDINÁRIAS POR MÉTODOS NUMÉRICOS.

Regressão Linear em SPSS

Avaliando o que foi Aprendido

(b) Qual a probabilidade de ter sido transmitido um zero, sabendo que foi recebido um (1.0) zero?

Apostila - Inferência baseada na Verossimilhança

Laboratório de Física Básica 2

Definição. A expressão M(x,y) dx + N(x,y)dy é chamada de diferencial exata se existe uma função f(x,y) tal que f x (x,y)=m(x,y) e f y (x,y)=n(x,y).

2 Modelo Clássico de Cramér-Lundberg

Exercícios Resolvidos da Distribuição de Poisson

TTT-PLOT E TESTE DE HIPÓTESES BOOTSTRAP PARA O MODELO BI-WEIBULL. Cleber Giugioli Carrasco 1 ; Francisco Louzada-Neto 2 RESUMO

1. ROTEIRO DE USO DO CORISCO Para usar o CoRisco, e gerar os seus próprios modelos de risco, você deve seguir o roteiro:

As fases na resolução de um problema real podem, de modo geral, ser colocadas na seguinte ordem:

Avaliação de Desempenho

Occurrence and quantity of precipitation can be modelled simultaneously. Peter K. Dunn Autor Braga Junior e Eduardo Gomes Apresentação

Processo de chegada: o Chegadas em grupo ocorrem segundo um processo Poisson com taxa. O tamanho do grupo é uma variável aleatória discreta

MODELOS DE REGRESSÃO PARA DADOS CONTÍNUOS ASSIMÉTRICOS

Cálculo Numérico Faculdade de Engenharia, Arquiteturas e Urbanismo FEAU

COMO AVALIAR O RISCO DE UM PROJETO ATRAVÉS DA METODOLOGIA DE MONTE CARLO

A MATEMÁTICA NO ENSINO SUPERIOR POLICIAL 1

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder

AULAS 13, 14 E 15 Correlação e Regressão

DISTRIBUIÇÃO NORMAL 1

Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística

Simulação Estocástica

Dadas a base e a altura de um triangulo, determinar sua área.

Introdução. Métodos de inferência são usados para tirar conclusões sobre a população usando informações obtidas a partir de uma amostra.

computador-cálculo numérico perfeita. As fases na resolução de um problema real podem, de modo geral, ser colocadas na seguinte ordem:

6 Construção de Cenários

DISTRIBUIÇÕES DE PROBABILIDADE

Problemas de Valor Inicial para Equações Diferenciais Ordinárias

Estudo de sobrevivência de insetos pragas através da distribuição de Weibull: uma abordagem bayesiana

MATEMÁTICA FINANCEIRA

CAP5: Amostragem e Distribuição Amostral

CAP. I ERROS EM CÁLCULO NUMÉRICO

3 Método de Monte Carlo

Probabilidades e Estatística

Construção do Boxplot utilizando o Excel 2007

Matemática A. Versão 2. Na sua folha de respostas, indique de forma legível a versão do teste. Teste Intermédio de Matemática A.

Considerações Finais. Capítulo Principais conclusões

Karine Nayara F. Valle. Métodos Numéricos de Euler e Runge-Kutta

Experimento. Guia do professor. Qual é o cone com maior volume? Secretaria de Educação a Distância. Ministério da Ciência e Tecnologia

Inteligência Computacional Aplicada a Engenharia de Software

Resoluções comentadas de Raciocínio Lógico e Estatística - SEPLAG EPPGG

Modelos bayesianos sem MCMC com aplicações na epidemiologia

Métodos Estatísticos II 1 o. Semestre de 2010 ExercíciosProgramados1e2 VersãoparaoTutor Profa. Ana Maria Farias (UFF)

Misturas e Algoritmo EM

Pesquisa Operacional

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por

SuperLogo: aprendendo com a sua criatividade

Introdução ao Método de Galerkin Estocástico

Instituto Superior Técnico. 19 de Janeiro de Parte I

Capítulo 5: Aplicações da Derivada

INSTRUMENTAÇÃO E CONTROLE DE PROCESSOS TRANSFORMADAS DE LAPLACE

ALGORITMO I ESTRUTURA DE CONTROLE REPETIÇÃO PARA / ENQUANTO;

IMPLEMENTAÇÃO E RESOLUÇÃO DE MODELOS MATEMÁTICOS UTILIZANDO A PLANILHA EXCEL

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Revisão de Probabilidade e Estatística

2. Representação Numérica

Conceitos de Confiabilidade Características da Distribuição Weibull

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo

Variáveis Aleatórias Contínuas

Leia o texto abaixo para resolver as questões sobre população e amostra.

MINI - CURSO. Métodos computacionais para inferência com aplicações em R. Equipe LEG :

Tecido A B

CI202 - Métodos Numéricos

CURSO ON-LINE PROFESSOR GUILHERME NEVES 1

Histogramas. 12 de Fevereiro de 2015

Distribuição Gaussiana. Modelo Probabilístico para Variáveis Contínuas

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

Notas de Cálculo Numérico

Universidade Federal Fluminense

Lógica e Raciocínio. Decisão sob Risco Probabilidade. Universidade da Madeira.

MINI - CURSO. LEG: Laboratório de Estatística e Geoinformação/UFPR. Métodos computacionais e inferência estatística. Equipe LEG :

Estatística e Probabilidade. Aula 8 Cap 05. Distribuição normal de probabilidade

Introdução à genética quantitativa usando os recursos do R

Explorações de alunos

ESCOLA SECUNDÁRIA MANUEL DA FONSECA, SANTIAGO DO CACÉM GRUPO DISCIPLINAR: 500 Matemática Aplicada às Ciências Sociais

1 Propagação de Onda Livre ao Longo de um Guia de Ondas Estreito.

INE 5111 Gabarito da Lista de Exercícios de Probabilidade INE 5111 LISTA DE EXERCÍCIOS DE PROBABILIDADE

Implementação e avaliação

CAPÍTULO 9 Exercícios Resolvidos

DISTRIBUIÇÃO DE WEIBULL CONCEITOS BÁSICOS APLICAÇÕES

ESCOLA E.B. 2,3 D. AFONSO III. Planificação da disciplina de Matemática - CEF - 2º Ano Ano letivo de 2014/2015

Modelos de regressão paramétricos

Introdução à Simulação

Técnicas computacionais em probabilidade e estatística II

Variáveis aleatórias contínuas e distribuiçao Normal. Henrique Dantas Neder

Cálculo numérico. ln 1 = 0. Representação numérica. Exemplo. Exemplos. Professor Walter Cunha. ln 1. I s

COMPORTAMENTO ASSITÓTICO DE ESTIMADORES DE MÁXIMA VEROSSIMILHANÇA

Processos Estocásticos

Transcrição:

Inferência baseada em Verossimilhança para o modelo de regressão Poisson 1 Introdução O objetivo deste relatório é mostrar o procedimento computacional para inferência baseada em Verossimilhança para dados com distribuição POisson. O processo será detalhado passo-a-passo. Conhecer a função densidade probabilidade da variável aleatória, como exemplo considere que X P(), então a função densidade probabilidade: P(Y = y) = exp y, y = 0,1,2,... y! O objetivo da inferência neste modelo é inferir sobre o valor do parâmetro, a partir de uma amostra y i observada. Sendo assim, vamos obter uma amostra do modelo, para isto, precisamos fixar um valor para o parâmetro do modelo, neste caso usamos = 10. > set.seed(123) > y <- rpois(100, lambda = 10) Obtida a amostra, começamos o procedimento de inferência baseado na Verossimilhança escrevendo a função de Verossimilhança. L() = n exp y i y i! Vamos escrever uma função R com a expressão da Verossimilhança > verossimilhanca <- function(lambda, amostra) { + ll <- prod(dpois(amostra, lambda = lambda)) + return(ll) Para simplificar as contas analiticas podemos usar a log-verossimilhança, l() = n+ n y i log() Da mesma forma escrevemos esta função em R, n log(y i!) > log.verossimilhanca <- function(lambda, amostra) { + ll <- sum(dpois(amostra, lambda = lambda, log = TRUE)) + return(ll) 1

Nossoobjetivoéencontraropontodemáximodestafunção,podemosfazer de três formas básicas: graficamente, analiticamente usando ferramentas de cálculo e numericamente. Para o primeiro caso podemos construir três gráficos explorando a verossimilhança L(), a log-verossimilhança l(θ) e a verossimilhança relativa L()/L(ˆ). Estes gráficos são apresentados na figura abaixo. Verossimilhança 0e+00 1e 107 2e 107 3e 107 4e 107 Log Verossimilhança 252 250 248 246 Log Verossimilhança 0.0 0.2 0.4 0.6 0.8 1.0 Figura 1: Verossimilhança, log-verossimilhanca e Verossimilhança Relativa. Feitos os gráficos podemos encontrar o ponto de máximo, com os seguintes comandos > saida <- data.frame(log.vero, grid.theta) > EMV <- saida[which(saida$log.vero == max(log.vero)), ]$grid.theta > EMV [1] 9.670117 Uma forma mais eficiente de encontrar o ponto de máximo é quando possível usar ferramentas de cálculo, começamos derivando a log-verossimilhança em relação ao parâmetros de interesse: n I=1 U() = n+ y i Igualando U() a zero encontramos o EMV, ˆ = n y i n Aplicando no conjunto de dados temos, > EMV.analitico = sum(y)/length(y) > EMV.analitico [1] 9.67 2

Uma outra forma mais geral é encontrar o ponto de máximo da função através de um algoritmo numérico, no R a função optim() implementa vários algoritmos > resultado <- optim(c(5), log.verossimilhanca, amostra = y, method = "BFGS", + control = list(fnscale = -1), hessian = TRUE) > resultado$par [1] 9.67 EncontradooEMVopróximopassoéencontrarumintervalodeconfiança, o método padrão é usar a função deviance, D() = 2(l(ˆ) l()) Uma opção mais fácil é usar o seguinte resultado, onde No caso da Poisson temos, ˆ an(,i(ˆ) 1 ) I(ˆ) = E d2 d 2l() ˆ I(ˆ) 1 2 = E( n y i lembrando que da esperança da Poisson temos, Fazendo as contas no R temos, I(ˆ) 1 = ˆ n > ic.assintotico = c(emv.analitico - qnorm(0.975) * sqrt(emv.analitico/length(y)), + EMV.analitico + qnorm(0.975) * sqrt(emv.analitico/length(y))) > ic.assintotico [1] 9.060517 10.279483 Usando a função deviance temos, > deviance <- function(lambda, lambda.estimado, amostra) { + dev <- 2 * (log.verossimilhanca(lambda.estimado, amostra = amostra) - + log.verossimilhanca(lambda, amostra = amostra)) + return(dev) Da mesma forma podemos fazer um gráfico, Com base no gráfico podemos encontrar os limites do intervalo, 3

Verossimilhança 0 5 10 15 9.0 9.5 10.0 10.5 11.0 Figura 2: Função deviance > saida.dev <- data.frame(grid.theta, desvios) > ic.deviance = range(saida.dev[which(saida.dev$desvios < qchisq(0.95, + df = 1)), ]$grid.theta) > ic.deviance [1] 9.073407 10.292329 Em situações mais gerais onde não é simples encontrar os limites do intervalo olhando diretamente para a deviance podemos fazer uma aproximação desta por Séries de Taylor, o que resulta em ( ˆ) 2 l (ˆ). Podemos fazer um gráfico da aproximação, > dev.approx <- function(lambda, lambda.estimado, amostra) { + dev.app = (lambda - lambda.estimado)^2 * (length(amostra)/lambda.estimado) + return(dev.app) Obtendo o intervalo baseado na deviance aproximada > saida.dev <- data.frame(grid.theta, desvios.app) > ic.deviance.app = range(saida.dev[which(saida.dev$desvios.app < + qchisq(0.95, df = 1)), ]$grid.theta) > ic.deviance.app [1] 9.060606 10.279328 Resumindo os intervalos > ic.assintotico [1] 9.060517 10.279483 > ic.deviance 4

Verossimilhança 0 5 10 15 9.0 9.5 10.0 10.5 11.0 Figura 3: Função deviance aproximada sobreposta a deviance exata. [1] 9.073407 10.292329 > ic.deviance.app [1] 9.060606 10.279328 5