Exemplos Regressão Dados de Contagem

Documentos relacionados
Exemplo Número de Clientes da Loja

Exemplo Falhas em Tecidos

Exemplos Modelos de Quase-Verossimilhança

Exemplo Ausências Escolares

Exemplos Regressão Dados Binários

Exemplo Infecções de Ouvido

Exemplo Vida Útil de Ferramentas

Exemplo Ataques Epilépticos

Faturamento de Restaurantes

Exemplo Multicolinearidade

Exemplos Equações de Estimação Generalizadas

Exemplo Placas Dentárias

Exemplo Misto Ataques Epilépticos

Modelos para dados de contagem

1 z 1 1 z 2. Z =. 1 z n

Exemplo Regressão Robusta

Exemplo Abastecimento de Refrigerantes

Exemplos Modelos Binomiais de Dose-Resposta

Resenha Modelos Lineares Generalizados

Exemplo Espinhel de Fundo

Exemplo Preferência de Automóveis

Exemplo Cupons com Desconto

MAE Modelos Lineares Generalizados 2 o semestre 2017

Exemplo MLG Misto. Gilberto A. Paula. Departamento de Estatística IME-USP, Brasil

Exemplo Chamadas Telefônicas

Exemplo Cupons com Desconto

ESTUDO SOBRE A TAXA ANUAL DE CÂNCER NASAL EM UMA REFINARIA DE NÍQUEL NO PAÍS DE GALES

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

Modelos de Regressão Múltipla - Parte IV

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Resenha dos Modelos Lineares Generalizados

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Aula 2 Uma breve revisão sobre modelos lineares

Análise de Dados Categóricos

MODELOS DE REGRESSÃO PARA DADOS CONTÍNUOS ASSIMÉTRICOS

MAE Planejamento e Pesquisa II

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - parte III

Modelos de Regressão Linear Simples - Análise de Resíduos

Aplicação do modelo de Quase-Verossimilhança

Análise de Regressão EST036

Modelos Lineares Generalizados

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa

Esse material foi extraído de Barbetta (2007 cap 13)

Faturamento de Restaurantes

Experimentos Balanceados com Dois Fatores

Modelos de Regressão Múltipla - Parte VI

Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados

Exemplo Regressão Binomial Dados Emparelhados

Modelos de Regressão Múltipla - Parte VII

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

Modelos Lineares Generalizados - Componentes do Modelo

Exame da OAB. Gilberto A. Paula. Departamento de Estatística IME-USP, Brasil

Aplicação de modelos lineares generalizados na captura de atum da espécie Thunnus albacares.

Princípios em Planejamento e Análise de Dados Ecológicos. Regressão linear. Camila de Toledo Castanho

AULA 8 - MQO em regressão múltipla:

Modelos de Regressão Linear Simples - parte II

Modelos de Regressão para Dados de Contagem

β 1 x β j 1 x j 1 + β j (x j +k) β j 1 x j 1 +

Prova # SUB 15 junho de 2015

Introdução ao modelo de Regressão Linear

CONHECIMENTOS ESPECÍFICOS

Trabalho 1. Gustavo Mello Reis Página 1

(a) Teste e IC para Duas Variâncias. (b) Teste para médias. Duas Amostras de Teste T e IC

Delineamento e Análise Experimental Aula 4

Modelos Binomial e Poisson

Prova # 2 8 junho de 2015

Modelos de Regressão Linear Simples parte I

MAE Planejamento e Pesquisa I

Análise de Dados Longitudinais Aula

Modelos de Regressão Linear Simples - parte I

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

Disciplina de Modelos Lineares Professora Ariane Ferreira

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Modelos e inferência para um experimento em blocos casualizados para o número de vagens em soja RESUMO

Regressão Linear Simples

CE062c - GAMLSS. Silva, J.P; Taconeli, C.A. 09 de outubro, Silva, J.P; Taconeli, C.A. CE062c - GAMLSS 09 de outubro, / 42

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo

MAE Estatística Descritiva - 1 o semestre de 2017 Professora: Márcia D Elia Branco Monitora PAE: Simone Harnik Gabarito - Lista 4

Modelo Linear Generalizado Exponencial Potência

Teorema do Limite Central

Modelo de regressão log-weibull-exponenciada para dados com censura intervalar

Modelos de regressão para dados correlacionados. Cibele Russo

Estimador de Máxima Verossimilhança Estudo de Caso - Regressão Poisson

Econometria. Econometria MQO MQO. Resíduos. Resíduos MQO. 1. Exemplo da técnica MQO. 2. Hipóteses do Modelo de RLM. 3.

TESTES DE HIPÓTESES E INTERVALOS DE CONFIANÇA EM MODELOS LINEARES GENERALIZADOS

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 12

5.3 Experimentos fatoriais a dois fatores. Ambos os fatores são supostos fixos e os efeitos de tratamento são definidos como desvios da média tal que

Métodos Estatísticos Avançados em Epidemiologia

Modelo de regressão Beta

Análise de Resíduos. investiga características que comprometem a validade do MRLS:

MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência

CC-226 Aula 07 - Estimação de Parâmetros

4 Modelos Lineares Generalizados

Regressão Linear Múltipla no R MAE-0217: ESTATÍSTICA DESCRITIVA MAIO DE 2017 PROFESSORA: MÁRCIA D ELIA BRANCO

Lista No. 5 Gabarito

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA DENNIS LEÃO GRR LUAN FIORENTIN GRR

FAMÍLIA EXPONENCIAL DE DISTRIBUIÇÕES

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Transcrição:

Exemplos Regressão Dados de Contagem p. 1/26 Exemplos Regressão Dados de Contagem Gilberto A. Paula Departamento de Estatística IME-USP MAE5763 - Modelos Lineares Generalizados 2 o semestre de 2011

Exemplos Regressão Dados de Contagem p. 2/26 Exposição de bactérias Vamos considerar um exemplo em que modelos de regressão normal linear são comparados com um modelo log-linear de Poisson para ajustar dados de contagem. resposta: número de bactérias sobreviventes em amostras de um produto elimentício exposto a uma temperatura de 300 o F. variável explicativa: tempo de exposição do produto (em minutos). (Montgomery, Peck e Vining, 2001) (Paula, 2010).

Exemplos Regressão Dados de Contagem p. 3/26 Descrição dados bactérias Bactérias 175 108 95 82 71 50 Exposição 1 2 3 4 5 6 Bactérias 49 31 28 17 16 11 Exposição 7 8 9 10 11 12 Numero de Bacterias 50 100 150 2 4 6 8 10 12 Tempo de Exposicao

Exemplos Regressão Dados de Contagem p. 4/26 Ajuste modelos nomais Com base na aproximação da Poisson pela normal vamos propor inicialmente os seguintes modelos: yi = α+βtempo i +ǫ i e yi = α+βtempo i +γtempo 2 i +ǫ i, em que ǫ i N(0,σ 2 ) são erros mutuamente independentes. A seguir apresentamos as estimativas dos parâmetros dos modelos ajustados e gráficos de resíduos.

Exemplos Regressão Dados de Contagem p. 5/26 Estimativas dos parâmetros dos modelos normal linear e normal quadrático para explicar Y i em fução do tempo de exposição. Parâmetro Linear- Y Quadrático- Y α 12,57(0,38) 13,64(0,51) β -0,82(0,05) -1,27(0,18) γ 0,04(0,01) σ 0,62 0,98 R 2 96,1% 97,8%

Exemplos Regressão Dados de Contagem p. 6/26 Resíduos modelos normais Residuo Studentizado -2 0 2 4 6 Residuo Studentizado -2 0 2 4-1 0 1 Percentis da N(0,1) (linear) -1 0 1 Percentis da N(0,1) (quadratico)

Exemplos Regressão Dados de Contagem p. 7/26 Ajuste modelo de Poisson Vamos supor agora o seguinte modelo log-linear de Poisson logµ i = α+βtempo i, em que Y i P(µ i ). As estimativas desse modelo são apresentadas na tabela abaixo. Parâmetro Estimativa E/E.Padrão α 5,30 88,34 β -0,23-23,00 Desvio 8,42 (10 g.l.)

Exemplos Regressão Dados de Contagem p. 8/26 Resíduos modelo de Poisson Componente do Desvio -2-1 0 1 2 3-1 0 1 Percentis da N(0,1)

Exemplos Regressão Dados de Contagem p. 9/26 Interpretação modelo de Poisson O modelo ajustado fica então dado por ˆµ(x) = e 5,30 0,23x, em que x denota o tempo de exposição.

Exemplos Regressão Dados de Contagem p. 9/26 Interpretação modelo de Poisson O modelo ajustado fica então dado por ˆµ(x) = e 5,30 0,23x, em que x denota o tempo de exposição. Logo, se diminuirmos de uma unidade o tempo de exposição a variação no valor esperado fica dada por ˆµ(x 1) ˆµ(x) = e 0,23 = 1,259. Ou seja, o número esperado de sobreviventes diminui aproximadamente 25,9%.

Exemplos Regressão Dados de Contagem p. 10/26 Diagnóstico modelo de Poisson Distancia de Cook 0.0 0.5 1.0 1.5 2.0 1 2 2 4 6 8 10 12 Indice

Exemplos Regressão Dados de Contagem p. 11/26 Curva ajustada modelo de Poisson Numero de Bacterias 50 100 150 2 4 6 8 10 12 Tempo de Exposicao

Exemplos Regressão Dados de Contagem p. 12/26 Conclusões Nota-se neste exemplo a superioridade do modelo log-linear de Poisson quando comparado aos dois modelos aproximados pela distribuição normal. Essa vantagem se reflete não somente pela qualidade do ajuste mas também na interpretação dos parâmetros uma vez que a escala da variável resposta foi preservada. A retirada da observação #1, que se destaca nos gráficos de dispersão e influência, muda um pouco as estimativas dos parâmetros, contudo não muda a inferência.

Exemplos Regressão Dados de Contagem p. 13/26 Perfil de clientes Considere os dados apresentados em Neter et al. (1996) sobre o perfil dos clientes de uma determinada loja oriundos de 110 áreas de uma cidade. O objetivo do estudo é relacionar o número de clientes em cada área (Nclientes) com as seguintes variáveis explicativas em cada área: número de domicílios (em mil) (Domic), renda média anual (em mil USD) (Renda), idade média dos domicílios (em anos) (Idade), distância ao concorrente mais próximo (em milhas) (Dist1) e distância à loja (em milhas) (Dist2).

Diagramas de dispersão Clientes 0 5 10 15 20 25 30 Clientes 0 5 10 15 20 25 30 20000 40000 60000 80000 120000 0 10 20 30 40 50 60 Renda Idade Clientes 0 5 10 15 20 25 30 Clientes 0 5 10 15 20 25 30 1 2 3 4 5 6 2 4 6 8 10 Dist1 Dist2 Exemplos Regressão Dados de Contagem p. 14/26

Exemplos Regressão Dados de Contagem p. 15/26 Estimativas modelo de Poisson Supor o MLG: (1) Nclientes i P(µ i ), (2) logµ i = α+β 1 Domic i +β 2 Renda i +β 3 Idade i +β 4 Dist1 i +β 5 Dist2 i (i = 1,...,110). Efeito Parâmetro Estimativa E/E.Padrão Constante α 2,942 14,21 Domicílio β 1 0,606 4,27 Renda β 2-0,012-5,54 Idade β 3-0,004-2,09 Dist1 β 4 0,168 6,54 Dist2 β 5-0,129-7,95

Exemplos Regressão Dados de Contagem p. 16/26 Interpretações Nota-se que as estimativas são altamente significativas. O desvio do modelo foi de D(y; ˆµ) = 114,98 (104 g.l.) que equivale a P= 0, 35 indicando ajuste adequado. Notamos pela tabela que o número esperado de clientes na loja cresce com o aumento do número de domicílios na área e da distância ao concorrente mais próximo, porém diminui com o aumento da renda média e da idade média dos domicílios bem como da distância da área à loja.

Exemplos Regressão Dados de Contagem p. 16/26 Interpretações Nota-se que as estimativas são altamente significativas. O desvio do modelo foi de D(y; ˆµ) = 114,98 (104 g.l.) que equivale a P= 0, 35 indicando ajuste adequado. Notamos pela tabela que o número esperado de clientes na loja cresce com o aumento do número de domicílios na área e da distância ao concorrente mais próximo, porém diminui com o aumento da renda média e da idade média dos domicílios bem como da distância da área à loja. Isso sugere que deve ser uma loja de conveniência.

Exemplos Regressão Dados de Contagem p. 17/26 Interpretações Podemos notar pelas estimativas que se aumentarmos, por exemplo, em 1 mil USD a renda média dos domicílios de uma determinada área esperamos aumento relativo no número de clientes que irão à loja de exp( 0,012) = 0,988. Ou seja, decrescimento de 1,2%.

Exemplos Regressão Dados de Contagem p. 17/26 Interpretações Podemos notar pelas estimativas que se aumentarmos, por exemplo, em 1 mil USD a renda média dos domicílios de uma determinada área esperamos aumento relativo no número de clientes que irão à loja de exp( 0,012) = 0,988. Ou seja, decrescimento de 1,2%. Por outro lado, se a distância ao concorrente mais próximo aumentar em uma milha esperamos aumento relativo no número de clientes que irão à loja de exp(0,168) = 1,183. Ou seja, aumento de 18,3%.

Diagnóstico modelo de Poisson 43 20 Medida h 0.0 0.4 0.8 Distancia de Cook 0.0 0.2 0.4 5 10 15 20 25 30 35 0 20 40 60 80 100 Valores Ajustados Indice Componente do Desvio -3-1 0 1 2 3 Variavel z 0.5 1.5 2.5 3.5 5 10 15 20 25 30 35 1.5 2.0 2.5 3.0 3.5 Valores Ajustados Preditor Linear Exemplos Regressão Dados de Contagem p. 18/26

Exemplos Regressão Dados de Contagem p. 19/26 Resíduos modelo de Poisson Componente do Desvio -2 0 2-2 -1 0 1 2 Percentis da N(0,1)

Exemplos Regressão Dados de Contagem p. 20/26 Conclusões Dentre as observações destacadas pelos gráficos de diagnóstico, apenas as áreas #20 e #43 apresentam algumas variações desproporcionais nas estimativas dos parâmetros, porém não houve mudança inferencial. Nota-se também que não há indícios de que a ligação utilizada seja inapropriada e o gráfico de resíduos não apresenta indicações de afastamentos sérios da suposição de distribuição de Poisson para o número de clientes que frequentam a loja de conveniência.

Exemplos Regressão Dados de Contagem p. 21/26 Estudo Seriado com Ratos Os dados descritos na tabela a seguir são provenientes de um estudo seriado com 204 ratos em que um tipo de tumor maligno foi inoculado nos animais para avaliar a influência da série (passagem do tumor) na morte (caquexia) do rato (Paula, Barbosa e Ferreira, 1989). Para cada animal foram observados as seguintes variáveis: grupo de passagem (P0 a P28), desenvolvimento de massa tumoral (sim ou não), ocorrência de caquexia (sim ou não) e tempo de observação (em dias).

Exemplos Regressão Dados de Contagem p. 22/26 Distribuição Ratos Caquéticos Massa Grupo de passagem tumoral P0-P6 P7-P18 P19-P28 Sim Casos 6 13 8 R-Dias 2597 3105 2786 Não Casos 12 3 1 R-Dias 1613 411 232 Portanto, dos 204 ratos acompanhados apenas 43 ficaram caquéticos e os 161 ratos restantes tiveram o tempo de sobrevida censurado.

Exemplos Regressão Dados de Contagem p. 23/26 Modelo de Poisson Seja O ij o número de ratos caquéticos no nível i de massa tumoral e grupo de passagem j (i = 1,2) e (j = 1,2,3). Vamos supor O ij P(µ ij ), em que µ ij = λ ij t ij e parte sistemática dada por logλ ij = α+β i +γ j, com as restrições β 1 = 0 e γ 1 = 0. Assim, teremos logµ ij = logt ij +α+β i +γ j.

Exemplos Regressão Dados de Contagem p. 24/26 Estimativas modelo de Poisson Efeito Estimativa E/E.Padrão α 5,875 18,83 β 2 0,860 2,51 γ 2 0,334 0,92 γ 3-0,040-0.09 O teste da razão de verossimilhanças para testar H 0 : γ 2 = 0,γ 3 = 0 contra H 1 : γ 2 0 ou γ 3 0 fica dado por ξ RV = 1,15 para 2 graus de liberdade (P=0,56). Logo, não rejeita-se a hipótese nula, ou seja, não foi detectado efeito de passagem.

Exemplos Regressão Dados de Contagem p. 25/26 Modelo reduzido Eliminando-se o efeito de passagem teremos o seguinte: logλ ij = α+β i, com a restrição β 1 = 0. As estimativas (erro padrão) ficam dadas por: ˆα = 5,750(0,192) e ˆβ 2 = 0,802(0,315).

Exemplos Regressão Dados de Contagem p. 25/26 Modelo reduzido Eliminando-se o efeito de passagem teremos o seguinte: logλ ij = α+β i, com a restrição β 1 = 0. As estimativas (erro padrão) ficam dadas por: ˆα = 5,750(0,192) e ˆβ 2 = 0,802(0,315). Modelo alternativo: logµ ij = δlogt ij +α+β i +γ j, em que ˆδ = 1,390(0,439). Para testar H 0 : δ = 1 contra H 1 : δ 1 obtém-se ξ W = {(1,390 1)/0,439} 2 = 0,789, portanto não rejeita-se H 0.

Exemplos Regressão Dados de Contagem p. 26/26 Conclusões Foi detectado apenas efeito de desenvolvimento de massa tumoral. A função desvio do modelo final foi de D(y; ˆµ) = 1,99 para 4 graus de liberdade indicando um ajuste adequado. A estimativa para a razão entre as taxas de caquexia (entre não desenvolveu e desenvolveu massa tumoral) é dada por: exp(0,802) = 2,23.

Exemplos Regressão Dados de Contagem p. 26/26 Conclusões Foi detectado apenas efeito de desenvolvimento de massa tumoral. A função desvio do modelo final foi de D(y; ˆµ) = 1,99 para 4 graus de liberdade indicando um ajuste adequado. A estimativa para a razão entre as taxas de caquexia (entre não desenvolveu e desenvolveu massa tumoral) é dada por: exp(0,802) = 2,23. Isso quer dizer que os ratos que não desenvolveram massa tumoral sobrevivem menos do que aqueles que desenvolveram massa tumoral!