Exemplos Regressão Dados Binários

Documentos relacionados
Exemplo Cupons com Desconto

Exemplo Cupons com Desconto

Exemplos Regressão Dados de Contagem

Exemplo Falhas em Tecidos

Exemplo Número de Clientes da Loja

Exemplos Modelos Binomiais de Dose-Resposta

Exemplo Regressão Binomial Dados Emparelhados

Exemplo Preferência de Automóveis

Exemplos Modelos de Quase-Verossimilhança

Faturamento de Restaurantes

Exemplo Placas Dentárias

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Regressão de Poisson e parentes próximos

Modelo de regressão estável aplicado a econometria

Modelos de Regressão Linear Simples - Análise de Resíduos

Contabilometria. Aula 9 Regressão Linear Inferências e Grau de Ajustamento

Modelos para dados de contagem

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa

CONHECIMENTOS ESPECÍFICOS

Análise Multivariada Aplicada à Contabilidade

INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Estatística II - Licenciatura em Gestão Época de Recurso - Parte prática (14 valores) 24/01/2011.

Exemplo Regressão Linear Múltipla

Modelo de Variáveis discretas. Regressão com uma variável dependente Binária. Variáveis dependentes Binárias. Modelo de Probabilidade Linear

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Aplicação de modelos lineares generalizados na captura de atum da espécie Thunnus albacares.

AULAS 28 E 29 Análise de Regressão Múltipla com Informações Qualitativas

Intervalos de Confiança

Bioestatística F. Modelo Binomial. Enrico A. Colosimo

INFERÊNCIA ESTATÍSTICA. ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p

ANOVA - parte I Conceitos Básicos

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

Estatística

Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

Resolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016.

MÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS

Exercícios Selecionados de Econometria para Concursos Públicos

Econometria Semestre

IND 1115 Inferência Estatística Aula 6

Análise de Sobrevivência

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

Disciplina de Modelos Lineares

Procedimento Complementar para Validação de Métodos Analíticos e Bioanalíticos usando Análise de Regressão Linear

RESOLUÇÃO DAS QUESTÕES DE ESTATÍSTICA

Regressão múltipla: problemas adicionais. Unidades de medida. Unidades de medida. Unidades de medida salário em dólares (*1000) Unidades de medida

1 Introdução aos Métodos Estatísticos para Geografia 1

MAE Estatística Descritiva - 1 o semestre de 2017 Professora: Márcia D Elia Branco Monitora PAE: Simone Harnik Gabarito - Lista 4

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

AULA 07 Inferência a Partir de Duas Amostras

INSTITUTO POLITÉCNICO DE SETÚBAL ESCOLA SUPERIOR DE SAÚDE ESTATÍSTICA. Cursos: Licenciatura em Enfermagem

MAT 461 Tópicos de Matemática II Aula 8: Resumo de Probabilidade

Estatística - Análise de Regressão Linear Simples. Professor José Alberto - (11) sosestatistica.com.br

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva

SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20

Técnicas Computacionais em Probabilidade e Estatística I. Aula I

Modelagem do comportamento da variação do índice IBOVESPA através da metodologia de séries temporais

a) 19% b) 20% c) Aproximadamente 13% d) 14% e) Qualquer número menor que 20%

Prova de Estatística

Estimação e Testes de Hipóteses

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Estatística Indutiva

Cap 7 Modelo de Cox. Outline. 2 Cap 2 O tempo. 3 Cap 3 Funções de Sobrevida. 5 Modelo de Cox. Carvalho MS (2009) Sobrevida 1 / 22

Testes de Aderência, Homogeneidade e Independência

4 Modelos Lineares Generalizados

Inferência Estatística:

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA

Estatística Descritiva (I)

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Exame 14/06/10 NOME:

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

Coleta e Modelagem dos Dados de Entrada

Teste de % de defeituosos para 1 amostra

Modelos de regressão para dados correlacionados. Cibele Russo

Filho, não é um bicho: chama-se Estatística!

7 Teste de Hipóteses

Resenha Modelos Lineares Generalizados

Intervalos de Confiança - Amostras Pequenas

MAE Introdução à Probabilidade e Estatística II Resolução Lista 4

Modelos Lineares Generalizados - Introdução

Modelagem estatística da captura da broca-do-café (Hypothenemus hampei) ao longo do tempo 1

Para ajudar a interpretar os resultados, o Cartão de Relatórios do Assistente do teste de % de defeituosos para 1 amostra exibe os seguintes

Universidade Federal de Alfenas Programa de Pós-graduação em Estatística Aplicada e Biometria-PPGEAB Prova de Conhecimentos Específicos

A Metodologia de Box & Jenkins

Capítulo 3: Elementos de Estatística e Probabilidades aplicados à Hidrologia

PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING

(ii) Acrescente lucros ao modelo da parte (i). Por que essa variável não pode ser

Lista 1 - Gabarito. Prof. Erica Castilho Rodrigues Disciplina: Modelos Lineares Generalizados. 29 de Abril. f(y i, θ i ) = θ i exp( yiθ i ).

AULAS 14 E 15 Modelo de regressão simples

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

TESTES DE HIPÓTESES. Conceitos, Testes de 1 proporção, Testes de 1 média

MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência

EXPERIMENTO FATORIAL BLOCADO PARA DETERMINAÇÃO DE DIFERENÇAS ENTRE TEMPO DE QUEIMA DE VELAS DE PARAFINA

Intervalos Estatísticos para uma única Amostra - parte I

CONTEÚDOS PROGRAMÁTICOS

Noções de Simulação. Ciências Contábeis - FEA - Noturno. 2 o Semestre MAE0219 (IME-USP) Noções de Simulação 2 o Semestre / 23

Conceitos Básicos Teste t Teste F. Teste de Hipóteses. Joel M. Corrêa da Rosa

Transcrição:

Exemplos Regressão Dados Binários p. 1/28 Exemplos Regressão Dados Binários Gilberto A. Paula Departamento de Estatística IME-USP MAE5763 - Modelos Lineares Generalizados 2 o semestre de 2011

Exemplos Regressão Dados Binários p. 2/28 Dados Binários Agrupados 1 Vamos considerar inicialmente os dados sobre o uso de cupons com descontos, enviados para clientes de uma rede de supermercados (Neter et al., 1996). Cupons com descontos de 5, 10, 15, 20, 25, 30 e 35 reais são enviados a clientes da rede de supermercados escolhidos aleatoriamente e deseja-se estimar a probabilidade de um cupom ser utilizado num prazo de 2 semanas após o envio pelo correio. Inicialmente vamos observar o gráfico da proporção de cupons usados.

Exemplos Regressão Dados Binários p. 3/28 Tabela de Cupons Usados Desconto Cupons Enviados Cupons Usados 5 200 30 10 200 45 15 200 70 20 200 100 25 200 137 30 200 166 35 200 176 Na Figura 1 tem-se o comportamento da proporção de cupons usados no período de duas semanas.

Exemplos Regressão Dados Binários p. 4/28 Figura 1. Proporção de Cupons Usados. Freq. Cupons Usados 0.0 0.2 0.4 0.6 0.8 1.0 5 10 15 20 25 30 35 Desconto

Exemplos Regressão Dados Binários p. 5/28 Nota-se pela Figura 1 que a probabilidade do cupom ser usado aumenta com o desconto do cupom. O modelo para explicar a probabilidade µ(x) de um cupom com desconto x ser usado pode ser expresso na forma: Y(x) B(n(x),µ(x)) µ(x) = eα+βx 1+e α+βx,

Exemplos Regressão Dados Binários p. 5/28 Nota-se pela Figura 1 que a probabilidade do cupom ser usado aumenta com o desconto do cupom. O modelo para explicar a probabilidade µ(x) de um cupom com desconto x ser usado pode ser expresso na forma: Y(x) B(n(x),µ(x)) µ(x) = eα+βx 1+e α+βx, em que Y(x) denota o número de cupons usados e n(x) o número de cupons enviados com desconto x.

Exemplos Regressão Dados Binários p. 6/28 Estimativas dos Parâmetros Efeito Estimativa E/E. Padrão Constante -2,535-16,11 Desconto 0,132 17,91 Portanto, nota-se que há um crescimento significativo da probabilidade do cupom ser usado em duas semanas com o aumento do desconto. O desvio do modelo é dado por D(y; ˆµ) = 2,16 (para 5 graus de liberdade), obtendo-se o nível descritivo P=0,83 que indica que o modelo está bem ajustado.

Exemplos Regressão Dados Binários p. 7/28 Modelo ajustado ˆµ(x) = e 2,535+0,132x 1+e 2,535+0,132x, em que ˆµ(x) é a probabilidade ajustada do cupom com desconto x ser usado no período de duas semanas.

Exemplos Regressão Dados Binários p. 7/28 Modelo ajustado ˆµ(x) = e 2,535+0,132x 1+e 2,535+0,132x, em que ˆµ(x) é a probabilidade ajustada do cupom com desconto x ser usado no período de duas semanas. A chance do cupom com desconto x ser usado no período de duas semanas fica dado por µ(x) 1 µ(x) = exp{α+βx}.

Exemplos Regressão Dados Binários p. 8/28 Chance ajustada ˆµ(x) 1 ˆµ(x) = exp{ 2,535+0,132x}, ou seja, a chance aumenta com o valor do desconto.

Exemplos Regressão Dados Binários p. 8/28 Chance ajustada ˆµ(x) 1 ˆµ(x) = exp{ 2,535+0,132x}, ou seja, a chance aumenta com o valor do desconto. A razão de chances entre um cupom com desconto (x+1) e um cupom com desconto x é definida por: ψ(x) = µ(x+1) 1 µ(x+1) µ(x) 1 µ(x).

Exemplos Regressão Dados Binários p. 9/28 Razão de chances ajustada: ˆψ(x) = exp{ 2,535+0,132(x+1)} exp{ 2,535+0,132x} = exp(0, 132) = 1,14.

Exemplos Regressão Dados Binários p. 9/28 Razão de chances ajustada: ˆψ(x) = exp{ 2,535+0,132(x+1)} exp{ 2,535+0,132x} = exp(0, 132) = 1,14. Interpretação: aumentando em 1 unidade o desconto a chance do cupom ser usado aumenta em aproximadamente 14%.

Exemplos Regressão Dados Binários p. 10/28 Figura 2. Envelope Exemplo Cupons. Componente do Desvio -3-2 -1 0 1 2-1.0-0.5 0.0 0.5 1.0 Percentis da N(0,1)

Exemplos Regressão Dados Binários p. 11/28 Dados Binários Agrupados 2 Vamos considerar como outra ilustração o conjunto de dados apresentado em Innes et al. (1969) referente a um estudo para avaliar o possível efeito cancerígeno do fungicida Avadex. No estudo 403 camundongos são observados. Desses, 65 receberam o fungicida e foram acompanhados durante 85 semanas, verificando-se o desenvolvimento ou não de tumor. Os demais animais não receberam o fungicida e também foram acompanhados pelo mesmo período. Os dados são resumidos a seguir.

Exemplos Regressão Dados Binários p. 12/28 Distribuição dos Camundongos Macho Fêmea Tumor Tratado Controle Tratado Controle Sim 6 8 5 13 Não 26 158 28 159 Total 32 166 33 172 Os dados estão descritos no arquivo camundongos.dat na seguinte ordem: sexo (1: macho, 0: fêmea), tratamento (1: tratado, 0: controle), ratos que desenvolveram o tumor e total de ratos expostos.

Exemplos Regressão Dados Binários p. 13/28 Seja π(x 1,x 2 ) a probabilidade de desenvolvimento de tumor dados x 1 (x 1 =1 macho, x 1 =0 fêmea) e x 2 (x 2 =1 tratado, x 2 =0 controle) e vamos denotar por Y(x 1,x 2 ) o número de camundongos na condição (x 1,x 2 ) com desenvolvimento de tumor no período. Vamos assumir que Y(x 1,x 2 ) segue uma binomial com parte sistemática dada por log { } π(x1,x 2 ) 1 π(x 1,x 2 ) = α+γx 1 +βx 2 +δx 1 x 2, em que δ denota a interação entre os dois fatores.

Exemplos Regressão Dados Binários p. 14/28 Para testar a hipótese de ausência de interação entre os fatores sexo e grupo (H 0 : δ = 0) comparamos o desvio do modelo sem interação D(y; ˆµ 0 ) = 0,832 com os percentis da distribuição qui-quadrado com 1 grau de liberdade. O nível descritivo obtido é dado por P= 0,362, indicando pela não rejeição da hipótese nula (homogeneidade das razões de chances). Ou seja, a razão de chances de desenvolvimento de tumor (entre tratado e controle) é a mesma nos grupos macho e fêmea.

Exemplos Regressão Dados Binários p. 15/28 Ajustamos então o modelo logístico sem interação log { } π(x1,x 2 ) 1 π(x 1,x 2 ) = α+γx 1 +βx 2, em que γ e β denotam, respectivamente, os efeitos de sexo e grupo. As estimativas são dadas abaixo: Efeito Estimativa E/E.Padrão Constante -2,602-9,32 Sexo -0,241-0,64 Grupo 1,125 2,81 Portanto, tem efeito de grupo mas não tem efeito de sexo.

Exemplos Regressão Dados Binários p. 16/28 Note que ˆψ = eˆβ é a razão de chances estimada entre tratado e controle (que é a mesma para macho e fêmea). Um intervalo assintótico de confiança para ψ com coeficiente (1 α), terá os limites (ˆψ I, ˆψ S ) = exp{ˆβ ±z (1 α/2) Var(ˆβ)}. Logo, para o exemplo acima e assumindo um intervalo de 95%, esses limites ficam dados por [1,403;6,759].

Exemplos Regressão Dados Binários p. 17/28 Dados Binários Não Agrupados Como exemplo neste tópico vamos considerar os dados sobre a preferência de automóveis (1: americano, 0: japonês) de uma amostra aleatória de 263 consumidores (Foster, Stine e Waterman, 1998, pp. 338-339). A probabilidade de preferência por carro americano será relacionada com as seguintes variáveis explicativas do comprador(a): (i) idade (em anos), (ii) sexo (0: masculino; 1: feminino) e (iii) estado civil (0:casado, 1:solteiro). Os dados estão descritos no arquivo prefauto.dat na ordem acima.

Exemplos Regressão Dados Binários p. 17/28 Dados Binários Não Agrupados Como exemplo neste tópico vamos considerar os dados sobre a preferência de automóveis (1: americano, 0: japonês) de uma amostra aleatória de 263 consumidores (Foster, Stine e Waterman, 1998, pp. 338-339). A probabilidade de preferência por carro americano será relacionada com as seguintes variáveis explicativas do comprador(a): (i) idade (em anos), (ii) sexo (0: masculino; 1: feminino) e (iii) estado civil (0:casado, 1:solteiro). Os dados estão descritos no arquivo prefauto.dat na ordem acima. A seguir tem-se algumas análises descritivas.

Exemplos Regressão Dados Binários p. 18/28 Preferência por Sexo e E. Civil Masculino Feminino Americano 61 (42,4%) 54 (45,4 %) Japonês 83 (57,6%) 65 (54,6 %) Total 144 119 Casado Solteiro Americano 83 (48,8%) 32 (34,4 %) Japonês 87 (51,2%) 65 (65,6 %) Total 170 93 Ambos os sexos preferem mais carro joponês. Dentre os casados há pequena vantagem por carro japonês. Essa preferência é bem mais acentuada entre os solteiros.

Exemplos Regressão Dados Binários p. 19/28 Figura 3. Idade segundo preferência. Idade 20 30 40 50 60 Japones Americano

Exemplos Regressão Dados Binários p. 20/28 Vamos supor que cada resposta seja Bernoulli com log { µi 1 µ i } = β 1 +β 2 Idade i +β 3 Sexo i +β 4 Ecivil i, em que µ i denota a probabilidade do i-ésimo comprador preferir carro americano. As estimativas são dadas abaixo: Efeito Estimativa E/E.Padrão Constante -1,653-2,33 Idade 0,050 2,31 Sexo -0,094-0,37 E.Civil -0,518-1,90

Exemplos Regressão Dados Binários p. 21/28 Nota-se que a variável sexo é não significativa. As novas estimativas sem essa variável são dadas por: Efeito Estimativa E/E.Padrão Constante -1,600-2,31 Idade 0,049 2,30 E.Civil -0,526-1,94 Para testar a inclusão da interação Idade*E.Civil aplicamos o teste da razão de verossimilhanças cujo resultado foi RV=0,81 (1 g.l.). O valor-p foi de P=0,368, portanto não incluímos a interação no modelo.

Exemplos Regressão Dados Binários p. 22/28 O modelo ajustado é dado por: log { } ˆµ 1 ˆµ = 1,600+0,049 Idade 0,526 E.Civil.

Exemplos Regressão Dados Binários p. 22/28 O modelo ajustado é dado por: log { } ˆµ 1 ˆµ = 1,600+0,049 Idade 0,526 E.Civil. Portanto, a preferência por automóvel americano aumenta com a idade do comprador. Com relação ao estado civil nota-se que os casados preferem mais carro americano do que os solteiros. Essa razão de chances (entre casados e solteiros) por carro americano pode ser estimada por ˆψ = exp(0,526) = 1,69.

Figura 4. Diagnóstico Exemplo Preferência. 99 223 99 Medida h 0.02 0.06 0.10 Distancia de Cook 0.0 0.10 0.20 0.3 0.4 0.5 0.6 0.7 0 50 100 150 200 250 Valores Ajustados Indice 0 50 100 150 200 250-1.0-0.5 0.0 0.5 1.0 Residuo Componente do Desvio -2 0 1 2 Residuo Componente do Desvio -2 0 1 2 Indice Preditor Linear Exemplos Regressão Dados Binários p. 23/28

Exemplos Regressão Dados Binários p. 24/28 Figura 5. Envelope Exemplo Preferência. Componente do Desvio -2-1 0 1 2-3 -2-1 0 1 2 3 Percentis da N(0,1)

Exemplos Regressão Dados Binários p. 25/28 Eliminação Influentes Apresentamos abaixo as estimativas e variações eliminando-se as observações #99 e #223. Efeito Estimativa z-valor Variação Constante -1,942-2,65-17,5% Idade 0,060 2,65 18,3% E.Civil -0,474-1,72 9,9% Efeito Estimativa z-valor Variação Constante -1,463-2,07 8,7% Idade 0,045 2,05-8,9% E.Civil -0,550-2,02-4,8%

Exemplos Regressão Dados Binários p. 26/28 Conclusões Neste exemplo em que ajustamos a probabilidade de um comprador preferir carro de marca americana em relação a marca japonesa, notamos que a idade do comprador e o estado civil são variáveis importantes. Com essas duas variáveis o modelo logístico se ajusta bem aos dados. Os dois pontos influentes, referentes a dois compradores com perfil atípico, embora mudem de forma desproporcinal as estimativas não mudam a inferência. Não há indícios de que a distribuição das respostas não seja Bernoulli.

Exemplos Regressão Dados Binários p. 27/28 Referências Foster, D. P.; Stine, R. A. e Waterman, R. P. (1998). Business Analysis using Regression. New York: Springer. Innes, J. R. M.; Ulland, B. M.; Valerio, M. G.; Petrucelli, L.; Fishbein, L.; Hart, E. R.; Pallota, A. J.; Bates, R. R.; Falk, H. L.; Gart, J. J.; Klein, M.; Mitchell, I. e Peters, J. (1969). Biossay of pesticides and industrial chemicals for tumorigenicity in mice: A preliminary note. Journal of the National Cancer Institute 42, 1101-1114.

Exemplos Regressão Dados Binários p. 28/28 Neter, J.; Kutner, M. H.; Nachtsheim, C. J. e Wasserman, W.(1996). Applied Linear Regression Models, 3rd Edition. Irwin, Illinois,