Exemplo Preferência de Automóveis Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2013 G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 1 / 22
Preferência Automóveis Sumário 1 Preferência Automóveis 2 Análise de Dados Preliminar 3 Modelo Binomial 4 Resultados Modelo Ajustado 5 Preferência Auto Americano 6 Conclusões 7 Referências G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 2 / 22
Preferência Automóveis Preferência Automóveis Descrição dos Dados Como ilustração de exemplo de modelo binomial para dados não agrupados, vamos considerar os dados sobre a preferência de automóveis (1: americano, 0: japonês) de uma amostra aleatória de 263 consumidores (Foster, Stine e Waterman, 1998, pp. 338-339). A probabilidade de preferência por carro americano será relacionada com as seguintes variáveis explicativas do comprador(a): idade (em anos), sexo (0: masculino; 1: feminino) e estado civil (0:casado(a), 1:solteiro(a)). G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 3 / 22
Análise de Dados Preliminar Sumário 1 Preferência Automóveis 2 Análise de Dados Preliminar 3 Modelo Binomial 4 Resultados Modelo Ajustado 5 Preferência Auto Americano 6 Conclusões 7 Referências G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 4 / 22
Análise de Dados Preliminar Descrição dos Dados Preferência segundo o Sexo Masculino Feminino Americano 61 (42,4%) 54 (45,4%) Japonês 83 (57,6%) 65 (54,6%) Total 144 119 G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 5 / 22
Análise de Dados Preliminar Descrição dos Dados Preferência segundo o Sexo Masculino Feminino Americano 61 (42,4%) 54 (45,4%) Japonês 83 (57,6%) 65 (54,6%) Total 144 119 Preferência segundo o Estado Civil Casado Solteiro Americano 83 (48,8%) 32 (34,4%) Japonês 87 (51,2%) 65 (65,6%) Total 170 93 G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 5 / 22
Análise de Dados Preliminar Boxplots da Idade segundo a Preferência Idade do Comprador 20 30 40 50 60 Japonês Americano G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 6 / 22
Modelo Binomial Sumário 1 Preferência Automóveis 2 Análise de Dados Preliminar 3 Modelo Binomial 4 Resultados Modelo Ajustado 5 Preferência Auto Americano 6 Conclusões 7 Referências G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 7 / 22
Modelo Binomial Modelo Binomial Descrição Denotaremos por Y i a preferência do i-ésimo comprador (=1 automóvel americano, =0 automóvel japonês). Vamos propor o seguinte modelo binomial para explicar a probabilidade de preferência por automóvel americano: Y i ind Be(π i ), log{ πi 1 π i } = β 1 +β 2 Idade i +β 3 Sexo i +β 4 ECivil i, em que π i denota a probabilidade do i-ésimo comprador preferir automóvel americano, para i = 1,...,263, G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 8 / 22
Resultados Modelo Ajustado Sumário 1 Preferência Automóveis 2 Análise de Dados Preliminar 3 Modelo Binomial 4 Resultados Modelo Ajustado 5 Preferência Auto Americano 6 Conclusões 7 Referências G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 9 / 22
Resultados Modelo Ajustado Modelo Binomial Estimativas Efeito Estimativa E.Padrão E/E.Padrão Constante -1,653 0,708-2,33 Idade 0,050 0,022 2,27 SexoF -0,094 0,256-0,37 ECivilS -0,518 0,272-1,90 A variável sexo é não significativa. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 10 / 22
Resultados Modelo Ajustado Modelo Binomial Estimativas Efeito Estimativa E.Padrão E/E.Padrão Constante -1,600 0,692-2,31 Idade 0,050 0,021 2,38 ECivilS -0,526 0,272-1,93 G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 11 / 22
Resultados Modelo Ajustado Modelo Binomial Estimativas Efeito Estimativa E.Padrão E/E.Padrão Constante -1,600 0,692-2,31 Idade 0,050 0,021 2,38 ECivilS -0,526 0,272-1,93 Interação O teste de ausência de interação entre idade e estado civil forneceu o seguinte valor para a estatística da razão de verossimilhanças ξ RV = 0, 81 com nível descritivo P=0,368, portanto não rejeitamos a ausência de interação entre idade e estado civil. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 11 / 22
Resultados Modelo Ajustado Interpretações Efeito Idade A probabilidade de preferência por automóvel americano aumenta com a idade do comprador. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 12 / 22
Resultados Modelo Ajustado Interpretações Efeito Idade A probabilidade de preferência por automóvel americano aumenta com a idade do comprador. Razão de Chances A razão de chances entre um comprador casado e um comprador solteiro preferir automóvel americano é estimada por ˆψ = exp(0, 526) = 1, 69. Ou seja, um comprador casado tem uma chance 69% maior de preferir automóvel americano em relação a um comprador solteiro. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 12 / 22
Resultados Modelo Ajustado Interpretações Estimativa Intervalar Estimativa intervalar de 90% para a razão de chances entre um comprador casado e um comprador solteiro preferir automóvel americano e 0,526±1,65 0,272 = e 0,526±0,449 = [1, 080; 2, 651][8, 0%; 165, 1%]. Portanto, um comprador casado tem uma chance entre 8% e 165,1% maior de preferir automóvel americano em relação a um comprador solteiro. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 13 / 22
Preferência Auto Americano Sumário 1 Preferência Automóveis 2 Análise de Dados Preliminar 3 Modelo Binomial 4 Resultados Modelo Ajustado 5 Preferência Auto Americano 6 Conclusões 7 Referências G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 14 / 22
Preferência Auto Americano Preferência Auto Americano Probabilidade Ajustada 0.2 0.4 0.6 0.8 Casado Solteiro 20 30 40 50 60 Idade G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 15 / 22
Preferência Auto Americano Diagnóstico Modelo Final Medida h 0.02 0.04 0.06 0.08 0.10 223 99 Distância de Cook 0.00 0.05 0.10 0.15 0.20 0.25 0.30 99 0.3 0.4 0.5 0.6 0.7 Valor Ajustado 0 50 100 150 200 250 Índice G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 16 / 22
Preferência Auto Americano Resíduos Modelo Final Componente do Desvio -2-1 0 1 2-3 -2-1 0 1 2 3 Percentil da N(0,1) G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 17 / 22
Preferência Auto Americano Pontos Discrepantes Sem 0bservação #99 Efeito Estimativa z-valor Variação Constante -1,942-2,65-21,4% Idade 0,060 2,65 22,4% ECivilS -0,474-1,72 9,9% G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 18 / 22
Preferência Auto Americano Pontos Discrepantes Sem 0bservação #99 Efeito Estimativa z-valor Variação Constante -1,942-2,65-21,4% Idade 0,060 2,65 22,4% ECivilS -0,474-1,72 9,9% Sem observação #223 Efeito Estimativa z-valor Variação Constante -1,463-2,07 8,6% Idade 0,045 2,05-8,1% ECivilS -0,550-2,02-4,6% G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 18 / 22
Conclusões Sumário 1 Preferência Automóveis 2 Análise de Dados Preliminar 3 Modelo Binomial 4 Resultados Modelo Ajustado 5 Preferência Auto Americano 6 Conclusões 7 Referências G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 19 / 22
Conclusões Conclusões Considerações Finais Neste exemplo em que ajustamos a probabilidade de um comprador preferir automóvel de marca americana em relação a marca japonesa, notamos que a idade do comprador e o estado civil são variáveis importantes. Com essas duas variáveis o modelo logístico se ajusta bem aos dados. Os dois pontos influentes, referentes a dois compradores com perfil atípico, embora mudem de forma desproporcinal as estimativas não mudam a inferência. Não há indícios de que a distribuição das respostas não seja Bernoulli. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 20 / 22
Referências Sumário 1 Preferência Automóveis 2 Análise de Dados Preliminar 3 Modelo Binomial 4 Resultados Modelo Ajustado 5 Preferência Auto Americano 6 Conclusões 7 Referências G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 21 / 22
Referências Referências Referência Foster, D. P.; Stine, R. A. e Waterman, R. P. (1998). Business Analysis using Regression. New York: Springer. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2013 22 / 22