Exemplo Preferência de Automóveis Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2016 G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 1 / 29
Preferência Automóveis Sumário 1 Preferência Automóveis 2 Análise de Dados Preliminar 3 Modelo Binomial 4 Resultados Modelo Ajustado 5 Conclusões 6 Referências G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 2 / 29
Preferência Automóveis Preferência Automóveis Descrição dos Dados Como ilustração de exemplo de modelo binomial para dados não agrupados, vamos considerar os dados sobre G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 3 / 29
Preferência Automóveis Preferência Automóveis Descrição dos Dados Como ilustração de exemplo de modelo binomial para dados não agrupados, vamos considerar os dados sobre preferência de automóveis (1: americano, 0: japonês) G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 3 / 29
Preferência Automóveis Preferência Automóveis Descrição dos Dados Como ilustração de exemplo de modelo binomial para dados não agrupados, vamos considerar os dados sobre preferência de automóveis (1: americano, 0: japonês) de uma amostra aleatória de 263 consumidores (Foster, Stine e Waterman, 1998, pp. 338-339). G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 3 / 29
Preferência Automóveis Preferência Automóveis Descrição dos Dados A probabilidade de preferência por carro americano será relacionada com as seguintes variáveis explicativas do comprador(a): G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 4 / 29
Preferência Automóveis Preferência Automóveis Descrição dos Dados A probabilidade de preferência por carro americano será relacionada com as seguintes variáveis explicativas do comprador(a): idade (em anos); G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 4 / 29
Preferência Automóveis Preferência Automóveis Descrição dos Dados A probabilidade de preferência por carro americano será relacionada com as seguintes variáveis explicativas do comprador(a): idade (em anos); sexo (0: masculino; 1: feminino); G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 4 / 29
Preferência Automóveis Preferência Automóveis Descrição dos Dados A probabilidade de preferência por carro americano será relacionada com as seguintes variáveis explicativas do comprador(a): idade (em anos); sexo (0: masculino; 1: feminino); estado civil (0:casado(a), 1:solteiro(a)). G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 4 / 29
Análise de Dados Preliminar Sumário 1 Preferência Automóveis 2 Análise de Dados Preliminar 3 Modelo Binomial 4 Resultados Modelo Ajustado 5 Conclusões 6 Referências G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 5 / 29
Análise de Dados Preliminar Descrição dos Dados Preferência segundo o Sexo Masculino Feminino Americano 61 (42,4%) 54 (45,4%) Japonês 83 (57,6%) 65 (54,6%) Total 144 119 G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 6 / 29
Análise de Dados Preliminar Descrição dos Dados Preferência segundo o Sexo Masculino Feminino Americano 61 (42,4%) 54 (45,4%) Japonês 83 (57,6%) 65 (54,6%) Total 144 119 Preferência segundo o Estado Civil Casado Solteiro Americano 83 (48,8%) 32 (34,4%) Japonês 87 (51,2%) 65 (65,6%) Total 170 93 G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 6 / 29
Análise de Dados Preliminar Boxplots da Idade segundo a Preferência Idade do Comprador 20 30 40 50 60 Japonês Americano G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 7 / 29
Modelo Binomial Sumário 1 Preferência Automóveis 2 Análise de Dados Preliminar 3 Modelo Binomial 4 Resultados Modelo Ajustado 5 Conclusões 6 Referências G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 8 / 29
Modelo Binomial Modelo Binomial Descrição Denotaremos por y i a preferência do i-ésimo comprador G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 9 / 29
Modelo Binomial Modelo Binomial Descrição Denotaremos por y i a preferência do i-ésimo comprador 0: automóvel japonês; G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 9 / 29
Modelo Binomial Modelo Binomial Descrição Denotaremos por y i a preferência do i-ésimo comprador 0: automóvel japonês; 1: automóvel americano. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 9 / 29
Modelo Binomial Modelo Binomial Descrição Denotaremos por y i a preferência do i-ésimo comprador 0: automóvel japonês; 1: automóvel americano. Vamos propor o seguinte modelo binomial para explicar a probabilidade de preferência por automóvel americano: G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 9 / 29
Modelo Binomial Modelo Binomial Descrição Denotaremos por y i a preferência do i-ésimo comprador 0: automóvel japonês; 1: automóvel americano. Vamos propor o seguinte modelo binomial para explicar a probabilidade de preferência por automóvel americano: y i ind Be(π i ), G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 9 / 29
Modelo Binomial Modelo Binomial Descrição Denotaremos por y i a preferência do i-ésimo comprador 0: automóvel japonês; 1: automóvel americano. Vamos propor o seguinte modelo binomial para explicar a probabilidade de preferência por automóvel americano: y i ind Be(π i ), log( πi 1 π i ) = β 1 +β 2 Idade i +β 3 Sexo i +β 4 ECivil i, G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 9 / 29
Modelo Binomial Modelo Binomial Descrição Denotaremos por y i a preferência do i-ésimo comprador 0: automóvel japonês; 1: automóvel americano. Vamos propor o seguinte modelo binomial para explicar a probabilidade de preferência por automóvel americano: y i ind Be(π i ), log( πi 1 π i ) = β 1 +β 2 Idade i +β 3 Sexo i +β 4 ECivil i, em que π i denota a probabilidade do i-ésimo comprador preferir automóvel americano, para i = 1,...,263, G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 9 / 29
Sumário 1 Preferência Automóveis 2 Análise de Dados Preliminar 3 Modelo Binomial 4 Resultados Modelo Ajustado 5 Conclusões 6 Referências G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 10 / 29
Modelo Binomial Estimativas Efeito Estimativa E.Padrão E/E.Padrão Constante -1,653 0,708-2,33 Idade 0,050 0,022 2,27 SexoF -0,094 0,256-0,37 ECivilS -0,518 0,272-1,90 G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 11 / 29
Modelo Binomial Estimativas Efeito Estimativa E.Padrão E/E.Padrão Constante -1,653 0,708-2,33 Idade 0,050 0,022 2,27 SexoF -0,094 0,256-0,37 ECivilS -0,518 0,272-1,90 A variável sexo é não significativa. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 11 / 29
Modelo Binomial Estimativas Efeito Estimativa E.Padrão E/E.Padrão Constante -1,600 0,692-2,31 Idade 0,050 0,021 2,38 ECivilS -0,526 0,272-1,93 G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 12 / 29
Modelo Binomial Estimativas Efeito Estimativa E.Padrão E/E.Padrão Constante -1,600 0,692-2,31 Idade 0,050 0,021 2,38 ECivilS -0,526 0,272-1,93 Interação O teste de ausência de interação entre idade e estado civil forneceu o seguinte valor para a estatística da razão de verossimilhanças ξ RV = 0, 81 com nível descritivo P=0,368. Portanto não rejeitamos a ausência de interação entre idade e estado civil. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 12 / 29
Diagnóstico Modelo Final Medida h 0.02 0.04 0.06 0.08 0.10 223 99 0.3 0.4 0.5 0.6 0.7 Valor Ajustado G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 13 / 29
Diagnóstico Modelo Final 99 Distância de Cook 0.00 0.05 0.10 0.15 0.20 0.25 0 50 100 150 200 250 Índice G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 14 / 29
Resíduos Modelo Final Componente do Desvio 2 1 0 1 2 3 2 1 0 1 2 3 Percentil da N(0,1) G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 15 / 29
Pontos Discrepantes Sem observação #99 Efeito Estimativa z-valor Variação Constante -1,942-2,65-21,4% Idade 0,060 2,65 22,4% ECivilS -0,474-1,72 9,9% G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 16 / 29
Pontos Discrepantes Sem observação #99 Efeito Estimativa z-valor Variação Constante -1,942-2,65-21,4% Idade 0,060 2,65 22,4% ECivilS -0,474-1,72 9,9% Este comprador tem 60 anos, comprou carro japonês e é solteiro. Sua eliminação aumenta a significância da idade e diminiui a significância do estado civil. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 16 / 29
Pontos Discrepantes Sem observação #223 Efeito Estimativa z-valor Variação Constante -1,463-2,07 8,6% Idade 0,045 2,05-8,1% ECivilS -0,550-2,02-4,6% G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 17 / 29
Pontos Discrepantes Sem observação #223 Efeito Estimativa z-valor Variação Constante -1,463-2,07 8,6% Idade 0,045 2,05-8,1% ECivilS -0,550-2,02-4,6% Este comprador tem 54 anos, comprou carro americano e é solteiro. Sua eliminação diminui a significância da idade e aumenta um pouco a significância do estado civil. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 17 / 29
Modelo Ajustado Preferência por Automóvel Americano A probabilidade ajustada de preferência por automóvel americano fica expressa na forma G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 18 / 29
Modelo Ajustado Preferência por Automóvel Americano A probabilidade ajustada de preferência por automóvel americano fica expressa na forma ˆπ = exp( 1, 600+0, 050 Idade 0, 526 ECivil) 1+exp( 1, 600+0, 050 Idade 0, 526 ECivil). G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 18 / 29
Probabilidade Ajustada Probabilidade Ajustada 0.2 0.4 0.6 0.8 Casado Solteiro 20 30 40 50 60 Idade G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 19 / 29
Interpretações Efeito Idade A probabilidade de preferência por automóvel americano aumenta com a idade do comprador. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 20 / 29
Interpretações Efeito Idade A probabilidade de preferência por automóvel americano aumenta com a idade do comprador. Razão de Chances A razão de chances entre um comprador casado e um comprador solteiro preferir automóvel americano é estimada por ˆψ = exp(0, 526) = 1, 69. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 20 / 29
Interpretações Efeito Idade A probabilidade de preferência por automóvel americano aumenta com a idade do comprador. Razão de Chances A razão de chances entre um comprador casado e um comprador solteiro preferir automóvel americano é estimada por ˆψ = exp(0, 526) = 1, 69. Ou seja, um comprador casado tem uma chance 69% maior de preferir automóvel americano em relação a um comprador solteiro. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 20 / 29
Interpretações Estimativa Intervalar Estimativa intervalar de 90% para a razão de chances entre um comprador casado e um comprador solteiro preferir automóvel americano G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 21 / 29
Interpretações Estimativa Intervalar Estimativa intervalar de 90% para a razão de chances entre um comprador casado e um comprador solteiro preferir automóvel americano e 0,526±1,65 0,272 = e 0,526±0,449 = [1, 080; 2, 651][8, 0%; 165, 1%]. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 21 / 29
Interpretações Estimativa Intervalar Estimativa intervalar de 90% para a razão de chances entre um comprador casado e um comprador solteiro preferir automóvel americano e 0,526±1,65 0,272 = e 0,526±0,449 = [1, 080; 2, 651][8, 0%; 165, 1%]. Portanto, um comprador casado tem uma chance entre 8% e 165,1% maior de preferir automóvel americano em relação a um comprador solteiro. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 21 / 29
Modelo Ajustado Preferência por Automóvel Japonês A probabilidade ajustada de preferência por automóvel japonês fica expressa na forma G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 22 / 29
Modelo Ajustado Preferência por Automóvel Japonês A probabilidade ajustada de preferência por automóvel japonês fica expressa na forma 1 ˆπ = exp(1, 600 0, 050 Idade+0, 526 ECivil) 1+exp(1, 600 0, 050 Idade+0, 526 ECivil). G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 22 / 29
Probabilidade Ajustada Probabilidade Ajustada 0.0 0.2 0.4 0.6 0.8 1.0 Casado Solteiro 20 30 40 50 60 Idade G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 23 / 29
Interpretações Efeito Idade A probabilidade de preferência por automóvel japonês diminui com a idade do comprador. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 24 / 29
Interpretações Efeito Idade A probabilidade de preferência por automóvel japonês diminui com a idade do comprador. Razão de Chances A razão de chances entre um comprador solteiro e um comprador cadado preferir automóvel japonês é estimada por ˆψ = exp(0, 526) = 1, 69. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 24 / 29
Interpretações Efeito Idade A probabilidade de preferência por automóvel japonês diminui com a idade do comprador. Razão de Chances A razão de chances entre um comprador solteiro e um comprador cadado preferir automóvel japonês é estimada por ˆψ = exp(0, 526) = 1, 69. Ou seja, um comprador solteiro tem uma chance 69% maior de preferir automóvel japonês em relação a um comprador casado. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 24 / 29
Interpretações Estimativa Intervalar Estimativa intervalar de 90% para a razão de chances entre um comprador solteiro e um comprador casado preferir automóvel japonês G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 25 / 29
Interpretações Estimativa Intervalar Estimativa intervalar de 90% para a razão de chances entre um comprador solteiro e um comprador casado preferir automóvel japonês e 0,526±1,65 0,272 = e 0,526±0,449 = [1, 080; 2, 651][8, 0%; 165, 1%]. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 25 / 29
Interpretações Estimativa Intervalar Estimativa intervalar de 90% para a razão de chances entre um comprador solteiro e um comprador casado preferir automóvel japonês e 0,526±1,65 0,272 = e 0,526±0,449 = [1, 080; 2, 651][8, 0%; 165, 1%]. Portanto, um comprador solteiro tem uma chance entre 8% e 165,1% maior de preferir automóvel japonês em relação a um comprador casado. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 25 / 29
Conclusões Sumário 1 Preferência Automóveis 2 Análise de Dados Preliminar 3 Modelo Binomial 4 Resultados Modelo Ajustado 5 Conclusões 6 Referências G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 26 / 29
Conclusões Conclusões Considerações Finais G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 27 / 29
Conclusões Conclusões Considerações Finais Neste exemplo em que ajustamos a probabilidade de um comprador preferir automóvel de marca americana em relação a marca japonesa, notamos que a idade do comprador e o estado civil são variáveis importantes. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 27 / 29
Conclusões Conclusões Considerações Finais Neste exemplo em que ajustamos a probabilidade de um comprador preferir automóvel de marca americana em relação a marca japonesa, notamos que a idade do comprador e o estado civil são variáveis importantes. Os dois pontos influentes, referentes a dois compradores com perfil atípico, embora mudem de forma desproporcinal as estimativas não mudam a inferência ao nível de 10%. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 27 / 29
Conclusões Conclusões Considerações Finais Neste exemplo em que ajustamos a probabilidade de um comprador preferir automóvel de marca americana em relação a marca japonesa, notamos que a idade do comprador e o estado civil são variáveis importantes. Os dois pontos influentes, referentes a dois compradores com perfil atípico, embora mudem de forma desproporcinal as estimativas não mudam a inferência ao nível de 10%. Não há indícios de que a distribuição das respostas não seja Bernoulli. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 27 / 29
Referências Sumário 1 Preferência Automóveis 2 Análise de Dados Preliminar 3 Modelo Binomial 4 Resultados Modelo Ajustado 5 Conclusões 6 Referências G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 28 / 29
Referências Referências Referência Foster, D. P.; Stine, R. A. e Waterman, R. P. (1998). Business Analysis using Regression. New York: Springer. G. A. Paula (IME-USP) Preferência Automóveis 2 o Semestre 2016 29 / 29