Faturamento de Restaurantes Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2016 G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 1 / 29
Faturamento de Restaurantes Sumário 1 Faturamento de Restaurantes 2 Análise de Dados Preliminar 3 Ajuste Modelo Linear Normal 4 Ajuste Modelo Duplo 5 Conclusões 6 Referências G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 2 / 29
Faturamento de Restaurantes Faturamento de Restaurantes Descrição dos Dados Como ilustração de dados heteroscedásticos vamos considerar uma amostra aleatória de 30 restaurantes em que observou-se para cada um as seguintes variáveis aleatórias: G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 3 / 29
Faturamento de Restaurantes Faturamento de Restaurantes Descrição dos Dados Como ilustração de dados heteroscedásticos vamos considerar uma amostra aleatória de 30 restaurantes em que observou-se para cada um as seguintes variáveis aleatórias: faturamento anual (em mil USD) G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 3 / 29
Faturamento de Restaurantes Faturamento de Restaurantes Descrição dos Dados Como ilustração de dados heteroscedásticos vamos considerar uma amostra aleatória de 30 restaurantes em que observou-se para cada um as seguintes variáveis aleatórias: faturamento anual (em mil USD) gasto anual com publicidade (em mil USD). G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 3 / 29
Faturamento de Restaurantes Faturamento de Restaurantes Descrição dos Dados Como ilustração de dados heteroscedásticos vamos considerar uma amostra aleatória de 30 restaurantes em que observou-se para cada um as seguintes variáveis aleatórias: faturamento anual (em mil USD) gasto anual com publicidade (em mil USD). O objetivo principal do estudo é tentar relacionar o faturamento médio anual com o gasto anual com publicidade (Montgomery, Peck e Vining, 2001, Seção 5.5). G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 3 / 29
Análise de Dados Preliminar Sumário 1 Faturamento de Restaurantes 2 Análise de Dados Preliminar 3 Ajuste Modelo Linear Normal 4 Ajuste Modelo Duplo 5 Conclusões 6 Referências G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 4 / 29
Análise de Dados Preliminar Medidas Resumo Descrição Medida Faturamento G. Publicidade n 30 30 Média 147,10 12,13 D.Padrão 42,13 5,12 CV 28,6% 42,2% Mínimo 72,34 3,00 1 o Quartil 117,70 8,93 Mediana 147,00 12,46 3 o Quartil 180,30 15,19 Máximo 218,70 19,50 G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 5 / 29
Análise de Dados Preliminar Boxplot Faturamento Anual Faturamento 100 150 200 G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 6 / 29
Análise de Dados Preliminar Boxplot Gastos com Publicidade Gastos Publicidade 5 10 15 20 G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 7 / 29
Análise de Dados Preliminar Dispersão Faturamento versus Publicidade Faturamento 100 150 200 5 10 15 20 Gastos Publicidade G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 8 / 29
Ajuste Modelo Linear Normal Sumário 1 Faturamento de Restaurantes 2 Análise de Dados Preliminar 3 Ajuste Modelo Linear Normal 4 Ajuste Modelo Duplo 5 Conclusões 6 Referências G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 9 / 29
Ajuste Modelo Linear Normal Modelo Linear Normal Descrição Nota-se indícios de aumento do faturamento com o aumento do gasto com publicidade. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 10 / 29
Ajuste Modelo Linear Normal Modelo Linear Normal Descrição Nota-se indícios de aumento do faturamento com o aumento do gasto com publicidade. Essa tendência sugere o seguinte modelo de regressão linear: G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 10 / 29
Ajuste Modelo Linear Normal Modelo Linear Normal Descrição Nota-se indícios de aumento do faturamento com o aumento do gasto com publicidade. Essa tendência sugere o seguinte modelo de regressão linear: y i = β 1 +β 2 publicidade i +ǫ i, G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 10 / 29
Ajuste Modelo Linear Normal Modelo Linear Normal Descrição Nota-se indícios de aumento do faturamento com o aumento do gasto com publicidade. Essa tendência sugere o seguinte modelo de regressão linear: y i = β 1 +β 2 publicidade i +ǫ i, para i = 1,...,30, em que y i denota o faturamento anual do i-ésimo restaurante com ǫ i iid N(0,σ 2 ). G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 10 / 29
Ajuste Modelo Linear Normal Modelo Ajustado Descrição das Estimativas Efeito Estimativa E. Padrão valor-t valor-p Constante 49,443 4,289 11,53 0,00 Publicidade 8,048 0,326 24,68 0,00 R 2 0,955 R 2 -ajustado 0,954 s 9,0 F 607,5 (1 e 28 g.l.) 0,00 G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 11 / 29
Ajuste Modelo Linear Normal Modelo Ajustado Descrição das Estimativas Efeito Estimativa E. Padrão valor-t valor-p Constante 49,443 4,289 11,53 0,00 Publicidade 8,048 0,326 24,68 0,00 R 2 0,955 R 2 -ajustado 0,954 s 9,0 F 607,5 (1 e 28 g.l.) 0,00 Os coeficientes são marginalmente significativos. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 11 / 29
Ajuste Modelo Linear Normal Análise de Diagnóstico Medida h 0.0 0.2 0.4 0.6 0.8 1.0 Distância de Cook 0.00 0.05 0.10 0.15 0.20 29 0 5 10 15 20 25 30 Índice 0 5 10 15 20 25 30 Índice Resíduo Padronizado 3 2 1 0 1 2 3 Resíduo Padronizado 3 2 1 0 1 2 3 0 5 10 15 20 25 30 Índice 80 100 120 140 160 180 200 Valor Ajustado G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 12 / 29
Ajuste Modelo Linear Normal Análise de Resíduos Residuo Studentizado 3 2 1 0 1 2 3 2 1 0 1 2 Percentil da N(0,1) G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 13 / 29
Ajuste Modelo Linear Normal Análise do Ajuste Comentários Embora o ajuste mostra-se adequado através da análise de resíduos, nota-se pelo último gráfico indícios de que a variância dos erros não é constante. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 14 / 29
Ajuste Modelo Linear Normal Análise do Ajuste Comentários Embora o ajuste mostra-se adequado através da análise de resíduos, nota-se pelo último gráfico indícios de que a variância dos erros não é constante. Há um aumento no valor do resíduo com o aumento no valor ajustado. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 14 / 29
Ajuste Modelo Duplo Sumário 1 Faturamento de Restaurantes 2 Análise de Dados Preliminar 3 Ajuste Modelo Linear Normal 4 Ajuste Modelo Duplo 5 Conclusões 6 Referências G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 15 / 29
Ajuste Modelo Duplo Modelo Normal Duplo Descrição A tendência detectada na análise de diagnóstico sugere o seguinte modelo alternativo: G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 16 / 29
Ajuste Modelo Duplo Modelo Normal Duplo Descrição A tendência detectada na análise de diagnóstico sugere o seguinte modelo alternativo: y i = β 1 +β 2 publicidade i +ǫ i, G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 16 / 29
Ajuste Modelo Duplo Modelo Normal Duplo Descrição A tendência detectada na análise de diagnóstico sugere o seguinte modelo alternativo: y i = β 1 +β 2 publicidade i +ǫ i, para i = 1,...,30, em que y i denota o faturamento anual do i-ésimo ind restaurante e ǫ i N(0,σi 2 ) com G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 16 / 29
Ajuste Modelo Duplo Modelo Normal Duplo Descrição A tendência detectada na análise de diagnóstico sugere o seguinte modelo alternativo: y i = β 1 +β 2 publicidade i +ǫ i, para i = 1,...,30, em que y i denota o faturamento anual do i-ésimo ind restaurante e ǫ i N(0,σi 2 ) com logσ 2 i = γ 1 +γ 2 publicidade i, sendo β 1, β 2, γ 1 e γ 2 os parâmetros a serem estimados. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 16 / 29
Ajuste Modelo Duplo Estimativas Modelo Ajustado MV Estimativas para a Média Efeito Estimativa E. Padrão Valor-z Valor-P Constante 51,020 2,709 18,83 0,00 Publicidade 7,898 0,273 28,93 0,00 G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 17 / 29
Ajuste Modelo Duplo Estimativas Modelo Ajustado MV Estimativas para a Média Efeito Estimativa E. Padrão Valor-z Valor-P Constante 51,020 2,709 18,83 0,00 Publicidade 7,898 0,273 28,93 0,00 Os coeficientes são marginalmente significativos. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 17 / 29
Ajuste Modelo Duplo Estimativas Modelo Ajustado MV Estimativas para a Média Efeito Estimativa E. Padrão Valor-z Valor-P Constante 51,020 2,709 18,83 0,00 Publicidade 7,898 0,273 28,93 0,00 Os coeficientes são marginalmente significativos. Estimativas para a Variância Efeito Estimativa E. Padrão Valor-z Valor-P Constante 2,516 0,674 3,73 0,00 Publicidade 0,135 0,051 2,65 0,00 G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 17 / 29
Ajuste Modelo Duplo Estimativas Modelo Ajustado MV Estimativas para a Média Efeito Estimativa E. Padrão Valor-z Valor-P Constante 51,020 2,709 18,83 0,00 Publicidade 7,898 0,273 28,93 0,00 Os coeficientes são marginalmente significativos. Estimativas para a Variância Efeito Estimativa E. Padrão Valor-z Valor-P Constante 2,516 0,674 3,73 0,00 Publicidade 0,135 0,051 2,65 0,00 Os coeficientes são marginalmente significativos. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 17 / 29
Ajuste Modelo Duplo Estimativas Modelo Ajustado MVR Estimativas para a Média Efeito Estimativa E. Padrão Valor-z Valor-P Constante 50,984 2,748 18,55 0,00 Publicidade 7,902 0,274 28,88 0,00 G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 18 / 29
Ajuste Modelo Duplo Estimativas Modelo Ajustado MVR Estimativas para a Média Efeito Estimativa E. Padrão Valor-z Valor-P Constante 50,984 2,748 18,55 0,00 Publicidade 7,902 0,274 28,88 0,00 Os coeficientes são marginalmente significativos. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 18 / 29
Ajuste Modelo Duplo Estimativas Modelo Ajustado MVR Estimativas para a Média Efeito Estimativa E. Padrão Valor-z Valor-P Constante 50,984 2,748 18,55 0,00 Publicidade 7,902 0,274 28,88 0,00 Os coeficientes são marginalmente significativos. Estimativas para a Variância Efeito Estimativa E. Padrão Valor-z Valor-P Constante 2,641 0,766 3,45 0,00 Publicidade 0,130 0,057 2,27 0,02 G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 18 / 29
Ajuste Modelo Duplo Estimativas Modelo Ajustado MVR Estimativas para a Média Efeito Estimativa E. Padrão Valor-z Valor-P Constante 50,984 2,748 18,55 0,00 Publicidade 7,902 0,274 28,88 0,00 Os coeficientes são marginalmente significativos. Estimativas para a Variância Efeito Estimativa E. Padrão Valor-z Valor-P Constante 2,641 0,766 3,45 0,00 Publicidade 0,130 0,057 2,27 0,02 Os coeficientes são marginalmente significativos. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 18 / 29
Ajuste Modelo Duplo Análise de Diagnóstico Média Distância de Cook 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1 Resíduo Studentizado 3 2 1 0 1 2 3 0 5 10 15 20 25 30 Índice 80 100 140 180 Valor Ajustado G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 19 / 29
Ajuste Modelo Duplo Análise de Resíduos Média Resíduo Studentizado 3 2 1 0 1 2 2 1 0 1 2 Percentil da N(0,1) G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 20 / 29
Ajuste Modelo Duplo Análise de Diagnóstico Variância Distância de Cook 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 1 15 0 5 10 15 20 25 30 Índice G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 21 / 29
Ajuste Modelo Duplo Análise de Resíduos Variância Resíduo Componente do Desvio 4 2 0 2 2 1 0 1 2 Percentil da N(0,1) G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 22 / 29
Ajuste Modelo Duplo Observações Influentes Comentários G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 23 / 29
Ajuste Modelo Duplo Observações Influentes Comentários A observação #1 aparece como possivelmente influente nas estimativas do modelo para a média. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 23 / 29
Ajuste Modelo Duplo Observações Influentes Comentários A observação #1 aparece como possivelmente influente nas estimativas do modelo para a média. As observações #1 e #15 aparecem como possivelmente influentes nas estimativas do modelo para a variância. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 23 / 29
Ajuste Modelo Duplo Observações Influentes Comentários A observação #1 aparece como possivelmente influente nas estimativas do modelo para a média. As observações #1 e #15 aparecem como possivelmente influentes nas estimativas do modelo para a variância. A eliminação individual das observações não muda a inferência, todos os coeficientes continuam significativos. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 23 / 29
Ajuste Modelo Duplo Modelo Ajustado MV Ajuste para a Média ˆµ(publicidade) = 51, 020 + 7, 898 publicidade, G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 24 / 29
Ajuste Modelo Duplo Modelo Ajustado MV Ajuste para a Média ˆµ(publicidade) = 51, 020 + 7, 898 publicidade, em que ˆµ(publicidade) denota o valor predito de faturamento para o gasto com publicidade. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 24 / 29
Ajuste Modelo Duplo Modelo Ajustado MV Ajuste para a Média ˆµ(publicidade) = 51, 020 + 7, 898 publicidade, em que ˆµ(publicidade) denota o valor predito de faturamento para o gasto com publicidade. Ajuste para a Variância ˆσ 2 (publicidade) = exp(2, 516+0, 135 publicidade), G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 24 / 29
Ajuste Modelo Duplo Modelo Ajustado MV Ajuste para a Média ˆµ(publicidade) = 51, 020 + 7, 898 publicidade, em que ˆµ(publicidade) denota o valor predito de faturamento para o gasto com publicidade. Ajuste para a Variância ˆσ 2 (publicidade) = exp(2, 516+0, 135 publicidade), em que ˆσ 2 (publicidade) denota o valor predito para a variância do fatumento para o gasto com publicidade. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 24 / 29
Ajuste Modelo Duplo Interpretação das Estimativas MV Estimativas para a Média Para cada aumento de 1000 USD no gasto anual com publicidade espera-se aumento de 7898 USD no faturamento anual do restaurante. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 25 / 29
Ajuste Modelo Duplo Interpretação das Estimativas MV Estimativas para a Média Para cada aumento de 1000 USD no gasto anual com publicidade espera-se aumento de 7898 USD no faturamento anual do restaurante. Estimativas para a Variância Para cada aumento de 1000 USD no gasto anual com publicidade espera-se aumento de 14,5% (exp(0,135) 100%) na variância do faturamento anual. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 25 / 29
Conclusões Sumário 1 Faturamento de Restaurantes 2 Análise de Dados Preliminar 3 Ajuste Modelo Linear Normal 4 Ajuste Modelo Duplo 5 Conclusões 6 Referências G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 26 / 29
Conclusões Conclusões Considerações Finais G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 27 / 29
Conclusões Conclusões Considerações Finais Este é um exemplo em que há indícios de heteroscedasticidade através do gráfico do resíduo padronizado contra o valor ajustado do modelo homocedástico. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 27 / 29
Conclusões Conclusões Considerações Finais Este é um exemplo em que há indícios de heteroscedasticidade através do gráfico do resíduo padronizado contra o valor ajustado do modelo homocedástico. O ajuste do modelo duplo, em que a média e a variância são ajustados conjuntamente, mostra-se mais adequado confirmando a dependência do faturamento médio anual bem como da variância do faturamento anual com o gasto anual com publicidade. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 27 / 29
Conclusões Conclusões Considerações Finais Este é um exemplo em que há indícios de heteroscedasticidade através do gráfico do resíduo padronizado contra o valor ajustado do modelo homocedástico. O ajuste do modelo duplo, em que a média e a variância são ajustados conjuntamente, mostra-se mais adequado confirmando a dependência do faturamento médio anual bem como da variância do faturamento anual com o gasto anual com publicidade. Os métodos de máxima verossimilhança e máxima verossimilhança restrita levam a resultados numéricos muito parecidos e aos mesmos resultados inferenciais. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 27 / 29
Referências Sumário 1 Faturamento de Restaurantes 2 Análise de Dados Preliminar 3 Ajuste Modelo Linear Normal 4 Ajuste Modelo Duplo 5 Conclusões 6 Referências G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 28 / 29
Referências Referências Referências G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 29 / 29
Referências Referências Referências Montgomery, D. C.; Peck, E. A. e Vining, G. G. (2001). Introduction to Linear Regression Analysis, Third Edition. Hoboken: Wiley. G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 29 / 29