Exemplo Regressão Linear Múltipla Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 1 o Semestre 2013 G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 1 / 27
Salário de Executivos Sumário 1 Salário de Executivos 2 Análise de Dados Preliminar 3 Ajuste Modelo Linear Normal 4 Diagnóstico Modelo Ajustado 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 2 / 27
Salário de Executivos Salário de Executivos Descrição dos Dados Como aplicação de modelos lineares normais vamos considerar os dados sobre o salário anual (em mil USD) de uma amostra aleatória de 220 executivos (145 homens e 75 mulheres). O salário será relacionado com as seguintes variáveis explicativas: (i) sexo (1: masculino; 0: feminino), (ii) posição na empresa (varia de 1 a 9), quanto maior o valor mais alta a posição e (iii) anos de experiência no cargo (Foster, Stine e Waterman, 1998, pp. 180-188). G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 3 / 27
Análise de Dados Preliminar Sumário 1 Salário de Executivos 2 Análise de Dados Preliminar 3 Ajuste Modelo Linear Normal 4 Diagnóstico Modelo Ajustado 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 4 / 27
Análise de Dados Preliminar Boxplots Salários Executivos Salario 110 120 130 140 150 160 170 Feminino Masculino G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 5 / 27
Análise de Dados Preliminar Comparação de Médias Descrição Sexo Amostra Média E.Padrão Masculino 145 144,11 1,03 Feminino 75 140,47 1,43 Diferença Teste-t valor-p Estimativa 3,64 2,06 0,04 E.Padrão 1,77 O valor-p indica diferença ao nível de 5%. Ignorando-se as demais variáveis há indícios de que os executivos ganham em média mais do que as executivas. G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 6 / 27
Análise de Dados Preliminar Boxplots Posição e Experiência Posicao 2 4 6 8 Experiencia 5 10 15 20 25 Feminino Masculino Feminino Masculino G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 7 / 27
Análise de Dados Preliminar Dispersão Variáveis Homens 2 3 4 5 6 7 8 9 salariom 110 120 130 140 150 160 170 2 3 4 5 6 7 8 9 posicaom experm 5 10 15 20 25 110 120 130 140 150 160 170 5 10 15 20 25 G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 8 / 27
Análise de Dados Preliminar Dispersão Variáveis Mulheres 2 4 6 8 salariof 120 130 140 150 160 170 2 4 6 8 posicaof experf 5 10 15 20 120 130 140 150 160 170 5 10 15 20 G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 9 / 27
Ajuste Modelo Linear Normal Sumário 1 Salário de Executivos 2 Análise de Dados Preliminar 3 Ajuste Modelo Linear Normal 4 Diagnóstico Modelo Ajustado 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 10 / 27
Ajuste Modelo Linear Normal Modelo Linear Normal Descrição Nota-se indícios de aumento do salário com o aumento da posição e aumento da experiência para ambos os sexos, sugerindo inicialmente um modelo linear: y i = β 1 +β 2 sexo i +β 3 exper i +β 4 posic i +ǫ i, para i = 1,...,220, em que y i denota o salário do i-ésimo executivo da amostra com ǫ i iid N(0,σ 2 ). G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 11 / 27
Ajuste Modelo Linear Normal Estimativas Descrição Aplicando o método de Akaike nenhuma variável é retirada do modelo. As estimativas dos parâmetros são dadas abaixo. Efeito Estimativa Erro padrão valor-t valor-p Constante 115,262 1,401 82,25 0,000 Experiência -0,472 0,113-4,17 0,000 SexoM -2,201 1,080-2,04 0,043 Posição 6,710 0,313 21,46 0,000 R 2 0,712 R 2 -ajustado 0,708 s 6,770 F 177,90 (3 e 216 g.l.) 0,000 Todas as variáveis são marginalmente significativas ao nível de 5%. G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 12 / 27
Ajuste Modelo Linear Normal Interação entre Fatores Definição Ocorre quando a variação esperada para a resposta entre dois níveis quaisquer de um dos fatores não for a mesma segundo os níveis do outro fator. G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 13 / 27
Ajuste Modelo Linear Normal Interação entre Fatores Definição Ocorre quando a variação esperada para a resposta entre dois níveis quaisquer de um dos fatores não for a mesma segundo os níveis do outro fator. Exemplo Presença de interação entre os fatores sexo e experiência significa que a diferença entre os salários médios de executivos e executivas não é a mesma à medida que varia o tempo de experiência. Interpretação similar para presença de interação entre sexo e posição. G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 13 / 27
Ajuste Modelo Linear Normal Testando Interação entre Fatores Descrição Vamos testar a ausência das interações sexo*experiência, sexo*posição e experiência*posição, dado que estão no modelo constante + sexo + experiência + posição. Interação valor-f valor-p sexo*exper 1,615 0,20 sexo*posicão 0,001 0,97 exper*posição 7,594 0,00 Portanto, será incluída no modelo apenas a interação experiência*posição. G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 14 / 27
Ajuste Modelo Linear Normal Modelo Linear Normal Descrição O modelo normal linear com interação entre experiência e exposição fica dado por: y i = β 1 +β 2 sexo i +β 3 exper i +β 4 posic i +β 5 exper i posic i +ǫ i, para i = 1,...,220, em que y i denota o salário do i-ésimo executivo iid da amostra com ǫ i N(0,σ 2 ). G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 15 / 27
Ajuste Modelo Linear Normal Estimativas Descrição As estimativas do modelo final são dadas abaixo. Efeito Estimativa Erro padrão valor-t valor-p Constante 108,042 2,961 36,48 0,000 Experiência 0,336 0,314 1,07 0,285 SexoM -2,811 1,087-2,59 0,010 Posição 8,096 0,590 13,73 0,000 Posic*Exper -0,135 0.049-2,76 0.006 R 2 0,722 R 2 -ajustado 0,716 s 6,670 F 139,40 (4 e 215 g.l.) 0,000 Exceto experiência, todas as variáveis são marginalmente significativas ao nível de 1%. G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 16 / 27
Diagnóstico Modelo Ajustado Sumário 1 Salário de Executivos 2 Análise de Dados Preliminar 3 Ajuste Modelo Linear Normal 4 Diagnóstico Modelo Ajustado 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 17 / 27
Diagnóstico Modelo Ajustado Diagnóstico Modelo Ajustado Medida h 0.02 0.06 0.10 30 191 139 178 213 Distancia de Cook 0.0 0.02 0.04 4 30 144 0 50 100 150 200 Indice 0 50 100 150 200 Indice Residuo Padronizado -2 0 2 4 Residuo Padronizado -2 0 2 4 0 50 100 150 200 Indice 120 130 140 150 160 Valor Ajustado G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 18 / 27
Diagnóstico Modelo Ajustado Resíduos Modelo Ajustado Residuo Studentizado -4-2 0 2-3 -2-1 0 1 2 3 Percentil da N(0,1) G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 19 / 27
Diagnóstico Modelo Ajustado Variações nas Estimativas Observações Influentes Apenas duas observações #4 e #30 causam variações desproporcionais em algumas estimativas, embora não ocorram mudanças inferencias. Esses pontos causam variações, respectivamente, de -14% e 11%, na estimativa do coeficiente de sexo. G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 20 / 27
Diagnóstico Modelo Ajustado Variações nas Estimativas Observações Influentes Apenas duas observações #4 e #30 causam variações desproporcionais em algumas estimativas, embora não ocorram mudanças inferencias. Esses pontos causam variações, respectivamente, de -14% e 11%, na estimativa do coeficiente de sexo. Identificação das Observações A observação de # 4 é de uma executiva com salário anual de USD 139 mil, posição 7 e 13,9 anos de experiência e a observação de # 30 é de um executivo com salário anual de USD 110 mil, posição 2 e 2,4 anos de experiência. G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 20 / 27
Resultados Modelo Ajustado Sumário 1 Salário de Executivos 2 Análise de Dados Preliminar 3 Ajuste Modelo Linear Normal 4 Diagnóstico Modelo Ajustado 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 21 / 27
Resultados Modelo Ajustado Modelo Ajustado Valor Predito O modelo ajustado fica dado por: ŷ(x) = 108, 042+0, 336 exper 2, 811 sexo+ +8, 096 posic 0, 135 posic exper, em que x = (exper, sexo, posic) T. G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 22 / 27
Resultados Modelo Ajustado Modelo Ajustado Valor Predito O modelo ajustado fica dado por: ŷ(x) = 108, 042+0, 336 exper 2, 811 sexo+ +8, 096 posic 0, 135 posic exper, em que x = (exper, sexo, posic) T. Estimativas Qual o salário previsto para executivos com 5 anos de experiência e posição 4? Executiva: USD 139,406 mil Executivo: USD 136,595 mil. G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 22 / 27
Resultados Modelo Ajustado Modelo Ajustado Executivas Descrição O modelo ajustado para o grupo de executivas fica dado por: ŷ(x) = 108, 042+8, 096 posic+(0, 336 0, 135 posic) exper. G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 23 / 27
Resultados Modelo Ajustado Modelo Ajustado Executivas Descrição O modelo ajustado para o grupo de executivas fica dado por: ŷ(x) = 108, 042+8, 096 posic+(0, 336 0, 135 posic) exper. Interpretações Portanto, executivas com posição alta e muita experiência tendem a ganhar menos do que executivas com posição alta e menos experiência. Isso quer dizer que aquelas executivas que permanecerem menos tempo no cargo tendem a ganhar mais do que aquelas que ficarem mais tempo no cargo. Mesmo resultado para os homens. G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 23 / 27
Conclusões Sumário 1 Salário de Executivos 2 Análise de Dados Preliminar 3 Ajuste Modelo Linear Normal 4 Diagnóstico Modelo Ajustado 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 24 / 27
Conclusões Conclusões Considerações Finais Nota-se neste exemplo a importância da interação na interpretação dos resultados. Ignorando-se as variáveis posição e experiência os salários anuais dos executivos são em média significativamente maiores do que das executivas. Porém, quando essas variáveis entram no modelo ocorre o contrário, para uma mesma posição e mesma experiência as executivas ganham em média mais do que os executivos. G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 25 / 27
Referências Sumário 1 Salário de Executivos 2 Análise de Dados Preliminar 3 Ajuste Modelo Linear Normal 4 Diagnóstico Modelo Ajustado 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 26 / 27
Referências Referências Referência Foster, D. P., Stine, R. A. e Waterman, R. P. (1998). Business Analysis using Regression. New York: Springer. G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 27 / 27