EXCEL NA ANÁLISE DE REGRESSÃO _2010_03_Exercicio _Regressão_exemplo O gerente de uma loja de artigos escolares, cada semana, deve decidir quanto gastar com propaganda e que atrativo (por exemplo preços mais baixos) deve introduzir para melhorar a receita total. Ele tem um interesse especial em conhecer quanto a receita total varia em função do nível de despesas com propaganda. Em particular gostaria de saber se o aumento da receita é suficiente para justificar o incremento das despesas com propaganda. O gerente tem interesse também na estratégia de preço. Uma redução de preço conduz a um aumento ou a uma redução da receita total? Se a demanda for inelástica com relação ao preço, uma redução de preço implica apenas um pequeno aumento da quantidade vendida, a receita total cairá. Se a demanda for elástica, uma redução do preço produzirá um incremento na receita total. Para responder a estas perguntas é necessário construir primeiro um modelo econômico: (1) RT = f(p, A) Onde: RT = Receita total P = preço A = despesa com anúncios/ propaganda, etc. No arquivo Regressão_1_dados.xls encontram-se as observações semanais sobre receita total, preço médio e despesas com propaganda desta loja. Com estes dados vamos usar Excel para estimar o seguinte modelo econométrico: (2) RT = β 0 + β 1 P + β 2 A + e Usando Excel na análise de regressão 1) Abrir o arquivo com os dados. No nosso exemplo, abrir o arquivo 02_Exercicio_Regressão_dados.xls 2) Posicionar o mouse numa célula vazia. 3) Escolher no menu Ferramentas a opção Análise de dados. 1
3.1) Se não encontrar esta opção no seu Excel, escolher no menu Ferramentas a opção Suplementos. Na caixa dos Suplementos disponíveis selecionar Ferramentas de análise e OK. Agora no menu Ferramentas vai aparecer a opção Análise de dados. 4) Na janela Análise de dados escolher Regressão e depois OK. 5) Na nova janela Regressão vamos inserir os nossos dados. 2
5.1) Na área Intervalo Y de entrada vamos inserir os dados da nossa variável y (ou variável dependente que no nosso exemplo é RT). Para fazer isso é necessário selecionar a área com os dados na nossa planilha do Excel. NOTA: É melhor selecionar também a célula com o nome da variável para facilitar a leitura do resultado da análise de regressão. 5.2) Na área Intervalo X de entrada vamos inserir os dados das nossas variáveis explicativas selecionando a respectiva área na planilha de dados, incluindo sempre o nome das variáveis (P e A). NOTA: No caso de regressão múltipla é necessário manter os dados relativos as variáveis explicativas em colunas adjacentes. 5.3) Escolher a opção Rótulos, pois o nosso intervalo de dados inclui as células com os nomes das variáveis. 5.4) Não vamos escolher a opção Constante é zero pois isso eliminaria o intercepto (a estimativa de β 0 ). 5.5) A opção Nível de confiança permite definir o valor usado para calcular os intervalos de confiança dos coeficientes estimados. O default é 95%. 5.6) Na área das Opções de saída podemos escolher onde vão aparecer os resultados da regressão. a) Se quiser manter os resultados na mesma planilha dos dados, escolher a opção Intervalo de saída e selecionar a célula onde vai aparecer o resultado. b) Se quiser salvar os resultados numa nova planilha, escolher a opção Nova planilha e inserir o nome da mesma. No nosso exemplo vamos escolher esta opção e inserir o nome resultados. c) Se quiser o resultado num novo arquivo do Excel, escolher a opção Nova pasta de trabalho. 5.7) Por enquanto não vamos escolher nada na área Resíduos pois não estamos interessados em conhecer, para cada observação, a diferença entre o valor de y i e o valor estimado ŷ i (e i = y i - ŷ i ). 3
Em síntese: 5.8) Clicando em OK, Excel calcula as várias estimativas usando o método dos Mínimos Quadrados Ordinários. INTERPRETANDO A SÁIDA DO EXCEL RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,931173872 = raiz quadrada de R 2 R-Quadrado 0,86708478 = coeficiente de determinação R 2 =1-(SQE/SQT) R-quadrado ajustado 0,861659669 = 1-(1- R 2 )*((T-1)/(T-K)), onde T=dimensão amostra, K=n. de regressores Erro padrão 6,069610535 = erro padrão da regressão = raiz quadrada da variância estimada Observações 52 = dimensão da amostra ANOVA (Análise de Variância) gl Regressão (fonte de variação explicada) (graus de liberdade) 2 (graus de liberdade do numerador no teste F) 49 (graus de liberdade do denominador no teste F) SQ (soma de quadrados) 11776,18388 (SQR) Resíduo (variação não explicada) 1805,16843 (SQE) Total 51 13581,35231 (SQT) MQ (média de quadrados) 5888,091939 (MQR=SQR/2) 36,84017205 (MQE=SQE/49) (variância estimada) F 159,828025 (MQR/MQE) F de significação 3,36962E-22 (Prob(F crítico >F) Coeficientes Erro padrão (dos coeficientes) Stat t (teste t calculado ) valor-p (Prob (t crítico >t)) 95% inferiores (limites intervalo 95% superiores de confiança) Interseção ( βˆ 0 ) 104,7855136 6,482718984 16,16382167 2,83516E-21 91,75800996 117,8130172 P ( βˆ 1 ) -6,641930069 3,191192928-2,081331407 0,042650528-13,05486847-0,228991673 4
A ( βˆ 2 ) 2,984298953 0,166936136 17,87689007 4,11139E-23 2,648828431 3,319769475 Comentário: 1) ANOVA F = 159,828 é o valor da estatística F associada ao teste de significância do modelo. Lembrando que o teste de significância do nosso exemplo é: H 0 : β 1 = β 2 = 0 H 1 : β 1 0 e/ou β 2 0 SQR / 2 F = = 159,828 SQE / 49 Para saber se o modelo é significativo teremos que comparar este valor com o valor do F crítico ou F da tabela. No nosso exemplo teremos 2 graus de liberdade do numerador e 49 graus de liberdade do denominador. Segundo a tabela F crítico = 3,1866. Dado que F>F crítico rejeitamos H 0 e podemos afirmar, com 95% de confiança, que o modelo é significativo. Podemos chegar a este mesmo resultado observando o valor do F de significação. Agora é só comparar o valor aqui calculado com o valor do nosso α =0,05. Se F de significação é menor (<) que α podemos rejeitar H 0 e afirmar que o modelo é significativo. 2) COEFICIENTES ESTIMADOS e TESTES DE SIGNIFICÂNCIA Para cada coeficiente estimado, Excel calcula o erro padrão e a estatística t do teste de significância do parâmetro. Lembrando que o teste de significância de um parâmetro é: H 0 : β i = 0 H 1 : β i 0 bi 0 t βi = ep(bi) No nosso exemplo, com α =0,05 e 49 graus de liberdade o valor de t crítico é = ± 2,01. Considerando β 1, a estatística t = -2,08133. Em valor absoluto t > t crítico por isso rejeitamos H 0. É possível obter o mesmo resultado considerando o valor da coluna a direita (valor-p). O valor da prob(t crítico >t) = 0,04265. Isso é menor de α =0,05. De novo, rejeitamos H 0, ou seja o nosso coeficiente é estatisticamente significativo. 3) INTERVALO DE CONFIANÇA Excel calcula como default, para cada coeficiente, o limite inferior e superior do intervalo de confiança de 95%. Se for escolhido um nível diferente, calcula também estes limites adicionais. TESTE DE HIPÓTESE TESTE de hipótese com α =0,05 para um coeficiente teste bilateral H 0 : β 1 = - 5 H 1 : β 1-5 5
βˆ ( 5) 6,6419 ( 5) t 1 β1 = = = -0,5145 ep( βˆ 1 ) 3,1912 Regra de rejeição: Rejeitar H 0 se t t crítico. Com Excel podemos calcular os valores críticos de t usando a função INVT. Lembrando que, no nosso exemplo, α =0,05 e a dimensão da amostra é 49. Em Excel - Selecionar Inserir e depois Função ou clicar em f x. - Escolher a função INVT na categoria Estatística. - Na área Probabilidade inserir o valor de α (0,05). - Na área Graus de liberdade inserir 49. 6
- Clicando OK vamos obter o valor 2,009574018. O valor crítico de t neste teste bilateral é = ± 2,009574018. - Conclusão do teste: aceitamos H 0 porque t β2 = -0,51452 > t crítico = -2,0096. TESTE de hipótese com α =0,05 para um coeficiente teste unilateral H 0 : β 1 0 (uma redução no preço acarreta uma redução na receita total demanda inelástica ao preço) H 1 : β 1 < 0 (uma redução no preço acarreta um aumento na receita total demanda elástica ao preço) βˆ 0 6,6419 t 1 β1 = = = -2,08133 ep( βˆ ) 3,1912 1 Regra de rejeição: Rejeitar H 0 se t -t crítico Vamos calcular o valor crítico seguindo a mesmo procedimento do teste bilateral. A única diferença está no valor a ser inserido na área de Probabilidade. Por default, Excel calcula o valor de t por um teste bilateral. Por isso, no nosso exemplo, agora teremos que inserir o valor 0,10. O resultado será t crítico = 1,67655 (por simetria t crítico = -1,67655). Comparando o valor absoluto de t β1 com este t crítico vamos rejeitar H 0. A evidência da nossa amostra apóia a hipótese que uma redução de preço provoca um aumento na receita total. Ou, em outras palavras, a demanda é elástica ao preço. 7
TESTE de hipótese com α =0,05 para mais de um coeficiente teste F Calcular os valores críticos com Excel função INVF Para calcular o valor crítico de F escolher a função INVF na categoria Estatística. Agora teremos que inserir os graus de liberdade para o numerador na área Graus_liberdade_1 (que é igual ao número de hipóteses testadas em H 0 ) e os graus de liberdade para o denominador na área Graus_liberdade_2 (que é igual a dimensão da amostra menos o número de coeficientes estimados). PREVISÃO Com Excel podemos calcular o valor pontual da previsão, associado à nossa regressão estimada. A regressão estimada é: Tˆ = βˆ + βˆ P βˆ A R 0 1 + 2 RTˆ = 104,785-6,642*P + 2,984*A Para fazer isso, numa célula livre abaixo da saída da regressão, vamos escrever: - os valores de P e A da simulação - a fórmula da nossa previsão 8
9