Estatística Aplicada II } Regressão Linear 1
Aula de hoje } Tópicos } Regressão Linear } Referência } Barrow, M. Estatística para economia, contabilidade e administração. São Paulo: Ática, 007, Cap. 7 e 8
Aula de hoje Objetivos: } Entender a causalidade entre variáveis através da análise de regressão 3
Revisão
Covariância } Dados n pares de valores (x 1, y 1 )..., (x n, y n ), chamaremos de covariância entre as variáveis X e Y, na população: cov( X, Y) n i = = 1 ( x x)( y y) } Para calcular a covariância na amostra, devemos dividir por n-1 e não por n } É a média dos produtos dos valores centrados das variáveis } Tendo esta definição, podemos escrever o coeficiente de correlação como: corr ( X, Y) = i n cov( X, Y) dp( X ). dp( Y) i 5
Os resultados são significantes? Ø H 0 : r = 0 H 1 : r 0 Ø A estatística do teste é: t = r n 1 r Ø A qual tem distribuição t com n- graus de liberdade 6
Teste de Hipótese } As etapas do teste são: 1. Escrever as hipóteses alternativas e nulas. Escolher o nível de significância do teste α 3. Calcular a estatística t, conhecida como a estatística do teste 4. Calcular o valor crítico do teste t *, 5. Decidir: Se o valor absoluto de t for maior do que o de t *, rejeitar H 0 com um nível de confiança de 1-α 7
Regressão Linear Simples Ø Modelo linear para explicar a variável Y, denominada variável dependente, explicada ou endógena como função da variável X, denominada variável independente, explicativa ou exógena 8
Regressão Linear Simples 60 Birth rate 50 40 Y ˆ = a + bx 3.6 30 0 10 0-1.0 0.0 1.0.0 3.0 4.0 5.0 6.0 7.0 8.0 Growth rate 9
Regressão Linear Simples 40 Birth rate 35 30 error, e 5 3 3.5 4 Growth rate 10
Regressão Linear Simples Ø A relação entre valor observado de Y e valor previsto de Y pelo modelo é dada por: Y = Yˆ + e Y = a + bx + e 11
Regressão Linear Simples Ø Os valores de a e b são dados pela minimização da soma do quadrado dos erros. Tem-se: e e b n n XY X X Y ( X ) a Y bx 1
Regressão Linear and Simples birth rates Country Birth rate GNP growth Y X Y X XY Brazil 30 5.1 900 6.01 153.0 Colombia 9 3. 841 10.4 9.8 Costa Rica 30 3.0 900 9.00 90.0 India 35 1.4 1,5 1.96 49.0 Mexico 36 3.8 1,96 14.44 136.8 Peru 36 1.0 1,96 1.00 36.0 Philippines 34.8 1,156 7.84 95. Senegal 48 0.3,304 0.09 14.4 South Korea 4 6.9 576 47.61 165.6 Sri Lanka 7.5 79 6.5 67.5 Taiwan 1 6. 441 38.44 130. Thailand 30 4.6 900 1.16 138.0 Total 380 40. 1,564 184.04 1,139.7 13
Regressão Linear Simples 35 TSS component Y i Yˆi Y RSS component 30 3 Growth rate X.8 14
Regressão Linear Simples Ø Mensuração da qualidade do ajuste: R RSS TSS Em que: TSS Y Y Y ny ˆ ESS Y Y Y a Y b XY 15
Inferência
Regressão Linear Simples - Inferência Ø Considere: Y i = a + bx i + e i Ø Utilizamos dados amostrais para calcular a e b. Ø Os valores a e b são estimativas dos verdadeiros parâmetros populacionais alpha e beta. 17
Regressão Linear Simples - Inferência Ø Podemos testar hipóteses com relação aos parâmetros populacionais Ø Para isso, precisamos calcular o desvio-padrão associado a cada uma delas. Ø A variância iance de b of é dada is por: given s b s i e ( X X ) 18
Regressão Linear Simples - Inferência 19 Ø Em que a variância estimada do erro é dada por: Ø A variância de a é dada por: n ESS n e s i e ) ( 1 X X X n s s i e a
Regressão Linear Simples - Inferência Ø Estamos prontos para testar hipóteses com relação aos valores dos parâmetros populacionais Ø Exemplo: H 0 : = 0 H 1 : 0 Ø A estatística do teste é: t b s b ~ tn 0
Regressão Linear Simples - Inferência Ø Podemos também criar intervalos de confiança para os parâmetros populacionais. Ø Como exercício, crie o intervalo de confiança de 95% para beta em nosso exemplo. 1
Regressão Linear Simples - Inferência Ø Podemos também testar se o valor do verdadeiro R-squared é igual a zero: H 0 : R = 0 H 1 : R > 0 Ø Nesse caso, a estatística do teste é: F R 1 ~ F 1, n 1 R n
Regressão Linear Múltipla
Regressão Linear Múltipla Ø Se a variável dependente for uma função de k variáveis explicativas, tem-se: Y b 0 b X 1 1 b X b k X k e Ø Como anteriormente, os valores dos parâmetros são estimados através da minimização da soma dos quadrados dos resíduos. 4
Regressão Linear Múltipla Ø Exemplo: Demanda por Importações Year Imports GDP GDP deflator Price of imports RPI all items 1973 18.8 74.0 4.6 1.5 5.1 1974 7.0 83.8 8.7 31.3 9.1 1975 8.7 105.9 35.7 35.6 36.1 : : : : : : 003 314.8 1110.3 195.6 106.7 191.7 004 333.7 1176.5 01.0 106. 197.4 005 366.5 14.7 05.4 110.7 0.9 5
Regressão Linear Múltipla Ø Gráfico das séries em termos reais 900 150 800 140 700 130 600 10 500 110 400 100 300 90 00 80 100 70 0 60 1973 1975 1977 1979 1981 1983 1985 1987 1989 1991 1993 1995 1997 1999 001 003 005 Real imports Real GDP Real import prices 6
Regressão Linear Múltipla Ø Gráfico das importações e PIB, ambas em termos reais 900 800 Real imports 700 600 500 400 300 0 50 100 150 00 50 300 350 Real GDP 7
Regressão Linear Múltipla Ø Gráfico das importações e preços de importados, ambos em termos reais Real imports 150.0 140.0 130.0 10.0 110.0 100.0 90.0 80.0 70.0 60.0 50.0 100.0 150.0 00.0 50.0 300.0 Import prices 8
Regressão Linear Múltipla Ø Os valores dos parâmetros estimados, bem como as informações para testes de hipóteses calculados no lab estão apresentados a seguir: Coefficients Standard Error t Stat P-value Intercept -17.61 73.33 -.35 0.03 Real GDP 0.59 0.06 9.1 0.00 Real import prices 0.05 0.37 0.13 0.90 Ø Adicionalmente, o R-squared reportado foi de 0.96 9
Regressão Linear Múltipla Ø O teste de significância do R-squared está sumarizado na tabela a seguir: ANOVA df SS MS F Significance F Regression 19031.05 64515.5 368.3 7.805E-1 Residual 8 4905.70 175.0 Total 30 133936.75 30
Regressão Linear Múltipla Ø Estimando-se o modelo em logs, obtem-se: Coefficients Standard Error t Stat P-value Intercept -3.60 1.65 -.17 0.04 ln GDP 1.66 0.15 11.31 0.00 ln import prices -0.41 0.16 -.56 0.0 Ø Com coeficiente de determinação de 0.98, significantemente diferente de zero. 31