Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra

Análise da Regressão múltipla: MQO Assintótico Capítulo 5 do Wooldridge

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostras finitas de tamanho n

Inferência em grandes amostras Lembre-se que sob as hipóteses do MLC, as distribuições amostrais são normais, o que nos permite derivar as distribuições t e F nos testes de hipóteses. Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros normais implica que a distribuição de y, dados x s, também é normal. 3

Inferência em grandes amostras (cont.) Observamos y e podemos identificar que existem muitos exemplos em que a normalidade não é verdadeira. Uma variável aleatória y que tenha distribuição normal deverá ter distribuição simétrica em torno de sua média. Qualquer variável assimétrica, como salários, detenções, poupança etc. não podem ser normais pois a normal é simétrica. 4

Inferência em grandes amostras (cont.) Exemplo: Modelo que explica a taxa de participação nos planos de pensão dos EUA. Variável dependente y: prate Análise da variável dependente no gretl - Histograma - Estatísticas descritivas 5

Ver: estatísticas descritivas Estatísticas Descritivas, usando as observações 1-1534 para a variável 'prate' (1534 observações válidas) Média 87,363 Mediana 95,700 Mínimo 3,0000 Máximo 100,00 Desvio padrão 16,717 C.V. 0,19135 Enviesamento -1,5196 Curtose Ex.,584 6

Histograma de prate (variável, gráfico de frequência simples) 0.5 0.4 Frequëncia relativa a 0.3 0. 0.1 0 0 0 40 60 80 100 prate 7

Histograma de prate (variável, gráfico de frequência simples) 0.14 Estatística de teste para normalidade: Qui-quadrado() = 1159,437 p-valor = 0,00000 prate N(87,363 16,717) 0.1 0.1 Densidade 0.08 0.06 0.04 0.0 0 0 0 40 60 80 100 10 140 8

Inferência em grandes amostras (cont.) A normalidade não é necessária para que MQO seja BLUE; ela é necessária apenas para inferência. No exemplo demonstrado, devemos abandonar as estatísticas t para determinar quais variáveis são estatisticamente significantes??? NÃO!!! 9

Teorema do Limite Central Baseado no teorema do limite central, podemos mostrar que os estimadores de MQO são assintoticamente normais. Ou seja, para amostras grandes, eles seguem uma distribuição normal aproximada. A normalidade assintótica implica que P(Z<z) Φ(z) quando n, ou seja, que P(Z<z) Φ(z) 10

Teorema do Limite Central O teorema central do limite diz que a média amostral padronizada de qualquer população com média µ e variância σ é assintoticamente ~N(0,1), ou: Z = Y σ µ n Y a ~ N ( 0,1) 11

Normalidade assintótica Sob as hipóteses de Gauss - Markov, (i) onde (ii) σˆ (iii) n ( ) a ˆ ( β ~ Normal 0, ), j β j σ a j ( ) 1 plim ˆ n r a j é um estimador consistente deσ ( ) ( ) a ˆ β β ep ˆ β ~ Normal( 0,1) j = j j ij 1

Normalidade assintótica (cont.) Como a distribuição t se aproxima da normal, dizemos que: ( ) ( ) a ˆ β β ep ˆ β ~ t j j j n k 1 Observe que, enquanto não precisamos assumir normalidade se a amostra for grande, ainda precisamos da hipótese de homocedasticidade e de média condicional zero. 13

Como é feita a inferência?? Os testes t e a construção dos intervalos de confiança são realizados exatamente da mesma forma anterior, quando considerávamos as hipóteses do Modelo Linear Clássico. ( ) ( ) a ˆ β ˆ j β j ep β j ~ tn k 1 14

Como decidir se o seu tamanho de amostra é suficiente?? Se o tamanho da amostra é grande (pelo menos 1500 observações, p.e.), isto é suficiente para usarmos o Teorema do limite central. Alguns econometristas acham que n = 30 é um tamanho satisfatório. A qualidade da aproximação também depende dos graus de liberdade. Com mais variáveis independentes no modelo, um tamanho da amostra maior é usualmente necessário para usar a aproximação t. 15

Outra estatística: estatística do multiplicador de Lagrange (LM) Uma vez que estamos usando grandes amostras e a normalidade assintótica para inferência, podemos utilizar mais que as estatísticas t e F. A estatística do multiplicador de Lagrange ou estatística LM é um teste alternativo para as restrições múltiplas de exclusão. Também chamada de estatística de escore. A estatística LM também é chamada de estatística nr. 16

Estatística LM (cont) Suponha que tenhamos o modelo y = β 0 + β 1 x 1 + β x +... β k x k + u A hipótese nula seja: H 0 : β k-q+1 = 0,..., β k = 0 q restrições de exclusão no modelo A estatística LM existe apenas a estimação do modelo restrito 17

Estatística LM (cont) ~ ~ ~ y β + β x +... + β x + = 0 1 1 k q k q u ~ Agora, u ~ em x LM = 1 pegue os resíduos, u ~, e faça a regressão de, x nr u,..., x k, onde (i.e., em todas as variáveis) R u é desta regressão. 18

Estatística LM (cont) Se as variáveis omitidas tiverem realmente coeficientes populacionais iguais a zero, então o resíduo encontrado deve ser pelo menos não correlacionado com cada uma dessas variáveis excluídas. R u Ou seja, o deve estar próximo de zero. Como determinar quando a estatística é suficientemente grande para rejeitar a hipótese nula a um nível de significância escolhido? 19

Estatística LM (cont) LM a ~ χ ; então q apenas calcular podemos escolher o valor crítico c, de uma distribuição χ o p - value de χ q q,ou Com uma amostra grande, o resultado dos testes F e LM devem ser similares. 0

Estatística LM: exemplo Modelo do crime (banco de dados: crime1.raw, dados de.75 homens nascidos em 1960 ou 1961 na Califórnia): Variável dependente: narr86 número de vezes que um homem foi preso Variáveis independentes: - pcnv: proporção de prisões anteriores que levaram à condenação. - avgsen: sentença média cumprida de condenações passadas. - tottime: tempo total que o homem passou na prisão em 1986 desde que atingiu a idade de 18 anos. - Ptime86: meses passados na prisão em 1986. - qemp86: número de trimestres, em 1986, durante os quais o homem esteve legalmente empregado. 1

Estatística LM: exemplo Teste: Testar a hipótese nula de que avgsen e tottime não possuem efeito sobre narr86, dado que todos demais fatores foram controlados. Ho: β=β3=0 Passo 1: estimar a regressão sem estas variáveis. Passo : regredir os resíduos desta regressão em todas variáveis independentes.

Modelo irrestrito narr86 = β 0 + β. time86 + β. pcnv + β. avgsen + β. tottime 1 + β. qemp86 + u 4 5 Modelo 1: Estimativas OLS usando as 75 observações 1-75 Variável dependente: narr86 3 + Variável Coeficiente Erro Padrão estatística-t p-valor const 0,706061 0,033154 1,974 <0,00001 *** pcnv -0,1515 0,040855-3,7015 0,000 *** avgsen -0,00704866 0,0141-0,5679 0,57016 tottime 0,010953 0,00957684 1,630 0,0671 ptime86-0,039585 0,00891659-4,409 0,00001 *** qemp86-0,103091 0,010397-9,915 <0,00001 *** Média da variável dependente = 0,404404 Desvio padrão da variável dependente = 0,859077 Soma dos resíduos quadrados = 194,39 Erro padrão dos resíduos = 0,84184 R não-ajustado = 0,047554 R ajustado = 0,0409951 Estatística-F (5, 719) = 4,889 (p-valor < 0,00001) 3

Modelo restrito (passo 1) narr 86 = β0 + β1. pcnv + β4. time86 + β5. qemp86 + u Modelo : Estimativas OLS usando as 75 observações 1-75 Variável dependente: narr86 Variável Coeficiente Erro Padrão estatística-t p-valor const 0,71177 0,0330066 1,5645 <0,00001 *** pcnv -0,14997 0,0408653-3,6688 0,0005 *** ptime86-0,0344199 0,008591-4,0065 0,00006 *** qemp86-0,104113 0,0103877-10,07 <0,00001 *** Média da variável dependente = 0,404404 Desvio padrão da variável dependente = 0,859077 Soma dos resíduos quadrados = 197,7 Erro padrão dos resíduos = 0,841603 R não-ajustado = 0,041333 R ajustado = 0,040663 Estatística-F (3, 71) = 39,0958 (p-valor < 0,00001) 4

Passo uhat = + β. time86 4 β 0 + β. pcnv + β. avgsen + β. tottime 1 + β. qemp86 5 + u Modelo 3: Estimativas OLS usando as 75 observações 1-75 Variável dependente: uhat 3 + Variável Coeficiente Erro Padrão estatística-t p-valor const -0,00571081 0,033154-0,173 0,8635 pcnv -0,0019713 0,040855-0,0317 0,97467 avgsen -0,00704866 0,0141-0,5679 0,57016 tottime 0,010953 0,00957684 1,630 0,0671 ptime86-0,0048386 0,00891659-0,547 0,58741 qemp86 0,001009 0,010397 0,0983 0,9170 Média da variável dependente = 0 Desvio padrão da variável dependente = 0,84114 Soma dos resíduos quadrados = 194,39 Erro padrão dos resíduos = 0,84184 R não-ajustado = 0,00149385 R ajustado = -0,00034319 Estatística-F (5, 719) = 0,813569 (p-valor = 0,54) 5

Estatística LM LM = nru LM =.75.(0,0015) = 4,09 LM a χ ~ valor crítico c(10%) LM = 4,09 < 4,61 = 4,61 6

Regra de rejeição Comparar LM com o valor crítico apropriado, c, de uma distribuição qui-quadrado. Se LM > c, a hipótese nula é rejeitada. LM = 4,09 < 4,61 Não podemos rejeitar a hipótese nula ao nível de 10%!!! 7

P-valor Podemos rejeitar a hipótese nula ao nível de 15% pois o p-valor é menor (1,9%). P( χ > 4,09) = 0,19 Pode consultar o p-valor no gretl: localizador de p-valor, coloque o grau de liberdade e o valor que corresponde a estatística t) Qui-quadrado(): área à direita de 4,09 = 0,1938 (à esquerda: 0,8706) 8

Eficiência assintótica Existem outros estimadores consistentes além do de MQO. No entanto, sob as hipóteses Gauss- Markov, os de MQO terão as menores variâncias assintóticas. Dizemos que MQO são assintoticamente eficientes. 9