Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra

Documentos relacionados
AULA 13 Análise de Regressão Múltipla: MQO Assimptótico

Os Mínimos Quadrados Ordinários Assintóticos

Análise da Regressão múltipla: Inferência. Aula 4 6 de maio de 2013

RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

Inferência em grandes amostras. Análise da Regressão múltipla: MQO Assintótico. Inferência em grandes amostras (cont.)

Aula 2 Uma breve revisão sobre modelos lineares

Análise de Regressão Múltipla: Mínimos Quadrados Ordinários

Análise de Regressão Linear Múltipla IX

Hipóteses do modelo linear clássico (CLM) Análise da Regressão múltipla: Inferência. Hipóteses do CLM (cont.) O teste t. Distribuição normal amostral

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2

Prova de Estatística

Capítulo 4 Inferência Estatística

Estimação e Testes de Hipóteses

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS

Análise Multivariada Aplicada à Contabilidade

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

ECONOMETRIA. Prof. Danilo Monte-Mor

Variáveis Instrumentais

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.

Teste de hipóteses para proporção populacional p

AULA 05 Teste de Hipótese

CONHECIMENTOS ESPECÍFICOS

Estatística e Modelos Probabilísticos - COE241

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

AULA 7 - Inferência em MQO: ICs e Testes de

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Estimação de Variáveis Instrumentais e Mínimos Quadrados de Dois Estágios. Wooldridge, Cápítulo 15

Unidade IV Inferência estatística

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

CONHECIMENTOS ESPECÍFICOS

Teste de Hipóteses Paramétricos

Econometria. Regressão Linear Simples Lista de Exercícios

Quiz Econometria I versão 1

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

Análise de Regressão Linear Múltipla III

AULA 07 Inferência a Partir de Duas Amostras

1 Probabilidade - Modelos Probabilísticos

AULAS 25 E 26 Heteroscedasticidade

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Prova de Estatística

Distribuição Amostral e Estimação Pontual de Parâmetros

Modelo de Regressão Múltipla

Ralph S. Silva

Probabilidade e Estatística

Distribuições Amostrais

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9

Análise de Regressão EST036

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Cap. 8 - Intervalos Estatísticos para uma Única Amostra

Aula 3 - Revisão de Probabilidade e Estatística: Esclarecimento de Dúvidas

Testes de Hipóteses. Curso de Introdução à Econometria usando o R. Vítor Wilher. 1 de Dezembro de analisemacro.com.br

Econometria em Finanças e Atuária

Métodos Quantitativos para Avaliação de Políticas Públicas

BIOESTATÍSTICA. Parte 5 Testes de Hipóteses

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos

AULAS 21 E 22 Análise de Regressão Múltipla: Estimação

7 Teste de Hipóteses

Distribuições por Amostragem

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

5 Avaliação dos estimadores propostos

INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Estatística II - Licenciatura em Gestão Época de Recurso - Parte prática (14 valores) 24/01/2011.

Inferência Estatistica

Métodos Quantitativos Aplicados

Universidade Federal de Lavras

Gabarito - Lista 5 - Questões de Revisão

AULA 04 Teste de hipótese

Testes de Hipóteses Paramétricos

Esse material foi extraído de Barbetta (2007 cap 13)

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

AULA 11 Heteroscedasticidade

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CAMPUS PONTA GROSSA METROLOGIA II

Apontamentos de Introdução às Probabilidades e à Estatística

Estatística Aplicada II. } Regressão Linear

MAB-515 Avaliação e Desempenho (DCC/UFRJ)

Testes de Hipóteses Paramétricos

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

Inferência Estatística

Bioestatística. Mestrado Saúde Materno Infantil 2005 Prof. José Eulálio Cabral Filho

AULA 9 - MQO em regressão múltipla: Propriedades Estatísticas (Valor Esperado)

CONHECIMENTOS ESPECÍFICOS

Capítulo 3 Estatísticas para Descrição, Exploração e Comparação de Dados. Seção 3-1 Visão Geral. Visão Geral. Estatísticas Descritivas

Conceitos Básicos Teste t Teste F. Teste de Hipóteses. Joel M. Corrêa da Rosa

Distribuições derivadas da distribuição Normal. Distribuição Normal., x real.

Estatística Aplicada a Negócios

Correlação Serial e Heterocedasticidade em Regressões de Séries Temporais. Wooldridge, Cap. 12

Transcrição:

Análise da Regressão múltipla: MQO Assintótico Capítulo 5 do Wooldridge

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostras finitas de tamanho n

Inferência em grandes amostras Lembre-se que sob as hipóteses do MLC, as distribuições amostrais são normais, o que nos permite derivar as distribuições t e F nos testes de hipóteses. Essa normalidade exata vem da hipótese de os erros terem distribuição normal. Essa hipótese de erros normais implica que a distribuição de y, dados x s, também é normal. 3

Inferência em grandes amostras (cont.) Observamos y e podemos identificar que existem muitos exemplos em que a normalidade não é verdadeira. Uma variável aleatória y que tenha distribuição normal deverá ter distribuição simétrica em torno de sua média. Qualquer variável assimétrica, como salários, detenções, poupança etc. não podem ser normais pois a normal é simétrica. 4

Inferência em grandes amostras (cont.) Exemplo: Modelo que explica a taxa de participação nos planos de pensão dos EUA. Variável dependente y: prate Análise da variável dependente no gretl - Histograma - Estatísticas descritivas 5

Ver: estatísticas descritivas Estatísticas Descritivas, usando as observações 1-1534 para a variável 'prate' (1534 observações válidas) Média 87,363 Mediana 95,700 Mínimo 3,0000 Máximo 100,00 Desvio padrão 16,717 C.V. 0,19135 Enviesamento -1,5196 Curtose Ex.,584 6

Histograma de prate (variável, gráfico de frequência simples) 0.5 0.4 Frequëncia relativa a 0.3 0. 0.1 0 0 0 40 60 80 100 prate 7

Histograma de prate (variável, gráfico de frequência simples) 0.14 Estatística de teste para normalidade: Qui-quadrado() = 1159,437 p-valor = 0,00000 prate N(87,363 16,717) 0.1 0.1 Densidade 0.08 0.06 0.04 0.0 0 0 0 40 60 80 100 10 140 8

Inferência em grandes amostras (cont.) A normalidade não é necessária para que MQO seja BLUE; ela é necessária apenas para inferência. No exemplo demonstrado, devemos abandonar as estatísticas t para determinar quais variáveis são estatisticamente significantes??? NÃO!!! 9

Teorema do Limite Central Baseado no teorema do limite central, podemos mostrar que os estimadores de MQO são assintoticamente normais. Ou seja, para amostras grandes, eles seguem uma distribuição normal aproximada. A normalidade assintótica implica que P(Z<z) Φ(z) quando n, ou seja, que P(Z<z) Φ(z) 10

Teorema do Limite Central O teorema central do limite diz que a média amostral padronizada de qualquer população com média µ e variância σ é assintoticamente ~N(0,1), ou: Z = Y σ µ n Y a ~ N ( 0,1) 11

Normalidade assintótica Sob as hipóteses de Gauss - Markov, (i) onde (ii) σˆ (iii) n ( ) a ˆ ( β ~ Normal 0, ), j β j σ a j ( ) 1 plim ˆ n r a j é um estimador consistente deσ ( ) ( ) a ˆ β β ep ˆ β ~ Normal( 0,1) j = j j ij 1

Normalidade assintótica (cont.) Como a distribuição t se aproxima da normal, dizemos que: ( ) ( ) a ˆ β β ep ˆ β ~ t j j j n k 1 Observe que, enquanto não precisamos assumir normalidade se a amostra for grande, ainda precisamos da hipótese de homocedasticidade e de média condicional zero. 13

Como é feita a inferência?? Os testes t e a construção dos intervalos de confiança são realizados exatamente da mesma forma anterior, quando considerávamos as hipóteses do Modelo Linear Clássico. ( ) ( ) a ˆ β ˆ j β j ep β j ~ tn k 1 14

Como decidir se o seu tamanho de amostra é suficiente?? Se o tamanho da amostra é grande (pelo menos 1500 observações, p.e.), isto é suficiente para usarmos o Teorema do limite central. Alguns econometristas acham que n = 30 é um tamanho satisfatório. A qualidade da aproximação também depende dos graus de liberdade. Com mais variáveis independentes no modelo, um tamanho da amostra maior é usualmente necessário para usar a aproximação t. 15

Outra estatística: estatística do multiplicador de Lagrange (LM) Uma vez que estamos usando grandes amostras e a normalidade assintótica para inferência, podemos utilizar mais que as estatísticas t e F. A estatística do multiplicador de Lagrange ou estatística LM é um teste alternativo para as restrições múltiplas de exclusão. Também chamada de estatística de escore. A estatística LM também é chamada de estatística nr. 16

Estatística LM (cont) Suponha que tenhamos o modelo y = β 0 + β 1 x 1 + β x +... β k x k + u A hipótese nula seja: H 0 : β k-q+1 = 0,..., β k = 0 q restrições de exclusão no modelo A estatística LM existe apenas a estimação do modelo restrito 17

Estatística LM (cont) ~ ~ ~ y β + β x +... + β x + = 0 1 1 k q k q u ~ Agora, u ~ em x LM = 1 pegue os resíduos, u ~, e faça a regressão de, x nr u,..., x k, onde (i.e., em todas as variáveis) R u é desta regressão. 18

Estatística LM (cont) Se as variáveis omitidas tiverem realmente coeficientes populacionais iguais a zero, então o resíduo encontrado deve ser pelo menos não correlacionado com cada uma dessas variáveis excluídas. R u Ou seja, o deve estar próximo de zero. Como determinar quando a estatística é suficientemente grande para rejeitar a hipótese nula a um nível de significância escolhido? 19

Estatística LM (cont) LM a ~ χ ; então q apenas calcular podemos escolher o valor crítico c, de uma distribuição χ o p - value de χ q q,ou Com uma amostra grande, o resultado dos testes F e LM devem ser similares. 0

Estatística LM: exemplo Modelo do crime (banco de dados: crime1.raw, dados de.75 homens nascidos em 1960 ou 1961 na Califórnia): Variável dependente: narr86 número de vezes que um homem foi preso Variáveis independentes: - pcnv: proporção de prisões anteriores que levaram à condenação. - avgsen: sentença média cumprida de condenações passadas. - tottime: tempo total que o homem passou na prisão em 1986 desde que atingiu a idade de 18 anos. - Ptime86: meses passados na prisão em 1986. - qemp86: número de trimestres, em 1986, durante os quais o homem esteve legalmente empregado. 1

Estatística LM: exemplo Teste: Testar a hipótese nula de que avgsen e tottime não possuem efeito sobre narr86, dado que todos demais fatores foram controlados. Ho: β=β3=0 Passo 1: estimar a regressão sem estas variáveis. Passo : regredir os resíduos desta regressão em todas variáveis independentes.

Modelo irrestrito narr86 = β 0 + β. time86 + β. pcnv + β. avgsen + β. tottime 1 + β. qemp86 + u 4 5 Modelo 1: Estimativas OLS usando as 75 observações 1-75 Variável dependente: narr86 3 + Variável Coeficiente Erro Padrão estatística-t p-valor const 0,706061 0,033154 1,974 <0,00001 *** pcnv -0,1515 0,040855-3,7015 0,000 *** avgsen -0,00704866 0,0141-0,5679 0,57016 tottime 0,010953 0,00957684 1,630 0,0671 ptime86-0,039585 0,00891659-4,409 0,00001 *** qemp86-0,103091 0,010397-9,915 <0,00001 *** Média da variável dependente = 0,404404 Desvio padrão da variável dependente = 0,859077 Soma dos resíduos quadrados = 194,39 Erro padrão dos resíduos = 0,84184 R não-ajustado = 0,047554 R ajustado = 0,0409951 Estatística-F (5, 719) = 4,889 (p-valor < 0,00001) 3

Modelo restrito (passo 1) narr 86 = β0 + β1. pcnv + β4. time86 + β5. qemp86 + u Modelo : Estimativas OLS usando as 75 observações 1-75 Variável dependente: narr86 Variável Coeficiente Erro Padrão estatística-t p-valor const 0,71177 0,0330066 1,5645 <0,00001 *** pcnv -0,14997 0,0408653-3,6688 0,0005 *** ptime86-0,0344199 0,008591-4,0065 0,00006 *** qemp86-0,104113 0,0103877-10,07 <0,00001 *** Média da variável dependente = 0,404404 Desvio padrão da variável dependente = 0,859077 Soma dos resíduos quadrados = 197,7 Erro padrão dos resíduos = 0,841603 R não-ajustado = 0,041333 R ajustado = 0,040663 Estatística-F (3, 71) = 39,0958 (p-valor < 0,00001) 4

Passo uhat = + β. time86 4 β 0 + β. pcnv + β. avgsen + β. tottime 1 + β. qemp86 5 + u Modelo 3: Estimativas OLS usando as 75 observações 1-75 Variável dependente: uhat 3 + Variável Coeficiente Erro Padrão estatística-t p-valor const -0,00571081 0,033154-0,173 0,8635 pcnv -0,0019713 0,040855-0,0317 0,97467 avgsen -0,00704866 0,0141-0,5679 0,57016 tottime 0,010953 0,00957684 1,630 0,0671 ptime86-0,0048386 0,00891659-0,547 0,58741 qemp86 0,001009 0,010397 0,0983 0,9170 Média da variável dependente = 0 Desvio padrão da variável dependente = 0,84114 Soma dos resíduos quadrados = 194,39 Erro padrão dos resíduos = 0,84184 R não-ajustado = 0,00149385 R ajustado = -0,00034319 Estatística-F (5, 719) = 0,813569 (p-valor = 0,54) 5

Estatística LM LM = nru LM =.75.(0,0015) = 4,09 LM a χ ~ valor crítico c(10%) LM = 4,09 < 4,61 = 4,61 6

Regra de rejeição Comparar LM com o valor crítico apropriado, c, de uma distribuição qui-quadrado. Se LM > c, a hipótese nula é rejeitada. LM = 4,09 < 4,61 Não podemos rejeitar a hipótese nula ao nível de 10%!!! 7

P-valor Podemos rejeitar a hipótese nula ao nível de 15% pois o p-valor é menor (1,9%). P( χ > 4,09) = 0,19 Pode consultar o p-valor no gretl: localizador de p-valor, coloque o grau de liberdade e o valor que corresponde a estatística t) Qui-quadrado(): área à direita de 4,09 = 0,1938 (à esquerda: 0,8706) 8

Eficiência assintótica Existem outros estimadores consistentes além do de MQO. No entanto, sob as hipóteses Gauss- Markov, os de MQO terão as menores variâncias assintóticas. Dizemos que MQO são assintoticamente eficientes. 9