AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

Documentos relacionados
AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

AULA 7 - Inferência em MQO: ICs e Testes de

Análise da Regressão múltipla: Inferência. Aula 4 6 de maio de 2013

AULA 9 - MQO em regressão múltipla: Propriedades Estatísticas (Valor Esperado)

RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Aula 3 - Revisão de Probabilidade e Estatística: Esclarecimento de Dúvidas

AULA 8 - MQO em regressão múltipla:

Hipóteses do modelo linear clássico (CLM) Análise da Regressão múltipla: Inferência. Hipóteses do CLM (cont.) O teste t. Distribuição normal amostral

AULA 05 Teste de Hipótese

Análise Multivariada Aplicada à Contabilidade

Probabilidade e Estatística

AULA 04 Teste de hipótese

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Inferência estatística

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos

Métodos Quantitativos

AULA 4 - MQO Simples: Propriedades algébricas e Estatísticas

Modelos de Regressão Linear Simples - parte III

Testes de Hipótese para uma única Amostra - parte I

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Cap. 8 - Intervalos Estatísticos para uma Única Amostra

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Métodos Quantitativos para Avaliação de Políticas Públicas

Prova de Estatística

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Bioestatística e Computação I

1 Probabilidade - Modelos Probabilísticos

Inferência Estatística

Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski

7 Teste de Hipóteses

AULA 1 - Modelos determinísticos vs Probabiĺısticos

Inferência para duas populações

TESTE DE HIPÓTESE. Introdução

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Cap. 4 - Estimação por Intervalo

Testes de Hipótese para uma única Amostra - parte II

Testes de Hipóteses. Curso de Introdução à Econometria usando o R. Vítor Wilher. 1 de Dezembro de analisemacro.com.br

Estatística e Modelos Probabilísticos - COE241

1 Teoria da Decisão Estatística

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

Inferência Estatistica

Prova de Estatística

AULA 07 Inferência a Partir de Duas Amostras

Introdução ao modelo de Regressão Linear

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Capítulo 4 Inferência Estatística

Modelos de Regressão Linear Simples parte I

Modelos de Regressão Linear Simples - parte I

Estimativas e Tamanhos de Amostras

Lista de Exercícios #8 Assunto: Teste de Hipóteses

Análise de Regressão EST036

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.

INFERÊNCIA ESTATÍSTICA. ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p

(a) Teste e IC para Duas Variâncias. (b) Teste para médias. Duas Amostras de Teste T e IC

AULA 13 Análise de Regressão Múltipla: MQO Assimptótico

Estimação e Testes de Hipóteses

Testes de Hipótese para uma única Amostra - parte II

Nota de Aula: Uma Primeira Forma para se Desenvolver o Teste de F para Hipóteses sobre Combinações Linear dos Coeficientes da Regressão

Probabilidade e Estatística

Testes de Hipóteses Paramétricos

Testes de Hipóteses II

AULAS 21 E 22 Análise de Regressão Múltipla: Estimação

Correlação e Regressão

Testes de Hipóteses Paramétricos

Análise de Regressão Múltipla: Mínimos Quadrados Ordinários

AULA 11 Heteroscedasticidade

AULAS 24 E 25 Análise de Regressão Múltipla: Inferência

Inferência Estatística:

Exemplo 1: Sabemos que a média do nível sérico de colesterol para a população de homens de 20 a 74 anos é 211 mg/100ml.

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

MAE Planejamento e Pesquisa II

Análise de Regressão EST036

Aula 9 Intervalo de confiança para a média da N(μ; σ 2 ), σ 2 desconhecida

Estatística Inferencial

Razão para rejeitar H 0

CONHECIMENTOS ESPECÍFICOS

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos

Teste de Hipótese e Intervalo de Confiança

Carlos Antonio Filho

Introdução à Bioestatística Turma Nutrição

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

Gabarito - Lista 5 - Questões de Revisão

Regressão Linear Simples

AULA 03 Estimativas e tamanhos amostrais

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

Tópicos em Gestão da Informação II

1. (a) Lembre-se que a média de uma variável aleatória discreta é uma média ponderada de seus valores, com as probabilidades sendo os pesos.

Transcrição:

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1 Susan Schommer Econometria I - IE/UFRJ

Distribuições amostrais dos estimadores MQO Nas aulas passadas derivamos o valor esperado e variância dos estimadores Para a inferência estatísticas precisamos saber não só os dois primeiros monentos de ˆβ j, mas também a distribuição completa de ˆβ j. Pelo teorema de Markov que vimos na aula passada a distribuição de ˆβ j poderia ser qualquer. Para tornar as distribuições amostrais de ˆβ j passíveis de tratamento, vamos assumir que o erro não observado é normalmente distribuído na população (Hipótese da normalidade. H6 [Normalidade] O erro populacional u é independente das variáveis explicativas x 1, x 2,..., x k e é normalmente distribuído com média zero e variância σ 2 : u Normal(0, σ 2 )

Distribuições amostrais dos estimadores MQO Sendo y escrito como uma combinação linear de u, podemos escrever y x Normal(α, β 1 x 1 +... + β k x k, σ 2 ) Sob H1 a H6 condicional aos valores amostrais das variáveis independentes, ˆβ j Normal[β j, V ar( ˆβ j )] e que V ar( ˆβ j ) = ( ˆβ j β j )/dp( ˆβ j ) Normal(0, 1) Isso é verdade pois cada ˆβ j = β j + ω ij u i onde ω j são ponderadores formados por variáveis independentes (não aleatórios). Assim ˆβ j é uma combinação linear dos erros u i na amostra. Temos uma função linear de uma variável aleatória (va) possui a mesma distribuição da va.

Distribuições amostrais dos estimadores MQO Podemos dizer ainda mais: qualquer combinação linear dos ˆα, ˆβ 1,..., ˆβ k também é normalmente distribuída, e qualquer subconjunto dos ˆβ j tem uma distribuição normal conjunta. A hipótese da normalidade dos erros, pode não ser reaĺıstica para amostras pequenas, mas para amostras grandes a normalidade dos estimadores de MQO ainda é aproximadamente verdadeira, mesmo sem normalidade dos erros.

Teste de hipótese Como nunca saberemos quem são os β j, a única coisa que podemos fazer são hipóteses sobre o valor de β j e em seguida, utilizar inferência estatística para testar nossa hipótese. Vimos que a variância do estimador padronizado sob as hipóteses H1 a H6 ( ˆβ j β j )/dp( ˆβ j ) Normal(0, 1) neste caso temos que o desvio padrão é função do desvio padrão do erro σ Entretanto, σ é um parâmetro populacional que não conhecemos Se considerarmos a estimativa do σ denotada por ˆσ temos agora que ˆσ é uma varável aleatória e não mais uma constante como o parâmetro populacional. Então ( ˆβ j β j )/ep( ˆβ j ) t n k 1 agora passa a ter distribuição t

Teste de hipótese O resultado acima é importante porque permite testar hipóteses que envolvam os β j. Na maioria das aplicações, nosso principal interesse é testar a hipótese nula H 0 : β j = 0 em que j corresponde a qualquer uma das k variáveis independentes. Interpretação correta: Uma vez que x 1, x 2,..., x j 1, x j+1,..., x k foram considerados, x j não tem nenhum efeito sobre o valor esperado de y.

Teste de hipótese Example Equação do salário: log(salárioh) = α + β 1 educ + β 2 exper + β 3 perm + u A H 0 : β 2 = 0 significa que, uma vez que a educação formal e a permanência foram consideradas, o número de anos no mercado de trabalho (exper) não tem nenhum efeito sobre o salário-hora. Se β 2 > 0 então a experiência prévia de trabalho contribui para a produtividade e, portanto, para o salário.

Teste de hipótese A estatística t de ˆβ j é definida como t ˆβj = ˆβ j ep( ˆβ j ) Observe que como ep( ˆβ j ) é sempre positivo, t ˆβj tem o mesmo sinal de ˆβ j Qualquer estimativa pontual de ˆβ j nunca será exatamente zero, seja H 0 verdadeira ou não. A questão é: quão distante está ˆβ j de zero? Um valor grande de ˆβ j não garante isso, pois existe um erro amostral em nossa estimativa de ˆβ j, de modo que o tamanho de ˆβ j deve ser ponderado pelo seu erro amostral. Como o erro-padrão de ˆβ j é uma estimativa do desvio-padrão de ˆβ j, t ˆβj mede quantos desvios-padrão estimados ˆβ j estão afastados de zero.

Teste contra hipóteses alternativas unilaterais Precisamos decidir sobre a hipótese alternativa relevante. Considere primeiro a hipótese alternativa unilateral do tipo H 1 : β j > 0 Esta hipótese pode ser baseada na teoria econômica. Temos que o valor esperado de t ˆβj é positivo. Assim estamos procurando um valor positivo suficientemente grande de t ˆβj a fim de rejeitar H 0 : β j = 0 em favor de H 1 : β j > 0 A definição de suficientemente grande com por exemplo nível de signficância de 5%, é o 95 o percentil de uma distribuição t com n k 1 graus de liberdade; denominaremos o ponto de c

Teste contra hipóteses alternativas unilaterais A regra de rejeição é que H 0 é rejeitada em favor de H 1, ao nível de significância de 5% se t ˆβj > c Essa regra de rejeição é um exemplo de um teste monocaudal. Para obter c, necessitamos somente do nível de signifância e dos graus de liberdade. Ex: teste com nível de 5% e com n k 1 = 28 graus de liberdade o valor crítico é c = 1, 701. Se t ˆβj < 1, 701 não rejeitamos H 0, se for a 1% temos c = 2, 467, ou seja, quando menor o nível, maior é o c de modo que para rejeitar H 0, exigimos um valor cada vez maior de t ˆβj.

Teste contra hipóteses alternativas unilaterais Se H 0 é rejeitada a 5% será automaticamente a 10%. A medida que aumentamos os graus de liberdade da distribuição t, ela se aproxima da distribuição normal padronizada (ex a partir de 120). Para o teste em que a hipótese alternativa unilateral cujo parâmetro é menor que zero, a regra de rejeição é: t ˆβj < c

Teste contra hipóteses alternativas bilaterais É comum testar H 0 : β j = 0 contra uma hipótese alternativa bilateral H 1 : β j 0 ela é uma hipótese alternativa relevante quando o sinal de β j não é bem determinada pela teoria. Quando a alternativa é bilateral, estamos interessados no valor absoluto da estatística t. A regra de rejeição é: t ˆβj > c. Para achar c, vamos especificar novamente um nível de significância, por exemplo, de 5%. Assim, em cada cauda da distribuição t será igual a 2, 5%. Quando a hipótese alternativa específica não é formulada, considera-se geralmente que é bilateral.

Teste de outras hipóteses sobre β j Algumas vezes estamos interessados em testar se β j é igual a alguma constante. Os exemplos mais comuns são β j = 1 e β j = 1. De forma geral temos: H 0 : β j = a j em que a j é o nosso valor hipotético de β j. A estatística t apropriada é t = ( ˆβ j a j )/ep( ˆβ j )

Cálculos dos p-valores dos testes t Podemos perguntar: dado o valor observado da estística t, qual é o menor nível de significância ao qual a hipótese nula seria rejeitada? Esse nível é conhecido como p-valor do teste. Obtemos o p-valor real ao calcular a probabilidade de que a variável aleatória t, com 40 gl seja maior que 1,85 em valor absoluto. O cálculo é muito trabalhoso, mas os programas de computador já fornecem esse resultado. O p-valor mais comum é: P ( T > t ) em que T representa a variável aleatória com distribuição t com n k 1 gl e t é o valor numérico da estatística do teste.

Significância econômica versus estatística Se a variável é estatisticamente signficante, discuta a magnitude do coeficiente para ter um idéia de sua importância prática ou economômica. Se a variável não é estatisticamente significante aos níveis usuais, pergunte se a variável tem o efeito esperado sobre y e se tal efeito é, na prática, grande. Se for grande calcule o p-valor. É comum encontrar variáveis com estatísticas t pequenas que têm o sinal errado (podemos apenar ignorar). Se a estatística for grande isso é um problema mais grave (em geral isso está relacionado com a omissão de uma variável relevante)

Intervalos de confiança Os intervalos de confiança (ou estimativas de intervalo), dão uma extensão dos valores prováveis do parâmetro populacional, e não somente uma estimativa pontual. Usando o fato que ( ˆβ j β j )/ep( ˆβ j ) t n k 1 uma simples manipulação algébrica leva a um IC do β j desconhecido. Um intervalo de confiança de 95% é dado por ˆβ j ± c ep( ˆβ j ) Se as amostras aleatórias fossem obtidas repetidas vezes, então o valor populacional β j estaria dentro do intervalo em 95% das amostras. Vale lembrar que o IC não será bom se temos MQO viesado, ou se heterocedasticidade está presente, então o erro-padrão não é válido.