Econometria I Lista 4: Inferência Professora: Fabiana Fontes Rocha Monitora: Camila Steffens 07 de maio de 2018 Instruções: Objetivos com a lista: estruturação do conteúdo e compreensão da matemática e da estatística envolvidas (com questão conceitual e teórica) e entendimento de problemas práticos (questões interpretativas). Materiais de apoio: 1. Introdução à Econometria, Jeffrey Wooldridge: capítulo 4. 2. Introductory Econometrics, Wooldridge. Appendix D: Summary of Matrix Algebra. 3. Introductory Econometrics, Wooldridge. Appendix E: The Linear Regression Model in Matrix Form. 4. Materiais de aula. Data de entrega: previamente à aula de monitoria do dia 14/05/2018. 1
I. Questões teóricas 1. Argumente que, se o 0 pertence ao intervalo de confiança de 1 α para ˆβ 1, então não é possível rejeitar a hipótese nula de H 0 : β 1 = 0 ao nível de significância de α. 2. Dado o modelo linear y = β 0 + β 1 x + ɛ, mostre a equivalência entre as estimativas de MQO matriciais e os estimadores de MQO derivados do modelo de regressão simples (primeira parte do curso). 3. Mostre que a hipótese de ausência de multicolinearidade perfeita em um modelo de regressão linear múltipla é equivalente à hipótese de posto pleno da matriz de dados X. 4. Mostre que a variância dos estimadores de MQO pode ser escrita da seguinte forma: V ar( ˆβ j ) = σ 2 SQT j (1 Rj 2 ). Dica: considere a interpretação de regressão múltipla na forma particionada. 2
II. Questões interpretativas 1. O Ministério da Saúde o contratou para fazer uma análise sobre o comportamento relacionado ao consumo de cigarros. Para tanto, foram coletadas algumas informações de uma amostra aleatória e rodado o comando abaixo especificado. Ao imprimir os resultados do modelo, algumas regiões estavam borradas, como na Figura 1. Para deixar a situação mais complicada, você está sem a base de dados para re-estimar o modelo. reg cigarros idade idade sqr imc tv moradores Figura 1: Resultados do Modelo estimado Resultados obtidos no Stata, a partir da regressão acima com uma amostra da PNS 2013. A variável cigarro é a quantidade de cigarros consumida diariamente, assumindo 0 para não fumantes. A variável idade s qr é a idade 2. A variável imc é o Índice de Massa Corporal, em que imc = peso altura 2. A variável tv é a quantidade de horas diárias que o indivíduo assiste televisão; e moradores é a quantidade de moradores no domicílio. 3
No entanto, como você sempre frequentou as aulas e as monitorias de Econometria I, essa situação não é uma dificuldade, pois você está apto a preencher as lacunas. a) Calcule o valor da Soma dos Quadrados Explicados (SS Model). b) Calcule o valor da Soma dos Quadrados Totais (SS). c) Calcule o R 2. d) Ache o número de observações dessa amostra. e) Ache o β i dade e sua respectiva estatística t. f) Calcule o intervalo de confiança de β idade 2. g) Calcule o p-valor de β imc. Dica: o teste é bicaudal. h) Calcule o erro padrão de β moradores. i) Calcule a estatística t da constante. j) Escreva o modelo econométrico com todos os coeficientes estimados. k) Agora faça uma breve análise, interpretando os coeficientes estimados e discorrendo sobre sua significância. 2. A tabela abaixo apresenta os resultados da estimação de modelos que buscam explicar o salário mensal recebido por uma subamostra de mulheres através de algumas variáveis explicativas. Com base nessa tabela, responda as seguintes questões. a) A variável que mensura a quantidade de moradores no domicílio, domicilio, tem efeito significativo sobre o salário? Se sim, explique esse efeito. b) Comente o efeito do educ sobre o salário. O que o o fato de a inclusão da variável domicilio ter mudado o coeficiente estimado de educ pode estar mostrando? c) A hipótese de que idade e domicilio são conjuntamente nulas foi levantada. Embase sua resposta para refutar ou não tal hipótese. Obs.: Considere todos os modelos. d) Qual a possível interpretação para o fato de que idade tem relação negativa com o salário no modelo (2) e relação positiva no modelo (3)? e) Comente a diferença entre os modelos (3) e (4), atentando para o papel do intercepto nessas regressões. 4
Tabela 1: Resultados da regressão Variável depedente: Salário Var. Indep. (1) (2) (3) (4) horas 17.15 17.10 17.12 11.97 (0.328) (0.329) (0.329) (0.288) educ 184.8 182.4 182.2 162.0 (1.118) (1.141) (1.141) (0.955) domicilio - -31.45-31.35-101.3 - (3.487) (3.487) (2.736) idade - -1.380 1.688-7.341 - (0.179) (0.734) (0.680) idade 2 - - -0.0294 0.0480 - - (0.00683) (0.00641) constante -892.2-727.0-763.1 - (16.09) (22.19) (23.72) - Observações 155,510 155,510 155,510 155,510 R 2 0.167 0.168 0.168 0.488 Erros padrão em parênteses Modelos estimados com uma subamostra de mulheres da PNAD-Contínua de 2016. O salário consiste no salário nominal, em Reais, recebido no trabalho principal; horas é a quantidade de horas semanais efetivamente trabalhada; educ é o número de anos de educação; domicilio é a quantidade de moradores no domicílio; idade é a idade da mulher. 5
3. Supondo que se queira estimar o seguinte modelo: y i = β 0 + β 1 x i1 + β 2 x i2 + ɛ i (1) As seguintes informações estão disponíveis: X T X = 33 0 0 0 40 20 0 20 60, XT y = 132 24 92, i (y i y) 2 = 150 a) Qual é o tamanho da amostra? b) Estime o vetor β = (β 0, β 1, β 2 ). Interprete os coeficientes estimados ˆβ 1 e ˆβ 2 enquanto efeitos parciais. c) Sob homoscedasticidade, calcule a estatística para o teste da hipótese H 0 : β 1 = 0. Interprete a rejeição ou a não rejeição da hipótese nula ao nível de significância de 5%. d) Como você testaria a hipótese H 0 : β 1 = β 2? 6