Gabarito - Lista Pré-Prova 1 Camila Steffens e Matheus Rosso 1 Questões teóricas 1.1 Regressão simples 1. (Wooldridge) Dado o modelo de regressão linear y = β 0 + β 1 x + u, supõe-se que E(u) 0. Definindo α 0 = E(u), demonstre que é possível reescrever o modelo com o mesmo parâmetro β 1, porém, com distintos intercepto e termo de erro, tendo este termo de erro valor esperado igual a zero. Supondo E(u) 0, seja o seguinte modelo modificado: y = β 0 + β 1 x + u + (E(u) E(u)) y = (β 0 + E(u) + β 1 x + (u E(u)) y = α 0 + β 1 x + v Onde α 0 = β 0 + E(u) e v = u E(u). 1.2 Regressão múltipla 1. Relacione os seguintes conceitos: parâmetros de um modelo de regressão múltipla, ceteris paribus e derivada parcial. Os parâmetros de um modelo de regressão múltipla expressam o efeito parcial de uma variável explicativa sobre a variável explicada. Tal efeito parcial diz respeito ao controle da variação de outras variáveis explicitamente presentes no modelo enquanto regressoras. O termo ceteris paribus traduz, em Economia, está noção de variar um elemento mantendo todos os demais fatores relevantes constantes. A derivada parcial em Cálculo Diferencial realiza exatamente isto, em termos matemáticos, para uma função continuamente diferenciável. 1
2. Supondo que você queira explicar a nota em Econometria de um aluno médio, nota [0, 10], a partir do seu tempo de estudo em horas diárias, estudo [0, 24]: nota i = β 0 + β 1 estudo i + u i. Tendo uma adequada compreensão da natureza abrangente do termo de erro e lendo interessantes artigos de Econometria Aplicada, um colega seu muito dedicado lhe sugere elencar variáveis de controle para estabelecer o efeito causal das entendiantes horas de estudo. (a) Qual a razão para tal sugestão, isto é, o que significa precisamente uma variável de controle? Querendo explicar a nota em função do estudo, é necessário controlar as variáveis que também afetam a nota e, ao mesmo tempo, têm correlação com a explicativa principal, estudo. Assim, sabendo que a estimação de regressão múltipla capta o efeito parcial de uma variável dadas outras variáveis explicitamente consideradas na regressão, com variáveis de controle, diminui-se o risco de se incorrer em endogeneidade (correlação entre uma explicativa e o termo de erro), o que implicaria em estimativas viesadas e não consistentes. (b) Quais variáveis de controle você sugere para o problema acima? Frequência em aula e nas monitorias são variáveis mensuráveis e que tendem a afetar o desempenho em termos de nota. 3. Dado o seguinte modelo populacional, y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + u, defina as condições de primeira ordem do problema de minimização da soma dos quadrados dos resíduos e indique que está satisfeita a condição necessária para a resolução do sistema cujas variáveis são ˆβ 0, ˆβ 1, ˆβ 2 e ˆβ 3. (y i ˆβ 0 ˆβ 1 x i1 ˆβ 2 x i2 ˆβ 3 x i3 ) = 0 i i i i (y i ˆβ 0 ˆβ 1 x i1 ˆβ 2 x i2 ˆβ 3 x i3 )x i1 = 0 (y i ˆβ 0 ˆβ 1 x i1 ˆβ 2 x i2 ˆβ 3 x i3 )x i2 = 0 (y i ˆβ 0 ˆβ 1 x i1 ˆβ 2 x i2 ˆβ 3 x i3 )x i3 = 0 Como há quatro equações e quatro variáveis, é possível, a princípio, resolver tal sistema e definir ˆβ 0, ˆβ 1, ˆβ 2 e ˆβ 3. 2
2 Questões interpretativas 2.1 Regressão simples 1. (Lista 2 - Turma 2) Considerando um modelo de regressão linear clássico relacionando duas variáveis quaisquer, (Y, X), y i seguinte amostra: {(y i, x i )} 3 i=1 = {(1, 1), (0, 1), (2, 0)}. a) ˆβ 0 = 7/6 e ˆβ 1 = 1/2. b) ep( ˆβ 0 ) = 2 2 e ep( ˆβ 1 ) = 3 2. = β 0 + β 1 x i + ɛ, proceda à estimação por MQO a partir da c) R 2 = SQE/SQT = (3/2) 2 = 3 4 = 0, 75. Portanto, 75% das variações de y são explicadas por variações em x. 2. (Lista 2 - Turma 2) Um pesquisador visa avaliar a política pública de cinema no Brasil. A partir de dados entre 1995 e 2013, obtém os seguintes resultados de regressões: ln(bilheteriacons) i = 10, 83 + 4, 32e 07 V alorcaptcons i + ˆɛ (1) n = 986, R 2 = 0, 3417 ln(bilheteriacons) i = 7, 4 + 1, 37ln(V alorcaptcons) i + ˆɛ (2) n = 716, R 2 = 0, 4144 Onde BilheteriaCons i é a bilheteria a preços constantes do filme i e V alorcaptcons i é o valor captado com a política de incentivo fiscal pelo mesmo filme i. a) Na equação (3), um aumento de um real no valor captado com política de incentivo fiscal aumenta a renda de bilheteria em 4, 32e 05%. Na equação (4), um aumento de 1% no valor captado aumenta a renda de bilheteria em 1,37%. b) Como há projetos de filmes que não contam com incentivo fiscal, V alorcaptconsi = 0 para tais filmes. Assim, na medida em que não está definido ln(0), o software não considera tais observações ao realizar a regressão proposta em (4). 3
3. (Wooldridge) Sendo kids o número de crianças nascidas vivas de uma dada mulher, e sendo educ os anos de educação da mesma mulher. Um modelo simples que explica a fertilidade é dado por: kids = β 0 + β 1 educ + u Sendo u o termo de erro. (a) Que fatores devem estar presentes em u? Algum deles tende a ter correlação com educ? A idade de uma mulher tende a ser positivamente correlacionada com os seus anos de educação, ao mesmo tempo em que tende a implicar em um maior número de filhos. Logo, tem-se uma possível variável relevante omitida que tem correlação com educ. (b) Dada a sua resposta em (a), você espera que se possa estimar o efeito causal de educ sobre kids? Não, provavelmente uma estimação da equação acima conduz a um parâmetro estimado ˆβ 1 viesado. 4. (Wooldridge) Seja a função estimada de consumo linear: cons = ˆβ 0 + ˆβ 1 inc Sendo cons o consumo e inc a renda. A propensão marginal a consumir estimada é ˆβ, enquanto que a propensão média a consumir é cons/inc = ˆβ 0 /inc + ˆβ 1. Utilizando dados de 100 famílias, com consumo e renda medidos em dólares, chega-se a: cons = 124, 84 + 0, 853inc n = 100, R 2 = 0, 692 (a) Interprete o intercepto e comente seu sinal e magnitude. O sinal negativo tende a implicar em uma propensão marginal a consumir superior à propensão média. (b) Qual o consumo previsto para uma família de renda igual a US$30.000? cons i = 124, 84 + 0, 853.30.000 = 25.465, 16. 4
(c) Com cons no eixo vertical e inc no eixo horizontal, desenhe o gráfico da reta estimada. Defina as interseções entre a reta e os eixos horizontal (raiz da equação prevista) e vertical (intercepto). 2.2 Regressão múltipla 1. (Wooldridge, adaptada) Seja o seguinte modelo que explica o tempo despendido dormindo a partir do tempo dedicado ao trabalho, dentre outras variáveis explicativas: sono i = β 0 + β 1 trab i + β 2 educ i + β 3 idade i + ɛ i (3) Responda às seguintes questões: (a) Defina os sinais esperados para estimativas de β 1, β 2 e β 3. Justifique sua resposta. Espera-se: ˆβ0 0, ˆβ 1 0, ˆβ 2 0, ˆβ 3 0. (b) Considerando sono i e trab i medidos em horas semanais, além de educ i e idade i em anos, seja a seguinte saída de uma regressão múltipla: sono ˆ i = 3.638, 25 0, 148trab i 11, 13educ i + 2, 2idade i (4) n = 706, R 2 = 0, 113 Se uma pessoa ganha uma promoção em seu trabalho, tendo, em contrapartida, que trabalhar 4 horas semanais adicionais, qual o efeito esperado sobre o sono, considerando o exposto na equação (2)? Como sono = ˆβ 1 trab, sono = 0, 148.4 = 0, 592. Logo, espera-se uma diminuição de um pouco mais de meia hora de sono semanal. (c) Discuta a magnitude do R 2. O que você pode concluir quanto ao grau de explicação do modelo? Você consegue pensar em algumas variáveis explicativas adicionais? Teriam elas alguma correlação com variáveis explicativas presentes em (4)? O que isto implica em termos de correlação entre o termo de erro e as explicativas na equação (3)? 11% da variação do sono é explicada pela variação das variáveis em (1). Aparentemente, trata-se de uma proporção pequena, em virtude do número de explicativas consideradas. Variáveis que indiquem o número de filhos da pessoa i, bem como o gênero e o estado civil podem ampliar a explicação da variável 5
dependente sono. Imagina-se, por exemplo, que o número de filhos tenha correlação com a idade, ao mesmo tempo em que afeta as horas de sono semanais. Portanto, deve haver correlação entre as explicativas e o termo de erro em (1). 3 Questões ANPEC 1. (ANPEC - 1995) Em um modelo clássico de regressão linear múltipla: (0) Uma das hipóteses estabelece que as variáveis explicativas são linearmente independentes. (4) A variância da variável dependente é igual à variância do termo aleatório. 2. (ANPEC - 1996) Suponha que, num modelo de regressão linear simples, o regressor (variável independente) seja correlacionado com o termo erro. afirmar: Sobre o estimador de MQO, podemos (0) É, em geral, viesado. (1) Não é possível de ser obtido. (2) É não viesado, porém não é eficiente. (3) É consistente. 3. (ANPEC - 2000) Seja o modelo de regressão linear clássico com duas variáveis explicativas, Y i = β 1 + β 2 X 2i + β 3 X 3i + u i. É correto afirmar que: (0) Se a correlação entre X 2 e X 3 é zero, então o estimador de mínimos quadrados ordinários (MQO) de β 2 é ˆβ i 2 = (X 2i X 2 )(Y i Y ) i (X. 2i X 2 ) 2 6
(1) Mesmo que a correlação entre X 2 e X 3 seja igual à unidade, pode-se estimar β 2 + cβ 3, em que c é uma constante conhecida. (2) A eficiência relativa dos estimadores de MQO, dentro da classe dos estimadores lineares não viesados, garantida pelo Teorema de Gauss Markov, necessita da hipótese de normalidade do erro u i. (3) Se o erro u i é heterocedástico, os estimadores de MQO serão viesados. (4) Se as variáveis explicativas são estocásticas, porém não correlacionadas com o erro u i, então os estimadores dos parâmetros do modelo são não-viesados. 4. (ANPEC - 2000) Considere o seguinte modelo de regressão linear clássico, relacionando as variáveis quantidade demandada (Q) e preço do produto (P ). Admita que as duas variáveis sejam medidas em Reais, e que a estimação será efetuada por MQO (ln é logaritmo natural): lnq i = β 1 + β 2 lnp i + u i i {1,..., 100} É correto afirmar que: (0) Variando-se o preço em 1%, a quantidade demandada variará 10β 2 %, ceteris paribus. (1) Ignorando-se o termo aleatório, se o preço ultrapassar determinado limite, será possível obter quantidades demandadas negativas. (2) Se mudarmos as unidades de Q e P para dólares americanos, então a estimativa de β 2 na nova equação será igual a sua estimativa obtida na equação em reais. (3) Se a variável lny (Y = renda) for acrescentada ao modelo o coeficiente R 2 desta nova regressão será maior ou igual ao coeficiente R 2 da regressão original. 7
5. (ANPEC - 2001) No modelo clássico de regressão linear Y i = β 1 + β 2 X i + u i : (0) A hipótese de que o erro é normalmente distribuído é necessária para que os estimadores de mínimos quadrados ordinários também sejam normalmente distribuídos. Gabarito ANPEC: verdadeiro. Porém, com amostra aleatória, não é necessária tal hipótese, uma vez que se utilize o teorema central do limite e uma vez que o tamanho da amostra cresça indefinidamente. A normalidade dos termos de erro é, ainda assim, uma hipótese suficiente para a normalidade de ˆβ 1 e ˆβ 1. (3) A hipótese V ar(u i X i ) = σ 2 é necessária para que os estimadores de mínimos quadrados ordinários sejam não tendenciosos. (4) Os estimadores de mínimos quadrados de β 1 e β 2 podem ser escritos como combinações lineares das observações Y i. 6. (ANPEC - 2003) Considere o modelo de regressão linear múltipla para dados seccionais: y i = β 0 + β 1 x 1i + β 2 x 2i +... + β k x ki + u i i {1,..., n} É correto afirmar que: (0) Para que os estimadores de mínimos quadrados sejam os melhores estimadores lineares nãotendeciosos é necessário que os erros sejam normalmente distribuídos. (1) A hipótese de que V ar(u x 1,..., x k ) = σ 2 não é necessária para que os estimadores de mínimos quadrados sejam consistentes. (2) A inclusão de uma nova variável explicativa no modelo reduzirá o coeficiente de determinação R 2. 8
(3) Para que as estatísticas t e F sejam válidas assintoticamente é necessário que os erros sejam normalmente distribuídos. (4) Se Cov(x 1, x 3 ) 0, então os estimadores de mínimos quadrados ordinários de β 0, β 1,..., β k serão tendenciosos. 7. (ANPEC - 2004) Considere o modelo de regressão linear múltipla para dados seccionais: y i = β 0 + β 1 x 1i + β 2 x 2i +... + β k x ki + u i i {1,..., n} É correto afirmar que: (0) Para que os estimadores de mínimos quadrados sejam lineares não-tendeciosos de menor variância (BLUE) é necessário que os erros sejam homocedásticos. (1) A hipótese de que V ar(u x 1,..., x k ) = σ 2 é necessária para que os estimadores de mínimos quadrados sejam não-tendenciosos. (3) Se Cov(x 1, x 3 ) 0, então os estimadores de mínimos quadrados ordinários de β 0, β 1,..., β k serão consistentes. (4) Se Cov(x 1, x 3 ) = 0, então os estimadores de mínimos quadrados ordinários de β 0, β 1,..., β k serão consistentes. 8. (ANPEC - 2005) Um pesquisador estima o seguinte modelo de regressão simples: Y i = β 0 + β 1 X i + u i. Outro pesquisador estima o mesmo modelo, mas com escalas diferentes para Y i e X i. O segundo modelo é: Y i = β0 + β 1 X i + u i, em que Y i = w 1 Y i e Xi = w 2X i, com w 1, w 2 > 0. (0) Os estimadores de MQO de β o e β 1 são iguais aos de β 0 e β 1. 9
(1) Se ˆσ 2 é a variância estimada de u i e ˆσ2 é a variância estimada de u i, então ˆσ 2 = w 2 1 ˆσ2. (2) As variâncias dos estimadores dos parâmetros do primeiro modelo são maiores do que as variâncias dos estimadores do segundo modelo. (3) Os coeficientes de determinação são iguais nos dois modelos. (4) A transformação de escala de (Y i, X i ) para (Yi, X i ) não afeta as propriedades dos estimadores de Mínimos Quadrados Ordinários dos parâmetros. 9. (ANPEC - 2006) Julgue as afirmativas. A respeito dos estimadores de Mínimos Quadrados Ordinários (MQO), em um modelo de regressão linear múltipla: (0) Se a variância do erro não for constante, as estimativas dos parâmetros serão não-viesadas. Gabarito ANPEC: verdadeiro. Porém, com heterocedasticidade, não necessariamente as estimativas são não viesadas. A hipótese necessária é a de ausência de correlação entre a explicativa e o termo de erro. (1) Se E(u) 0, os estimadores de todos os parâmetros, com exceção do intercepto, serão viesados. (2) Se o erro não seguir a distribuição Normal as estimativas por MQO são consistentes. (3) Sob as hipóteses do modelo de regressão clássica, com erros na forma de ruído branco com distribuição Normal, os estimadores de MQO serão os mais eficientes possíveis. (4) A presença de colinearidade imperfeita entre as variáveis explicativas gera estimadores viesados. 10. Dado o modelo de regressão linear clássico, y = β 0 + β 1 x + u, quanto à hipótese de exogeneidade das variáveis explicativas, responda se verdadeiro ou falso: 10
(0) Supor E(u x) = 0 implica em E(u) = E(ux) = 0. (1) Como E(u x) = 0 é mais forte do que Cov(u, x) = 0, é suficiente para uma estimação não viesada via métodos dos momentos e MQO considerar E(u) = 0 e Cov(x, u) = 0. (2) Para a estimação de máxima verossimilhança, como se supõe normalidade para o termo de erro ɛ, não é necessária a hipótese de amostra aleatória {(y i, x i )} n i=1. (3) Uma forma de se testar se E(xu) = 0 consiste em fazer um teste de hipótese sobre o equivalente amostral desta suposição tendo por hipótese nula H 0 : E(xu) = 0. (4) Caso u = γq + v, onde Cov(x, v) = 0, a hipótese de não correlação entre x e u é válidade se, e somente se, Cov(x, q) = 0. 11. Dado o modelo de regressão linear clássico, y = β 0 + β 1 x + u, quanto a propriedades algébricas dos estimadores, responda se verdadeiro ou falso: (0) A reta de regressão, por construção, passa pelo ponto (y, x), mesmo que se estime um modelo sem intercepto. (1) Por construção, i ŷiû i = 0. (2) Caso se multiplique a amostra {(y i, x i )} n i=1 por uma constante k > 0, e caso se estime, a partir desta amostra modificada, ˆβ 0 e ˆβ 1, então, sendo ˆβ 0 e ˆβ 1 as estimativas decorrentes da amostra original, vale que ˆβ 0 = ˆβ 0 e ˆβ 1 = ˆβ 1. (3) No mesmo contexto do item anterior, sendo R 2 o coeficiente de determinação da estimação que decorre dos dados modificados e R 2 o coeficiente que decorre dos dados originais, então R 2 = R 2. 11
(4) Se estimando o modelo com intercepto chega-se a ˆβ 0 > 0, então, como R 2 = i ( ˆβ 0 + ˆβ 1 x i y) 2 i (y i y) 2, então a estimação do modelo sem intercepto implica em um R 2 inferior ao decorrente da estimação com intercepto. 12. Dado o modelo de regressão linear clássico, y = β 0 + β 1 x + u, quanto à hipótese de homocedasticidade, responda se verdadeiro ou falso: (0) A omissão de uma variável relevante, q, pode, dentre outros problemas, violar a hipótese de homocedasticidade. (1) A hipótese de homocedasticidade não tem implicações em termos de ausência de viés e em termos de consistência dos estimadores de MQO, porém, há implicações em termos de eficiência. (2) Supondo a não validade da hipótese de homocedasticidade, caso se conheça que V ar(u x i ) = h(x i ), onde h(x i ) é uma função da variável explicativa x i, então tal hipótese tem validade para y i / h(x i ) = β 0 / h(x i ) + β 1 x i h(xi ) + u i / h(x i ). (3) Mesmo que V ar(u i x i ) seja uma função de x i, procedimentos de inferência têm preservada sua validade com a estimação usual dos erros padrão de ˆβ 0 e ˆβ 1 (4) Sob a hipótese de E(u x) = 0, a homocedasticidade equivale a E(u 2 x) = σ 2. 13. (ANPEC - 2012) Considere o seguinte modelo de regressão: y i = β 0 + β 1 x 1i + ɛ i, em que β 0 e β 1 são parâmentros estimados pelo método dos mínimos quadrados ordinários e ɛ i representa o erro do modelo. (0) Primeiro, não assumimos a hipótese de que E[y x 1 ] = 0, mas sim E[ɛ x 1 ] = 0. Na verdade, E[y x 1 ] = β 0 + β 1 x 1. De qualquer forma, a soma dos resíduos será zero pela forma como estabelecemos o problema no MQO. Note que i=1 ˆɛ i = 0 consiste em uma propriedade 12
algébrica dos estimadores de MQO, sendo justamente a Condição de Primeira Ordem do intercepto. (1) Note que SQT = SQE + SQR. (2) Novamente, não assumimos a hipótese de que E[y x 1 ] = 0. Além disso, i=1 ˆɛ ix i = 0 consiste em uma propriedade algébrica dos estimadores de MQO, sendo justamente a Condição de Primeira Ordem do parâmetro de inclinação. (3) Note que i=1 y iɛ ˆ i = 0 também consiste em uma propriedade algébrica dos estimadores de MQO. (4) Na verdade, R 2 é igual ao quadrado do coeficiente de correlação amostral entre o y i observado e o predito, ŷ i. DEM.: Seja o coeficiente de correlação amostral entre y i e ŷ i tal que (i) ˆρ(y i, ŷ i ) = Cov(y ˆ i,ŷ i ) V ar(y ˆ i V ar(ŷ ˆ. i Sabemos que a covariância amostral é definida da seguinte forma: Como y i = ŷ i + ˆɛ i, Como i=1 nˆɛ iŷ i = 0, sabemos que: ˆ Cov(y i, ŷ i ) = 1 n i=1 (y i y)(ŷ i y) ˆ Cov(y i, ŷ i ) = 1 n i=1 (ŷ i + ˆɛ i y)(ŷ i y) Cov(y ˆ i, ŷ i ) = 1 n i=1 (ŷ i y)(ŷ i y), logo, Cov(y ˆ i, ŷ i ) = V ar(ŷ ˆ i (ii). Substituindo (ii) em (i), temos: (iii) ˆρ(y i, ŷ i ) = Portanto, elevando ambos os lados ao quadrado: ar(ŷ ˆ i V ar(y ˆV i V ar(ŷ ˆ. i (iv) ˆρ(y i, ŷ i ) 2 = 2 V ar(ŷ ˆ i V ar(ŷ V ar(y ˆ i V ar(ŷ ˆ = ˆ i i V ar(y ˆ i 13 = SQE SQT = R2.
14. (ANPEC - 2013) Um pesquisador tem dados de 50 países das seguintes variáveis: N, número médio de jornais comprados durante um ano; Y, PIB per capita medido em dólares. ˆN = 25, 0 + 0, 020Y, R 2 = 0, 06, RSS = 4000, F = 4, 0. (...) Suponha que você rode a mesma regressão com Y medido em reais. Assuma, por simplicidade, que a taxa de câmbio seja dois reais por dólar. É correto afirmar que: (0) Note que a nova variável explicativa, seja Y reais, será agora 2Y. A estimativa do coeficiente de Y reais será 1/2 vezes a estimativa do coeficiente de Y. (1) A estimativa do intercepto permanecerá inalterada. Mudanças de unidade na variável explicativa não alteram a estimativa do intercepto. (2) RSS permanecerá inalterado. Note que i=1 ɛ2 i = i=1 (N i ˆN i ) 2. N e ˆN não modificam com mudança na unidade da variável explicativa Y. ˆσ (3) A estimativa do desvio padrão do coeficiente de Y será 2 n. Portanto, o denomina- i=1 (Y 2 i Ŷi) dor será modificado com a mudança na unidade da variável explicativa Y. (4) R 2 permanecerá inalterado, pois a qualidade de ajuste do modelo não depende das medidas das variáveis. 15. (ANPEC - 2014) Estimando o modelo por Mínimos Quadrados Ordinários, calcule o valor da estimativa obtida para ˆβ 1. Multiplique o resultado por 10. 4 10 = 40 Demonstração: ˆβ 1 = N i=1 (Y i Y )(X i X) N i=1 (X i X) 2 = 4800 1200 = 4 16. (ANPEC - 2014)[ADAPTADA] Considere o modelo de regressão linear simples:y i = β 0 +β 1 x i +ɛ i, 14
no qual (Y i, X i ), i = 1,..., N é uma amostra aleatória, Cov(ɛ i, X i ) 0, V ar[x i ] > 0. Baseando-se nas informações acima, julgue a seguinte afirmativa: (0) O estimador de Mínimos Quadrados Ordinários para β 1 será tendencioso. Note que a ausência de viés dos estimadore de MQO depende da hipótese de média condicional zero do erro, isto é, E[ɛ i X i ] = 0. Se Cov(ɛ i, X i ) 0, então E[ɛ i X i ] E[ɛ i ].E[X i ] 0. Mas como E[ɛ i ] = 0, isso implica que E[ɛ i X i ] 0. Usando a Lei das Expectativas Iteradas, E[ɛ i X i ] = E x [E(ɛ i X i X)] = X i E[ɛ i X] 0, o que implica que E[ɛ i X i ] 0. Logo, o estimador de MQO será viesado (tendencioso). 17. (ANPEC - 2015) Considere o modelo de regressão linear simples: y i = β 0 + β 1 x i + u i, i = 1,..., n, em que E[u i x i ] = 0 e V ar[u i x i ] = σ 2. (...) É correto afirmar que: (0) Note que β 1 é um estimador de uma regressão através da origem. Se o intercepto, β 0 0, e x 0, β1 será um estimador tendencioso de β 1. (3) Note que ˆβ 1 é um estimador de MQO. Como valem as hipóteses RLS1 a 4, ˆβ 1 é um estimador não tendencioso de β 1. (4) β 1 = i=1 x iy i = i=1 x i(β 0 +β 1 x i +ɛ i ) = β 0 i=1 x iβ 1 + i=1 x iɛ i ) β 1 = β 0 i=1 x i + β 1 + i=1 x iɛ i ) Então E[ β i=1 1 ] = β 0 E[ x i i=1 n ] + β 1 + E[ x iɛ i ) ] O último termo é zero (como mostramos na Lista 2). Então: E[ β nx 1 ] = β 1 + β 0 E[ ] Como ˆβ 1 é não tendencioso, temos que E[ ˆβ 1 ] = β 1. Logo: E[ β 1 ] = E[ ˆβ nx 1 ] + β 0 E[ ] 15
Se β 0 > 0, E[ β 1 ] > E[ ˆβ 1 ] somente se x > 0. Note que β 1 será não tendencioso se x = 0 ou β 0 = 0. 18. (ANPEC - 2016)[ADAPTADA] Baseada nas equações abaixo: (0) Note que, em modelo com log na variável dependente e independente, temos que % y = β 1 % x; isto é, um aumento de 1% na renda das unidades de consumo, o consumo de carne bovina terá um aumento esperado de 1,15%. Além disso, lembre que trabalhamos sempre com a ideia do ceteris paribus, isto é, considerando as demais variáveis constantes. (1) Para um nível de renda igual a R$ 1,00, temos que ln(renda) = 0. O consumo de carne será igual aos interceptos nos dois Estados, mantendo todas as demais condições constantes. Note que o intercepto para o RS é menos que o intercepto para o RN. Então não podemos afirmar que o consumo é maior no RS. Na verdade, veremos posteriormente que os interceptos não são estatisticamente significativos. Então não poderíamos nem afirmar que o consumo é distinto entre os dois estados. (3) 19. (ANPEC - 2017) Estimar ˆβ 1 por MQO. Note que: ˆβ 1 = i=1 (x i x)(y i ) i=1 (x i x)x i = 20. (ANPEC - 2018)Estimar ˆβ 1 por MQO. Note que: ˆβ 1 = i=1 (x i x)(y i ) i=1 (x i x)x i = i=1 (x iy i ) x i=1 (y i) n x i=1 x = 500 400 i 15 10 = 100 5 = 20. i=1 (x iy i ) x i=1 (y i) n x i=1 x = 180 1 120 i 60 1 30 = 60 30 = 2. 16