Econometria Semestre 2010.01 121 121 CAPÍTULO 12 AUTOCORRELAÇÃO 12.1. A NATUREZA DO PROBLEMA O objetivo deste capítulo é examinar as conseqüências da violação de uma das hipóteses fundamentais do modelo linear clássico, a hipótese de que os erros do modelo não são correlacionados. Este tipo de problema ocorre na prática quando fazemos regressão de séries temporais, e no restante do capítulo usaremos o subscrito t (ao invés de i) para explicitar a dependência dos dados no tempo. Também, por razões que deverão ficar claras ao longo do texto, os erros (correlacionados) serão denotados por u, enquanto os erros não correlacionados continuarão, como nos capítulos anteriores, a ser denotados por ε. Em primeiro lugar, é preciso definir o que entendemos por autocorrelação (ou correlação serial). A autocorrelação é a correlação que existe entre valores de uma série temporal observados em diferentes instantes de tempo. A autocorrelação pode também se referir a observações em diferentes pontos no espaço (correlação espacial), e o tratamento dado ao problema é basicamente o mesmo apresentado aqui, por isso nosso foco será apresentar o problema no contexto de séries temporais. No modelo clássico, uma das premissas é a inexistência de correlação entre os erros em instantes distintos. Isto é, supõe se que: E(u i.u j ) = 0 para i j. Note que esta hipótese implica em Cov(u i, u j ) = 0 para i j pois a média do erro é zero por hipótese. Em que situação esta premissa costuma ser violada? Considere, por exemplo, um modelo para a venda mensal de TVs no varejo. No passado recente, houve a redução de imposto sobre produtos industrializados para combater a recessão, e isso incrementou as vendas. Também, em 2009, as
Econometria Semestre 2010.01 122 122 taxas de juros ao consumidor caíram. Agora, em 2010, estamos a um passo da Copa do Mundo que, sabidamente, tem um impacto positivo sobre as vendas de TVs. E os erros de um modelo, como ficam? Muito provavelmente, o erro do modelo num mês terá uma expressiva correlação com o erro do modelo em meses adjacentes. Ou seja, a hipótese de que erros em instantes diferentes são descorrelatados é falsa, ou seja, existe autocorrelação entre os erros. Isso quer dizer que as perturbações que ocorrem num instante de tempo afetam as que ocorrem em outro instante. Antes de descobrir por que existe autocorrelação, é essencial esclarecer algumas questões sobre nomenclatura. É prática comum tratar a autocorrelação e a correlação serial como sinônimos, mas alguns autores preferem distinguir os dois termos. Nós não faremos isso aqui para nós, autocorrelação e correlação serial significam a mesma coisa. A Figura 12.1. a seguir exibe alguns padrões plausíveis para a presença e ausência de autocorrelação. Nela são plotados os erros (ou, na prática, os resíduos) contra o eixo dos tempos. A Figura 12.1a mostra um padrão cíclico. A Figura 12.1b sugere uma tendência ascendente nos erros, enquanto a Figura 12.1.c mostra um padrão linear descendente linear nos distúrbios. 12.1d mostra termos de tendência linear e quadrática nos distúrbios. Apenas a Figura 12.1.e não exibe um padrão sistemático, apoiando a hipótese de autocorrelação nula dos erros, que é a premissa do modelo clássico de regressão. FIGURA 12.1
Econometria Semestre 2010.01 123 123 A pergunta natural é: Por que a correlação serial ocorre? Há diversas razões, algumas mostradas a seguir. Inércia Séries temporais econômicas apresentam inércia ou lentidão. O PIB, índices de preços, produção, emprego e desemprego apresentam ciclos. A partir do fundo da recessão, começa a recuperação econômica e a maioria destas séries começar a se mover para cima. Neste movimento, o valor de uma série num ponto no tempo é maior do que seu valor anterior. Assim, há uma dinâmica que continua até que algo aconteça (por exemplo, o aumento na taxa de juros ou os impostos, ou ambos) para atrasá los. Por isso, nas regressões envolvendo séries temporais, observações sucessivas tendem a ser interdependentes. Viés de Especificação variáveis excluídas Na prática o pesquisador muitas vezes começa com um modelo de regressão plausível que não podem ser o mais "perfeito''. Após a análise de regressão, o pesquisador examina os resultados
Econometria Semestre 2010.01 124 124 para descobrir se eles estão de acordo com as expectativas a priori e as premissas básicas dos modelos de mínimos quadrados. Por exemplo, o pesquisador pode plotar os resíduos obtidos a partir da regressão ajustada e observar padrões como os mostrados na Figura 12.1a a d. Esses resíduos podem sugerir que algumas variáveis que foram originalmente candidatas, mas não foram incluídas no modelo, devem ser incluídas. Este é o caso do viés de especificação da variável excluída. Muitas vezes, a inclusão dessas variáveis remove o padrão de correlação observado nos resíduos. Por exemplo, suponha que temos o modelo de demanda: Onde Y = quantidade demandada de carne de boi, X2 = preço da carne de boi, X3 = renda do consumidor, X4 = preço da carne de porco e t = tempo. No entanto, por alguma razão, ajustamos a regressão que se segue: Agora, se (12.1.2) é o modelo verdadeiro, mas ajustamos (12.1.3), isso equivale a fazer v t = β 4.X 4t + u t. E na medida que o preço da carne suína afeta o consumo de carne, o termo de erro ou distúrbio v irá refletir um padrão sistemático, criando assim uma (falsa) autocorrelação. Um teste simples disso seria executar os dois modelos (12.1.2) e (12.1.3) e ver se autocorrelação, observada no modelo (12.1.3) desaparece quando (12.1.2) é ajustado. A mecânica de detecção de autocorrelação será discutida na seção 12.6. Viés de Especificação Forma Funcional Incorreta Suponha que o modelo verdadeiro é: Mas em vez deste, ajustamos o seguinte modelo: Ou seja, ajustamos uma forma funcional errada para a função custo marginal, que é a variável dependente no modelo. As curvas de custo marginal correspondentes ao modelo "verdadeiro'' e incorreto são mostradas na Figura 12.2.
Econometria Semestre 2010.01 125 125 FIGURA 12.2. Como a Figura 12.2 mostra, entre os pontos A e B a curva de custo marginal linear estará sempre acima do verdadeiro custo marginal, enquanto que fora deste intervalo o oposto ocorre. Este resultado é esperado, pois o termo de erro v i em (12.1.5, o modelo errado) é, de fato, igual a Output 2 + u i e, portanto, vai pegar o efeito sistemático do termo Output 2 no custo marginal. Neste caso, v i exibirá autocorrelação por causa da utilização de uma forma funcional errada. No capítulo 13, vamos considerar vários métodos para detectar o viés de especificação. Fenômeno Cobweb (Teia de Aranha) O fornecimento de muitos produtos agrícolas reflete o fenômeno chamado teia de aranha, onde a oferta reage ao preço com uma defasagem de um período de tempo, porque as decisões de oferta levam um certo tempo para serem implementadas (o período de gestação). Assim, no início do plantio da safra deste ano, os agricultores são influenciados pelo preço vigente no ano passado, e sua função de oferta é: Suponha que no final do período t, o preço P t é inferior ao preço do amo passado, P t 1. No período t + 1 os agricultores podem decidir produzir menos do que eles fizeram no período t. Obviamente, nesta situação os distúrbios não deverão ser aleatórios, pois se os agricultores produzem demais no ano t, devem reduzir sua produção em t + 1, e assim por diante, levando a um padrão de teia de aranha.
Econometria Semestre 2010.01 126 126 Defasagens Em uma regressão de séries temporais das despesas de consumo sobre a renda, é comum observar que a despesa de consumo do período atual período depende, entre outras coisas, das despesas de consumo dos períodos anteriores. Por exemplo: Um modelo de regressão como (12.1.7) é conhecido como auto regressivo porque uma das variáveis explicativas é o valor defasado da variável dependente. (Estes modelos serão novamente estudados no capítulo 17.) A justificativa para um modelo como (12.1.7) é simples. Os consumidores não mudam seus hábitos de consumo facilmente por motivos psicológicos, tecnológicos ou institucionais. Agora, se nós negligenciarmos o termo defasado em (12.1.7), o termo de erro resultante refletirá um padrão sistemático devido à influência do consumo defasado sobre o consumo atual. Manipulação de dados Na análise empírica, os dados brutos são frequentemente "Manipulados''. Por exemplo, em regressões envolvendo séries trimestrais, os dados são às vezes obtidos a partir dos dados mensais simplesmente adicionando três observações mensais e dividindo a soma por 3. Esta média suaviza as flutuações do dados mensais, e o gráfico dos dados trimestrais parece muito mais suave do que o dos dados mensais, e essa mesma regularidade pode gerar um padrão sistemático nos termos de erro, introduzindo assim autocorrelação. Outra fonte de manipulação é interpolação ou extrapolação de dados. Por exemplo, o Censo de População é realizado a cada 10 anos. Se existe uma necessidade de obter dados para alguns anos no período intercensitários 1990 2000 ou 2000 2010, a prática comum é a interpolação com base em algum pressuposto ad hoc. Estas técnicas de massagem dos dados podem impor aos dados um padrão sistemático que pode não existir nos dados originais.
Econometria Semestre 2010.01 127 127 Transformação de dados Considere o seguinte modelo: Onde, por exemplo, Y = despesa de consumo e X = renda. Como (12.1.8) é válido em todos os períodos de tempo, ele é válido também no período anterior (t 1). Assim, podemos escrever (12.1.8) como: Y t 1, X t 1, e u t 1 são conhecidos como os valores defasados de Y, X, e U respectivamente. Neste caso a defasagem é de um período. Subtraindo (12.1.9) de (12.1.8), obtemos: Onde Δ é conhecido como o operador de primeira diferença. Assim, ΔY t = (Y t Y t 1 ), ΔX t = (X t X t 1 ) e ΔU t = (U t U t 1 ). Podemos escrever (12.1.10) como: A equação (12.1.9) é conhecida como forma de nível e a equação (12.1.10) é conhecida como a forma de primeira diferença. Ambas as formas são frequentemente utilizadas em pesquisas empíricas. Por exemplo, se em (12.1.9) Y e X representam os logaritmos das despesas de consumo e renda, então em (12.1.10) ΔY e ΔX representam variações nos logaritmos das despesas de consumo e renda. Mas, uma variação no logaritmo é uma mudança relativa (percentual), se ela for multiplicada por 100. Assim, em vez de estudar relações entre as variáveis na forma de nível, podemos estar interessados em suas relações na forma de crescimento. Se o termo de erro em (12.1.8) satisfaz as hipóteses padrão MQO, especialmente a hipótese de não autocorrelação, pode se mostrar que o erro v t em (12.1.11) é autocorrelacionado. (A prova é dada no apêndice 12A, Seção 12A.1.)
Econometria Semestre 2010.01 128 128 Modelos como (12.1.11) são conhecidos como modelos de regressão dinâmica, ou seja, modelos que envolvem regressandos defasados. Eles serão estudados em profundidade no Capítulo 17. O que interessa no exemplo anterior é que às vezes a autocorrelação pode ser induzida como resultado da transformação do modelo original. Não estacionariedade Lembre se que uma série temporal é estacionária se suas características (por exemplo, média, variância e covariância) são invariantes no tempo, ou seja, eles não mudam ao longo do tempo. Se isso não acontecer, a série temporal é dita não estacionária. Como veremos na Parte V, em um modelo de regressão na forma do nível como (12.1.8) é possível que tanto Y e X sejam nãoestacionárias e, portanto, o erro u também seja não estacionário, e irá exibir autocorrelação. Em resumo, existem diversas razões pelas quais o termo de erro em um modelo de regressão pode ser autocorrelacionado. No restante do capítulo, investigamos os problemas decorrentes da autocorrelação e que pode ser feito sobre isso. A autocorrelação pode ser positiva (Figura 12.3a) ou negativa, embora a maioria das séries temporais econômica geralmente apresente autocorrelação positiva. Isso acontece porque a maioria delas move se para cima ou para baixo durante longos períodos de tempo e não apresenta um movimento constante para cima e para baixo como o mostrado na Figura 12.3b. FIGURA 12.3. AUTOCORRELAÇÃO POSITIVA (a) E NEGATIVA (b)
Econometria Semestre 2010.01 129 129 12.2. ESTIMATIVA MQO NA PRESENÇA DE AUTOCORRELAÇÃO O que acontece com os estimadores de MQO e suas variâncias se os erros do modelo apresentam autocorrelação? Suponha agora que E (u t.u t + s ) 0 para s 0 e que todas as outras hipóteses do modelo clássico são mantidas. Considere o modelo de regressão com duas variáveis: Y t = β 1 + β 2.X t + u t. Suponha que os ruídos deste modelo têm agora a seguinte estrutura: Onde ρ (a letra grega rô) é o coeficiente de autocorrelação e ε t é o erro estocástico que satisfaz as hipóteses usuais do modelo de mínimos quadrados, a saber:
Econometria Semestre 2010.01 130 130 Na literatura de engenharia, um termo de erro com as propriedades (12.2.2) é chamado de ruído branco. O que (12.2.1) postula é que a valor do termo de erro no período t é igual a ρ vezes o seu valor no período anterior, acrescido de um termo de erro puramente aleatório. O esquema (12.2.1) é conhecido como esquema autoregressivo de primeira ordem de Markov, ou simplesmente regime auto regressivo de primeira ordem, geralmente denotado como AR (1). O nome autoregressivo é apropriado porque (12.2.1) pode ser interpretado como a regressão de u t em sim mesmo defasado em um período. Diz se que é de primeira ordem porque u t e seu valor imediatamente anterior estão envolvidos, ou seja, o máximo atraso é 1. Se o modelo for u t = ρ 1 u t 1 + ρ 2 u t 2 + ε t, seria um AR (2), um modelo autoregressivo de segunda ordem. Pode se provar que, na situação de ruídos AR(1): Onde cov(u t,u t + s ) indica a covariância entre os termos de erro separados por s instantes e cor(u t,u t + s ) a correlação entre estes mesmos termos de erro. Note que cor(u t,u t ) = 1 sempre, pois a correlação de uma variável com si mesma é sempre um. Por causa da propriedade de simetria de covariâncias e correlações, cov(u t,u t + s ) = cov(u t,u t s ) e o mesmo ocorre com as correlações. O coeficiente ρ é uma constante entre 1 e +1 e então (12.2.3) mostra que, sob o esquema AR (1), a variância de u t é ainda constante (u t é homocedástico), mas u t está correlacionado não só com o seu valor imediatamente anterior, mas também com seus valores em outros instantes do passado. É fundamental observar que ρ < 1, ou seja, o valor absoluto de ρ é menor que um. Se ρ = 1, as variâncias e covariâncias acima não estão definidas. Se ρ <1, dizemos que o processo AR (1) dado em (12.2.1) é estacionário, ou seja, sua média, variância e covariância não mudam ao longo do tempo. Se ρ é menor que um, então a covariância diminuirá à medida que avançamos no passado distante, ou seja, à medida que a diferença entre as defasagens ( lags ) aumenta. Se ρ
Econometria Semestre 2010.01 131 131 é MAIOR que um, o processo é não estacionário e tem um comportamento claramente explosivo. Gere uma sequência de erros iid {e t } no Excel e ajuste o modelo u t = 1,2u t 1 + e t para verificar que isso acontece. Utilize qualquer valor inicial para u 0. Se ρ = 1, o processo é descrito por u t = u t 1 + e t, e é um processo NÃO ESTACIONÁRIO bastante importante na prática, chamado de random walk, ou passeio aleatório. O fato interessante é que a primeira diferença de um passeio aleatório é um processo estacionário, pois u t u t 1 = e t, ou seja, Δu t = e t onde Δ é o operador 1 a. diferença. Uma razão para usar o modelo AR (1) não é apenas por sua simplicidade em relação aos modelos AR de ordem superior, mas também porque, mostrou ser útil em aplicações práticas. Considere novamente o modelo de regressão de duas variáveis: Y t = β 1 + β 2.X t + u t. No capítulo 3 vimos que o estimador MQO do coeficiente angular é: Cuja variância é dada por: Onde a letra minúscula indica que a variável é calculada como um desvio em relação à média. Sob a hipótese AR(1), pode se mostrar que a variância deste estimador é: Onde Var(β^2) AR1 indica a variância do estimador sob a hipótese de erros AR(1). A comparação de (12.2.8) e (12.2.7) mostra que a variância sob o esquema AR(1) tem uma coleção de termos adicionais (em relação à variância sob a hipótese de erros não correlacionados). Estes termos adicionais dependem de ρ e também das autocorrelações amostrais da variável explicativa X em vários períodos anteriores.
Econometria Semestre 2010.01 132 132 Além disso, em geral não podemos prever se a variância dada por (12.2.7) será maior ou menor que a dada por (12.2.8). É claro que se ρ = 0, as duas fórmulas coincidirão. Mas, como princípio geral, as duas variâncias não serão iguais. Para dar uma idéia da diferença entre as variâncias (12.2.7) e (12.2.8), suponha que o regressor X também siga um processo AR(1) com um coeficiente de autocorrelação r. Pode se mostrar que (12.2.8) se reduz a: Se, por exemplo, r = 0,6 e ρ = 0,8, utilizando (12.2.9) segue que Var(β^2) AR1 = 2,8461 Var(β^2) MQO. Dito de outra forma, Var(β^2) MQO = (1/ 2,8461) Var(β^2) AR1 = 0,3513 Var(β^2) AR1. Ou seja, a fórmula usual de MQO [(12.2.7)] subestimará a variância de β2 sob o esquema AR(1) por cerca de 65%. Em resumo: uma aplicação cega das fórmulas MQO usuais para calcular os desvios e os erros padrão dos estimadores MQO estimadores pode levar a resultados totalmente enganosos. Suponha que a gente insista em continuar usando o estimador MQO de β 2 e que corrigimos a variância levando em conta a estrutura AR(1) para o erro. Quais as propriedades de β^2? Ele é ainda linear e não tendencioso, mas não é BLUE (ou seja, não é eficiente). Já tínhamos chegado a conclusões semelhantes quanto estudamos o problema da heterocedasticidade, e vimos que naquelas condições era possível encontrar um estimador eficiente através de mínimos quadrados generalizados. Na próxima seção veremos quais os passos necessários para encontrar estimadores BLUE sob a hipótese de erros AR(1). 12.3. O ESTIMADOR BLUE NA PRESENÇA DE AUTOCORRELAÇÃO Considere ainda o modelo de regressão com duas variáveis e suponha a existência de erros AR(1) como na seção anterior. Pode se mostrar que o estimador BLUE do coeficiente angular é dado por:
Econometria Semestre 2010.01 133 133 Onde C é um fator de correção que pode ser ignorado na prática. Note que em (12.3.1) o subscrito t vai de 2 até n (pois o estimador depende de y e x defasados em um instante). A variância deste estimador é dada por: Onde D é um outro fator de correção, que também pode ser ignorado na prática. O estimador β^2gls, como o expoente sugere, é obtido pelo método de mínimos quadrados generalizados. Como observado no Capítulo 11, o método de mínimos quadrados generalizados quer incorporar quaisquer informações adicionais disponíveis (por exemplo, a natureza da heterocedasticidade ou a autocorrelação) diretamente no processo de estimação através da transformação das variáveis, enquanto que os mínimos quadrados ordinários esta informação não é diretamente levada em consideração. A fórmula do estimador de mínimos quadrados generalizados dado em (12.3.1) depende explicitamente do parâmetro de autocorrelação ρ enquanto o estimador MQO dado por (12.2.6) ignora esta informação. Intuitivamente, essa é a razão pela qual o estimador de mínimos quadrados generalizados é BLUE e não o estimador MQO. O estimador de mínimos quadrados generalizados usa toda a informação disponível, o que não ocorre com o estimador MQO. Se ρ = 0, não existem informações adicionais a serem consideradas, e, portanto, os estimadores por mínimos quadrados generalizados e mínimos quadrados ordinários são idênticos.
Econometria Semestre 2010.01 134 134 Em resumo, sob autocorrelação, é o estimador de mínimos quadrados generalizados dado em (12.3.1) que é BLUE e a variância mínima é agora dada por (12.3.2) e não por (12.2.8) ou (12.2.7). Você pode reescrever o estimador de mínimos quadrados generalizados de uma forma mais parecida com o estimador usual MQO. Sejam: x y * t * t = x t = y t ρ. x ρ. y t 1 t 1 Então, a equação (12.3.1) torna se: ˆβ GLS 2 = x y * * t t *2 xt + C, que tem praticamente a mesma forma que a do estimador MQO, mas agora aplicado às variáveis x y * * t e t. Também é importante notar que em (12.3.1) e em (12.2.6) os estimadores estão expressos como funções das variáveis centradas em torno das suas médias (expressas por letras minúsculas). Nota técnica O Teorema de Markov fornece apenas uma condição suficiente para o estimador MQO ser BLUE. As condições necessárias e suficientes para que este estimador seja BLUE são dadas pelo teorema de Krushkal, mencionado no capítulo anterior. Logo, em alguns casos o estimador MQO pode se BLUE apesar da autocorrelação. Mas, estes casos não são comuns na prática. 12.4 O QUE ACONTECE SE USAMOS MQO E EXISTE AUTOCORRELAÇÃO? Lembre se: mesmo quando existe autocorrelação, os estimadores MQO são ainda não tendenciosos e lineares, além de consistentes e assintoticamente Normais. Mas, eles não são mais estimadores de variância mínima (ou seja, não são BLUE)! Suponha que continuamos a usar os estimadores MQO. Levaremos em conta duas situações. 1) Estimação MQO levando em conta a autocorrelação Suponha que usamos o estimador usual MQO, dado por:
Econometria Semestre 2010.01 135 135 Mas, agora decidimos empregar sua variância corrigida para a autocorrelação, isto é: Se empregarmos esta variância (12.2.8) na construção de intervalos de confiança, os IC tendem a ser mais largos que os obtidos a partir dos estimadores de mínimos quadrados generalizados, e isto ocorre mesmo se aumentarmos indefinidamente o tamanho da amostra. Ou seja, na situação de autocorrelação dos erros, o estimador MQO não é assintoticamente eficiente. Em resumo: não use estimadores MQO na presença de autocorrelação, pois você estará tirando conclusões erradas, e aumentar o tamanho da amostra não melhorará a situação. 2) Estimação MQO sem levar em conta a autocorrelação A situação torna se ainda pior se, além de usarmos o estimador MQO na presença de autocorrelação, deixarmos de corrigir sua variância, isto é, continuamos a usar: Quais os problemas decorrentes desta decisão? ˆ A variância dos resíduos, dada por: ˆ 2 2 = u t RSS σ = será provavelmente menor que a n 2 n 2 variância real σ 2. Isso nos leva a superestimar R 2 e as estatísticas t. Mesmo que σ 2 não seja subestimado, Var(β^2) poderá subestimar Var(β^2) AR1 dada pela equação (12.2.8), a variância do estimador MQO sob a premissa de autocorrelação dos resíduos de lag 1. Assim, os testes t e F construídos a partir de Var(β^2) levarão a conclusões erradas sobre a significância dos parâmetros na regressão.
Econometria Semestre 2010.01 136 136 Sob a premissa do modelo clássico (inexistência de autocorrelação dos resíduos), o estimador da variância ˆ 2 = uˆ t RSS = n 2 n 2 E ˆ. σ 2 é não tendencioso para σ 2 2 2, isto é: ( σ ) = σ Se a hipótese de inexistência de autocorrelação for violada e supormos que os erros seguem uma estrutura AR(1) então pode se mostrar que: Onde r é o coeficiente de correlação amostral entre valores sucessivos da variável explicativa X, dado por: Suponha que ambos ρ e r são positivos, o que é usual no caso de séries econômicas. Então, 2 2 de (12.4.1) segue que ( ) σ E ˆ σ <, ou seja, o estimador usual da variância subestimará a variância verdadeira. Além disso, Var(β^2) é um estimador tendencioso de Var(β^2) AR1, o que pode ser observado comparando se (12.2.7) e (12.2.8). Se ambos ρ e r são positivos segue que Var(β^2) < Var(β^2) AR1 e então a variância do estimador MQO subestima sua variância sob a premissa de erros AR(1). Então, ao usar o estimador MQO β^2 estamos supondo que ele tem uma precisão maior que a real (isto é, estamos subestimando seu erro padrão). Assim, ao calcular a estatística t para β 2 estaremos inflando o valor desta estatística, que parecerá maior do que é, na verdade. Isso nos leva a acreditar que o parâmetro β 2 é significante, quando, não verdade, não o é. Exemplo simulação de Monte Carlo O objetivo deste exemplo é mostrar como o uso do estimador MQO na situação de erros AR(1) tende a subestimar σ 2 e Var(β^2). Suponha que o modelo real é conhecido e dado por: Y = 1+ 0,8X u t t = 0,7u t 1 t + ε + u t t (12.4.3 e 12.4.5) Onde os ε t são um ruído branco com média zero e variância 1.
Econometria Semestre 2010.01 137 137 Os ε t s serão gerados aleatoriamente da distribuição N(0,1) (usando o Excel), e usamos como valor inicial ε 0 = 0. Note que, a partir da geração dos ε t s e de um valor inicial para u, por exemplo u 0 =5, podemos usar a equação (12.4.5) para gerar uma sequência de u t que apresentam correlação serial de lag 1. Na tabela abaixo estão os ε t s gerados aleatoriamente da distribuição N(0,1). instante (t) e(t) instante (t) e(t) instante (t) e(t) instante (t) e(t) instante (t) e(t) 0 0 11-0,690 22-0,370 33 0,539 44-0,363 1-0,300 12-1,690 23 1,343 34 0,902 45-0,032 2-1,278 13-1,847 24-0,085 35 1,919 46 0,028 3 0,244 14-0,978 25-0,186 36-0,085 47-0,323 4 1,276 15-0,774 26-0,513 37-0,524 48 2,195 5 1,198 16-2,118 27 1,972 38 0,675 49-1,742 6 1,733 17-0,568 28 0,866 39-0,381 50-0,736 7-2,184 18-0,404 29 2,376 40 0,758 8-0,234 19 0,135 30-0,655 41-1,444 9 1,095 20-0,365 31 1,661 42-0,847 10-1,087 21-0,327 32-1,612 43-1,522 A partir desta tabela podemos gerar os u t de acordo com a equação (12.4.5) e a condição inicial u 0 = 5. Por exemplo: u 1 = 0,7.u 0 +ε 1 = 0,7(5) + ( 0,300) = 3,200 u 2 = 0,7.u 1 +ε 2 = 0,7(3,200) + ( 1,278) = 0,962 etc... A próxima figura mostra a evolução dos u t s ao longo do tempo. u(t) = 0,7*u(t-1)+e(t) 6 4 2 0 0 1 2 3 4 5 6 7 8 9 1011 12 1314 15 1617 18 1920 21 2223 24 2526 27 2829 30 3132 33 3435 36 3738 39 4041 42 4344 45 4647 48 4950-2 -4-6
Econometria Semestre 2010.01 138 138 Suponha agora que os valores de X são 1, 2,..., 50. A partir deles e dos u s gerados acima podemos, a partir da equação (12.4.3), obter os Y t. Então, Y t = 1 + 0,8.X t + u t para t = 1,2,..., 50. Específicamente, Y 1 = 1 + 0,8 + u 1 = 1,8 + u 1 = 1,8 + 3,2 = 5 Y 2 = 1 + 0,8(2) + u 2 = 2,6 + u 2 = 2,6 + 0,962 = 3,562, etc... A próxima tabela fornece os valores de u t e Y t para t = 1,2,...10. instante (t) e(t) u(t) = 0,7*u(t-1)+e(t) Y(t) = 1 + 0,8*t +u(t) 0 0 5 1-0,300 3,200 5,000 2-1,278 0,962 3,562 3 0,244 0,918 4,318 4 1,276 1,919 6,119 5 1,198 2,542 7,542 6 1,733 3,512 9,312 7-2,184 0,275 6,875 8-0,234-0,042 7,358 9 1,095 1,066 9,266 10-1,087-0,341 8,659 O gráfico de Y t é mostrado a seguir (para t =1, 2,..., 50): Y(t) = 1 + 0,8*t +u(t) 45 40 35 30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 1112 13 1415 16 1718 19 2021 22 2324 25 2627 28 2930 31 3233 34 3536 37 3839 40 4142 43 4445 46 4748 49 50 No próximo passo ajustamos uma regressão aos primeiros 25 pares (X t,y t ). Veremos que o resultado desta regressão não lembra nem um pouco a equação verdadeira E(Y t X t ) = 1 + 0,8*X t.
Econometria Semestre 2010.01 139 139 O resultado da regressão linear no Excel é: ANOVA gl SQ MQ F F de significação Regressão 1 521,03 521,03 148,91 0,00 Resíduo 23 80,48 3,50 Total 24 601,50 Coeficientes Erro padrão Stat t valor-p 95% inferiores 95% superiores Interseção 2,5160 0,7712 3,2623 0,0034 0,9206 4,1115 X 0,6331 0,0519 12,2029 0,0000 0,5258 0,7404 O R 2 2 desta regressão é 86,6%. Note que a variância estimada ˆ σ é 3,50 (igual à RSS/(n 2) = 80,48/23 =3,50), um valor MUITO diferente do real. Da tabela acima nota se que a equação estimada usando os primeiros 25 pares é: Y ˆ = 2,516 + 0,633* e ambos os coeficientes angular e linear são significantes, de acordo com t X t as estatísticas t correspondentes. A próxima figura mostra os valores de Y t e as retas real (1 + 0,8X t ) e ajustada pelo modelo de regressão nos 25 primeiros pontos (2,516 + 0,633X t ). Valor Real de Y, reta estimada por MQO e reta verdadeira 24 20 16 12 8 4 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Y real Reta verdadeira (1 +0,8*X) Y Previsto MQO A figura anterior justifica porque o procedimento de MQO tende a subestimar a variância se existe autocorrelação dos resíduos. Note que os resíduos computados em relação à reta vermelha (reta MQO) tendem a ser menores que os resíduos calculados em relação à reta real (reta azul). Para verificar isso, basta selecionar um ponto Y qualquer e traçar a linha vertical entre Y e a reta
Econometria Semestre 2010.01 140 140 ajustada MQO (ou entre Y e a linha verdadeira linha azul). Assim, os resíduos MQO não fornecem uma boa estimativa dos erros u i. Considere um outro experimento de Monte Carlo, usando os mesmos dados que antes, mas suponha que ρ = 0 na equação (12.4.5), e não mais 0,7 como suposto na experiência anterior. Então os u t são agora descorrelatados, u 1 = ε 1 = 0,300, u 2 = ε 2 = 1,278, etc... Daí: Y 1 = 1 + 0,8 + u 1 = 1,8 + u 1 = 1,8 0,3 = 1,5 Y 2 = 1 + 0,8(2) + u 2 = 2,6 + u 2 = 2,6 1,278 = 1,322 etc... A seguir ajustamos a reta por MQO para os primeiros 25 pares (X t,y t ). Note que agora a hipótese de erros descorrelatados é válida e assim a reta ajustada deve se aproximar da reta verdadeira 1 + 0,8X t. Os 25 valores de X e Y são mostrados na próxima tabela: X Y X Y 1 1,50 14 11,22 2 1,32 15 12,23 3 3,64 16 11,68 4 5,48 17 14,03 5 6,20 18 15,00 6 7,53 19 16,33 7 4,42 20 16,63 8 7,17 21 17,47 9 9,30 22 18,23 10 7,91 23 20,74 11 9,11 24 20,11 12 8,91 25 20,81 13 9,55 A equação estimada usando os primeiros 25 pares é: Y ˆ = 0,785 + 0,790* X Note que o coeficiente linear da regressão não é significante (a 5%). O R 2 desta regressão é 96,7% 2 (no caso anterior era 86,6%). A variância estimada ˆ σ é 1,20 (vide tabela ANOVA), bem mais próxima do valor verdadeiro (1). t t
Econometria Semestre 2010.01 141 141 Modelo Simulado SEM Autocorrelação dos Resíduos - valores reais, reta teórica e reta ajustada por MQO 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,9834 R-Quadrado 0,9672 R-quadrado ajustad 0,9657 Erro padrão 1,0951 Observações 25 Y Reta verdadeira (1 +0,8*X) Y Previsto MQO ANOVA gl SQ MQ F F de significação Regressão 1 812,31 812,31 677,31 0,00 Resíduo 23 27,58 1,20 Total 24 839,89 Coeficientes Erro padrão Stat t valor-p 95% inferiores 95% superiores Interseção 0,785 0,452 1,739 0,095-0,149 1,719 X 0,790 0,030 26,025 0,000 0,728 0,853 O gráfico a seguir apresenta os pares (X, Y) e as retas real e ajustada por MQO. 12.5. EXEMPLO RELAÇÃO ENTRE SALÁRIOS E PRODUTIVIDADE NOS EUA Os dados da tabela 12.4 apresentam índices de remuneração real por hora (Y) e produção por hora (X) em empresas dos EUA no período entre 1959 e 1998. A figura a seguir mostra estes dados.
Econometria Semestre 2010.01 142 142 Gujarati ajusta dois modelos, um linear e outro log linear, com os resultados mostrados a seguir. 1) Modelo linear Ode d é a estatística de Durbin Watson, que será discutida a seguir e se(.) indica o erro padrão do estimador. 2) Modelo log linear As questões que se colocam na prática são: Os modelos exibem resultados parecidos. Os coeficientes estimados, avaliados pelas estatísticas t, parecem altamente significantes. Mas, até que ponto os resultados das regressões (12.5.1) e (12.5.2) são confiáveis? A autocorrelação deve ser um problema aqui, pois ambas as séries evoluem no tempo, e nesta situação não podemos confiar nos erros padrão (e assim as estatísticas t produzidas também não são confiáveis).
Econometria Semestre 2010.01 143 143 Então a questão principal é: COMO DETECTAR A AUTOCORRELAÇÃO? 12.6. DETECTANDO A AUTOCORRELAÇÃO Lembre se que a ausência de autocorrelação é uma premissa feita sobre os erros do modelo, que não são observáveis o melhor que temos para inferir sobre os erros são os resíduos do modelo, que podem ser calculados. Então o melhor que podemos fazer é usar os resíduos para verificar se a premissa de correlação zero dos erros está sendo violada (usamos este mesmo raciocínio para inferir sobre a heterocedasticidade, lembra se?). 1) Método Gráfico O gráfico dos resíduos (ou do quadrado dos resíduos) pode revelar a existência de autocorrelação. SE NÃO EXISTE AUTOCORRELAÇÃO, o gráfico dos resíduos ao longo do tempo deve ser puramente aleatório, com o seguinte aspecto: Volte ao exemplo da seção 12.5. e considere o modelo linear (12.5.1). O gráfico dos resíduos (e dos resíduos padronizados, i.e., divididos pelo erro padrão da regressão σˆ ) é mostrado a seguir:
Econometria Semestre 2010.01 144 144 Note que ambos os resíduos ( puro e padronizado) exibem um padrão parecido com o da figura abaixo: Ou seja, os resíduos parecem seguir o padrão: uma sequência de valores negativos, uma sequência de valores positivos e uma sequência de valores negativos. Este padrão sugere que os resíduos não são puramente aleatórios, ou seja, há uma indicação de correlação entre os resíduos de diferentes instantes. Uma forma de tentar verificar isso é fazer o gráfico do resíduo no instante t contra o resíduo no instante anterior. Se este gráfico apresenta um padrão claramente não aleatório, há evidência de que o resíduo no instante t dependa do resíduo no instante anterior, ou seja, há evidência de autocorrelação de lag 1. O gráfico a seguir mostra os resíduos nos instantes t e t 1 da regressão linear (12.5.1). O gráfico mostra um padrão linear bastante claro entre u^(t) e u^(t 1). Isso indica uma forte correlação positiva entre os resíduos, e portanto há evidência de autocorrelação nos erros (não observáveis).
Econometria Semestre 2010.01 145 145 2) O teste das carreiras ( runs test ) Nas páginas anteriores mostramos algumas maneiras de tentar detectar a autocorrelação nos erros a partir de gráficos dos resíduos. O problema é que estas análises, embora muito importantes, são bastante empíricas e subjetivas, não há uma receita infalível para dizer inequivocamente que a autocorrelação existe ou não. O teste das carreiras (também conhecido com teste de Geary ou teste de Wald Wolfowitz) é um teste de aleatoriedade, e será aplicado aos resíduos do modelo. Ele se baseia no sinal dos resíduos da regressão. Lembre se que os resíduos têm média zero, e assim o que o teste verifica é se os padrões de resíduos acima e abaixo da média (zero) são aleatórios. O teste pode ser estendido a séries com médias diferentes de zero, basta aplicar o teste à série com a média subtraída. No caso da regressão (12.5.1) existem 40 resíduos, que apresentam o seguinte padrão: 9 resíduos negativos 21 resíduos positivos 10 resíduos negativos Definição ( carreira ) Uma carreira ( run ) é uma sequência ininterrupta de resultados com o mesmo sinal. A extensão da carreira é o número de elementos que a compõem. No caso dos resíduos da regressão (12.5.1) existem 3 carreiras, a primeira de extensão (comprimento) 9, a segunda de comprimento 21 e a terceira de comprimento 10. Será que estas 3 carreiras se comportam mais ou menos da mesma forma que uma sequência de 3 carreiras de 40 observações aleatórias? Sejam: N = número total de observações = N 1 + N 2 N 1 = número de sinais positivos N 2 = número de sinais negativos R = número de carreiras
Econometria Semestre 2010.01 146 146 Considere a hipótese nula de que os resultados sucessivos são independentes. Suponha que AMBOS N 1 e N 2 > 10. Nestas condições, o número de carreiras é assintoticamente Normal com média e variância: Sob a hipótese nula de aleatoriedade e usando um intervalo de confiança 95% então: { E( R) 1,96. R E( R) + 1,96. σ } 0, 95 Pr σ = (12.6.3) R R Ou seja, R está no intervalo descrito acima com 95% de probabilidade. Logo, REJEITA SE A HIPÓTESE DE ALEATORIEDADE DAS CARREIRAS (COM NÍVEL 5%) SE O INTERVALO DESCRITO EM (12.6.3) NÃO CONTÉM R. No s resíduos da regressão (12.5.1), N 1 = 21, N 2 = 19, N = 21 19 = 40 e R = 3. Então: 2(21)(19) μ = E( R) = + 1 = 20,95 (ATENÇÃO CORRIGIR O VALOR NO GUJARATI) 40 σ 2 r 2 = ( 21)( 19)( 2(21)(19) 40) 2 ( 40) ( 39) = 604884 62400 = 9,6936 = ( 3,1134) 2 Logo, o IC 95% para R é: (20,95 1,96*3,11, 20,95 + 1,96*3,11) = (14,85, 27,05) que obviamente não inclui R = 3. Logo, rejeitamos a hipótese de que os resíduos da regressão (12.5.1) são aleatórios, ou sejam, eles apresentam algum tipo de comportamento sistemático. Nota O teste apresentado é válido quando ambos N 1 e N 2 > 10. Swed e Eisenhart elaboraram tabelas para valores menores que estes. As tabelas estão no apêndice D.6 de Gujarati e são reproduzidas a seguir. As tabelas D.6A e D.6B fornecem o número crítico n de carreiras. Se n é menor que o valor
Econometria Semestre 2010.01 147 147 em D.6A ou maior que o valor em D.6B, rejeita se a hipótese de aleatoriedade ao nível 5%. Por exemplo, suponha que existem N = 30 observações, das quais N1=20 são positivas e N2=10 são negativas. Então, se olharmos para as tabelas anteriores, rejeita se a hipótese de aleatoriedade se R <= 9 (tabela D.6A) ou R => 20 (tabela D.6B).