4 Modelos de Regressão Dinâmica

Documentos relacionados
4 Base de dados, métricas estatísticas e metodologia

Um Modelo Híbrido para Previsão de Curto Prazo da Demanda de Gasolina Automotiva no Brasil

2 Metodologia. 2.1 Série Temporal

Esse material foi extraído de Barbetta (2007 cap 13)

ANÁLISE DE SÉRIES TEMPORAIS

Modelos de Regressão Linear Simples - Análise de Resíduos

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9

Mestrado Profissionalizante em Finanças as e Economia Empresarial FGV / EPGE Prof. Eduardo Ribeiro Julho Setembro 2007

Econometria em Finanças e Atuária

Modelos de Regressão Linear Simples - Análise de Resíduos

Métodos Quantitativos para Avaliação de Políticas Públicas

Aula 2 Uma breve revisão sobre modelos lineares

CONHECIMENTOS ESPECÍFICOS

A Metodologia de Box & Jenkins

Notas de Aulas Econometria I ** Eduardo P. Ribeiro, 2010 PARTE II

Prova de Estatística

Modelo de Regressão Múltipla

LES0773 Estatística Aplicada III

2 Modelos Não Lineares

Endogeneidade, Variáveis Instrumentais e Modelos de Equações Estruturais

Regressões: Simples e MúltiplaM. Prof. Dr. Luiz Paulo Fávero 1

Econometria. Séries Temporais Lista de Exercícios

Correlação e Regressão

Exercícios Selecionados de Econometria para Concursos Públicos

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

Ralph S. Silva

2 Estimação de uma Curva de Demanda Agregada para o Brasil

Análise de Regressão Linear Múltipla IX

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 12

Aula 2 Tópicos em Econometria I. Porque estudar econometria? Causalidade! Modelo de RLM Hipóteses

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra

Homocedasticidade? Exemplo: consumo vs peso de automóveis

Análise de Regressão EST036

AULA 11 Heteroscedasticidade

Estatística - Análise de Regressão Linear Simples. Professor José Alberto - (11) sosestatistica.com.br

Análise e Previsão de Séries Temporais Aula 1: Introdução às séries temporais. Eraylson Galdino

RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO

Prova de Estatística

Correlação Serial e Heterocedasticidade em Regressões de Séries Temporais. Wooldridge, Cap. 12

AULAS 21 E 22 Análise de Regressão Múltipla: Estimação

Neste capítulo apresentam-se os modelos STVAR-Tree, o principal da dissertação, além dos modelos competidores PAR(p) e Neuro-Fuzzy.

Mais Informações sobre Itens do Relatório

Prof. Lorí Viali, Dr.

Econometria. Econometria MQO MQO. Resíduos. Resíduos MQO. 1. Exemplo da técnica MQO. 2. Hipóteses do Modelo de RLM. 3.

Renda x Vulnerabilidade Ambiental

Correlação e Regressão Linear

4 Modelo Híbrido de Previsão de Reativo

AULA 9 - MQO em regressão múltipla: Propriedades Estatísticas (Valor Esperado)

Vetores Auto-Regressivos (VAR) Cristian Rafael Pelizza Estágio de docência

'HVFULomRH$QiOLVH([SORUDWyULDGRV'DGRV

Econometria. Econometria ( ) O modelo de regressão linear múltipla. O modelo de regressão linear múltipla. Aula 2-26/8/2010

Análise de Regressão Linear Simples e

Análise Multivariada Aplicada à Contabilidade

2 Modelos em Espaço de Estado Lineares: Formulação Geral

Econometria em Finanças e Atuária

Métodos Quantitativos Aplicados

Quiz Econometria I versão 1

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

Análise de regressão linear simples. Diagrama de dispersão

Introdução ao modelo de Regressão Linear

CORRELAÇÃO E REGRESSÃO. Modelos Probabilísticos para a Computação Professora: Andréa Rocha. UNIVERSIDADE FEDERAL DA PARAÍBA Dezembro, 2011

PREVISÃO. Prever o que irá. acontecer. boas decisões com impacto no futuro. Informação disponível. -quantitativa: dados.

Econometria Lista 1 Regressão Linear Simples

Estimação de Variáveis Instrumentais e Mínimos Quadrados de Dois Estágios. Wooldridge, Cápítulo 15

A análise de séries temporais é uma área da estatística dedicada ao estudo de dados orientados no tempo (MONTGOMERY, 2004).

Econometria - Lista 6

AULAS 25 E 26 Heteroscedasticidade

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

Capítulo 1. ˆ Observações correlacionadas são mais difíceis de analisar e requerem técnicas

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

ESTATÍSTICA COMPUTACIONAL

Séries Temporais Tendência e sazonalidade.

Especialização em Engenharia de Processos e de Sistemas de Produção

AULAS 14 E 15 Modelo de regressão simples

Testes de Raiz Unitária para Dados em Painel

Predição da Taxa de Desemprego Brasileira utilizando com Modelo de Regressão com Erros Autocorrelacionados

Revisão dos Modelos de Vetores Autorregressivos com Fundamentação Econômica 2012

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

Multicolinariedade e Autocorrelação

Dissertação apresentada como requisito parcial para obtenção do título de Mestre pelo Programa de Pós- Graduação em Engenharia Elétrica da PUC-Rio.

i j i i Y X X X i j i i i

REGRESSÃO E CORRELAÇÃO

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS

Análise de dados em Geociências

VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO DE ANÁLISE DE VARIÂNCIA ANÁLISE DE RESÍDUOS

Econometria IV Modelos Lineares de Séries Temporais. Fernando Chague

2 Revisão Bibliográfica

6 Geração de Cenários

Econometria. Regressão Linear Simples Lista de Exercícios

Econometria Semestre

Aplicação da metodologia Box & Jenkins para previsão de vendas de emulsificante

Modelagem do comportamento da variação do índice IBOVESPA através da metodologia de séries temporais

Noções sobre Regressão

7 Testes de Robustez. 7.1 Efeito sobre os alunos não beneficiados

Estimação no Domínio do tempo: Covariâncias e modelos ARIMA

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

Coeficiente de determinação R 2 no modelo de regressão linear normal

AULA 07 Regressão. Ernesto F. L. Amaral. 05 de outubro de 2013

Transcrição:

4 Modelos de Regressão Dinâmica Nos modelos de regressão linear (Johnston e Dinardo, 1998) estudados comumente na literatura, supõe-se que os erros gerados pelo modelo possuem algumas características como: média zero, variância constante, distribuição normal e independência, implicando, assim, na inexistência de correlação serial. Segundo Barros e Souza (1995), ao se tentar modelar uma série temporal através de um modelo de regressão, a hipótese de independência dos ruídos não é realista, e os resultados e testes usados nos modelos de regressão não são válidos. Por exemplo, segundo os autores, algumas das conseqüências da autocorrelação dos resíduos são: 1) Os estimadores usuais por mínimos quadrados são ainda não tendenciosos, mas não têm variância mínima. 2) Os estimadores da variância e dos erros padrões dos coeficientes da regressão são subestimados, o que levaria à conclusão de que os estimadores são mais precisos do que na realidade. 3) Os intervalos de confiança para os parâmetros da regressão e os testes de hipóteses relacionados a estes intervalos perdem a validade, como uma conseqüência direta de 2). Desta forma, estes três motivos implicam na necessidade de procurar procedimentos para tratar o problema de autocorrelação dos erros, pois ignorálos leva, em geral, a inúmeras conclusões falsas. Em particular, dado que a hipótese de independência dos erros não é realista no contexto de séries temporais, os modelos de regressão dinâmica estendem os modelos usuais de regressão ao levantarem esta restrição. Os modelos de regressão dinâmica combinam a dinâmica de séries temporais e o efeito de variáveis explicativas. Atenta-se que o termo regressão dinâmica não indica que os parâmetros do modelo evoluem no tempo (onde é o caso dos modelos de espaço de estados que usam o Filtro de Kalman (Hamilton, 1994)). Ao invés disso, a palavra dinâmica significa aqui um modelo de regressão no qual se inclui a estrutura de dependência de uma série temporal. Modelos de regressão dinâmica devem ser usados quando existe uma estrutura de dependência entre a variável de interesse e possíveis variáveis

32 causais e, ao mesmo tempo, quando a estrutura de correlação da série dependente indicar que não se pode supor a independência dos erros. Nos modelos de regressão dinâmica, a variável dependente é explicada por seus valores defasados e pelos valores atuais e passados de variáveis causais ou exógenas. (Zanini, 2000) 4.1. Estrutura dos modelos Os modelos de regressão dinâmica podem ser descritos pela equação: ϕ(b)y t = βx t + ε t (4.1) onde: y t, variável dependente (endógena) no instante t; β, vetor de coeficientes das variáveis causais, que vai ser estimado por mínimos quadrados; x t, vetor de variáveis causais (exógenas) no instante t; ε t, ruído aleatório associado ao modelo, onde supomos que os ε t são distribuídos como NID(0,σ2); ϕ(b), polinômio auto-regressivo de ordem p, isto é: ϕ(b) = 1 - ϕ 1 B - ϕ 2 B 2 -... - ϕ p B p sendo B o operador de retardo. A estrutura do modelo de regressão dinâmica permite considerar como elementos de x t variáveis causais e também suas defasagens. A presença do polinômio ϕ(b) no modelo traz uma grande flexibilidade desta classe de modelos, mas, ao mesmo tempo, dificulta a procura por um modelo adequado. Observa-se que, se ϕ(b) = 1, não existem defasagens da variável dependente, e a interpretação do modelo é muito simples, pois as variáveis causais influenciam diretamente a variável endógena. Ao contrário, quando ϕ(b) 1, o modelo pode ser usado para representar relações bastante complicadas. O modelo de regressão dinâmica pode ser considerado um caso particular do que é conhecido na literatura como modelos de Cochrane e Orcutt generalizados. A seguir uma breve explicação destes modelos. 4.2. Modelos de Regressão Cochrane e Orcutt Generalizados por: O modelo de regressão generalizado de Cochrane e Orcutt (1949) é dado ϕ(b)y t = βx t + w t (4.2)

33 R(B)w t = ε t (4.3) onde R(B) é um polinômio auto-regressivo Pode-se notar que a equação (4.2) tem a mesma forma da equação (4.1) da regressão dinâmica, entretanto os erros w t apresentam uma estrutura AR dada pela equação (4.3). No modelo original supõe-se que os ruídos w t seguem um AR(1), ou seja, a equação (4.3) é dada por: w t = ηw t-1 + ε t onde esse último termo da expressão é distribuído como NID(0, σ 2 ). Este modelo, dado pelas equações (4.2) e (4.3), ainda pode ser descrito em termos de uma única equação como a seguir. Note que da equação (4.2): w t = ϕ(b)y t - βx t Substituindo esta última expressão na equação (4.3) tem-se que: R(B).[ ϕ(b)y t - βx t ] = ε t (4.4) Desta última expressão nota-se que o modelo de regressão generalizado de Cochrane e Orcutt introduz defasagens tanto na variável dependente (Y t ) quanto nas causais. A expressão (4.4) indica também que a relação de causalidade entre y t e x t não é afetada pela introdução do polinômio autoregressivo R(B). Esta última equação pode ainda ser escrita em termos de novas variáveis y* t e x* t dadas por: Y* t = R(B)y t e x* t = R(B)x t onde R(B) é chamado de fator comum e representa a estrutura de correlação presente no erro w t. A equação obtida, então, se usando estas novas variáveis é: ϕ(b)y* t = βx* t + ε t (4.5) Logo, o modelo de regressão generalizado de Cochrane e Orcutt reduz-se ao modelo de regressão dinâmica usual ao se considerar as novas variáveis Y* t e x* t. O modelo original de Cochrane e Orcutt tem como fator comum R(B) = 1 - αb e então a equação (4.5) se reduz a: ϕ(b).[y t - αy t-1 ] = β[x t - αx t-1 ] + ε t (4.6) Neste modelo, o procedimento de estimação é seqüencial. A estimativa inicial de α é igual a 0, e a partir dela estimamos β e ϕ(b) por mínimos quadrados ordinários. A partir destas estimativas encontra-se um estimador de R(B) através da equação R(B)w t = ε t. O polinômio estimado R(B) é então usado para transformar y t e x t e reestimar β e ϕ(b). O processo é repetido até que se alcance a convergência dos parâmetros. Para maiores detalhes do modelo e do procedimento de estimação veja Barros e Souza (1995).

34 4.3. Estratégia de modelagem para modelos de Regressão Dinâmica A estratégia usualmente empregada para construir um modelo de regressão dinâmica é uma estratégia bottom-up, isto é, considera-se inicialmente um modelo simples para depois melhorá-lo e incluir novas variáveis até encontrar um modelo apropriado. A elaboração de um modelo de regressão dinâmica é muitas vezes um procedimento difícil, pois é preciso não apenas escolher as variáveis a serem incluídas no modelo, mas também as defasagens destas variáveis. Na definição do modelo adequado, é necessário levar em conta não só a significância dos parâmetros, mas também uma certa estrutura lógica do modelo. Em síntese, na escolha de um modelo de regressão, não é necessário apenas encontrar um ajuste de parâmetros adequado, mas fundamentalmente verificar se os coeficientes estimados são coerentes. As previsões geradas por um modelo de regressão dinâmica dependem não só de valores passados da série, mas também dos valores previstos para as variáveis causais. Logo, para se obter as previsões da série y t para T+1, T+2, T+3, etc, é necessário fornecer ao modelo os valores futuros do vetor de variáveis causais x t. Se as previsões destas variáveis exógenas não forem apropriadas, o modelo de regressão dinâmica irá também gerar previsões inadequadas. Veja em Zanini (2000) um fluxograma que, após as considerações citadas acima, indica de forma genérica quais são os passos que devem ser seguidos para a construção de um modelo de regressão dinâmica. Vale dizer ainda que, nos modelos de regressão dinâmica, podem ser usadas variáveis de intervenção ou variáveis dummy (Johnston e Dinardo, 1998). O objetivo deste tipo de procedimento é considerar situações atípicas como, por exemplo, para o caso do preço spot de energia elétrica no Brasil, o racionamento ocorrido de Julho de 2001 a Janeiro de 2002. Os modelos de regressão dinâmica incorporam ainda diretamente a sazonalidade da série ao modelo, ao invés de supor que a série será previamente dessazonalizada. Para isso, existem duas maneiras de tratar a sazonalidade: via dummies sazonais ou diretamente, através de defasagens na variável dependente ou nos erros estruturados.

35 4.4. Testes estatísticos utilizados nos modelos de Regressão Dinâmica Diversos testes estatísticos podem ser utilizados para mensurar o grau de adequação de um modelo de regressão dinâmica. Estes testes, que são em sua grande maioria variantes dos testes de Multiplicadores de Lagrange (Barros e Souza, 1995), são aplicados em diversos estágios da modelagem da série. Temse, por exemplo: 1) testes com o objetivo de definir a especificação do modelo explicativo; 2) testes visando encontrar a dinâmica do modelo, isto é, a inclusão ou não de variáveis defasadas; 3) testes para verificar o ajuste do modelo. Serão abordados, de uma forma geral, quais são, na prática, os procedimentos para que os testes sejam realizados. Primeiramente, menciona-se os testes utilizados para a verificação da dinâmica do modelo. A dinâmica de um modelo acontece através das defasagens da variável dependente e/ou através da presença de erros estruturados num modelo de Cochrane-Orcutt. A cada momento da elaboração do modelo, são realizados testes de hipóteses (Dudewicz e Mishra, 1988) sobre a dinâmica do modelo. Em todos os casos a seguir, a hipótese nula afirma que a dinâmica do modelo está corretamente especificada, ou seja, a inclusão de outras defasagens da variável dependente ou outros erros estruturados não é necessária. A hipótese alternativa representa, em cada caso, a necessidade de inclusão de novos termos. Sendo assim se tem: a) Teste de defasagem da variável endógena: suponha que a variável dependente y t e suas defasagens y t-1, y t-2,..., y t-p-1 estejam presentes no modelo atual. A hipótese alternativa consiste em adicionar a variável defasada y t-p ao modelo, isto é, adiciona-se a primeira defasagem ainda não presente no modelo atual. Se esta variável for considerada significante, a hipótese nula é rejeitada e deve-se adicionar a variável y t-p ao modelo. b) Teste da defasagem sazonal da variável endógena: este teste é semelhante ao anterior. A hipótese alternativa consiste em adicionar ao modelo atual a variável defasada até a primeira defasagem sazonal y t-ps ainda não presente ao modelo. Se o coeficiente de y t-ps for significante, esta variável deve ser incluída no modelo e a hipótese nula deve ser rejeitada.

36 c) Teste da seqüência de defasagens da variável endógena: a hipótese alternativa consiste em adicionar todos as defasagens da variável dependente que ainda não estão presentes no modelo. d) Teste da defasagem dos resíduos: a hipótese alternativa consiste em adicionar ao modelo o primeiro termo defasado ε t-p ainda não incluído no modelo atual. e) Teste da defasagem sazonal dos resíduos: na hipótese alternativa adiciona-se ao modelo atual a primeira defasagem sazonal ε t-ps ainda não presente no modelo. Depois de mencionar os testes para a verificação da dinâmica do modelo, o próximo teste serve para a especificação correta das variáveis causais. O objetivo destes próximos testes é verificar se a inclusão de uma ou mais variáveis ainda não contempladas no modelo resulta numa melhora do ajuste. Salienta-se para o fato de que os testes para a especificação de variáveis causais não se referem à parte dinâmica do modelo, e não tratam da inclusão de defasagens da variável dependente e de erros estruturados que são realizados nos testes para a dinâmica. f) Teste das variáveis causais excluídas: neste teste verifica-se a necessidade de inclusão de cada uma das variáveis (escolhidas previamente para análise), mas que ainda não estão presentes no modelo. Se quaisquer destas variáveis são consideradas significantes, deve-se incluí-las no modelo (talvez seqüencialmente) e rodar a mesma bateria de testes para verificar se a inclusão foi vantajosa. g) Teste da defasagem das variáveis causais: na hipótese alternativa inclui-se uma defasagem adicional das variáveis causais já presentes no modelo atual. Por último, testa-se a presença de autocorrelação na série de resíduos. Vale dizer que testes para verificar a homocedasticidade dos mesmos também podem ser feitos. Se as autocorrelações dos resíduos são significantes para algumas defasagens, alguma característica da variável dependente não foi capturada pelo modelo atual. Segundo Barros e Souza (1995), a existência de autocorrelações significantes nos resíduos pode então indicar uma das seguintes situações: 1) deve-se incluir mais defasagens da variável dependente ou 2) deve-se incluir defasagens adicionais das variáveis exógenas já presentes no modelo ou incluir novas variáveis causais.