Um Modelo Híbrido para Previsão de Curto Prazo da Demanda de Gasolina Automotiva no Brasil

Documentos relacionados
4 Modelos de Regressão Dinâmica

4 Base de dados, métricas estatísticas e metodologia

Previsão de Contingência Judicial em Empresas do Setor Elétrico: Uma Abordagem via Regressão Dinâmica e Amortecimento Exponencial

Aplicação da metodologia Box & Jenkins para previsão de vendas de emulsificante

Análise e Previsão de Séries Temporais Aula 1: Introdução às séries temporais. Eraylson Galdino

Modelagem do comportamento da variação do índice IBOVESPA através da metodologia de séries temporais

Eliane da Silva Christo. Previsão de Potência Reativa. Tese de Doutorado

Combinação Geométrica de Métodos Preditivos; Aplicação à Previsão de Consumo Residencial Mensal de Energia Elétrica

3 Modelos Comparativos: Teoria e Metodologia

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos

Redes Neurais: Uma Aplicação na Previsão de Vendas

Metodologia para estimação e previsão dos perfis das curvas de carga por subestação e classes de consumo

4 APLICAÇÕES À SÉRIE TEMPORAL DE CONSUMO RESIDENCIAL MENSAL DE ENERGIA ELÉTRICA

Jorge Caiado CEMAPRE/ISEG, Universidade Técnica de Lisboa Web:

2 Modelos Não Lineares

Análise do consumo de energia elétrica da cidade de Uberlândia MG, utilizando modelos de séries temporais

Esse material foi extraído de Barbetta (2007 cap 13)

Revisão dos Modelos de Vetores Autorregressivos com Fundamentação Econômica 2012

Análise de previsão da inflação no período pós-plano Real

Análise e previsão das taxas da população ocupada em Fortaleza, Ceará, de setembro de 1991 a dezembro de 2008

Metodologia de Box-Jenkins. Metodologia de Box-Jenkins. Metodologia de Box-Jenkins

Econometria em Finanças e Atuária

PREVISÃO DE PREÇO DO QUILO DO CAFÉ ARÁBICA: UMA APLICAÇÃO DOS MODELOS ARIMA E GARCH

Análise do volume útil do reservatório de Furnas via modelos de séries temporais

Análise do custo médio por metro quadrado da construção civil no estado de Minas Gerais usando modelos de séries temporais

Mestrado Profissionalizante em Finanças as e Economia Empresarial FGV / EPGE Prof. Eduardo Ribeiro Julho Setembro 2007

Uso de séries temporais na análise da temperatura média mensal da cidade de Mossoró, RN

Correlação e Regressão

Utilizando a função auto.arima em modelos de séries temporais

CONHECIMENTOS ESPECÍFICOS

MELHORA DO MODELO SARIMA PARA A PREVISÃO DA DEMANDA MÁXIMA DE CARGA DE ENERGIA DA PUC-RIO UTILIZANDO A SIMULAÇÃO PELO MÉTODO DE MONTE CARLO

Análise comparativa entre métodos estatístico e rede neural aplicados em séries temporais

i j i i Y X X X i j i i i

Econometria Semestre

Modelo de Regressão Múltipla

PREVISÃO. Prever o que irá. acontecer. boas decisões com impacto no futuro. Informação disponível. -quantitativa: dados.

Notas de Aulas Econometria I ** Eduardo P. Ribeiro, 2010 PARTE II

Modelagem do preço da soja utilizando a metodologia de análise de séries temporais 1

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9

ANÁLISE DE SÉRIES TEMPORAIS

Análise e Previsão de Séries Temporais Aula 2: Introdução às séries temporais. Eraylson Galdino

Aula 2 Uma breve revisão sobre modelos lineares

Análise de Regressão EST036

Análise Multivariada Aplicada à Contabilidade

FICHA DE COMPONENTE CURRICULAR

A Metodologia de Box & Jenkins

2. Séries Temporais Definição

Neste capítulo apresentam-se os modelos STVAR-Tree, o principal da dissertação, além dos modelos competidores PAR(p) e Neuro-Fuzzy.

Análise da série temporal do desemprego em regiões metropolitanas do Brasil

2 Revisão Bibliográfica

Avaliação da produção de cana-de-açúcar no Brasil através do estudo de séries temporais

CONHECIMENTOS ESPECÍFICOS

PREVISÃO EM SÉRIES TEMPORAIS COMBINANDO MODELOS ESTATÍSTICOS E CONCEITOS FUZZY

AULAS 14 E 15 Modelo de regressão simples

Métodos Quantitativos para Avaliação de Políticas Públicas

Ralph S. Silva

Regression and Clinical prediction models

2 Metodologia. 2.1 Série Temporal

i j i i Y X X X i j 1 i 2 i i

Predição da Taxa de Desemprego Brasileira utilizando com Modelo de Regressão com Erros Autocorrelacionados

LES0773 Estatística Aplicada III

Capítulo 3. O Modelo de Regressão Linear Simples: Especificação e Estimação

Uma aplicação do modelo ARIMA para os preços do real estate nos municípios de São Paulo e Rio de Janeiro

6 Geração de Cenários

Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito

CONHECIMENTOS ESPECÍFICOS

Regressão linear múltipla. Regressão linear múltipla

Análise de dados em Geociências

AJUSTE DE UM MODELO DE SÉRIES TEMPORAIS PARA PREVISÃO DA TEMPERATURA MÍNIMA DO AR PARA LAVRAS/MG EM 2011

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE CIÊNCIAS CONTÁBEIS PROGRAMA DE PÓS GRADUAÇÃO EM CIÊNCIAS CONTÁBEIS - PPGCC FICHA DE DISCIPLINA

5 PREVISÃO DE SÉRIES TEMPORAIS DE VAZÃO DE DRENOS DA BARRAGEM DE FUNIL

Análise de Regressão Prof. MSc. Danilo Scorzoni Ré FMU Estatística Aplicada

A análise de séries temporais é uma área da estatística dedicada ao estudo de dados orientados no tempo (MONTGOMERY, 2004).

Regressões: Simples e MúltiplaM. Prof. Dr. Luiz Paulo Fávero 1

Prof. Lorí Viali, Dr.

variável dependente natureza dicotômica ou binária independentes, tanto podem ser categóricas ou não estimar a probabilidade associada à ocorrência

Econometria. Séries Temporais Lista de Exercícios

MODELO APLICADO À PREVISÃO DA DEMANDA DE ENERGIA ELÉTRICA DO CAMPUS I DO CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA DE MINAS GERAIS (CEFET-MG).

Análise de Regressão Linear Simples e

PREVISÃO DA PRODUÇÃO DE ÁLCOOL

Modelagem para previsão/estimação: uma aplicação Neuro-Fuzzy

2 Modelos em Espaço de Estado Lineares: Formulação Geral

Previsão da Carga de Energia Diária em Patamares Combinando Técnicas Estatísticas e de Inteligência Computacional

Análise de regressão linear simples. Diagrama de dispersão

Endogeneidade, Variáveis Instrumentais e Modelos de Equações Estruturais

ESTATÍSTICA COMPUTACIONAL

'HVFULomRH$QiOLVH([SORUDWyULDGRV'DGRV

AULAS 14 E 15 Modelo de regressão simples

Exercícios Selecionados de Econometria para Concursos Públicos

Um Estudo do Comportamento dos Gráficos de Controle Construídos Via Metodologia de Geoestatística

2 Estimação de uma Curva de Demanda Agregada para o Brasil

Renda x Vulnerabilidade Ambiental

3 Modelo estocástico para os fatores de risco

Econometria em Finanças e Atuária

1.1 Principais objetivos

Introdução ao modelo de Regressão Linear

Correlação e Regressão Linear

Transcrição:

Proceedings of the V Brazilian Conference on Neural Networks - V Congresso Brasileiro de Redes Neurais pp. 403 407, April 2 5, 2001 - Rio de Janeiro - RJ - Brazil Um Modelo Híbrido para Previsão de Curto Prazo da Demanda de Gasolina Automotiva no Brasil Alexandre Zanini 1, Reinaldo Castro Souza 2, Carlos Eduardo Pedreira 3 1 Dept. Engenharia Elétrica PUC-RIO 2 Dept. Engenharia Elétrica PUC-RIO 3 Dept. Engenharia Elétrica PUC-RIO E-mails: azanini@ele.puc-rio.br, reinaldo@ele.puc-rio.br, pedreira@ele.puc-rio.br Abstract In this paper a short term model to forecast automotive gasoline demand in Brazil is proposed. From the metodology point of view, data is analyzed and a model using a bottom-up strategy is developed. In other words, a simple model is improved step by step until a proper model that fits well the reality is found. Departuring from a univariate model it ends up in a neural network formulation, passing through dynamic regression models. The models obtained in this scheme are compared according to some criterion, mainly forecast accuracy. We conclude, that the efficiency of putting together classical statistics models ( such as Box & Jenkins and dynamic regression) and neural networks improve the forecasting results. This result is highly desirable in modeling time series and, particularly, to the short term forecast of automotive gasoline, object of this paper. 1 - Introdução Na década de 90 observou-se, no Brasil, os primeiros movimentos de um processo de desestatização e flexibilização do monopólio do petróleo com a entrada de novos agentes. Neste novo contexto, a concorrência passa a ser parte integrante e de grande relevância. A abertura da indústria nacional de petróleo e gás natural no Brasil fortalece a necessidade de gerar projeções confiáveis de demanda de combustíveis, em particular, os derivados de petróleo, gás natural e álcool. Acredita-se que uma melhor compreensão do funcionamento do mercado de petróleo e gás natural pode fornecer subsídios para estratégias de planejamento e gestão. Neste artigo, propõe-se um modelo híbrido de previsão para demanda mensal de gasolina automotiva no Brasil [5]. A estratégia de modelagem proposta associa um modelo autoprojetivo [1] a um modelo de regressão dinâmica [4] objetivando-se explicar o comportamento da série de demanda de gasolina através de variáveis exógenas. Finalmente, com o objetivo de captar o comportamento não linear acrescenta-se uma rede neural feedforward. Nas seções dois e três, faz-se uma breve revisão dos fundamentos teóricos dos modelos usados na técnica de modelagem bottom-up. Os resultados preditivos dos modelos são apresentados na seção quatro, sendo feitas as conclusões na seção cinco. 2. Regressão Dinâmica 2.1 Conceituação básica Nos modelos de regressão linear [3], supõe-se que os erros gerados pelo modelo possuem média zero, variância constante, distribuição Normal e independência (o que implica na inexistência de correlação serial). Na prática, ao se tentar modelar uma série temporal através de um modelo deste tipo, a hipótese de independência dos ruídos pode ser não realista. Algumas das conseqüências da autocorrelação dos resíduos são: 1) Os estimadores usuais por mínimos quadrados são ainda não tendenciosos, mas não têm variância mínima; 2) Os estimadores da variância e dos erros padrões dos coeficientes da regressão são subestimados, o que levaria à conclusão de que os estimadores são mais precisos do que na realidade são, e 3) Os intervalos de confiança para os parâmetros da regressão e os testes de hipóteses relacionados a estes intervalos perdem a validade, como uma conseqüência direta de 2). Por estas razões, torna-se interessante buscar procedimentos que tratem o problema de autocorrelação dos erros. Não sendo a hipótese de independência dos erros realista, uma solução são os modelos de regressão dinâmica (que podem ser considerados como um caso particular dos modelos de Cochrane e Orcutt generalizados [2]). Estes modelos combinam a dinâmica de séries temporais e o efeito de variáveis explicativas. Atenta-se que o termo regressão dinâmica não indica que os parâmetros do modelo evoluem no tempo (como é o caso, por exemplo, dos modelos de espaço de estado que usam o Filtro de 403

Kalman). Ao contrário, a palavra dinâmica significa aqui um modelo de regressão no qual incluímos a estrutura de dependência de uma série temporal. Modelos de regressão dinâmica devem ser usados quando existe uma estrutura de dependência entre a variável de interesse e variáveis causais e, ao mesmo tempo, quando a estrutura de correlação da série dependente (série a ser explicada) indicar que não podemos supor a independência dos erros. A variável dependente é explicada por seus valores defasados e pelos valores atuais e passados de variáveis causais ou exógenas. Note-se uma outra distinção entre os modelos de regressão dinâmica e modelos de espaço de estados. Nos modelos de regressão dinâmica, as variáveis exógenas são tratadas como números fixos e não como variáveis aleatórias. Já nos modelos de espaço de estados, as variáveis exógenas são tratadas como séries temporais, ou seja, realizações de processos estocásticos. Logo, no contexto da modelagem em espaço de estados, a estrutura de autocovariâncias e autocorrelações das séries de variáveis exógenas é uma informação de interesse, enquanto este aspecto é ignorado nos modelos de regressão dinâmica. Os modelos de regressão dinâmica podem ser descritos pela equação: ϕ(b)y t = βx t + ε t (1) onde: Y t = variável dependente (endógena) no instante t β = vetor de coeficientes das variáveis causais, que será estimado por mínimos quadrados x t = vetor de variáveis causais (exógenas) no instante t ε t = ruído aleatório associado ao modelo, onde supomos que os ε t são independentes e identicamente distribuídos com densidade N(0,σ 2 ) ϕ(b) = polinômio autoregressivo de ordem p, isto é: ϕ(b) = 1 - ϕ 1 B - ϕ 2 B 2 -... - ϕ p B p sendo B o operador de atraso A estrutura do modelo de regressão dinâmica permite ainda considerar como elementos x t variáveis causais e também suas defasagens. 2.2 Construção de modelos de regressão dinâmica Geralmente os modelos econométricos têm uma estrutura conhecida, baseada em considerações teóricas e o problema reduz-se ao problema de estimação dos parâmetros do modelo já conhecido. Entretanto, este é raramente o caso no contexto de séries temporais, onde a estratégia é construir modelos a partir dos dados. A estratégia usualmente empregada para construir um modelo de regressão dinâmica é uma estratégia bottomup, isto é, partimos de um modelo simples e o refinamos incluindo, quando necessário, novas variáveis até encontrar um modelo apropriado. A elaboração de um modelo de regressão dinâmica é muitas vezes um procedimento difícil, pois é preciso não apenas escolher as variáveis a serem incluídas no modelo, mas também os lags (defasagens) destas variáveis. A especificação correta de um modelo de regressão dinâmica envolve a precisa especificação da relação causal entre as variáveis e da estrutura dinâmica do modelo. Para este fim, realiza-se vários testes até se chegar a um modelo final (a maioria dos testes empregados em regressão dinâmica é uma variante dos testes de Multiplicadores de Lagrange (testes LM) e são baseados na distribuição Qui-Quadrado). Os testes são aplicados em diversos estágios da modelagem da série e consistem basicamente em: i) testes com o objetivo de definir a especificação do modelo explicativo (verificar se a inclusão de uma ou mais variáveis ainda não contempladas no modelo resulta numa melhora do ajuste); ii) testes visando encontrar a dinâmica do modelo (verificar se a inclusão ou não de variáveis defasadas ainda não contempladas resulta numa melhora do ajuste) e iii) testes baseados na autocorrelação dos resíduos (verificar se algum tipo de estrutura presente na série a ser explicada não foi captada pelo modelo em consideração) 3 - Um Modelo Híbrido para Previsão da Demanda de Gasolina O modelo híbrido proposto consiste em combinar redes neurais com regressão dinâmica. O modelo de regressão dinâmica foi otimizado e previamente comparado com um modelo de Box & Jenkins apresentando melhores resultados. O modelo de regressão dinâmica escolhido expressa a seguinte relação de causalidade entre a variável a ser explicada (demanda de gasolina automotiva) e as variáveis exógenas: ln(demanda) t = f[ln(preço t ; Renda t ; Demanda t-3 ; Demanda t-12 )] Uma rede neural é utilizada para prever o erro originado por este modelo de regressão dinâmica de forma a otimizar seu resultado final. Na equação a seguir observa-se que: β ln(d) t = -β 1 ln(p) t + β 2 ln(r) t + β 3 ln(d) t-3 + DETERMÍNISTICO + ε t ALEATÓRIO 404

22 20 18 16 14 Onde: D t = logaritmo da demanda no tempo t P t = logaritmo do preço no tempo t R t = logaritmo da renda no tempo t D t-3 = logaritmo demanda no tempo t 3 D t-12 = logaritmo demanda no tempo t 12 ε t = ruído no tempo t O lado esquerdo desta equação é denominado Y (valor real da demanda). A parte determinística do modelo fornece um valor estimado Y*. Este valor, entretanto, é estimado por um modelo que assume pressupostos de linearidade. Assume-se, portanto, que a diferença Y Y* representa o aspecto não linear da causalidade. Uma rede neural é então utilizada para prever esta diferença. Espera-se que, o valor desta previsão (feita pela rede neural), somada à estimativa Y* (gerada pelo modelo de regressão dinâmica) resulte em uma estimativa melhor da demanda (Y**). É preciso que se defina o conjunto de entrada saída desejada. Definiu-se então duas entradas (erro em t e em t-12) e como saída o erro no tempo t. Ressalta-se que buscou-se utilizar uma arquitetura de rede que fosse a mais simples possível, visando uma maior probabilidade de generalização. 4 Resultados Numéricos A série de demanda de gasolina automotiva pode ser visualizada na figura 1. Figura 1: Gráfico da Demanda de Gasolina Automotiva no Brasil (m 3 ) elaboradas, sendo que a segunda compõe o modelo híbrido. A estrutura dos modelos pode ser visualizada no quadro 1 a seguir: Quadro 1: Modelos elaborados Modelo BJ SARIMA (0,1,1)x(1,0,0) 12 ln(demanda) t = f[ln(demanda t-1 ; Demanda t-12 ; Demanda t-3 ; erro t-1 )] Modelo de Regressão Dinâmica 1 (RD1) ln(demanda) t = f[ln(preço t ; Renda t ; Demanda t-1 ; Demanda t-12 )] Modelo de Regressão Dinâmica 2 (RD2) ln(demanda) t = f[ln(preço t ; Renda t ; Demanda t-3 ; Demanda t-12 )] Rede Neural 1 (RN1) Estrutura: uma camada escondida (com 3 neurônios) e 1 neurônio na camada de saída. Entrada: demanda em t-1, t-12 e t-13 Saída: demanda em t Rede Neural 2 (RN2) ou Modelo Híbrido Estrutura: uma camada escondida (com 3 neurônios) e 1 neurônio na camada de saída. Entrada: erro do RD2 em t-1 e t-12 Saída: erro do RD2 em t Após partir de um modelo mais simples (univariado) para um mais complexo (redes neurais) passando por um modelo de regressão dinâmica, realiza-se nesta seção uma análise comparativa dos resultados obtidos através destes modelos. As seguintes medidas de erro foram utilizadas com a finalidade de comparar os resultados: (Mean Absolute Percentual Erro): U-Theil: U N i= = 1 THEIL erro percentual N = 1 1 i = 1 2 ei i = 1 ( Z( i) Z ( i 12 10 X 1E+008 8 1991 1992 1993 1994 1995 1996 1997 1998 1999 Para efeito de comparação dos resultados de previsão, elaborou-se um modelo Box & Jenkins para a demanda de gasolina. Fez-se dois modelos de regressão dinâmica (sendo o melhor modelo selecionado para compor o modelo híbrido). Duas redes neurais foram O é uma medida clássica e o U-THEIL permite fazer uma comparação em relação ao método ingênuo. Estas medidas de erro foram calculadas in sample (janeiro de 1991 a junho de 1999) e out of sample (período de julho a dezembro de 1999). A eficiência preditiva dos modelos pode ser comparativamente observada nas figuras 2 e 3. Cabem aqui então algumas considerações. Pode-se observar que, na amostra in sample, o segundo modelo de regressão dinâmica (RD2) apresenta melhor resultado do o que primeiro modelo de regressão 405

dinâmica (RD1) assim como também se desempenha melhor do que o modelo de Box & Jenkins (BJ). Este resultado já era esperado, dado que se acredita que um modelo causal, a priori, se elaborado com coerência, teria que apresentar um resultado melhor que o de um modelo univariado tendo em vista que, ao levar em conta outras causalidades, ele dispõe de maior poder de explicação. Nota-se, entretanto, que os modelos de melhor eficiência preditiva na amostra in sample são os dois modelos onde se usam redes neurais, com o modelo híbrido (RN2) reduzindo significativamente o erro de previsão. O mesmo acontece quando observa-se o gráfico do U-THEIL de cada um dos modelos. Novamente, as redes neurais apresentam melhor desempenho, ficando mais nítida agora a diferença entre o primeiro modelo de redes neurais (RN1) e o modelo RD2. Figura 3: Resultados Out-of-sample Figura 2: Resultados In sample U-THEIL U-THEIL Analisando agora os gráficos do e U-THEIL na amostra out of sample (figura 3) pode-se novamente constatar um melhor desempenho dos modelos que fazem uso das redes neurais. Vê-se também que o segundo modelo de regressão dinâmica apresenta melhor eficiência preditiva que o modelo RD1 e do que o modelo BJ. Entretanto uma observação merece destaque. Os modelos que usam as redes neurais se houveram melhor, sendo que o primeiro modelo de redes neurais (RN1), reduz pela metade o no out of sample, apresentando também menor U-THEIL. Vêse também uma diferença significativa do dos outros modelos para o erro do modelo de RN2. 406

5 Comentários finais É sabido que séries econômicas como séries de demanda, preço, inflação entre outras, muitas das vezes apresentam um comportamento que dificulta uma modelagem através de modelos puramente lineares quando abordada a questão da eficiência preditiva dos modelos. A metodologia desenvolvida neste trabalho contemplou esta realidade através de uma estratégia bottom-up de construção de modelos que originou um modelo que apresentou fundamentalmente melhores previsões para a série de demanda de gasolina automotiva no Brasil. Com a finalidade de comparar diversas abordagens, tomou-se como ponto de partida a construção de um modelo autoprojetivo através da metodologia Box & Jenkins. Num segundo momento, buscando argumentos na teoria econômica, construiu-se um modelo de regressão mas através de um método que contemplasse e contornasse, por exemplo, as hipóteses de independência dos erros assumidas pelos modelos de regressão tradicionais. Chegou-se assim a um modelo que expressa as relações de elasticidade-preço e elasticidade-renda e que ainda contempla as características sazonais da série de demanda de gasolina. Lembra-se que este modelo ainda forneceu informação sobre a significância da demanda no lag 3 relacionando-a com a demanda atual o que merece maior investigação. Por fim, projetou-se, ainda com a finalidade de comparar resultados, uma rede neural para prever diretamente a demanda mensal de gasolina automotiva, na tentativa de encontrar um modelo que tratasse os aspectos não lineares intrínsecos ao mundo real e aos fenômenos econômicos de tal forma que pudesse otimizar os resultados das previsões. Finalmente, elaborou-se um modelo híbrido no qual uma rede neural é incorporada ao modelo de regressão dinâmica. Este modelo híbrido, além de reduzir de forma significativa o erro de previsão out of sample, também apresenta uma outra importante vantagem: mantém a possibilidade do tomador de decisões, tanto público quanto privado, controlar melhor a realidade na medida que lhes possibilita a consecução de cenários para as variáveis causais renda e preço. Ressalta-se que esta metodologia de construção de modelos utilizada para prever a demanda mensal de gasolina automotiva no Brasil, pode ser aplicada, em princípio, a outras séries. Por fim, fica mais uma vez evidenciada a eficiência da combinação de redes neurais com modelos estatísticos clássicos. Referências: [1] Box, G. E. P., Jenkins, G. M., Time Series Analysis, Forecasting and Control, San Francisco, Holden- Day, 1994. [2] Cochrane, D.; Orcutt, G.H.. Application of Least Squares Regression to Relationships Containing Autocorrelated Error Terms. Journal of the American Statistical Association, 44, p. 32-61, 1949 [3] Gujarati, D.N.. Basic Econometrics. McGraw Hill, 1995. [4] Goodrich, R. L.. Applied Statistical Forecasting. Business Forecast Systems. 1992. [5] Zanini A. Redes neurais e Regressão dinâmica: Um Modelo Híbrido para Previsão de Curto Prazo da Demanda de Gasolina Automotiva no Brasil. Dissertação de Mestrado DEE PUC-RIO, Abril de 2000. 407