ESTUDO DO CONSUMO E DO NÚMERO DE CONSUMIDORES DE ENERGIA ELÉTRICA DO RS POR MEIO DE COMPONENTES PRINCIPAIS E MODELOS DE PREVISÃO

Tamanho: px
Começar a partir da página:

Download "ESTUDO DO CONSUMO E DO NÚMERO DE CONSUMIDORES DE ENERGIA ELÉTRICA DO RS POR MEIO DE COMPONENTES PRINCIPAIS E MODELOS DE PREVISÃO"

Transcrição

1 UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE PRODUÇÃO ESTUDO DO CONSUMO E DO NÚMERO DE CONSUMIDORES DE ENERGIA ELÉTRICA DO RS POR MEIO DE COMPONENTES PRINCIPAIS E MODELOS DE PREVISÃO DISSERTAÇÃO DE MESTRADO Francisca Mendonça Souza Santa Maria, RS, Brasil 011

2 ESTUDO DO CONSUMO E DO NÚMERO DE CONSUMIDORES DE ENERGIA ELÉTRICA DO RS POR MEIO DE COMPONENTES PRINCIPAIS E MODELOS DE PREVISÃO Francisca Mendonça Souza Dissertação apresentada ao Programa de Pós-Graduação em Engenharia de Produção, Área de Concentração em Gerência da Produção da Universidade Federal de Santa Maria (UFSM, RS), como requisito parcial para a obtenção do grau de Mestre em Engenharia de Produção. Orientador: Prof. Dr. Luis Felipe Dias Lopes Santa Maria, RS, Brasil 011

3 Universidade Federal de Santa Maria Centro de Tecnologia Programa de Pós-Graduação em Engenharia de Produção A Comissão Examinadora, abaixo assinada, aprova a Dissertação de Mestrado ESTUDO DO CONSUMO E DO NÚMERO DE CONSUMIDORES DE ENERGIA ELÉTRICA DO RS POR MEIO DE COMPONENTES PRINCIPAIS E MODELOS DE PREVISÃO elaborada por Francisca Mendonça Souza como requisito parcial para obtenção do grau de Mestre em Engenharia de Produção COMISSÃO EXAMINADORA: Luis Felipe Dias Lopes, Dr. (Presidente/Orientador) (UFSM) Roselaine Ruviaro Zanini, Dra. (UFSM) Castelar Braz Garcia, Dr. (UFPEL) Santa Maria, 0 de janeiro de 011

4 Dedico este trabalho aos meus pais, a quem devo toda esta caminhada, a eles o meu reconhecimento e carinho. Ao Adriano, pelo estímulo, experiências e ensinamentos. Ao Acássio, o meu reconhecimento, pelo companheirismo e incentivo.

5 AGRADECIMENTOS A Deus, por iluminar meu caminho e me dar forças para seguir sempre em frente; Ao Prof. Dr. Luis Felipe Dias Lopes, pela orientação disponível dispensada a este trabalho; Aos professores do PPGEP UFSM e aos colegas pelo companheirismo e aprendizado em equipe; À banca examinadora, pela contribuição e sugestões dadas a esta pesquisa; À CAPES Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, pelo auxílio financeiro. Aos familiares, pelo incentivo e apoio, que se fizeram sempre presentes; aos colegas e amigos, que foram imprescindíveis, pois sempre se mostraram solidários e capazes de tornar as dificuldades mais amenas; Aos meus pais que compartilharam de meus ideais e os alimentaram, pelo exemplo de dedicação e perseverança, pela compreensão, carinho e amor.

6 RESUMO Dissertação de Mestrado Programa de Pós-Graduação em Engenharia de Produção Universidade Federal de Santa Maria ESTUDO DO CONSUMO E DO NÚMERO DE CONSUMIDORES DE ENERGIA ELÉTRICA DO RS POR MEIO DE COMPONENTES PRINCIPAIS E MODELOS DE PREVISÃO AUTORA: FRANCISCA MENDONÇA SOUZA ORIENTADOR: PROF. DR. LUIS FELIPE DIAS LOPES Data e Local da Defesa: Santa Maria, 0 de janeiro de 011. O crescimento econômico do estado do Rio Grande do Sul, assim como do restante do país, está intimamente ligado à distribuição e geração de energia elétrica. Desta forma, para que o sistema energético do estado não entre em colapso (falta/excesso) nas etapas de geração e fornecimento, é necessário o estudo da distribuição da energia gerada e do número de consumidores. Portanto, o objetivo deste estudo é determinar uma variável de referência, por meio da análise de componentes principais, de forma a analisar globalmente o comportamento do consumo em MWh e dos consumidores de energia elétrica do Rio Grande do Sul por meio de modelos de previsão lineares (ARIMA) e não lineares(arch). A análise refere-se ao número de consumidores e ao consumo de energia elétrica no estado do RS, realizado pelas três maiores distribuidoras de energia elétrica, nomeadamente a AES-Sul, CEEE e RGE, no período de janeiro de 1998 a dezembro de 009. Os modelos matemáticos encontrados para as variáveis estudadas são capazes de modelar satisfatoriamente os dados, possibilitando uma análise de seu comportamento, capaz de acompanhar e de determinar o movimento das séries em estudo de forma global, proporcionando medidas de gerenciamento, tanto das empresas distribuidoras de fornecimento quanto do número de consumidores de cada empresa, permitindo uma análise sobre a estabilidade do processo produtivo. Palavras-chave: Previsão; ARIMA; ARCH; Componentes Principais; Energia Elétrica.

7 6 ABSTRACT Mastership Dissertation Post-graduation Program in Production Engineering Federal University of Santa Maria STUDY OF CONSUMPTION AND NUMBER OF CONSUMERS OF ELECTRICITY THROUGH THE RS AND PRINCIPAL COMPONENTS MODELS FOR PREDICTING AUTHOR: FRANCISCA MENDONÇA SOUZA ADVISER: PROF. DR. LUIS FELIPE DIAS LOPES Santa Maria, 0 th january, 011. The economic growth of the state of Rio Grande do Sul as well as the rest of the country is closely connected with the distribution and power generation. Thus for the state's energy system does not collapse (shortage / surplus) in steps of generation and supply, it is necessary to study the distribution of energy generated and the number of consumers. Therefore, the purpose of this study is to determine a reference variable by means of principal component analysis in order to analyze the overall behavior of consumption and consumers in MWh of electricity in the Rio Grande do Sul, by means of linear models of forecast (ARIMA) and nonlinear (ARCH). The analysis refers to the number of consumers and to the consumption of electrical energy to the RS, conducted by the three largest electricity distributors, including AES-Sul, CEEE and GER from January 1998 to December 009. The mathematical models for the variables studied are able to model satisfactorily the data, enabling an analysis of their behavior, able to monitor and determine the movement of the series under study as a whole, providing management measures, both companies supply distributor as the number of customers of each company, allowing an analysis on the stability of the production process. Key-words: Forecasting; ARIMA; ARCH; Principal Components; Electrical Energy.

8 LISTA DE TABELAS Tabela 1 Distribuidoras e regiões de abrangência... Tabela Autovalores e variância explicada de cada componente para o número de consumidores de energia elétrica... Tabela 3 Cargas fatoriais companhia CEEE-RS... Tabela 4 Autovalores e variância explicada de cada componente para o fornecimento mensal de energia por classe de consumo... Tabela 5 Cargas Fatoriais constantes nas variáveis residencial, comercial, industrial, rural, serviços públicos e outros para as três distribuidoras em estudo... Tabela 6 Estatísticas descritivas das componentes principais para o número de consumidores e consumo de energia elétrica para as três distribuidoras... Tabela 7 Teste de raiz unitária ADF, KPSS aplicados às componentes principais que representam respectivamente as distribuidoras CEEE, AES- Sul, e RGE, para o número de consumidores... Tabela 8 Teste de raiz unitária ADF, KPSS aplicados às componentes principais que representam respectivamente as distribuidoras CEEE, AES- Sul, e RGE, para o fornecimento de energia (MWh)... Tabela 9 Correlação entre número de consumidores das CP para CEEE, AES- Sul e RGE componente principal representativa desta distribuidora. Tabela 10 Correlação entre variáveis originais para o consumo de energia em MWh e a componente principal representativa de cada distribuidora... Tabela 11 Modelo ARIMA, dos critérios AIC para distribuidora CP1 CEEE... Tabela 1 Resultados das estatísticas F e ARCH-LM... Tabela 13 Modelo com heterocedasticidade do fator CP 1CEEE... Tabela 14 Resultados das estatísticas F e ARCH-LM... Tabela 15 Modelo ARIMA, dos critérios AIC para distribuidora CP1 AES-Sul... Tabela 16 Testes para presença de heterocedasticidade... Tabela 17 Modelo ARIMA, dos critérios AIC para distribuidora CP1 RGE... Tabela 18 Testes para presença de heterocedasticidade... Tabela 19 Modelo ARIMA, dos critérios AIC para distribuidora CP CEEE... Tabela 0 Testes para presença de heterocedasticidade... Tabela 1 Modelo SARIMA, dos critérios AIC para distribuidora CEEE... Tabela Resultados das estatísticas F e ARCH-LM... Tabela 3 Modelo ARIMA, dos critérios AIC para distribuidora CP CEEE... Tabela 4 Resultados das estatísticas F e ARCH-LM... Tabela 5 Modelo SARIMA, dos critérios AIC para distribuidora AES-Sul... Tabela 6 Resultados das estatísticas F e ARCH-LM... Tabela 7 Modelo SARIMA, dos critérios AIC para distribuidora AES-Sul... Tabela 8 Resultados das estatísticas F e ARCH-LM... Tabela 9 Modelo ARIMA, dos critérios AIC para distribuidora CP RGE... Tabela 30 Resultados das estatísticas F e ARCH-LM

9 LISTA DE FIGURAS Figura 1 Comportamento das funções de autocorrelação e autocorrelação parcial de um modelo AR (1)... Figura Comportamento das funções de autocorrelação parcial e autocorrelação de um modelo MA (1)... Figura 3 Fluxograma do ciclo iterativo de Box & Jenkins... Figura 4 Representação gráfica dos autovalores e percentual de variância explicada CEEE (a), AES-Sul (b) e RGE(c) respectivamente... Figura 5 Gráfico das cargas fatoriais para as distribuidoras CEEE (a), AES- Sul (b) e RGE (c) para o número de consumidores de energia elétrica para o Rio Grande do Sul... Figura 6 Círculo de correlação unitário para as CEEE (a), AES-Sul (b) e RGE (c) respectivamente... Figura 7 Representação gráfica dos autovalores e percentual de variância explicada CEEE, AES-Sul e RGE respectivamente... Figura 8 Gráfico das cargas fatoriais para as distribuidoras CEEE (a), AES- Sul (b) e RGE (c) para o número de consumidores de energia elétrica para o Rio Grande do Sul... Figura 9 Círculo de correlação unitário para as CEEE (a), AES-Sul (b) e RGE (c) respectivamente... Figura 10 Fatores que representam as três companhias para o número de consumidores de energia elétrica... Figura 11 Fatores que representam as três companhias para o fornecimento de energia elétrica... Figura 1 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da Componente principal para número de consumidores da distribuidora CP1 CEEE/RS... Figura 13 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da Componente principal para número de consumidores da distribuidora AES- Sul/RS... Figura 14 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da Componente principal para número de consumidores da para distribuidora CP1 RGE... Figura 15 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da Componente principal para número de consumidores da distribuidora CP RGE... Figura 16 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da Componente principal para o fornecimento de energia em MWh da distribuidora CP1 CEEE... Figura 17 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da Componente principal para o fornecimento de energia em MWh da distribuidora CP CEEE... Figura 18 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da Componente principal para o fornecimento de energia em MWh da distribuidora CP1 AES-Sul... Figura 19 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da Componente principal para o fornecimento de energia em MWh da distribuidora CP1 RGE

10 Figura 0 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da Componente principal para o fornecimento de energia em MWh da distribuidora CP RGE... Figura 1 Série residual do modelo ARIMA (1,1,0)... Figura Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo ARIMA (1,1,0) para a componente principal que explica a concessionária CP 1CEEE... Figura 3 Comportamento residual da FAC e FACP do modelo ARCH (1)... Figura 4 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo ARCH (1) para a componente principal que explica a concessionária CP1_CEEE... Figura 5 Valores originais, valores estimados e os resíduos para o modelo ARCH(1)... Figura 6 Série residual do modelo ARIMA (1,1,1)... Figura 7 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo ARIMA (1,1,1) para a componente principal que explica a concessionária CP1_AES-Sul. Figura 8 Valores originais, valores estimados e os resíduos para o modelo ARCH(1) CP 1AES-Sul... Figura 9 Comportamento residual da FAC e FACP SARIMA (1,1,0) (1,0,0) 1... Figura 30 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo SARIMA (1,1,0) (1,0,0) 1 para a componente principal que explica a concessionária CP1_RGE... Figura 31 Valores originais, valores estimados e os resíduos para o modelo ARCH(1) CP 1RGE... Figura 3 Comportamento residual da FAC e FACP ARIMA (1,1,0)... Figura 33 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo ARIMA (1,1,0) para a componente principal que explica a concessionária CP RGE... Figura 34 Valores originais, valores estimados e os resíduos para o modelo ARIMA (1, 1, 0)... Figura 35 Comportamento residual da FAC e FACP SARIMA (1,1,1) (1,1,0) 1... Figura 36 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo SARIMA (1,1,1) (1,1,0) 1 para a componente principal que explica a concessionária CP1_CEEE... Figura 37 Valores originais, valores estimados e os resíduos para o modelo SARIMA (1,1,1) (1,1,0) 1... Figura 38 Comportamento residual da FAC e FACP ARIMA (1,1,1)... Figura 39 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo ARIMA (1,1,1) para a componente principal que explica a concessionária CP CEEE... Figura 40 Valores originais, valores estimados e os resíduos para o modelo ARIMA (1,1,1)... Figura 41 Comportamento residual da FAC e FACP do modelo SARIMA (0,1,1) (1,1,0) 1... Figura 4 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo SARIMA (0,1,1) (1,1,0) 1 para a componente principal que explica a concessionária CP1_AES-Sul

11 Figura 43 Valores originais, valores estimados e os resíduos para o modelo SARIMA (0,1,1) (1,1,0) 1... Figura 44 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos do modelo SARIMA (0,1,1) (1,1,1) 6 para a componente principal que explica a concessionária CP1 RGE... Figura 45 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo SARIMA (0,1,1) (1,1,1) 6 para a componente principal que explica a concessionária CP1 RGE... Figura 46 Valores originais, valores estimados e os resíduos para o modelo SARIMA (0,1,1) (1,1,1) 6... Figura 47 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos do modelo SARIMA (0,1,0) (1,1,1) 6 para a componente principal que explica a concessionária CP RGE... Figura 48 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo SARIMA (0,1,0) (1,1,1) 6 para a componente principal que explica a concessionária CP RGE... Figura 49 Valores originais, valores estimados e os resíduos para o modelo SARIMA (0,1,1) (1,1,1)

12 11 SUMÁRIO RESUMO... ABSTRACT... LISTA DE TABELAS... LISTA DE FIGURAS... 1 INTRODUÇÃO Tema da pesquisa Justificativa e importância do trabalho Problema de pesquisa Objetivos Objetivo geral Objetivos específicos Delimitação do tema Estrutura do trabalho... REFERENCIAL TEÓRICO....1 Análise de componentes principais.... Modelos lineares e não lineares de previsão Modelos não lineares de previsão... 3 METODOLOGIA... 4 APRESENTAÇÃO E ANÁLISE DOS RESULTADOS Análise de componentes principais Estatísticas descritivas das componentes principais Verificação da estacionariedade das componentes principais Correlação linear entre as variáveis originais e as CP selecionadas Modelos de Previsão das Componentes Principais selecionadas Modelo para o número de consumidores de energia elétrica do RS Modelo para o consumo de energia elétrica em MWh por classe de consumo no Rio Grande do Sul para CEEE, AES-Sul e RGE... 5 CONSIDERAÇÕES FINAIS... REFERÊNCIAS

13 LISTA DE ABREVIATURAS E SIGLAS ADF Teste de Dickey e Fuller Aumentado AES-Sul Empresa do grupo americano AES Corporation ANEEL Agência Nacional de Energia Elétrica. AIC Critério de Informação Akaike AR Autorregressivo ARCH Heterocedasticidade Condicional Autorregressiva ARCH-LM Teste Multiplicador de Lagrange ARIMA Autorregressivo Integrado de Média Móvel ARIMA-ARCH Modelo ARIMA considerando Heterocedasticidade Autorregressiva ARMA Autorregressivo de Média Móvel CEEE Companhia Estadual de Distribuição de Energia Elétrica CP Componente principal EGARCH GARCH Exponencial Estatística F Estatística F-Snedecor FAC Função de Autocorrelação FACP Função de Autocorrelação Parcial GARCH Heterocedasticidade Condicional Autorregressiva Generalizada KPSS Teste proposto pelos autores Kwiatkowski, Phillips, Schmidt e Shin MA Média Móvel MV Método de Máxima Verossimilhança Q Estatística Q de Ljung-Box RB Ruído Branco RGE Rio Grande Energia

14 1 INTRODUÇÃO O emprego da energia elétrica no país teve como marco pioneiro a instalação da Usina Hidrelétrica Ribeirão do Inferno, em 1883, destinada ao fornecimento de força motriz a serviços de mineração em Diamantina, Minas Gerais; a Usina Hidrelétrica da Companhia Fiação e Tecidos São Silvestre, de 1885, no município de Viçosa, também em Minas Gerais; a Usina Hidrelétrica Ribeirão dos Macacos, em 1887, no mesmo estado; a Usina Termelétrica Velha Porto Alegre, em 1887, no Rio Grande do Sul; e a Usina Hidrelétrica Marmelos, instalada em 1889, em Juiz de Fora, Minas Gerais, por iniciativa do industrial Bernardo Mascarenhas. Até a primeira década do século XX, foi construído no país um grande número de pequenas usinas geradoras de energia elétrica. A produção visava ao atendimento dos serviços públicos instalados nas cidades, sendo empregada, predominantemente, na iluminação pública e particular, nos bondes utilizados para o transporte coletivo e no fornecimento de força motriz a unidades industriais, sobretudo do setor têxtil. Eram frequentes as instalações autoprodutoras nas indústrias e em unidades de consumo doméstico, no setor agrícola. Essas empresas municipais constituíramse como resultado da iniciativa do empresariado nacional ligado à agricultura de exportação, aos serviços urbanos, principalmente iluminação e transportes, e à indústria. A energia elétrica como objeto de estudo tornou-se imprescindível nos dias de hoje, pois o tema repercute em todos os setores da economia. Pode-se discutir a produção de energia, o planejamento energético, a previsão de demanda, os temas que envolvem o meio ambiente, a sustentabilidade, a inovação, a tecnologia, a logística, a economia, a sociedade. Ao longo dos últimos anos, o setor elétrico brasileiro passou por mudanças estruturais em sua regulamentação, a exemplo do que ocorreu em diversos países de todo o mundo. O objetivo foi o estabelecimento de um modelo de máxima eficiência econômica, caracterizado pela existência de um ambiente competitivo que viabilizasse investimentos em expansão e garantisse o atendimento ao mercado consumidor, conforme os critérios de confiabilidade e qualidade estabelecidos pela ANEEL - Agência Nacional de Energia Elétrica.

15 14 As distribuidoras utilizam subdivisões denominadas por setores, seja este de distribuição ou de consumo, e estes setores são denominados: industrial, rural, comercial, residencial e outros, que é uma subdenominação de consumos. Após a reestruturação da distribuição de energia elétrica, o que deixou clara a competitividade entre as companhias, houve a adoção de novas políticas para orientar suas decisões estratégicas, que determinam o sucesso no curto e no longo prazo. Em um ambiente competitivo e com incertezas, um dos maiores desafios é a alocação de recursos e incentivos sujeitos a riscos inerentes à distribuição e manutenção da potência demandada de modo que não afete o mercado consumidor. Essa incerteza induz as distribuidoras à procura da máxima eficiência, contribuindo para o planejamento e para o atendimento da demanda com qualidade e confiabilidade, indo ao encontro de soluções de problemas, resultantes da diferença entre as metas da empresa e a situação constatada. 1.1 Tema da pesquisa O tema desta pesquisa é a utilização de modelos de previsão lineares e não lineares, aplicados às componentes principais representativas do número de consumidores, e ao volume de consumo de energia elétrica das três maiores empresas distribuidoras para o Rio Grande do Sul. 1. Justificativa e importância do trabalho O crescimento econômico do estado do Rio Grande do Sul, assim como do restante do país, está intimamente ligado à distribuição e geração de energia elétrica. Desta forma, para que o sistema energético do estado não entre em colapso (falta/excesso) nas etapas de geração e fornecimento, é necessário o estudo da distribuição da energia gerada e do número de consumidores. Este mapeamento, feito por meio de técnicas de previsão, auxilia os gestores na verificação da tendência geral do consumo e de consumidores. Assim, é possível acompanhar os movimentos dessa distribuição. Desta forma, justifica-se o trabalho apresentado, em que é possível prever o nível das séries em estudo e, quando estas apresentarem características de volatilidade, é possível estudar o seu comportamento em relação a sua variabilidade.

16 15 A sua importância está no fato de ser possível verificar os períodos de maior e menor volatilidade cluster de volatilidade, identificando períodos em que se deve tomar o maior cuidado, evitando excessos e/ou restrições nos períodos voláteis identificados tanto na distribuição quanto no consumo pode acarretar problemas de falta ou excesso de na distribuição. 1.3 Problema de pesquisa O problema de pesquisa é a utilização da análise de componentes principais para prever o nível das séries em estudo e, quando possível, a volatilidade da mesma. Desta forma, procura-se reduzir a dimensionalidade do problema e estudar o comportamento geral das séries. 1.4 Objetivos Neste item, descreve-se o objetivo geral e os objetivos específicos que nortearão a pesquisa Objetivo geral Determinar variáveis de referência por meio da análise de componentes principais de forma a analisar globalmente o comportamento do consumo em MWh e do número de consumidores de energia elétrica do Rio Grande do Sul por meio de modelos de previsão lineares e não lineares Objetivos específicos Determinar a combinação linear representativa das distribuidoras de energia elétrica, por meio da análise de componentes principais, de modo a englobar todos os setores de distribuição e consumo; Estimar modelos lineares, utilizando a metodologia Box & Jenkins para prever o nível da combinação linear em estudo; Verificar a presença de volatilidade e estimá-la, por meio de modelos não lineares, da classe geral Autorregressivos heteroscedásticos condicionais (ARCH), da

17 16 combinação linear das variáveis quando necessário; Mostrar a aplicabilidade das previsões das combinações lineares, de modo a revelarem o comportamento das variáveis individuais. 1.5 Delimitação do tema Esta pesquisa está delimitada geograficamente pelas companhias e usuários do Rio Grande do Sul e pela utilização de técnicas de modelos lineares da classe geral ARIMA e pelos modelos não lineares ARCH. Além destas delimitações citadas, deve-se ressaltar que os modelos de previsões aqui utilizados serão capazes de fornecer o movimento geral da curva, sem que seja possível especificar valores previstos individualmente, pois o que se procura é detectar os movimentos ascendentes e descendentes das curvas em estudo. 1.6 Estrutura do trabalho A pesquisa foi estruturada em cinco capítulos. O primeiro traz a introdução, o tema da pesquisa, a justificativa e a importância do trabalho, o problema de pesquisa, o objetivo geral e os específicos, a delimitação do tema e a estrutura do trabalho. No capítulo dois, encontra-se a Revisão de Literatura, em que se apresenta uma revisão de alguns conceitos sobre modelos lineares e não lineares, assim como a análise de componentes principais, pois esses serão os tópicos necessários para o desenvolvimento da pesquisa. Na metodologia, no capítulo três, são apresentadas as etapas necessárias para a coleta, tabulação e modelagem das variáveis e dos dados em estudo, representados pelas componentes. Já, no capítulo quatro, são demonstrados os resultados das análises realizadas neste estudo. As considerações finais e as sugestões constam no capítulo cinco e, após esse, estão relacionadas às referências bibliográficas.

18 REFERENCIAL TEÓRICO Descrevem-se, neste item, os assuntos necessários para a elaboração da pesquisa, de modo a atingir o objetivo geral e os específicos. Aborda-se a análise de componentes principais, modelos lineares, por meio dos modelos ARIMA, e os modelos não lineares por meio dos modelos ARCH..1 Análise de componentes principais O método de Análise de Componentes Principais (ACP) foi desenvolvido por Pearson (1901) e, posteriormente, por Hotelling (1933). Essa técnica vem sendo estudada por autores como Morrison (1976), Seber (1984), Reinsel (1993), Jackson (1980, 1981) e Johnson e Wichern (199, 1998). A idéia central é a redução do conjunto de dados a ser analisado, principalmente quando os dados são constituídos de um grande número de variáveis inter-relacionadas. Essa redução é feita transformando-se o conjunto de variáveis originais em um novo conjunto de variáveis que mantém, ao máximo, a variabilidade do conjunto de dados. As novas variáveis, denominadas de Componentes Principais (CP), são independentes e não correlacionadas, favorecendo a análise, principalmente quando muitas variáveis devem ser analisadas. Partindo-se de um vetor X = [( X1X Xp)], um vetor de variáveis aleatórias com vetor média µ e matriz de variância-covariância Σ, procura-se encontrar um novo conjunto de variáveis Y 1 Y Yp, as quais são não correlacionadas entre si e cujas variâncias de cada nova variável é descrita em ordem decrescente de valores. Esta combinação linear é denominada de componente principal (REIS, 001). Cada componente principal será representada por Yj = lijx 1 + ljx + + lpjx p1 = ajx, em que a j corresponde ao vetor de constantes que deve manter a condição de normalidade, isto é, p a ij j = 1 = 1para que o sistema tenha solução única e de ortogonalidade, isto é, a a ij kj p j = 1 = 0 para i k com i,k = 1,..., p, que garante que as componentes principais sejam independentes.

19 18 Para satisfazer as condições de normalidade e ortogonalidade, utiliza-se o método do multiplicador de Lagrange, resultando na definição da equação característica de Σ, em que: Il = 0 1 λ (1) Para que se encontre a solução desse sistema, é necessário que λ Il 1 seja singular, isto é, quando igualada ao vetor nulo, deverá ter uma solução não nula para a 1, se e somente se λ for um autovalor da matriz Σ. Conforme Corrar, Paulo e Dias Filho (007), tomando os elementos do vetor x i, assim determinados como os coeficientes de componente principal: Y i, tem-se que o i-ésimo i) Vâr( Y i ) = Λ ˆ logo i Vâr ( Y1 ) Vâr ( Y ) >... Vâr ( Yp ); ii) Vâr ( X ) Λˆ = Vâr( Y ) ; i i = i > () (3) iii) p Côv( Y, Y ) = 0, desdeque a a = 0. (4) i j j= i ij kj A explicação de cada componente principal variância. Logo, tem-se que o quociente é expresso em percentagem: Y i é medida em termos de p ^ Λ i = 1 Λ Λˆ i = 1 Λˆ Λˆ i.100 =.100 traço( Σ) i i.100 =, ^ p i i sendo que esta expressão representa a proporção da variância total explicada por cada componente. No caso de se trabalhar com dados amostrais, a metodologia de análise continua a mesma, apenas se substitui a matriz de variância-covariância populacional Σ pela matriz de variância-covariância amostral S. É possível encontrar tantas componentes principais quantas forem as variáveis envolvidas na análise. Mas, como um dos principais objetivos da análise é a redução de dimensionalidade, é necessário selecionar o número de componentes a serem consideradas no estudo. (5)

20 19 Alexander (005) diz que a análise de componentes principais trata de um método usual na extração das mais importantes fontes não autocorrelacionadas de variação de um sistema multivariado. Não somente as estruturas a termo, mas também as volatilidades implícitas das diversas opções de um mesmo ativo. Desta forma, a técnica torna-se útil para a aplicação do estudo proposto.. Modelos lineares e não lineares de previsão Tradicionalmente, são utilizados os modelos lineares autorregressivos integrados e de médias móveis (ARIMA), para eliminar a autocorrelação, os quais são adequados para modelar a média condicional de uma série, cuja variância dos erros é assumida constante ao longo do tempo. Modelos ARIMA Uma das técnicas usadas pela econometria contemporânea para a previsão do comportamento de variáveis se constitui no emprego de modelos univariados. A construção dos modelos de séries temporais univariados é fundamentada na teoria de que existe uma grande quantidade de informação presente na série de dados, sendo esses dados capazes de fornecer estimativas sobre o comportamento futuro da variável. Assim, será apenas o próprio comportamento da variável que responderá pela sua dinâmica futura. Este tipo de modelo é conhecido na literatura como o modelo autorregressivo integrado de médias móveis (ARIMA), ou definido simplesmente por modelo (ARIMA, BOX e JENKINS, 1970). A construção do modelo ARIMA parte da concepção de que as séries temporais envolvidas na análise são geradas por um processo estocástico estacionário, cuja natureza pode ser representada a partir de um modelo matemático. Segundo Box, Jenkins e Reinsel (1994), um processo é estacionário quando ele oscila em torno de uma média constante, com variância também constante, conhecida por homocedástica, e é definido como estocástico por ser controlado por leis probabilísticas. Segundo Morettin (006), os modelos ARIMA são modelos responsáveis por capturar e modelar processos de memória curta, pois a FAC decresce rapidamente para zero. Caso o processo não tenha esta característica, outros modelos devem ser empregados.

21 0 Um processo { x, t Z} segue um processo ARIMA (p,d,q) se modelo ARMA(p,q), ou seja, t d x t seguir um d φ( B) x = θ ( B) e (6) t onde B é operador retroativo, ou operador de defasagens, d é inteiro positivo e representa a diferença, conforme a ordem de integração; φ e θ são os parâmetros dos processos autorregressivos e de média móvel de ordem p e q, t respectivamente, e e RB σ. t ~ (0, ) A construção de modelos ARIMA segue um ciclo iterativo da metodologia de Box e Jenkins, que é composto por quatro etapas: a) identificação; b) estimação; c) verificação do diagnóstico e d) previsão (GUJARATI, 000). Esses modelos também são discutidos pelos autores Box, Jenkins e Reinsel (1994), Makridakis, Wheelwright e Hyndman (1998), Morettin e Toloi (004) e Morettin (008). A seguir, descrevem-se os modelos estacionários AR, MA e ARMA. Modelo Autorregressivo de Ordem p (AR(p)) O nome autorregressivo é pelo fato de que Z t, no instante t é função dos Z s nos instantes anteriores a t, adicionado de um erro no instante t. O modelo que contém φ ( B) = 1 é chamado modelo autorregressivo, sendo denotado por AR (p), onde p indica a ordem do modelo, isto é, o número de defasagens. ~ ~ ~ ~ Z t= ϕ 1Zt 1+ ϕ Zt ϕpzt p+ a ~ ϕ ( B ) Z t = a t. t (7) (8) O modelo autoregressivo de ordem 1 e pode ser representado pelas expressões (9) e (11), respectivamente ~ ~ AR ( 1) Z = ϕ Z + a ~ t 1 t 1 ~ ~ AR ( ) Zt= ϕ 1Zt 1+ ϕ Zt + onde a notação Z ~ t corresponde a valores subtraídos da média do processo. t a t (9) (10) Z ~ t = Z t µ (11)

22 1 O modelo será considerado estacionário se φ (B) convergir para B 1 como ϕ ( B) = 0, condição chamada de condição de estacionariedade. A condição de estacionaridade do AR(p) estabelece que todas as raízes da equação devem cair fora do círculo unitário e, sendo o processo de ordem finita, será sempre inversível. Vê-se, portanto, que as autocovariâncias não dependem do t, e sim da ordem p. Como ϕ < 1, pela condição de estacionariedade, quanto maior o valor de p, ou seja, quanto maior a distância entre as observações, menor a autocovariância. A identificação do modelo será feita através das funções de autocorrelação e autocorrelação parcial, que indicam a ordem do modelo, conforme a Figura 1. FAC FACP ρ k ϕ kk t Figura 1 Comportamento das funções de autocorrelação e autocorrelação parcial de um modelo AR (1). 1 t A função de autocorrelação (FAC) decai exponencialmente, alternando ou não de sinal. Em geral é uma mistura de exponenciais e ondas senóides amortecidas e, a autocorrelação parcial (FACP) apresentará um corte rápido no lag significativo, indicando a ordem p do modelo. Modelo de Médias Móveis de Ordem q (MA(q)) O nome do modelo vem do fato de que Z t é uma função soma algébrica ponderada dos a t que se movem no tempo. O nome, em si não é exato, pois Z t não é média, visto que os parâmetros θ ' s não somam, obrigatoriamente, a unidade. Notação: MA (q) em que q indica a ordem do modelo, e θ é um parâmetro. ~ Zt= at+ θ... θ Z ~ t θ ( B) 1 at 1+ + qat q ; a t (1) = (13)

23 A notação Z ~ t corresponde a valores do processo subtraídos de sua média. Pode-se observar os modelos MA(1) e MA() nas equações 14 e 15. ~ MA( 1) Zt= at + θ 1a (14) t 1 ~ MA ) Z = a + θ a θ a (15) ( + t t 1 t 1 t O modelo é considerado estacionário se o processo for de ordem finita. Logo, no AR(1) e no AR(), o número de defasagens é finito, portanto o modelo será sempre estacionário. A inversibilidade é dada em função dos parâmetros, se π (B) convergir para B <1 com π ( B) =θ 1 B, as raízes da equação deverão cair fora do círculo unitário. A identificação do modelo é feita através das funções de autocorrelações e autocorrelações parciais. A função de autocorrelação fornece a ordem do modelo, a qual deverá apresentar um corte rápido no lag significativo, indicando a ordem do modelo. A autocorrelação parcial decairá exponencialmente se todos os parâmetros forem positivos, caso contrário, formará uma senóide amortecida (SOUZA, 1991). ρ K ϕ k k t t Figura Comportamento das funções de autocorrelação parcial e autocorrelação de um modelo MA (1). Modelo Autorregressivo de médias móveis ARMA (p, q) No modelo ARMA assim como nos modelos puros AR(p) e MA(q), ajustam -se somente as séries temporais estacionárias, sendo os modelos definidos pelas equações 16 e 17. ou Z z t t zt + + φpzt p + at θat qa (16) t q = c+ φ θ φ zt φpzt p = c+ at θat θqa (17) t q

24 3 Há restrições específicas aos valores que possam assumir os parâmetros das equações (.10) e (.11). Para p=1, -1< φ 1 <1. Para p =, -1 < φ < 1, φ + φ1 < 1 e φ φ 1 < 1. Para p > 3, condições mais elaboradas prevalecem. Similarmente, para q=1, -1 < θ 1 < 1. Para q =, -1 < θ < 1, θ +θ 1 < 1 e θ -θ 1 < 1. Para q>3, também prevalecem condições mais elaboradas (MAKRIDAKIS et al., 1998, p. 334). Um dispositivo de notação útil é a utilização do operador de deslocamento retroativo B, conforme 18. BX t = X t 1, (18) ou, em outras palavras, B operando sobre Z t tem o efeito de deslocar os dados para trás em período. Assim, B ( BXt ) = B Xt = Xt e, eventualmente. (19) 1 B X t = X (0) t 1 Utilizando-se o operador B, a equação (.14) pode ser escrita como segue: p q ( 1 φ1b φpb ) Xt = c+ (1 θ 1B θqb ) a (1) t Pois é da expressão (.15) que o modelo em questão recebe sua denominação específica de ARMA (p, q), isto é, modelo autorregressivo de média móvel, de ordem p e q, conforme assinalado na expressão (1). p q ( 1 φ1b φpb ) Xt = c+ (1 θ 1B θqb ) a. AR(p) MA(q) t () Os coeficientes φ 1,φ,..., φ p, e θ 1, θ,..., θ q são estimados pelo ajuste da série temporal que está sendo modelada pelos métodos de mínimos quadrados ou da máxima verossimilhança. A aplicação do método dos mínimos quadrados é semelhante à da regressão linear, entretanto, sem as formas simples desta aplicação, sendo as estimativas

25 4 feitas interativamente, por softwares, até que a soma dos erros quadráticos seja minimizada. No segundo método, a verossimilhança de um conjunto de observações, denominada L, é proporcional à probabilidade de se obter as observações, dado o modelo, sendo, portanto, uma medida da plausibilidade o atual conjunto de observações, dado um particular conjunto de valores dos parâmetros. O método da máxima verossimilhança estima, interativamente, através de softwares, os valores dos parâmetros que maximizem a verossimilhança (MAKRIDAKIS et al., 1998). O modelo ARMA, como qualquer modelo de previsão adequadamente ajustado a uma série temporal, deve ter seus erros, e t, distribuídos aleatoriamente, isto é, comportando-se como uma série de ruído branco. Teoricamente, todos os coeficientes de autocorrelação de uma série de números aleatórios devem ser zero, pois eles não guardam qualquer relação entre si. Entretanto, a distribuição amostral dos coeficientes de autocorrelação de um conjunto de n amostras, retiradas de uma população de números aleatórios, pode ser aproximada por uma curva normal de média zero e desvio padrão de 1/ n. Portanto, espera-se que 95% das n amostras de coeficientes de autocorrelação de uma série aleatória estejam entre ± 1,96 / n. Se não for este o caso, a série provavelmente não é de ruído branco (MAKRIDAKIS et al., 1998). Uma abordagem alternativa à verificação dos coeficientes de autocorrelação dos resíduos da aplicação do modelo ARMA é a utilização dos testes de Portmanteau, que considera o conjunto dos k primeiros coeficientes de autocorrelação, ao contrário de considerar cada um separadamente. É correto concluir que os resíduos não são ruído branco e a estatística Q, sugerida por Box- Pierce, ou Q*, sugerida por Ljung-Box, se posicionam no extremo de 5% da cauda direita da distribuição do Box-Pierce, ou Q*, de Ljung-Box, são as seguintes: χ. As expressões, para o cálculo das estatísticas Q, de Q= n h r k k= 1 (3) e

26 5 Q * = n+ ( n+ ) r h k k= 1 ( n k) (4) Nas expressões (3) e (4), n é o número de observações da série, e h é a máxima defasagem dos coeficientes de correlação dos resíduos. Alguns autores aconselham que seja tomado h = 0 (MAKRIDAKIS et al., 1998), outros, h = n/4 (Box et al., 1994, p. 3). O valor de h deve ser utilizado como número de graus de liberdade da distribuição χ. Quando nem a função de autocorrelação nem a função de autocorrelação parcial caem bruscamente a zero, a recomendação de uso de um modelo ARIMA é reforçada. Como vimos anteriormente, os processos AR(p), MA(q) e ARMA(p,q) apresentam a função de autocorrelação FAC com características especiais. Assim: (i) um processo AR(p) tem FAC que decai de acordo com exponenciais e/ou senóides amortecidas, infinita em extensão; (ii) um processo MA(q) tem FAC finita, no sentido que ela apresenta um corte após o lag q; (iii) um processo ARMA (p, q) tem FAC infinita em extensão, a qual decai de acordo com exponenciais e/ou senóides amortecidas após o lag q-p. Essas observações serão úteis no procedimento de identificação do modelo aos dados observados; calculando-se as estimativas das FAC que se acredita reproduzir, adequadamente, as verdadeiras FAC s desconhecidas, e comparando seu comportamento com o descrito acima. Para cada modelo, deve-se escolher um modelo que descreva o processo estocástico. Modelos não estacionários ARIMA (p, d, q) Como os processos encontrados na prática são raramente estacionários, deve-se encontrar algum tipo de operador que, por transformações matemáticas, transforme o conjunto de dados em estacionários. Até agora, obteve-se, a partir de um processo de ruído branco a t, um processo Z t estacionário, porém com relação de dependência. Como os processos encontrados são raramente estacionários, deve-se encontrar algum tipo de operador que produza, a partir de Z t, um processo estacionário.

27 6 Consideram-se, nesta modelagem, somente os processos chamados não estacionários homogêneos, isto é, aqueles que podem se tornar estacionários por meio de diferenças. Dada uma série Z t, a primeira diferença de Z t é definida por: Z = Z Z (5) t t t 1 e a segunda diferença é dada por: Z = ( Z Z ) 1 ; (6) t t t Z + t 1 Zt Z = t Zt. (7) genericamente, a d-ésima diferença de Z t é definida por: d d 1 Z = ( Z ). (8) t t Essas séries são não estacionárias homogêneas, mas, com um número finito de diferenças, consegue-se estacionarizá-las. Dada Z t, não estacionária, se W t por um modelo ARMA (p,q), isto é: W d t= Zt, for estacionária pode-se representar φ ( B ) W = θ ( B). (9) t a t Diz-se que Z t segue um modelo autorregressivo integrado de médias móveis ARIMA (p, d, q). φ ( = θ a. (30) d B ) Zt ( B) t Como Z = ( 1 B) Z, vê-se que = 1 B e (.4) pode ser escrito como: t t φ ( = θ Z (31) d B ) (1 B) Zt ( B) t Na maioria dos casos, é suficiente tomar d = 1 ou diferenças para que seja estacionária. d Zt Outro fator que deve ser levado em consideração no momento da modelagem de séries temporais é a periodicidade que pode aparecer nos dados. Esta periodicidade que ocorre dentro do período de um ano é denominada de

28 7 sazonalidade e é representada por um período de repetição S. A periodicidade pode ser incorporada ao modelo por meio da utilização de um modelo ARIMA sazonal, como representado na equação 3. S d D S φ ( B) Φ (B ) S Z t=θ(b) Θ(B )a (3) t Onde, S é o período da sazonalidade, que pode ser trimestral, (s=3) semestral (s=6) e assim consecutivamente. Caso seja detectada uma não estacionariedade do tamanho da sazonalidade S, pode-se realizar diferenças sazonais, de modo que a série se torne estacionária. S S = 1 B. (33) A equação.7 representa o operador diferença sazonal, D da equação (.6) é o número de diferenças sazonais, ( ) = φ é o operador S S φ B + φ B + + SP P autorregressivo sazonal de ordem P, e S S SQ Θ ( B ) = 1+Θ1 B ΘQ B é o operador de médias móveis sazonal de ordem Q. A equação (.6) implica que devemos tomar D diferenças sazonais da série Z t, onde d representa a ordem de diferenciação não estacionária de modo que a série d D d S D t = SZt = ( 1 B) (1 B Z (34) t Y ) seja estacionária, o que possibilitará a aplicação da metodologia Box & Jenkins. (VICINI e SOUZA, 007). O modelo (34) é denominado ARIMA sazonal ou SARIMA (p, d, q) (P, D, Q) s. Veja-se alguns casos particulares do modelo: (i) ARIMA (0, 1, 1): Z t = (1 - θb)a t ; (ii) ARIMA (1, 1, 1): (1 φ B) Z t = (1 - θb) a t ; (iii) ARIMA (p, 0, 0) = AR(p); ARIMA (0, 0, q) = MA(q); (iv) ARIMA (p, 0, q) = ARMA (p, q). O item (i) é um caso importante, e é também chamado de modelo integrado

29 8 de médias móveis, IMA (1, 1). Z t ( Zt 1+ at t θb) a. = (35) Pode-se demonstrar que esse modelo pode ser escrito na forma autorregressiva, conforme equação 36. Z t = Zt 1 + λ( 1 λ) Zt + λ(1 λ ) Zt at onde Z t seja dado em termos de seu passado, através de uma ponderação λ (36) exponencial. A seguir, apresentam-se as etapas para a efetivação da metodologia Box & Jenkins que será utilizada para a modelagem das séries em estudo. A metodologia de Box-Jenkins refere-se ao método sistemático de identificação, ajuste, checagem e uso de modelos autorregressivos integrados à média móvel ou, simplesmente, modelos ARIMA. Como uma série temporal tem dados coletados sequencialmente ao longo do tempo, espera-se que ela apresente correlação seriada no tempo. Os modelos Box- Jenkins, genericamente conhecidos por ARIMA (Autoregressive Integreted Moving Average), em português são denominados Autorregressivos Integrados de Médias Móveis. São modelos matemáticos que visam a captar o comportamento da correlação seriada ou autocorrelação entre os valores da serie temporal e, com base nesse comportamento, realizar previsões futuras. A estratégia utilizada para a construção de modelos pela metodologia Box & Jenkins é baseada no ciclo iterativo, Figura 3, no qual a estrutura do modelo é formada pelos próprios elementos da série.

30 9 IDENTIFICAÇÃO DO MODELO ESTIMAÇÃO DOS PARÂMETROS VERIFICAÇÃO NÃO O MODELO É ADEQUADO SIM PREVISÃO Figura 3 Fluxograma do ciclo iterativo de Box & Jenkins. O processo de identificação consiste em determinar quais dos filtros AR, MA, ARMA ou ARIMA, compõem a série. A realização do processo de identificação necessita, portanto, de outros instrumentos, que são a função de autocorrelação e a função de autocorrelação parcial. Função de Autocorrelação (FAC) é o coeficiente de autocorrelação ou correlação serial de ordem k, ou seja, a autocorrelação entre y t e y t- k, é dada por: ρ k cov( yt, yt = V ( y ) t k ) γk = γ 0. (37) A sequência de pares (k, ρ k ), k = 1,,... é denominada função de autocorrelação. Valores negativos de k não são considerados explicitamente, tendo em vista que ρ k = ρ- k. O coeficiente de autocorrelação ρ k envolve parâmetros geralmente desconhecidos. A análise estatística da FAC amostral requer o conhecimento da distribuição de r k. Se ρ k = 0 para k 0, onde a variância de r k é aproximadamente igual a 1/n. Se n for grande, a distribuição de r k é aproximadamente, normal:

31 30 k k N( 0;1/ n). (38) = 0 para k>q: Bartellet (1946) obteve o seguinte resultado, para a variância de r k, quando ρ k V ( r k 1 ) = ( ρq ), k = q+ 1, q+, n ρ (39) Nesse caso, o cálculo efetivo da variância de V(k) requer a substituição de ρ por r. Uma vez concluída a distribuição por r k, pode-se construir os intervalos de confiança e realizar os testes de hipótese usuais, para verificar se cada coeficiente de autocorrelação (ρ 1, ρ,...) é nulo. Também é possível testar se os k, primeiros coeficientes de autocorrelação são conjuntamente iguais a zero. Nesse caso, utilizase o teste de Ljung-Box, cuja estatística é dada por: r Q *( k) = n( n+ ) (40) k k k k= 1n Q(k) tem distribuição χ, com k graus de liberdade. Se Q(k) > χ k, rejeita-se a hipótese de que os k primeiros coeficientes de autocorrelação são nulos. Função de Autocorrelação Parcial (FACP), o coeficiente de autocorrelação parcial de ordem k, usualmente representado por φ, mede a correlação entre y kk t e y t- k, depois que a influência de Y t-1, Y t-,..., Y t- k+1, sobre Y t for descontada. O coeficiente φ, j = 1,,... é dado pelo último coeficiente, β jj jj, de cada uma das autorregressões a seguir: y y y t t t = β y = β y = β k1 y t 1 t 1 t 1 + ε, φ = β t + β + β k y t y t 11 + ε, φ t β kk y = β t k + ε, φ t kk = β kk (41) Os valores de φ jj, podem também, ser obtidos a partir da solução do sistema de equações de Yule-Walker para sucessivos valores de j:

32 31 ρ = φ + φ ρ + + φ ρ ρ = φ ρ + φ + + φ ρ 1 ρ = φ ρ k k φ ρ k k k k 1 k + + φ φ k jj = φ, j= 1,, j (4) A sequência de pares (j, φ ) constitui a função de autocorrelação parcial. jj Estimativas de φ - jj φˆ podem ser obtidas aplicando-se mínimos quadrados jj ordinários às autorregressões, para estimar β jj, ou substituindo por ρ j por r j, no sistema de equações de Yule-Walker. Segundo Quenouille (1949), se o processo for autorregressivo de ordem p, a variância de φˆ para j > p é aproximadamente igual a jj 1/n. Adicionalmente, para n moderado, φˆ tem-se distribuição normal. Portanto: jj ˆ φ N(0;1/ n) para j > p (43) jj = Assim, os testes de hipótese e os intervalos de confiança usuais podem ser empregados para avaliar a significância da estatística de φˆ jj. A estimação dos parâmetros é a próxima etapa, consiste em determinar se a série estacionária, original ou transformada, é gerada por um processo autorregressivo (p 0), de médias móveis (q 0), e/ou mista. Neste caso é necessário determinar o valor de p e/ou q. As características da FAC e da FACP, em cada caso, é que indicarão qual o possível processo gerador da série...1 Modelos não lineares de previsão A modelagem linear representada pelos modelos ARIMA será útil para estimar os modelos que representarão a série em estudo. Os resíduos oriundos da modelagem ARIMA serão investigados em relação à homocedasticidade de sua variância, caso os resíduos apresentarem característica de variância não constante, serão analisados por meio dos modelos não lineares ARCH. Os Modelos Autorregressivos de Heterocedasticidade Condicional (ARCH) tiveram o seu surgimento com o pesquisador americano Robert Engle

33 3 (198), que observou que os dois primeiros momentos de uma série temporal (média e variância) não são captados conjuntamente pelos modelos lineares. Geralmente, os modelos ARIMA, embora produzindo resíduos do tipo ruído branco, quando analisados na sua forma quadrática, não apresentam um comportamento não aleatório puro. Os modelos lineares são responsáveis por modelar e prever a média condicional da série em estudo, assumindo que o resíduo a t de tais modelos seja ruído branco, com média zero e variância constante. Os modelos propostos por Engle dão um passo a mais e verificam a existência de heterocedasticidade nos resíduos. Esta heterocedasticidade residual é denominada de volatilidade, o que a princípio poderia ser um problema a ser enfrentado na modelagem de séries temporais, pois não apresentaria propriedades desejáveis na modelagem e na estimação dos parâmetros, passa a ser uma ferramenta a mais para descobrir o comportamento de uma variável (SÁFADI e ANDRADE FILHO, 007). Como a variabilidade pode ser explicada pela volatilidade existente entre os erros oriundos do modelo de previsão linear, pode-se observar que a variância destes erros não é constante ao longo do tempo, mas varia de um período para outro, existindo uma autocorrelação na variância dos erros de previsão (GUJARATI, 000). A idéia básica desses modelos é a de que os componentes da série e t não sejam correlacionados serialmente, mas são dependentes, e essa dependência pode ser descrita por uma função quadrática de seus valores passados. Desta forma, a série de resíduos et pode possuir média zero e não ser autocorrelacionada, mas a série dos seus valores quadráticos e, por isso, são denominados de modelos não lineares. e t pode apresentar autocorrelação serial Geralmente séries temporais com presença de heterocedasticidade apresentam caudas mais pesadas, portanto, a curtose (K) é uma medida que pode auxiliar na identificação da presença de volatilidade. Esta medida é obtida pela razão entre o quarto momento de e ( E e ) ) e o quadrado de sua variância. t ( 4 t Desenvolvendo algebricamente este quociente, tem-se que a curtose de um modelo ARCH (1), por exemplo, será dada por meio de (44).

34 33 3(1 α 1 ) K ( e t ) = > 3. (44) (1 3α ) 1 Portanto, ao admitir-se que a t segue uma modelo ARCH, as caudas são mais pesadas do que a da distribuição normal que possui curtose igual a 3. Com isso, pode-se dizer que se há excesso de curtose, então há volatilidade. O modelo ARCH, propriamente dito, assume que, em uma regressão, a variância do erro se correlaciona com a variável independente (erro da regressão). Desta forma, a variância é dita condicional (não constante) e seu valor depende da observação do próprio erro (ÉLIN DUXUS, 009). A idéia principal do modelo ARCH é o fato de que a variância de e t, no período de tempo t, depende de e t 1. O termo de erro e t, condicionado à informação disponível no período ( t 1) seria distribuído conforme a seguinte notação: e t ~ N[0,( α αe )] (45) t 1 em que α 0 e α 1 são parâmetros explicativos da variância do termo de erro (CAMPOS, 007). Um modelo ARCH(m), em que m denota a ordem do modelo, expressa a variância condicional do modelo anterior para a média condicional como uma função das inovações quadráticas passadas (SILVA, SÁFADI e CASTRO JÚNIOR, 005). Segundo Morettin (008), o modelo ARCH(m) é definido por: e t r he t = (46) t t h = α + αr + + α r (47) t 0 1 t 1 m t m em que e t é i.i.d com média zero, e h t é a variância condicional. Para assegurar que a variância condicional seja positiva e fracamente estacionária, as seguintes restrições paramétricas são necessárias: α > 0 0, α 0 t para todo t= m e α t < 1. Sob a condição de estacionariedade, a variância será dada por:

35 34 α0 Var( rt ) = m 1 = αt t 1 (48) Pela própria definição, valores grandes de r t são seguidos por outros valores grandes da série. Se admitirmos que r t siga uma modelo ARCH, as caudas serão mais pesadas do que as da distribuição Normal, o que é uma propriedade característica do modelo. Na prática, seguindo o modelo original de Engle, assume-se que e t tem distribuição Normal ou t-student padronizada (SILVA, SÁFADI e CASTRO JÚNIOR, 005). Campos (007) afirma que, se a assimetria é diferente de zero e a curtose é maior que três, isso significa que a série pode exibir sinais de volatilidade e de clusters de volatilidade. A assimetria retrata a forma de distribuição dos dados, e a curtose indica que a série apresenta uma distribuição leptocúrtica em relação à normal, isto é, os dados estão agrupados no centro juntamente com algumas observações nos extremos das caudas. Apresentam-se, a seguir, as etapas pertencentes aos modelos ARCH. Maiores detalhes encontram-se em Morettin (006), Bueno (008), Enders (1995) e Hamilton (1994). Desta forma, Engle (198) provou que os modelos lineares são incompletos em função da incapacidade de explicar algumas características dessas séries. Na área das finanças a volatilidade serve como uma medida de velocidade de reação do mercado financeiro, pois mercados com baixas volatilidades são considerados mercados lentos, pois a tendência é se manterem estáveis. E mercados com alta velocidade são considerados rápidos, pois possuem grande variabilidade e suas ações e reações podem ser inesperadas. Os modelos ARCH são estimados pelo método de máxima verossimilhança e seguem as etapas de identificação do modelo, estimação dos parâmetros, verificação ou checagem e, por fim, faz a análise dos resíduos para validar o modelo não linear encontrado. Estas etapas são similares às etapas da metodologia de Box & Jenkins. Neste sentido, o estudo do comportamento da volatilidade tem sido considerado uma peça fundamental, pois serve como medidor da vulnerabilidade dos mercados financeiros e da economia. Deseja-se analisar-se nas

36 35 empresas distribuidoras de energia elétrica para o Rio Grande do Sul o conhecimento individual da volatilidade. Se o comportamento da volatilidade dessas empresas for significativo, suas volatilidades devem ser estimadas, sendo possível, assim, analisar o seu efeito. Desde o Prêmio de Nobel de Economia que Engle recebeu em 003 pela sua contribuição com métodos estatísticos de modelagem e previsão da volatilidade de séries financeiras, os modelos ARCH tem sido amplamente estudados, ampliados e utilizados com diferentes propósitos. Issler (1999) e Bollerslev, Chou e Kroner (199) discutem brevemente as vantagens que a modelagem ARCH oferece em relação às medidas que frequentemente são usadas por agentes do mercado. Salienta-se o estudo aqui desenvolvido em um processo do número de consumidores e consumo de energia elétrica. Verificar se estes setores possuem características heterocedásticas, verificar a sua volatilidade ao longo do tempo seria de extrema importância para manter o processo de consumo e o número de consumidores sob controle. Antecipando os comportamentos dessas variáveis, evitam-se inúmeros problemas, tais como os blackouts, o excesso de geração de energia e/ou distribuição dentre e gargalos no setor o que podem levar a impactos negativos como custos elevados, más decisões de investimentos, precificação de títulos e gerenciamento de risco. Testes de diagnósticos No processo de modelagem de séries temporais, têm-se diversos pressupostos, já mencionados, que devem ser satisfeitos e, portanto, testados. Na seção 4.4, apresentam-se estatística Ljung-Box para detectar autocorrelação e os testes de raiz unitária para analisar a estacionariedade; na seção 4.5, os testes de normalidade; os testes para detectar a heterocedasticidade condicional residual. i) Testes de normalidade O pressuposto da normalidade precisa ser atendido com o objetivo de oferecer confiabilidade aos testes estatísticos, uma vez que, em geral, eles se baseiam na distribuição normal do termo residual. Sua violação afeta as qualidades

37 36 de não tendenciosidade e variância mínima do método de mínimos quadrados ordinários. Vários testes estatísticos têm sido usados para avaliar a normalidade dos resíduos do modelo estimado, dentre os quais se destacam: - Jarque-Bera É uma estatística que tem a vantagem de ser simples na sua operacionalização, em termos de compreensão intuitiva. Depende de dois parâmetros, assimetria e curtose, que podem ser calculados a partir de dados históricos. A estatística Jarque-Bera possui um poder de teste elevado, não erra na presença de normalidade. Há uma baixa probabilidade de indicar a normalidade na presença de não normalidade das distribuições, ou seja, pode-se cometer o Erro Tipo II, aceitando-se a hipótese de normalidade quando a hipótese alternativa de não normalidade é a verdadeira. É mensurada pela seguinte equação, a qual segue uma distribuição quiquadrada com dois graus de liberdade: A3 ( K 4 3) JB= N + ~ χ ( α = 5%) 5, (49) onde: A3 é coeficiente de assimetria, K 4 é o coeficiente de curtose excessivo e N é o tamanho da amostra. As hipóteses a serem testadas são: H 0 = Assimetria = zero e curtose = a três (normalidade); H 1= Assimetria zero e curtose três (não normalidade). Regra de decisão: o teste baseia-se nos coeficientes de assimetria e curtose. Se p-valor for maior que o nível de significância de 5% cujo valor crítico é 5,99, a hipótese nula de normalidade não será violada.

38 37 ii) Testes para autocorrelação A autocorrelação indica se existe uma dependência temporal entre os valores sucessivos dos resíduos, ou seja, os resíduos são correlacionados entre si. A presença de autocorrelação significa que as estimativas através do método MQO dos parâmetros não são tão eficientes, ou seja, não apresentam variância mínima. Ela provoca um viés nos erros-padrão, conduzindo a testes e intervalos de confiança incorretos. A estatística Ljung-Box, em conjunto com os correlogramas FAC e FACP, é aplicada nas seguintes situações: inicialmente, nos dados originais para analisar, em primeira instância, a estacionariedade da série; em seguida, nos resíduos do modelo ARIMA com o propósito de verificar se os resíduos do modelo estimado formam um ruído branco; posteriormente, nos resíduos ao quadrado desse modelo para identificar se existe autocorrelação significativa. Se houver, é necessário aplicar testes para verificar se existe heterocedasticidade condicional na série quadrática. Se a heterocedasticidade for confirmada, a série é modelada através dos modelos ARCH. - Estatística Ljung-Box Segundo Ehlers (007), ao invés de verificar as autocorrelações residuais individualmente, pode-se testar se um grupo de autocorrelações é significativamente diferente de zero por meio das chamadas estatísticas Q. Segundo Morettin (006), Box e Pierce (1970) sugeriram, um teste de hipótese para as autocorrelações dos resíduos estimados, apesar de não detectar quebras específicas no comportamento de ruído branco, pode indicar se esses valores são muito altos. Uma modificação desse teste foi proposta por Ljung e Box (1978), na qual a estatística de teste é dado pela expressão (50) Q K) = n( n+ ) K k k= 1 ( n rˆ k) ( ((50) em que n representa o número de observações, e k representa o número de parâmetros estimados, seguindo uma distribuição liberdade. χ com K p q graus de

39 38 de As hipóteses testadas são: H 0 = Ruído branco (RB); H 1= Não é ruído branco (RB). Regra de decisão: se a estatística calculada excede o valor crítico da tabela χ para determinado nível de significância, podemos rejeitar a hipótese nula de que todos os rˆ ) ( k que pelo menos uma autocorrelação são iguais a zero. Isso implica aceitar a hipótese alternativa de ˆ ( ) r k é estatisticamente diferente de zero. Nesse caso, o resíduo não é ruído branco. No caso da aceitação da hipótese alternativa, rejeita-se o modelo, pois há uma estrutura de correlação serial significativa nos resíduos (GUJARATI, 000; SÁFADI, 004). distribuição Na prática, utilizam-se entre as 15 e 0 primeiras autocorrelações rˆ ). Embora, em amostras grandes, tanto a estatística Q como a Q(K) sigam a χ, a estatística Q(K) de Ljung-Box possui as melhores propriedades em amostras pequenas do que a estatística Q de Box e Pierce. ( k Testes para heterocedasticidade condicional Apresentam-se, a seguir, os testes para comprovação da presença de heterocedasticidade condicional na série residual do modelo estimado. Até pouco tempo atrás, a heterocedasticidade era considerada um problema muito comum em dados cross section, embora também esteja presente em algumas séries temporais, mas estudos de Engle (198) e por Bollerslev (1986) provaram que essa anomalia também pode ser modelada. Na prática, é desejável que a variância dos resíduos do modelo estimado seja constante, ou seja, Var ( µ ) = σ. Caso isso ocorra, diz-se que os resíduos do i modelo estimado são homocedásticos. A violação desse pressuposto revela que a variância irá diferir ao longo do tempo, isto é, heterocedásticos. Var ( µ i ) = σ i, e os resíduos serão Na presença de heterocedasticidade, o método de mínimos quadrados ordinários não produz estimativas eficientes para seus parâmetros nem variância

40 39 mínima. A não minimização da variância conduz a erros-padrão viesados e à incorreção dos testes t-student e F-Snedecor, além dos intervalos de confiança. Isso justifica a necessidade de aplicar modelos heterocedásticos para modelar essa característica. Existem diversos testes estatísticos para detectar a presença de heterocedasticidade nos resíduos ao quadrado do modelo estimado. Apresentam-se a seguir, os testes de White aplicado no caso multivariado, o ARCH-LM empregado nos casos univariados e, posteriormente, a estatística F. - ARCH-LM O teste ARCH-LM, do tipo multiplicador de Lagrange proposto por Engle (198), testa a hipótese de que os erros resultantes da estimação do modelo são dependentes dos erros auxiliar (BEM, 1998). rt 1, rt,, rt m, e baseia-se na estimação da regressão Silva et al. (005) afirma que, se os coeficientes de autocorrelações estimados revelam um padrão previsível para a média condicional da série analisada e se as autocorrelações estimadas para os resíduos ao quadrado também exibem sinais de previsibilidade, há uma evidência de efeitos ARCH. O teste ARCH-LM utiliza a seguinte expressão: onde r = α + αr + + α r + u ((51) t 0 1 t 1 m t m t t= m+ 1,, T. A estatística do teste T R, também chamada de Obs*Rsquared, tem distribuição assintótica do coeficiente de correlação múltipla da regressão (51). hipóteses: χ ( m) sob H 0. Nesse caso, R é o quadrado Para comprovar a presença de efeitos ARCH, testam-se as seguintes H 0 = Não existem efeitos ARCH; H 1= Existem efeitos ARCH. Regra de decisão: se p-valor é menor que o nível de significância adotado, no caso específico deste trabalho adotou-se um nível de 5%, rejeita-se a hipótese nula, portanto, existe heterocedasticidade condicional.

41 40 - Estatística F De acordo com Morettin (008), um teste assintoticamente equivalente, que pode ter propriedades melhores para amostras pequenas, consiste em utilizar a estatística F ( SQR SQR ) / m ~ F( mt, m 1) SQR /( T m 1) 0 1 = 1 ((5) na qual T r t m t r = + e SQR ( ) 0 = 1 SQR =, com r a média amostral T ˆ 1 u t= m+ 1 t dos r t u e ˆt os resíduos de MQO da regressão (5). Se o valor de F for significativo, diz-se que há heterocedasticidade condicional na série. Assim, o teste ARCH-LM é aplicado nos resíduos do modelo estimado em dois momentos: primeiro, aplica-se o teste à série de resíduos ao quadrado do modelo ARIMA para média condicional. Se esta série possui heterocedasticidade condicional, necessita-se estimar um modelo por meio dos modelos ARCH. Em um segundo momento, aplica-se o teste na série dos resíduos padronizados do modelo ARCH para variância condicional e na série ao quadrado destes resíduos, em que se pretende verificar a não rejeição da hipótese nula nos dois casos, indicando que a série residual do modelo estimado é puramente aleatória, sem dependência na média e na variância. - Testes de raiz unitários para analisar a estacionariedade Os testes a serem utilizados para testar a estacionariedade das componentes em estudo são o Augmented Dickey-Fuller (1984) - (ADF), que possui como hipótese nula que a série é não estacionária e integrada de ordem d (d > 0). Na grande maioria dos casos de séries não estacionárias, basta uma diferenciação para tornar a série resultante estacionária, isto é, I(0). Como uma forma de validação dos testes ADF, utiliza-se o teste Kwiatkowski- Phillips-Schmidt-Shin (199) - (KPSS), em que as hipóteses apresentadas são inversas dos testes ADF, ou seja, H 0 postula que a série é I(0) contra a alternativa que a série seja I(1). Estes testes são amplamente discutidos na literatura de econometria como em Enders (1995) e Maddala (199). Como as hipóteses nulas dos testes ADF e KPSS são distintas, espera-se

42 41 que os dois testes sinalizem a mesma decisão em relação à estacionariedade da série. Mas Baillie et al. (1996) salienta que a utilização desses testes pode gerar situações de conflitos, chegando-se a uma inconclusão em relação à estacionariedade da séries.

43 3 METODOLOGIA A análise refere-se ao número de consumidores e ao consumo de energia elétrica no estado do RS, realizado pelas três maiores distribuidoras de energia elétrica, nomeadamente a AES-Sul, CEEE e RGE. Não são considerados, neste estudo, as cooperativas de energia elétrica ou geração própria de energia, que são responsáveis por menos de 6% de geração e distribuição. Os dados foram coletados no período de janeiro de 1998 a dezembro de 009, com observações mensais e medidas em unidades mega watts hora (MWh). No setor de consumo e de número de consumidores, as observações são mensais. Os setores analisados dessas distribuidoras são: industrial, comercial, rural, serviços públicos, residencial e outros. A coleta de dados foi realizada na Fundação de Economia e Estatística do Rio Grande do Sul, que reúne informações de natureza socioeconômica relativas ao estado e a seus municípios. Será necessário realizar a modelagem linear aplicada às componentes selecionadas, utilizando a classe geral dos modelos ARIMA e verificando a adequação dos modelos concorrentes por meio da análise dos resíduos, assim como selecionando aqueles que melhor representarem a série em estudo por meio dos critérios de penalidades AIC (Critério de Informação Akaike). Caso seja verificada a presença de volatilidade residual na variável em estudo, esses resíduos serão modelados utilizando a classe de modelos ARCH e novamente será investigada a adequação do modelo via análise dos resíduos. Foram consideradas, como variáveis deste estudo, o volume de consumo (em MWh) e o número de consumidores nos setores e distribuidoras apresentados na Tabela 1. Tabela 1 Distribuidoras e regiões de abrangência. Companhias Estaduais de Distribuição de Energia Elétrica para o Rio Grande do Sul Distribuidoras Setores Área de Concessão CEEE AES-Sul RGE Residencial Comercial Industrial Rural Serviços Públicos Outros Regiões metropolitanas de Porto Alegre, litoral e campanha gaúcha. Regiões metropolitanas e centro-oeste do estado. Região norte-nordeste do estado do Rio Grande do Sul.

44 43 Para melhor visualização da abrangência de cada distribuidora de energia elétrica para o Rio Grande do Sul, em estudo, observa-se a Figura I. Figura I: Distribuidoras de energia elétrica para o Rio Grande do Sul. Fonte: SIGEL/ANNEL Elaboração:DEPLAN/SEPLAG 08/009. As etapas metodológicas a serem seguidas são as seguintes: Etapa 1: Análise de Componentes Principais (ACP) Extração das componentes principais e seleção das mesmas variáveis do número de consumidores e do fornecimento de energia, nos diversos setores e diversas companhias, de modo que sejam usadas apenas CP selecionadas pelo método de Kaiser (1960). Objetiva-se nesta etapa a ausência de correlação entre as componentes principais, o que proporciona uma melhor eficácia para se tratar os problemas de multicolinearidade, além de reduzir a dimensão estudada. Etapa : Estatísticas descritivas Inicialmente, um gráfico com a variável original é traçado para se ter uma idéia do seu comportamento. Também, verificam-se as estatísticas descritivas que revelem o comportamento da variável em estudo, tais como estacionariedade, medidas de assimetria, curtose e normalidade. Ainda, busca-se avaliar a presença de outliers e a possível identificação para suas causas. Segundo Bayer e Souza (007), a estatística univariada tradicional considera as variáveis de forma

45 44 independente, não particularizando suas possíveis inter-relações, mas sua utilização é de suma importância no desenvolvimento de trabalhos científicos, pois ela é capaz de mostrar como as variáveis em análise estão se comportando. Etapa 3: Modelagem linear ARIMA (p, d, q) Devido às características que determinado processo produtivo possui, já é possível verificar a presença de autocorrelação nos dados. Para facilitar a identificação de autocorrelação, recorre-se à Função de Autocorrelação (FAC) e à Função de Autocorrelação Parcial (FACP) para determinar o grau de autocorrelação na variável em estudo. Logo, estimam-se modelos concorrentes da classe geral ARIMA, servindo-se da metodologia Box e Jenkins (1970), em que se procura um modelo que represente um ruído branco, isto é, que tenha média zero e variância constante. O modelo selecionado será aquele que, além de explicar o fenômeno em estudo após ser realizada a análise dos resíduos, procurando-se sempre por modelos que forneçam ruído branco, isto é, com média zero e variância constante e não autocorrelacionados, apresente melhores estatísticas nos critérios de penalidades AIC (apud SOUZA e LOPES, 009). O melhor resíduo selecionado terá os seus resíduos investigados em relação à homocedasticidade, por meio do teste LM-ARCH. Etapa 4: Análise de heterocedasticidade residual Na presença de heterocedasticidade, o método de mínimos quadrados ordinários não produz estimativas eficientes para seus parâmetros nem mesmo uma variância mínima. A não minimização da variância conduz a erros-padrão viesados e à incorreção dos testes t-student e F-Snedecor, além dos intervalos de confiança. Isso justifica a necessidade de aplicar modelos não lineares da classe ARCH em séries que apresentam heterocedasticidade (SILVA, 000). O teste ARCH-LM, do tipo multiplicador de Lagrange, proposto por Engle (198), testa a hipótese de que os erros resultantes da estimação do modelo linear são dependentes dos erros a t 1, at,, at m e baseia-se na estimação da regressão auxiliar (BEM, 1998). Silva, Sáfadi e Castro Júnior (005) afirmam que, se os coeficientes de

46 45 autocorrelações estimados revelam um padrão previsível para a média condicional da série analisada e se as autocorrelações estimadas para os resíduos quadráticos também exibem sinais de previsibilidade, há uma evidência de efeitos ARCH. O teste ARCH-LM utiliza a seguinte expressão: r = α + αr + + α r + u (53) t 0 1 t 1 m t m t onde t= m+ 1,, T. A estatística do teste T R tem distribuição assintótica X m sob H 0. Nesse caso, R é o quadrado do coeficiente de correlação múltipla da regressão (53). hipóteses: Para comprovar a presença de efeitos ARCH, testam-se as seguintes H : 0 A série não possui efeitos ARCH; H 1 : A série possui efeitos ARCH. Regra de decisão: se p-valor é menor que o nível de significância adotado, rejeita-se a hipótese nula, portanto, existe heterocedasticidade condicional. Assim, o teste ARCH-LM foi aplicado nos resíduos do modelo estimado em dois momentos. No primeiro momento, aplica-se o teste à série de resíduos quadráticos do modelo ARIMA. Se esta série possui heterocedasticidade condicional, necessita-se estimar um modelo por meio dos modelos não lineares da classe ARCH e, em um segundo momento, aplica-se o teste na série de resíduos quadráticos do modelo ARCH e nos resíduos padronizados oriundos do modelo ARCH. Desta forma, procura-se a indicação de que a série residual do modelo estimado é puramente aleatória, sem dependência na média e na variância. Etapa 5: Modelagem não linear ARCH (m) O objetivo da modelagem ARCH é considerar os efeitos da volatilidade conjuntamente com os da média do processo. No passo, já estabelecidos os resíduos que eram ruído branco e não autocorrelacionados, passa-se, no passo 3, a investigar a dependência quadrática destes resíduos e, se estes mostrarem-se heterocedásticos, parte-se para uma modelagem conjunta ARIMA-ARCH. Nesta etapa, os passos metodológicos são semelhantes ao passo 4, apenas

47 46 com o diferencial de que a variável em estudo passa a ser a série de resíduos do modelo ARIMA selecionado. Após estimado o modelo conjunto ARIMA-ARCH, os resíduos oriundos do melhor modelo serão investigados em relação a sua adequação, verificando se eles seguem um ruído branco não correlacionado e não possuem heterocedasticidade residual. O fluxograma abaixo resume as etapas metodológicas descritas anteriormente. Figura II: Etapas metodológicas Fonte: Elaboração própria. Quantificar e qualificar as necessidades futuras de energia elétrica com qualidade e confiabilidade por meio de modelos lineares e não lineares aplicados a componentes principais é a proposta deste estudo, para que as empresas tenham mais um subsídio para as tomada de decisões e desenvolvam com eficiência a distribuição de energia para todos os setores. Para o cumprimento de todos os passos metodológicos, faz-se necessário a utilização de softwares computacionais, a fim de realizar os testes, análises, estimação e modelagem dos dados. Para a análise de CP foi utilizado o software Statistica versão 7.0 e, para as demais análises, o EWVIES 7.0.

48 4 APRESENTAÇÃO E ANÁLISE DOS RESULTADOS Neste capítulo são apresentados os resultados da análise do consumo em (MWh) e do número de consumidores de energia elétrica para o Rio Grande do Sul por meio de modelos lineares e não lineares aplicados às componentes principais. Desta forma, os resultados obtidos contribuirão para revelar a aplicabilidade dos modelos de previsões nas combinações lineares, de modo a revelarem o comportamento global das variáveis, fornecendo condições para entender o comportamento conjunto das variáveis, de forma que as decisões a serem tomadas possam ser subsidiadas em bases científicas, obtendo o melhor planejamento, permitindo a alocação racional e otimizada. Nas últimas duas décadas, tem sido observada uma tendência na reestruturação na maioria das áreas de negócio, desde o comércio de produtos até serviços públicos. O impacto da reestruturação tem sido profundo em todos os setores envolvidos e mudou significantemente as condições de competição. Nos serviços públicos, o processo iniciou no setor de telecomunicações e teve continuidade nos mercados de eletricidade e gás (DYNER e LARSEN, 001). O perfil do consumo de energia no País está mudando e deve demandar alterações na política de investimentos das empresas distribuidoras. A avaliação é do consultor Eduardo Bernini ( ex-presidente da Eletropaulo. Segundo a estatal, o consumo médio por residência atingiu 165 kwh por mês, depois de quatro anos seguidos de crescimento. Trata-se de um reflexo direto do aumento da renda e da mobilidade social verificada nos últimos anos, comenta o especialista, que observa um novo padrão de consumo na população brasileira. Segundo observou em entrevista recente o diretor-geral do Operador Nacional do Sistema Elétrico - ONS, Hermes Chipp ( em vez de um único horário de pico, o sistema elétrico apresentou, no verão de 009, um segundo pico de energia. Bernini, no entanto, demonstra preocupação com o impacto do aumento de consumo residencial sobre a qualidade da distribuição da energia nas grandes cidades.

49 48 Tendo em vista este aumento de consumo de energia, é imprescindível o estudo de projeção da demanda para se fazer desde o planejamento de geração, de transmissão, da distribuição e operação até o financeiro. Com isso, a empresa será capaz de projetar a oferta e a demanda em níveis de confiabilidade. Com o planejamento da transmissão, a empresa tem como estruturar o carregamento de linhas e transformadores, o sentido dos fluxos de intercâmbio e custos de distribuição, diminuindo os possíveis sinistros registrados como a sobrecarga, entre outros. O aumento do PIB no estado do Rio Grande do Sul tem sido acompanhado pelo aumento dos níveis de consumo de energia elétrica nos últimos anos. Quanto ao perfil do consumo de energia elétrica, é o setor industrial que mais consome energia, com 37,7%. O setor residencial é responsável por 5,68%, o comercial por 16,84% e as áreas rurais por 1,54%. Com relação às cooperativas de eletrificação rural, apesar de 67% dos consumidores serem rurais, consomem somente 5,3% da energia elétrica distribuída, enquanto o setor industrial, com 0,64% dos consumidores, consome 3,3% da energia elétrica distribuída. O planejamento da evolução temporal e distribuição espacial do número de consumidores em áreas urbanas e rurais vão ao encontro do atendimento com qualidade e confiabilidade, operacionalizando o despacho de unidades geradoras e das interligações, de modo a minimizar custos de transmissão e produção. 4.1 Análise de componentes principais A ACP foi efetuada com o intuito de encontrar uma CP que fosse representativa do conjunto de dados, uma vez que a informação contida nas p- variáveis originais é substituída pela informação contida em k (k<p) componentes principais. A análise de componentes principais foi realizada utilizando-se o fornecimento mensal de energia por classe de consumo fornecida e o número de consumidores de energia elétrica por classe de consumo no Rio Grande do Sul em cada mês. Estas são uma combinação linear de todas as variáveis originais, independentes entre si e escolhidas por ordem decrescente dos autovalores com o máximo de informação, em termos de variação total contida nos dados iniciais, permitindo, com isso, reduzir a dimensão do conjunto original de variáveis e permitir

50 49 construir os modelos de previsão. A técnica de componentes principais permite reduzir o número de variáveis originais, correlacionadas em variáveis não correlacionadas em uma mesma quantidade de variáveis, transformada em componentes ortogonais, ou seja, nas componentes principais, que são uma combinação linear de todas as variáveis originais, independentes entre si e escolhidas por ordem decrescente dos autovalores com o máximo de informação, em termos de variação total contida nos dados iniciais, permitindo, com isso, reduzir a dimensão do conjunto original de variáveis e permitir construir os modelos de previsão. A técnica de componentes principais apresenta tantas componentes principais quantos forem o número de variáveis que estão sendo analisadas, porém, com a propriedade de que, em ordem decrescente, as primeiras componentes principais retêm a maior parte da variância dos dados originais de seleção dos componentes (KAISER, 1960; KATTEL, 1960) e da variância média de 70% Análise do número de consumidores de energia elétrica por classe de consumo no Rio Grande do Sul para CEEE, AES-Sul e RGE Neste item, faz-se a análise do número de consumidores de energia elétrica do RS. Além da análise descritiva, procede-se a análise de componentes principais com o intuito de reduzir a dimensionalidade do estudo e, no momento de realizar a modelagem estatística, pretende-se obter um comportamento global das variáveis de maior representatividade na componente analisada. Na Figura 4, visualiza-se a seleção das componentes principais através do método gráfico Screeplot, sendo que a porcentagem de variação explicada pela componente está no eixo das ordenadas, e os autovalores estão representados em ordem decrescente no eixo das abscissas.

51 ,41% 5,5 5,0 4,5 76,0% 4,5 4,0 3,5 65,65% Percentual de Variância Explicada ,04% 1,86%,44%,3%,0% Percentual de Variância Explicada 4,0 3,5 3,0,5,0 1,5 1,0 0,5 0,0 10,38% 7,80% 3,59% 1,64%,39% Percentual de Variância Explicada 3,0,5,0 1,5 1,0 0,5 0,0,33% 10,0% 1,63%,34%,04% CP 1 CP CP 3 CP 4 CP 5 CP 6 CP 7 CP 8-0, , Componentes Principais Componentes Principais Componebtes Principais (a) (b) (c) Figura 4 Representação gráfica dos autovalores e percentual de variância explicada CEEE (a), AES-Sul (b) e RGE(c) respectivamente. Para a distribuidora CEEE, a primeira componente explica 89,41% da variância total, sendo selecionada apenas a primeira componente. O segundo critério de seleção consiste em incluir somente aquelas componentes cujos valores próprios sejam superiores a 1. Este critério é sugerido por Kaiser (1960, apud, SOUZA e VICINI, 005). Ele tende a incluir poucas componentes quando o número de variáveis originais é inferior a vinte e, em geral, utilizam-se componentes que conseguem sintetizar uma variância acumulada em torno de 70%. Segundo Lopes, Lima e Zanella (007), o objetivo é encontrar um meio de condensar a informação contida em número de variáveis, em um conjunto menor de variáveis estatísticas. Para a distribuidora AES-Sul, a primeira componente explica 76,0% da variância total, sendo considerada a primeira componente, pois esta componentes conseguem sintetizar uma variância acumulada superior a 70%. Para a distribuidora RGE, as duas primeiras componentes explicam 87,98% da variância total, sendo consideradas a primeira e a segunda componente, obedecendo aos dois critérios de seleção, que consistem em incluir somente aquelas componentes cujos valores próprios sejam superiores a 1 e utilizar componentes que conseguem sintetizar uma variância acumulada em torno de 70%. Na Tabela, estão demonstrados os fatores representados pelos autovalores resultantes da matriz de correlação, o percentual da variância explicado por cada fator e o percentual total de explicação da variância do conjunto de fatores.

52 51 Tabela Autovalores e variância explicada de cada componente para o número de consumidores de energia elétrica. Distribuidora Extração das componentes principais Número de Componente Autovalores % da variância explicada Autovalores acumulados % da variância explicada acumulada CEEE 1 5,36 89,41 5,36 89,41 AES-Sul 1 4,57 76,0 4,57 76,0 RGE 1 3,94 65,65 3,94 65,65 1,34,33 5,8 87,98 Por meio da ACP aplicada ao conjunto das variáveis, é selecionada para distribuidora CEEE uma CP ou nova variável, que represente 89,41% das variáveis originais. A partir dessa análise, ao invés de utilizar as seis variáveis, passa a ser utilizada apenas uma CP, representada pelos seus autovalores superiores a 1, com uma perda de informação de aproximadamente 10,59% das variáveis originais. Para a AES-Sul, constata-se que a primeira componente principal (CP 1 ) representa 76,0%. A partir desta análise, ao invés de utilizar as seis variáveis, passa a ser utilizada apenas uma CP, representada pelo seu autovalor superior a 1, com uma perda de informação de aproximadamente 3,8% das variáveis originais. Para a distribuidora RGE, foram selecionadas as duas primeiras componentes principais, a (CP 1 ) que representa 65,65% e a (CP ) que representa,33% da variabilidade das variáveis pesquisadas. Verifica-se, ainda, que os dois autovalores são superiores a uma unidade e representam uma variância explicada acumulada de 87,98%. A partir desta análise, ao invés de utilizar as seis variáveis, passam a ser utilizados apenas dois fatores, representados pelos seus autovalores superiores a 1, com uma perda de informação de aproximadamente 1,0% das variáveis originais. Na Tabela 3, são mostradas as influências que cada variável possui na composição de cada componente por meio das cargas fatoriais, refletindo quais componentes principais estão mais correlacionadas com as variáveis originais.

53 5 Assim, com base no poder de explicação dos autovalores, foi selecionada uma componente principal utilizada para determinação do modelo de previsão para a CP1 CEEE e pode-se afirmar que é a mais importante para o estudo, pois ela é derivada do maior autovalor, explica 89,41% e representa os seis setores deste estudo. A variável com maior correlação com a CP 1CEEE é a variável nominada Res e representa o setor residencial, seguida das variáveis Com setor comercial, Rural setor rural, S Publ setor serviços públicos, Outros setor outros, ou seja, subdenominações das demais componentes em análise. Para a AES-Sul, utiliza-se uma CP que representa 76,0% das variáveis explicadas. Pode-se afirmar que a CP 1AES-Sul é derivada do maior autovalor e representa as seis variáveis em estudo. A variável com maior correlação com esta CP 1AES-Sul : Res representa o setor residencial, seguida das variáveis Com setor comercial, Ind setor industrial, Rural setor rural, SPubl setor serviços públicos, Outros setor outros, ou seja, subdenominações das demais componentes em análise. Tabela 3 Cargas fatoriais por companhia. CEEE Variáveis CP 1 CP CP 3 CP 4 CP 5 CP 6 Res -0,94 0,03 0,08 0,9-0,14-0,07 Com -0,98 0,07 0,1 0,09-0,0 0,13 Ind 0,76-0,0 0,61 0,03-0,0 0,00 Rural -0,79-0,59-0,03 0,05 0,16-0,0 S Publ -0,84 0,44 0,5-0,07 0,17-0,04 Outros -0,91-0,16 0,10-0,34-0,14-0,0 AES-Sul CP 1 CP CP 3 CP 4 CP 5 CP 6 Res -0,44 0,03 0,11 0,6-0,46-0,44 Com -0,46 0,08 0,18 0,19-0,06 0,84 Ind 0,36-0,5 0,89 0,07-0,06 0,01 Rural -0,37-0,75-0,04 0,10 0,53-0,10 S Publ -0,39 0,56 0,37-0,16 0,54-0,7 Outros -0,43-0,1 0,14-0,73-0,46-0,11 RGE

54 53 CP 1 CP CP 3 CP 4 CP 5 CP 6 Res -0,97-0,1 0,01 0,13-0,05 0,03 Com -0,98-0,15-0,01 0,08-0,05-0,03 Ind -0,3 0,76 0,56 0,04 0,01 0,00 Rural -0,96-0,08 0,07-0,7-0,01 0,00 S Publ -0,98-0,01-0,14 0,05 0,1 0,00 Outros 0,3-0,83 0,51 0,01 0,03 0,00 Para a distribuidora RGE, foram selecionadas duas componentes principais utilizadas para determinação do modelo de previsão. A variável com maior correlação com esta CP 1RGE : Res representa o setor residencial, seguida das variáveis Com setor comercial, Rural setor rural, S Publ setor serviços públicos, Outros setor outros, ou seja, subdenominações das demais componentes em análise, e a CP RGE representa: Ind setor industrial. As correlações negativas de algumas variáveis em relação aos fatores mostram que as variáveis se relacionam de forma oposta, isto é, quando um setor aumenta, o outro diminui. Os resultados da ACP são expostos na Tabela 3. Deste modo, as distribuidoras podem ser explicadas respectivamente: CEEE por uma componente, com um poder de explicação de 89,41%; AES-Sul por uma componente com poder de explicação de 76,0% e a distribuidora RGE - por duas componentes com poder de explicação acumulado de 87,98%. As cargas fatoriais são demonstradas na Tabela 3, em que se observa que as correlações são bastante elevadas, e isso se reflete nas semelhanças das cargas fatoriais da primeira componente principal para as distribuidoras CEEE e AES-Sul. Já, para a RGE, o ante exposto se divide em duas componentes. Segundo Alexander (005), o deslocamento da primeira componente principal representa os movimentos paralelos de ascendência e descendência, portanto, uma mudança que ocorra em uma das variáveis que compõem a componente principal se refletirá nesta componente. Por essa razão, a primeira componente principal é chamada componente de tendência das curvas, neste caso, 89,41% da variação total da distribuidora CEEE (a), 76,0% da variação total da distribuidora AES-Sul (b) e 87,98% da variação total da distribuidora RGE (c).

55 54 O deslocamento da componente principal provoca uma inclinação da curva das cargas fatoriais do número de consumidores de energia elétrica, conforme Figura 5. (a) (b) (c) Figura 5 Gráfico das cargas fatoriais para as distribuidoras CEEE (a), AES-Sul (b) e RGE (c) para o número de consumidores de energia elétrica para o Rio Grande do Sul. Pode-se perceber, analisando a Figura 5, que a ACP, além de reduzir as dimensões a serem analisadas, as componentes selecionadas são capazes de acompanhar os movimentos das mudanças de todas as curvas em análise, devido à elevada correlação que é refletida pelas cargas fatoriais da primeira componente para CEEE e AES-Sul e para a primeira e a segunda componentes para a RGE, que não somente são muito similares, ma também muito próximas de 1. Na Figura 6, mostra-se o círculo de correlação unitário, com a nuvem de variáveis distribuídas no plano fatorial, cujas variáveis mais próximas ao círculo de

56 55 correlação são altamente representativas. Na Figura 6a, observam-se as variáveis que estão mais correlacionadas e, assim, melhor explicam a CP 1CEEE e a CP CEEE. Na Figura 6b, observam-se as variáveis que estão mais correlacionadas e, assim, melhor explicam a CP 1AES-Sul e a CP AES-Sul. Na Figura 6c, observam-se as variáveis que estão mais correlacionadas e, assim, melhor explicam a CP 1RGE e a CP RGE. 1,0 Ind 0,5 Factor :,33% 0,0 S Publ Rural Com Resid -0,5 Outros -1,0-1,0-0,5 0,0 0,5 1,0 Factor 1 : 65,65% Active (a) (b) (c) Figura 6 Círculo de correlação unitário para as CEEE (a), AES-Sul (b) e RGE (c) respectivamente. Pela inspeção do circulo unitário de correlação unitário, também é possível identificar as variáveis mais correlacionadas. Por exemplo, na Figura 6a, vêem-se que Serviços Públicos, Rural, Comercial e Residencial estão bem correlacionados ou apresentam o mesmo comportamento, pois o ângulo formado entre as variáveis é muito pequeno. A variável Industrial apresenta um ângulo um pouco maior com as variáveis que estão no segundo e terceiro quadrantes, mas este ângulo é menor do que 45, mostrando que a correlação com as demais variáveis é moderada. A variável Outros apresenta-se não correlacionado, pois o ângulo formado é de aproximadamente de 180 com as variáveis Serviços Público, Rural, Comercial e Residencial. Industrial e as variáveis que incluem a variável Outros também apresentam fraca correlação entre si, pois o ângulo formado é aproximadamente 10. É de salientar que o comportamento individual das variáveis na sua representação do sistema é muito bom, pois quase todas as variáveis estão posicionadas em cima do circulo unitário de correlação.

57 Análise do consumo em MWh de energia elétrica por classe no Rio Grande do Sul para CEEE, AES-Sul e RGE Na Figura 7, visualiza-se a seleção das componentes principais por meio do método gráfico Screeplot, sendo que a porcentagem de variação explicada pela componente está no eixo das ordenadas, e os autovalores estão representados em ordem decrescente no eixo das abscissas. 4,5 5,0 4,5 4,0 6,8% 4,5 74,83% 4,0 6,50% 3,5 4,0 3,5 Percentual de Variância Explicada 3,0,5,0 1,5 1,0 0,5 18,60% 8,59% 5,90% 4,11%,53% Percentual de Variância Explicada 3,5 3,0,5,0 1,5 1,0 0,5 10,88% 8,65% 3,51% 1,69%,44% Percentual Variância Explicada 3,0,5,0 1,5 1,0 0,5 17,8% 13,45% 4,47% 1,85%,45% 0,0 0,0 0,0-0, Componentes Principais -0, Componentes Principais -0, Componentes Principais (a) (b) (c) Figura 7 Representação gráfica dos autovalores e percentual de variância explicada CEEE, AES-Sul e RGE respectivamente. Para a distribuidora CEEE (a), as duas primeiras componentes explicam 81% da variância total, sendo consideradas as primeiras componentes, segundo critério de seleção, que consiste em incluir somente aquelas componentes cujos valores próprios sejam superiores a 1. Para a distribuidora AES-Sul (b), a primeira componente explica 74,83% da variância total, sendo considerada a primeira componente e, para a distribuidora RGE (c), as duas primeiras componentes explicam 79,78% da variância total, sendo considerada a primeira e a segunda componentes. Na Tabela 4, estão demonstradas as CP representadas pelos autovalores resultantes da matriz de correlação do consumo mensal de energia em MWh, o percentual da variância explicado por cada fator e o percentual total de explicação da variância do conjunto de fatores.

58 57 Tabela 4 Autovalores e variância explicada de cada componente para o fornecimento mensal de energia por classe de consumo. Autovalores Extração das componentes principais Distribuidora Número de Componente Autovalores % da variância explicada Autovalores acumulados % da variância explicada acumulada CEEE 1 3,74 6,30 3,74 6,30 1,1 18,60 4,85 80,90 AES-Sul 1 4,49 74,83 4,49 74,83 RGE 1 3,75 6,50 3,75 6,50 1,04 17,8 4,79 79,78 Por meio da ACP, foram selecionadas, para a distribuidora CEEE, duas CP, que representam 80,9% das variáveis originais. Constata-se que a primeira componente principal CP 1CEEE representa 6,30% das variáveis pesquisadas, e a CP CEEE representa 18,60% das variáveis. Verifica-se, ainda, que dois autovalores acima de 1 representam uma variância explicada acumulada de 80,9%. Para a distribuidora AES-Sul, constata-se que a primeira componente principal CP 1AES-Sul representa 74,83% da variabilidade das variáveis pesquisadas. A partir dessa análise, ao invés de utilizar as seis variáveis, passa a ser utilizado apenas um fator, representado pelos seus autovalores superiores a 1, com uma perda de informação de aproximadamente 5,17% das variáveis originais. Para a distribuidora RGE, consideram-se as duas primeiras componentes principais CP 1RGE, que representa 65,50%, e a CP RGE, que representa 17,8% da variabilidade das variáveis pesquisadas. Verifica-se, ainda, que os dois autovalores acima de 1 representam uma variância explicada acumulada de 79,78%. Na Tabela 5, estão demonstradas, por ordem de importância, as correlações existentes entre os fatores e as variáveis originais, refletindo quais são as componentes principais (os fatores) que estão mais ou menos correlacionadas com as variáveis (os setores). Com base no poder de explicação dos autovalores, foram selecionadas as duas componentes principais utilizadas para determinação do modelo de previsão. Nesta análise, utilizaram-se as duas CP, que representam 80,9% das

59 58 variáveis explicadas. Pode-se afirmar que a CP 1CEEE é a mais importante para o estudo, pois ela é derivada do maior autovalor, que explica 6,3%, e representa o maior número de variáveis (cinco das seis variáveis). A variável com maior correlação com esta CP 1CEEE representa: Res - setor residencial, seguida das variáveis Com setor comercial, Rural setor rural, S Publ setor serviços públicos, Outros setor outros, ou seja, subdenominações das demais componentes em análise. Portanto, com base no poder de explicação dos autovalores, foram selecionadas duas componentes principais utilizadas para determinação do modelo de previsão. Para AES-Sul, foi selecionada uma CP 1AES-Sul, que representa 74,83% das variáveis explicadas. Tabela 5 Cargas fatoriais constantes nas variáveis residencial, comercial, industrial, rural, serviços públicos e outros para as três distribuidoras em estudo. CEEE Variáveis CP 1 CP CP 3 CP 4 CP 5 CP 6 Res -0,86 0,08-0,9 0, 0,35 0,01 Com -0,9 0,31-0,01-0,08-0,17 0,13 Ind 0,44 0,8 0,9-0,11 0,0 0,00 Rural -0,84-0,0 0,03-0,48 0,11-0,04 S Publ -0,84 0,47-0,07 0,11-0,1-0,11 Outros -0,73-0,9 0,58 0,0 0,04 0,00 AES-Sul CP 1 CP CP 3 CP 4 CP 5 CP 6 Res -0,94 0,04 0,05 0,9-0,14-0,07 Com -0,98 0,09 0,10 0,09-0,0 0,14 Ind 0,74-0,06 0,67 0,05-0,03 0,00 Rural -0,77-0,61 0,08 0,05 0,16-0,0 S Publ -0,8 0,50 0,19-0,06 0,18-0,04 Outros -0,91-0,13 0,15-0,33-0,15-0,0

60 59 RGE CP 1 CP CP 3 CP 4 CP 5 CP 6 Res 0,4 0,6-0,0-1,11-1,17 -,77 Com 0,6 0,09-0,16 0,11-0,85 4,87 Ind 0,14-0,78 0,6 0,39-1,0-1,18 Rural 0,3 0,7-0,6 1,41 0,44 -,14 S Publ 0,4-0,3-0,06-0,60,9 0,19 Outros 0,1 0,3 1,0 0,0 0,18-0,01 A RGE, nesta análise, faz uso de duas CP, que representam 79,78% das variáveis explicadas. A variável com maior correlação com esta CP 1RGE Res representa o setor residencial, seguida das variáveis Com setor comercial, Rural setor rural, S Publ setor serviços públicos, Outros setor outros, ou seja, subdenominações das demais componentes em análise, e a CP RGE representa Ind setor industrial. Os resultados da ACP são expostos na Tabela 4. Deste modo, as distribuidoras podem ser explicadas respectivamente: CEEE por duas componentes com um poder de explicação acumulado de 80,30%; AES-Sul por uma componente com poder de explicação de 74,83% e a distribuidora RGE por duas componentes com poder de explicação acumulado de 79,78%. As cargas fatoriais são demonstradas na Tabela 5, em que se observa que as correlações são bastante elevadas, e isso se reflete nas semelhanças das cargas fatoriais da primeira e segunda componente principal, para as distribuidoras CEEE e RGE. Já a AES-Sul é representada por uma componente principal. A primeira componente principal é chamada componente de tendência das curvas, neste caso, 80,9% da variação total da distribuidora CEEE (a), 74,83% da variação total da distribuidora AES-Sul (b) e 79,78% da variação total da distribuidora RGE (c). O deslocamento da componente principal provoca uma inclinação da curva das cargas fatoriais do número de consumidores de energia elétrica, conforme Figura 8.

61 60 (a) (b) (c) Figura 8 Gráfico das cargas fatoriais para as distribuidoras CEEE (a), AES-Sul (b) e RGE (c) para o número de consumidores de energia elétrica para o Rio Grande do Sul. Pode-se perceber, analisando a Figura 8, que a ACP foi capaz de reduzir as dimensões e que as componentes selecionadas acompanham o movimento das mudanças de todas as curvas em análise para a CEEE e para a AES-Sul, sendo a primeira e a segunda componente para a RGE muito similares. Na Figura 9, mostra-se o círculo de correlação unitário, com a nuvem de variáveis distribuídas no plano fatorial, para as três distribuidoras de energia elétrica para o Rio Grande do Sul, cujas variáveis mais próximas ao círculo de correlação são altamente representativas.

62 61 1,0 Ind 1,0 1,0 Factor : 18,60% 0,5 0,0 S Publ Com Resid Rural Outros Factor : 10,88% 0,5 0,0 S Publ Com Res Outros Ind Factor : 17,8% 0,5 0,0 Outros Rural Res Com S Publ -0,5-0,5 Rural -0,5 Ind -1,0-1,0-0,5 0,0 0,5 1,0 Factor 1 : 6,8% -1,0-1,0-0,5 0,0 0,5 1,0 Factor 1 : 74,83% -1,0-1,0-0,5 0,0 0,5 1,0 Factor 1 : 6,50% (a) (b) (c) Figura 9 Círculo de correlação unitário para as CEEE (a), AES-Sul (b) e RGE (c) respectivamente. Na Figura 9, observam-se as variáveis que estão mais correlacionadas e assim melhor explicam a CP 1CEEE e a CP CEEE. As variáveis S. Publ, Com, Resid, Rural, Outros (subdenominações das demais componentes em análise), estão bem representadas neste plano, pois se encontram próximas à circunferência e estão fortemente correlacionadas entre si, e o ângulo formado entre as variáveis é muito pequeno. Já, a variável Industrial apresenta um ângulo um pouco maior, mas menor que 45, com as variáveis que estão no segundo e terceiro quadrantes. Pode-se observar que o comportamento individual das variáveis na sua representação do sistema é muito bom, pois quase todas as variáveis estão em cima do círculo unitário. Analogamente analisam-se os demais círculos de correlação unitária. 4. Estatísticas descritivas das componentes principais Neste item serão apresentadas as estatísticas descritivas para as três companhias analisadas, como um suporte para a realização dos modelos a serem usados, com o intuito de conhecer o comportamento das variáveis no decorrer do período analisado e verificar os indícios para a presença de heterocedasticidade condicional na série. Na Tabela 6, apresentam-se algumas estatísticas descritivas das componentes principais que explicam as três distribuidoras de energia elétrica, cuja unidade de medida é a percentagem.

63 6 Tabela 6 Estatísticas descritivas das componentes principais para o número de consumidores e consumo de energia elétrica para as três distribuidoras. Número de Consumidores de energia elétrica para RS Estatísticas CP 1CEEE CP 1AES-Sul CP 1 RGE CP RGE Média -7x ,9x ,3x ,3x10-16 Assimetria 0,0-0,43 0,5-0,89 Curtose -0,38-0,43-0,70-0,11 Desvio-padrão incondicional 0,16,14 1,98 1,16 Coeficiente de Variação (%) Consumo de energia elétrica em MWh, para RS -,30x ,37x ,7x ,51x10 16 Estatísticas CP 1CEEE CP CEEE CP 1AES-Sul CP 1 RGE CP RGE Média 1,5x ,65x ,68x ,75x ,04x10-15 Assimetria -0,56-0,38-0,38 0,0 0,79 Curtose,49 3,65,45,59 4,89 Desvio-padrão incondicional 1,93 1,06,1 1,94 1,0 Coeficiente de Variação(%) 1,33x ,89x ,6x ,87x10-14,5x10-14 Com a análise descritiva das variáveis para o número de consumidores, verificou-se, pelo coeficiente de variação, que a média da variável é considerada pouco representativa, visto que esse valor expresso em percentual está muito próximo de 50%. Ao analisar o valor da assimetria e da curtose, observou-se que a assimetria é diferente de zero e que a curtose variou entre -0,11 e 0,5, o que é um indicativo de que algumas das componentes principais podem exibir sinais de volatilidade e de clusters de volatilidade, conforme Campos (007). De acordo com Soares e Castelar (003), se a curtose excede três unidades, a distribuição é dita leptocúrtica. Analisando o consumo em MWh em relação à análise descritiva das variáveis, verificou-se, pelo coeficiente de variação, que a média da variável é considerada pouco representativa, visto que esse valor expresso em percentual está muito próximo de 50%.

64 63 Ao analisar o valor da assimetria e da curtose, observou-se o seguinte: como a assimetria é diferente de zero e a curtose variou entre,49 e 4,89, é um indicativo de que algumas das componentes principais podem exibir sinais de volatilidade. Inicialmente, analisou-se o comportamento da variável em estudo, investigando-se em relação às medidas descritivas. A próxima etapa é estimar modelos lineares, utilizando a metodologia Box & Jenkins baseado na técnica de análise de componentes principais, verificando a presença de volatilidade e estimando-a por meio de modelos não lineares da classe geral ARCH quando necessário. Alexander (005) diz que ACP é um recurso muito útil, porque permite uma grande redução das dimensões e a ordenação natural do sistema e ainda fornece uma interpretação significativa das componentes principais. Além disso, esta análise facilita, em grande parte, a avaliação do movimento da volatilidade, vinculada a oscilações de demanda e ao fornecimento de energia elétrica. Os resultados a seguir explicam as três companhias em estudo, levando em consideração todos seus setores de fornecimento de energia para o número de consumidores e para o fornecimento de energia em MWh. Nestes dois casos, a ACP possibilitou que as dimensões fossem substancialmente reduzidas, capturando todas as possíveis combinações de deslocamento das séries em estudo. As Figuras 10 e 11 mostram o comportamento dos fatores que representam o número de consumidores para as três companhias distribuidoras de energia elétrica, CEEE, AES-Sul e RGE, para o Rio Grande do Sul. Avaliando estas figuras, verifica-se que as séries não apresentam um comportamento estacionário em relação à média Jan./98 Maio/98 Set./98 Jan./99 Maio/99 Set./99 Jan./00 Maio/00 Set./00 Jan./01 Maio/01 Set./01 Jan./0 Maio/0 Set./0 Jan./03 Maio/03 Set./03 Jan./04 Maio/04 Set./04 Jan./05 Maio/05 Set./05 Jan./06 Maio/06 Set./06 CP1_CEEE CP1_AES-Sul CP1_RGE CP_RGE Figura 10 Fatores que representam as três companhias para o número de consumidores de energia elétrica. Jan./07 Maio/07 Set./07 Jan./08 Maio/08 Set./08 Jan./09 Maio/09 Set./09

65 64 Nesta figura as companhias são representadas respectivamente pelos fatores derivados da ACP. O CP 1CEEE explica em 89,41% todos os setores da companhia; CP1 AES-Sul fator que representa todos os setores em 76,0%; CP 1RGE e CP RGE representa a companhia RGE, que explica 87,98% da variabilidade dos seis setores mantidos pela empresa Jan./98 Maio/98 Set./98 Jan./99 Maio/99 Set./99 Jan./00 Maio/00 Set./00 Jan./01 Maio/01 Set./01 Jan./0 Maio/0 Set./0 Jan./03 Maio/03 Set./03 Jan./04 Maio/04 Set./04 Jan./05 Maio/05 Set./05 Jan./06 Maio/06 Set./06 Jan./07 Maio/07 Set./07 Jan./08 Maio/08 Set./08 Jan./09 Maio/09 Set./09 CP1_CEEE CP1_AES-Sul CP_RGE CP_CEEE CP1_RGE Figura 11 Fatores que representam as três companhias para o fornecimento de energia elétrica. Na Figura 11, as companhias são representadas respectivamente pelas componentes principais, onde a CP 1CEEE e CP CEEE em 80,90%; CP 1AES-Sul fator que representa todos os setores em 74,83%; CP 1RGE e CP RGE representa a companhia RGE que explica 79,78%. 4.3 Verificação da estacionariedade das componentes principais Como análise preliminar, é necessário investigar a estacionariedade das componentes principais das três distribuidoras de energia, de forma a classificar as séries em relação ao seu grau de integração. A verificação da estacionariedade para as componentes principais que explicam o número de consumidores das distribuidoras de energia elétrica em estudo foi realizada por meio da construção de correlogramas, apresentados na Figura 1, 13, 14 e 15. Também conhecidos por função de autocorrelação (FAC) e

66 65 função de autocorrelação parcial (FACP), em conjunto com as estatísticas Ljung- Box, testes de raiz unitária e Kwiatkowski-Phillips-Schmidt-Shin tests - KPSS. i) Correlogramas Os gráficos da Figura 1, 13, 14, 15, apresentam as estatísticas Ljung-Box, que evidenciam a presença de autocorrelação para os primeiros 15 lags, pois os p- valores são menores que o nível de significância adotado. Além disso, percebe-se uma persistência nos dados, indicando uma dependência serial. Sendo assim, podese considerar que as séries não são estacionárias. Figura 1 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da Componente principal para o número de consumidores da distribuidora CP1 CEEE/RS. Figura 13 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da Componente principal para número de consumidores da distribuidora AES-Sul/RS.

67 66 Figura 14 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da Componente principal para número de consumidores da para distribuidora CP1 RGE. Figura 15 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da Componente principal para número de consumidores da distribuidora CPRGE. A verificação da estacionariedade para as componentes principais que explicam o fornecimento de energia em MWh foi realizada por meio da construção de correlogramas, apresentados na Figura 16, 17, 18, 19 e 0, também conhecidos por função de autocorrelação (FAC) e função de autocorrelação parcial (FACP), em conjunto com as estatísticas Ljung-Box, testes de raiz unitária e KPSS. Os gráficos das Figuras 16, 17, 18, 19 e 0 apresentam as estatísticas Ljung- Box, que evidenciam a presença de autocorrelação para os primeiros 15 lags, pois os p-valores são menores que o nível de significância adotado. Sendo assim, podese considerar que as séries não são estacionárias.

68 67 Figura 16 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da componente principal para o fornecimento de energia, em MWh, da distribuidora CP 1CEEE. Figura 17 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da componente principal para o fornecimento de energia, em MWh, da distribuidora CP CEEE. Figura 18 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da componente principal para o fornecimento de energia, em MWh, da distribuidora CP 1AES-Sul.

69 68 Figura 19 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da componente principal para o fornecimento de energia, em MWh, da distribuidora CP 1RGE. Figura 0 Correlograma, estatística de Ljung-Box - Q(K) e p-valor da componente principal para o fornecimento de energia, em MWh, da distribuidora CP RGE. Para testar estatisticamente a presença ou não de estacionariedade dos fatores, aplicam-se os testes de hipóteses ADF e KPSS conjuntamente, com a finalidade de obter um critério mais robusto na identificação do processo gerador dos fatores. Testes de raiz unitária Os testes de raiz unitária para as componentes principais das distribuidoras CEEE, AES-Sul e RGE para o estado do Rio Grande do Sul, quanto o número de consumidores, são mostrados na Tabela 7.

70 69 Tabela 7 Teste de raiz unitária ADF, KPSS aplicados as componentes principais que representam respectivamente as distribuidoras CEEE, AES-Sul, e RGE, para o número de consumidores. Distribuidora ADF KPSS CEEE (CP1) -0,96 I(1) 1,41 I(0) AES-Sul (CP1) -0,09 I(1) 1,54 I(0) RGE (CP1) -,36 I(1) 1,36 I(0) RGE(CP) -0,83 I(1) 0,40 I(0) (CEEE CP1) -11,1 I(0) 0,07 I(1) (AES-Sul CP1) -16,03 I(0) 0,04 I(1) (RGE CP1) -10,51 I(0) 0,43 I(1) (RGE CP) -6,34 I(0) 0,8 I(1) Os testes de raiz unitária para as componentes principais das distribuidoras CEEE, AES-Sul e RGE para o estado do Rio Grande do Sul, quanto ao fornecimento de energia elétrica, em MWh, são mostrados na Tabela 8. Tabela 8 Teste de raiz unitária ADF, KPSS aplicados as componentes principais que representam respectivamente as distribuidoras CEEE, AES-Sul, e RGE, para o fornecimento de energia em MWh. Distribuidora ADF KPSS CEEE (CP1) CEEE (CP) -0,93-4,19 I(1) I(1) 1,7 0,7 AES-Sul (CP1) -3,3 I(1) 1,49 I(0) RGE (CP1) -0,8 I(1) 1,46 I(0) RGE(CP) -3,76 I(1) 0,38 I(0) I(0) I(0) (CEEE CP1) (CEEE CP) -6,56-9,80 I(0) I(0) 0,4 0,50 I(1) I(1) (AES-Sul CP1) -15,47 I(0) 0,03 I(1) (RGE CP1) -8,77 I(0) 0,1 I(1) (RGE CP) -18,65 I(0) 0,34 I(1)

71 Correlação linear entre as variáveis originais e as CP selecionadas O termo correlação indica relação em dois sentidos (co + relação) e é usado em estatística para designar a força que mantém unido dois conjuntos de valores. A verificação da existência e do grau de relação entre as variáveis é o objeto de estudo da correlação. A fim de constatar a existência de relação entre os setores e os fatores selecionados na ACP, isto é, verificar se as variáveis ou os setores estão bem representados pelos fatores selecionados. Analisando a correlação entre as variáveis originais e as componentes principais selecionadas na análise do número de consumidores de energia elétrica para as três companhias, pode-se observar quais variáveis originais possuem maior influência na formação das componentes principais, conforme descritos na Tabela 9. Alexander (005) diz que uma forte correlação positiva indica que os movimentos crescentes de uma das séries de retorno tendem a ser acompanhadas por movimentos crescentes de outra e similarmente movimentos decrescentes em ambas as séries caminham juntas. Se há uma forte correlação negativa, então os movimentos crescentes em uma das séries são associados aos movimentos decrescentes na outra. Tabela 9 Correlação entre número de consumidores das CP para CEEE, AES-Sul e RGE componente principal representativa desta distribuidora. CP 1CEEE CP 1AES-Sul CP 1RGE CP RGE Res -0,99-0,94-0,97-0,1 Com -0,98-0,98-0,98-0,15 Ind -0,76 0,76-0,3 0,76 Rural -0,99-0,79-0,96-0,08 S Publ -0,98-0,84-0,98-0,01 Outros 0,95-0,91 0,3-0,83 (em negrito os valores significativos) Observa-se que todas as variáveis têm uma correlação forte significativa com a componente principal que a representa; a variável que tem menor correlação é a variável Industrial, mas mesmo assim é fortemente correlacionada. Analisando a correlação entre as variáveis originais e as componentes principais selecionadas na análise do consumo de energia elétrica, em MWh, para

72 71 as três companhias, pode-se observar quais variáveis originais possuem maior influência na formação das componentes principais, conforme descritos na Tabela 10. Observa-se que, no geral, todas as variáveis têm uma correlação forte significativa com a componente principal que a representa. Há variáveis que têm menor correlação, mas mesmo assim apresentam elevada correlação correlacionada. Tabela 10 Correlação entre variáveis originais para o consumo de energia em MWh e a componente principal representativa de cada distribuidora. Distribuidoras para o consumo em MWh de energia elétrica CP 1CEEE CP CEEE CP 1AES-Sul CP 1RGE CP RGE Res -0,86 0,08-0,94 0,89 0,6 Com -0,9 0,31-0,98 0,97 0,09 Ind 0,44 0,8 0,74 0,5-0,81 Rural -0,84-0,0-0,77 0,85 0,8 S Publ -0,84 0,47-0,8 0,89-0,34 Outros -0,73-0,9-0,91 0,47 0,33 (em negrito os valores significativos) 4.5 Modelos de Previsão das Componentes Principais Selecionadas Um dos principais interesses da análise de séries temporais é a previsão. No setor elétrico, a projeção constitui a base no processo de planejamento de investimentos em termos técnicos e estratégicos, sendo que a energia necessária a ser contratada pelas empresas distribuidoras advém do estudo das projeções de demanda Modelo para o número de consumidores de energia elétrica do RS Os consumidores são o foco principal das empresas, pois a competição pela conquista de mercado faz com que estas passem a planejar o futuro de uma maneira mais complexa, envolvendo aspectos estratégicos, incertezas e, muitas vezes, limitações de informações.

73 7 Esta projeção de demanda é realizada pelas próprias empresas que realizam um estudo de mercado. O que será apresentado a seguir é a aplicação de uma metodologia que foge da tradicional, baseada em técnicas estatísticas mais complexas. i) Análise da distribuidora de energia elétrica CEEE A Companhia Estadual de Distribuição de Energia Elétrica CEEE é uma empresa de economia mista pertencente ao Grupo CEEE, distribuidora dos serviços de distribuição de energia elétrica na região sul-sudeste do estado do Rio Grande do Sul. Com área de concessão que compreende a região metropolitana de Porto Alegre, litoral e campanha gaúcha, a CEEE Distribuição atende a 7 municípios, abrangendo km², o que corresponde aproximadamente a 3% do mercado consumidor do Rio Grande do Sul, através de seus km de redes urbanas e rurais. A CEEE Distribuição atendeu, em 006, um total de mil unidades consumidoras, o que equivale a cerca de 4 milhões de pessoas ou um terço da população gaúcha, distribuindo diretamente 6.87 GWh. No mesmo período, a empresa investiu R$ 100 milhões em seu sistema de distribuição (Disponível em: < Acesso em: 0 dez. 010). No intuito de encontrar o melhor modelo que represente corretamente os diversos setores de consumo de CEEE, foi utilizado a CP1 CEEE, que explica 89,41% desta companhia. Dessa forma, uma análise de todos os setores foi englobada em uma única componente. Na Tabela 11, sugere-se que o ARIMA foi o modelo de ruído branco que melhor se ajustou, cujos coeficientes são significativos no nível adotado. Tabela 11 Modelo ARIMA, dos critérios AIC para distribuidora CP1 CEEE. CP1 CEEE Coeficiente D.Padrão t-statistic Prob. AIC Durbin- Watson Jarque- Bera ARIMA(1,1,0)

74 73 Mediante os modelos concorrentes obtidos, o melhor modelo ajustado para a componente principal que explica a distribuidora de energia elétrica CEEE é um ARIMA (1,1,0). Este modelo foi determinado com o auxílio do critério penalizador AIC. A Figura 1 ilustra o comportamento temporal dos resíduos do modelo ARIMA (1,1,0). Figura 1 Série residual do modelo ARIMA (1,1,0). Na Figura 1, determina-se que o processo é estacionário, pois a FAC residual do modelo mostra que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95%. Dessa forma, para confirmar que os resíduos não são autocorrelacionados, utilizou-se o teste de Ljung-Box Q*, analisando os p- valores que foram maiores que o nível de significância adotado, assim considerandoos como estacionários. Com o intuito de analisar a presença de heterocedasticidade na série residual, na Figura, apresenta-se o correlograma da série quadrática dos resíduos oriundos da CP modelada pelo ARIMA (1,1,0). Figura Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo ARIMA (1,1,0) para a componente principal que explica a concessionária CP 1CEEE.

75 74 Analisando a Figura, determina-se que o processo é estacionário e não autocorrelacionado, pois a FAC residual do modelo mostra que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95%, e os p-valores são maiores que o nível de significância adotado. Para testar estatisticamente a presença de heterocedasticidade condicional, aplicou-se o teste de hipótese ARCH-LM nos resíduos quadráticos do modelo ARIMA (1,1,0). Como foi constatada a presença desse fenômeno, há justificativa para a utilização de um modelo não linear da família ARCH para modelar a volatilidade. Encontra-se, na Tabela 1, o resultado deste teste. Para comprovar a presença de efeitos ARCH, foram testadas as seguintes hipóteses: H 0 : Não existem efeitos ARCH (homocedasticidade); H 1 : Existem efeitos ARCH (heterocedasticidade). Tabela 1 Resultados das estatísticas F e ARCH-LM. ARCH LM F-statistic 10,84 TR² 18,35 ARCH F-statistic 4,47 TR² 4,40 Prob. F(1,139) 0,003 χ () 0,004 Prob.F(1,139) 0,036 χ () 0,036 A partir dos resultados encontrados, verifica-se que a estatística F e a estatística ARCH-LM foram significativas. Assim, rejeita-se a hipótese nula, implicando que há heterocedasticidade condicional nos resíduos quadráticos deste modelo. Isso posto, justifica-se a utilização do modelo ARCH com intuito de modelar a volatilidade do CP 1CEEE Na Tabela 13, observam-se os resultados da estimação do modelo com heterocedasticidade do fator CP 1CEEE para o número de consumidores desta companhia de distribuição de energia elétrica.

76 75 Tabela 13 Modelo com heterocedasticidade do fator CP1CEEE para o número de consumidores. Método: ML ARCH (Marquardt) Distribuição Normal Equação para variância condicional Coeficiente Erro-Padrão Estatística Z p-valor. Constante 0,83 0,09-3,79 0,00 ARCH(1) 0,47 0,14 3,50 0,005 O modelo para a volatilidade do CP 1CEEE é um ARCH(1), que apresenta parâmetros estatisticamente significativos. Como o parâmetro do ARCH(1) é razoavelmente baixo, igual a 0,47, indica-se que, após um curto período de tempo, a variância da série deverá convergir à média histórica, ou seja, os setores que compõe a CP 1CEEE no período anterior não influenciaram no próximo período. Desta forma, pode-se dizer que, no período analisado, não há uma grande, flutuação na série que venha a comprometer o comportamento global das estimativas da média do processo. A região de abrangência da CEEE, que compreende as regiões metropolitanas de Porto Alegre, litoral e campanha gaúcha, deve ser a que mais sofre com a alternância do número de consumidores. Para a validação do modelo que melhor explicou a volatilidade do CP 1CEEE foi preciso fazer a análise dos resíduos, por meio do teste de Ljung-Box aplicado aos resíduos e também aos resíduos quadráticos dos mesmos. A Figura 3 ilustra o comportamento da FAC e FACP dos resíduos do modelo ARCH(1). Figura 3 Comportamento residual da FAC e FACP do modelo ARCH (1).

77 76 Analisando a Figura 3, determina-se que o processo é não autocorrelacionado e estacionário, pois a FAC residual do modelo mostra que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95% e os p- valores são maiores que o nível de significância adotado, mostrando que os resíduos são não autocorrelacionados, indicando que a série de resíduos é um ruído branco. Buscando verificar a existência de heterocedasticidade residual, faz-se a FAC e a FACP para os resíduos quadráticos. Figura 4 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo ARCH (1) para a componente principal que explica a concessionária CP 1CEEE. Analisando a Figura 4, determina-se que o processo é estacionário e não apresenta uma estrutura de dependência serial, pois a FAC e FACP residual do modelo mostra que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95%, e os p-valores são maiores que o nível de significância adotado, mostrando que os resíduos são um ruído branco. Para testar estatisticamente se o modelo conseguiu captar a presença de heterocedasticidade condicional, aplicou-se o teste de hipótese ARCH nos resíduos quadráticos do modelo ARCH(1), conforme Tabela 14. hipóteses: Para comprovar a presença de efeitos ARCH, foram testadas as seguintes H : 0 Não existem efeitos ARCH (homocedasticidade); H 1 : Existem efeitos ARCH (heterocedasticidade).

78 77 Tabela 14 Resultados das estatísticas F e ARCH-LM. ARCH F-statistic 0,0 TR² 0,0 Prob.F(,115) 0,880 χ () 0,879 A partir dos resultados encontrados, verifica-se que a estatística F não foi significativa. Assim, aceita-se a hipótese nula, implicando que não há heterocedasticidade condicional nos resíduos quadráticos do modelo. A Figura 5 mostra os valores originais, os valores estimados e os resíduos para a série CP1 CEEE Mar./98 Jul./98 Nov./98 Mar./99 Jul./99 Nov./99 Mar./00 Jul./00 Nov./00 Mar./01 Jul./01 Nov./01 Mar./0 Jul./0 Nov./0 Mar./03 Jul./03 Nov./03 Mar./04 Jul./04 Nov.04 Mar./05 Jul./05 Nov./05 Mar./06 Jul./06 Nov./06 Mar./07 Jul./07 Nov.07 Mar./08 Jul./08 Nov./08 Mar./09 Jul./09 Nov./09 Residual Actual Fitted Figura 5 Valores originais, valores estimados e os resíduos para o modelo ARCH(1). ii) Análise da distribuidora de energia elétrica AES-Sul Empresa do grupo americano AES Corporation, a AES-Sul é uma distribuidora do serviço público de energia elétrica. Com sede em Porto Alegre, atua na região centro-oeste do estado do Rio Grande do Sul. Atende a 118 municípios das regiões metropolitana e centro-oeste do estado, com aproximadamente milhão de clientes, nas categorias residencial, industrial e rural, entre outros, sendo milhões de pessoas beneficiadas e 50 subestações (Disponível em: < Acesso em: 0 dez. 009). Analisando os resultados descritos anteriormente, o fator CP 1AES-Sul apresenta um comportamento não estacionário em relação à média. Estas conclusões são demonstradas pela análise da FAC e FACP e do teste ADF e KPSS. Do exposto anteriormente, busca-se a estimação do melhor modelo que represente a distribuidora AES-Sul para o número de consumidores.

79 78 Na Tabela 15, observa-se as estatísticas do modelo ARIMA que melhor se ajustou e formou um ruído branco no nível de significância adotado. Foram testados vários modelos concorrentes, os quais foram testados e avaliados em relação à parcimônia dos parâmetros, juntamente com a estatística AIC. Tabela 15 Resultados do ajuste do modelo ARIMA para distribuidora CP1 AES-Sul. CP1 AES-Sul Coeficiente D.Padrão t-statistic Prob. AIC Durbin- Watson Jarque- Bera ARI(1) MA(1) O melhor modelo ajustado para a componente principal que explica a distribuidora de energia elétrica AES-Sul é um ARIMA (1,1,1). Na Figura 6 observa-se o comportamento temporal dos resíduos do modelo. Figura 6 Série residual do modelo ARIMA (1,1,1). Na Figura 6, determina-se que o processo é não autocorrelacionado e estacionário, pois a FAC residual do modelo mostra que os lag apresentam a autocorrelação dentro dos limites de confiabilidade de 95%. Dessa forma, para confirmar que os resíduos não são autocorrelacionados, utilizou-se o teste de Ljung- Box Q*, analisando os p-valores maiores que o nível de significância adotado. Sendo assim, pode-se afirmar que a série é estacionária e é ruído branco. Buscando verificar a existência de heterocedasticidade residual, faz-se a FAC e a FACP para os resíduos quadráticos do modelo ARIMA (1,1,1).

80 79 Figura 7 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo ARIMA (1,1,1) para a componente principal que explica a concessionária CP 1AES-Sul. Analisando a Figura 7, determina-se que o processo é estacionário, pois a FAC residual do modelo mostra que os lag apresentam a autocorrelação dentro dos limites de confiabilidade de 95%, e os p-valores são maiores que o nível de significância adotado, admitindo-se que o modelo é ruído branco. Para testar estatisticamente a presença de heterocedasticidade condicional, aplicou-se o teste de hipótese ARCH-LM nos resíduos quadráticos do modelo ARIMA (1,1,1), o qual não sinalizou a presença de heterocedasticidade residual. Dessa forma, não há justificativa para a utilização de um modelo não linear da família ARCH para modelar a volatilidade. Encontra-se, na Tabela 16, o resultado desse teste. hipóteses: Para comprovar a presença de efeitos ARCH, foram testadas as seguintes H : 0 Não existem efeitos ARCH (homocedasticidade); H 1 : Existem efeitos ARCH (heterocedasticidade). Tabela 16 Testes para presença de heterocedasticidade. ARCH LM F-statistic 0,80 TR² 1,59 Prob.F(,115) 0,455 χ () 0,451 ARCH F-statistic,13 TR²,1 Prob.F(1,116) 0,157 χ () 0,144

81 80 A Figura 8 mostra os valores originais, os valores estimados e os resíduos para a série CP 1CEEE Mar./98 Jul./98 Nov./98 Mar./99 Jul./99 Nov./99 Mar./00 Jul./00 Nov./00 Mar./01 Jul./01 Nov./01 Mar./0 Jul./0 Nov./0 Mar./03 Jul./03 Nov./03 Mar./04 Jul./04 Nov.04 Mar./05 Jul./05 Nov./05 Mar./06 Jul./06 Nov./06 Mar./07 Jul./07 Nov.07 Mar./08 Jul./08 Nov./08 Mar./09 Jul./09 Nov./ Residual Actual Fitted Figura 8 Valores originais, valores estimados e os resíduos para o modelo ARCH(1) CP 1AES-Sul. Análise da distribuidora de energia elétrica RGE A Rio Grande Energia (RGE) é a distribuidora de energia elétrica da região norte-nordeste do estado do Rio Grande do Sul. Privatizada em outubro de 1997, a RGE atende a 6 municípios gaúchos, o que representa 51% do total de municípios do RS. A área de cobertura da Rio Grande Energia divide-se em duas regiões: a centro, com sede em Passo Fundo e a leste, com sede em Caxias do Sul. São km - 34% do território do estado. Agrupadas, essas regiões apresentam um dos melhores índices sociais e econômicos do Brasil. Também são as responsáveis pelo maior pólo agrícola, pecuário, industrial e turístico do estado. A RGE faz parte do Grupo CPFL Energia, um dos maiores grupos privados do setor elétrico brasileiro (Disponível em: < BR/Default.aspx> Acesso em: 03 dez. 010). A distribuidora RGE passou a ser representada por duas componentes principais, desta forma têm-se duas análises em separado. i) RGE CP 1 Entre os modelos concorrentes, o melhor modelo ajustado para a componente principal que explica a distribuidora de energia elétrica CP 1RGE, foi o SARIMA (1,1,0) (1,0,0) 1, conforme Tabela 17.

82 81 Tabela 17 Modelo ARIMA, dos critérios AIC para distribuidora CP1 RGE. CP1 RGE Coeficiente D.Padrão t- statistic Prob. ARI(1) 0,4 0,006,750 0,006 SAR(1) 1 0,19 0,091,075 0,039 AIC Watson Durbin- Jarque- Bera -,98 1,99 9,48 Mediante os modelos concorrentes obtidos, o melhor modelo ajustado para a componente principal que explica a distribuidora de energia elétrica RGE é SARIMA (1,1,0) (1,0,0) 1, e este modelo foi determinado com o auxílio do critério penalizador AIC. A Figura 9 ilustra o comportamento da FAC e FACP dos resíduos do modelo SARIMA (1,1,0) (1,0,0) 1. Figura 9 Comportamento residual da FAC e FACP SARIMA (1,1,0) (1,0,0) 1. Na Figura 9, determina-se que o processo é não autocorrelacionado e estacionário, pois a FAC residual do modelo mostra que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95%. Dessa forma, para confirmar que os resíduos não são autocorrelacionados utilizou-se o teste de Ljung- Box Q*, analisando os p-valores maiores que o nível de significância adotado, mostrando que os resíduos são não autocorrelacionados. Buscando verificar a existência de heterocedasticidade residual, faz-se a FAC e a FACP para os resíduos quadráticos, conforme a Figura 30.

83 8 Figura 30 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo SARIMA (1,1,0) (1,0,0) 1 para a componente principal que explica a concessionária CP 1RGE. Analisando a Figura 30, determina-se que o processo é estacionário e de dependência serial que necessite ser modelada, pois a FAC e a FACP residual do modelo mostra que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95%, e os p-valores são maiores que o nível de significância adotado. Para testar estatisticamente a presença de heterocedasticidade condicional, aplicou-se o teste de hipótese ARCH-LM aos dados do modelo ARIMA (1,1,1) conforme a Tabela 18. Como não foi constatada a presença desse fenômeno, não há justificativa para a utilização de um modelo não linear da família ARCH para modelar a volatilidade. hipóteses: Para comprovar a presença de efeitos ARCH, foram testadas as seguintes H 0 : Não existem efeitos ARCH (homocedasticidade); H 1 : Existem efeitos ARCH (heterocedasticidade). Tabela 18 Testes para presença de heterocedasticidade. ARCH LM F-statistic 4,41 Obs*R-squared 0,000 Prob.F(,115) 0,014 χ () 1,000 ARCH F-statistic,86 TR²,84 Prob.F(1,116) 0,093 χ () 0.091

84 83 A Figura 31 mostra os valores originais, os valores estimados e os resíduos para a série CP1 CEEE Mar./00 Jul./00 Nov./00 Mar./01 Jul./01 Nov./01 Mar./0 Jul./0 Nov./0 Mar./03 Jul./03 Nov./03 Mar./04 Jul./04 Nov.04 Mar./05 Jul./05 Nov./05 Mar./06 Jul./06 Nov./06 Mar./07 Jul./07 Nov.07 Mar./08 Jul./08 Nov./08 Mar./09 Jul./09 Nov./09 Residual Actual Fitted Figura 31 Valores originais, valores estimados e os resíduos para o modelo ARCH(1) CP 1RGE. ii) RGE CP Mediante os modelos concorrentes obtidos, o melhor modelo ajustado para a componente principal que explica a distribuidora de energia elétrica CP RGE, Tabela 19, é um ARIMA (1,1,0). Esse modelo foi determinado pelos critérios penalizadores AIC. Tabela 19 Modelo ARIMA, dos critérios AIC para distribuidora CP CEEE. CP RGE Coeficiente D.Padrão t-statistic Prob. AIC Watson Durbin- Jarque- Bera ARI(1) 0,35 0,078 4,476 0,000 -,9 1, ,16 Mediante os modelos concorrentes obtidos, o melhor modelo ajustado para a componente principal que explica a distribuidora de energia elétrica RGE é ARIMA (1,1,0). A Figura 3 ilustra o comportamento temporal dos resíduos do modelo ARIMA (1,1,0).

85 84 Figura 3 Comportamento residual da FAC e FACP ARIMA (1,1,0). A Figura 3 mostra que o processo é estacionário e os resíduos não autocorrelacionados, pois a FAC residual do modelo mostra que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95%. Dessa forma, utilizou-se o teste de Ljung-Box Q*, analisando os p-valores maiores que o nível de significância adotado, indicando que a série de resíduos é um ruído branco. Como forma de testar a heterocedasticidade residual da série em estudo, as FAC e a FACP podem ser observadas na Figura 33. Figura 33 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo ARIMA (1,1,0) para a componente principal que explica a concessionária CP RGE. Analisando a Figura 33, determina-se que o processo é não autocorrelacionado, pois a FAC residual do modelo mostra que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95%, e os p-valores são maiores que o nível de significância adotado. Além da inspeção visual, para testar estatisticamente a presença de heterocedasticidade condicional, aplicou-se o teste de hipótese ARCH-LM nos

86 85 resíduos quadráticos do modelo ARIMA (1,1,0). Como foi constatada a presença deste fenômeno, há justificativa para a utilização de um modelo não linear da família ARCH para modelar a volatilidade. H 0 : Não existem efeitos ARCH (homocedasticidade); H 1 : Existem efeitos ARCH (heterocedasticidade). Tabela 0 Testes para presença de heterocedasticidade. ARCH LM F-statistic 1,60 TR² 3,17 Prob.F(,115) 0,04 χ () 0,04 ARCH F-statistic 1,9 TR² 1,9 Prob.F(1,116) 0,168 χ () 0,165 A partir dos resultados encontrados, verifica-se que a estatística F e a estatística ARCH-LM não foram significativas. Assim, aceita-se a hipótese nula, implicando que não há heterocedasticidade condicional nos resíduos quadráticos deste modelo. Isto posto, não se justifica a utilização do modelo ARCH com intuito de modelar a volatilidade do CP RGE. A Figura 34 mostra os valores originais, os valores estimados e os resíduos para a série CP RGE Mar./98 Jul./98 Nov./98 Mar./99 Jul./99 Nov./99 Mar./00 Jul./00 Nov./00 Mar./01 Jul./01 Nov./01 Mar./0 Jul./0 Nov./0 Mar./03 Jul./03 Nov./03 Mar./04 Jul./04 Nov.04 Mar./05 Jul./05 Nov./05 Mar./06 Jul./06 Nov./06 Mar./07 Jul./07 Nov.07 Mar./08 Jul./08 Nov./08 Mar./09 Jul./09 Nov./09 Residual Actual Fitted Figura 34 Valores originais, valores estimados e os resíduos para o modelo ARIMA (1, 1, 0). A modelagem de componentes principais por meio dos modelos ARIMA e/ou ARCH possibilita que, além da redução da dimensionalidade, ocorra a identificação

87 86 dos principais setores formadores daquela componente. De acordo com Alexander (005), a ACP é capaz de acompanhar o movimento conjunto de diversas curvas, o que possibilita uma eficácia no acompanhamento de todas as variáveis envolvidas no sistema. Além disso, a análise possibilita uma ordenação natural das variáveis envolvidas no processo Modelo para o consumo de energia elétrica em MWh por classe de consumo no Rio Grande do Sul para CEEE, AES-Sul e RGE A demanda de potência é medida e expressa em KW, que corresponde à potência elétrica solicitada pelo consumidor à empresa distribuidora durante o período de fornecimento mensal. O consumo efetivo é medido e expresso em KWh, o qual corresponde ao real consumo ao longo do período faturado, normalmente de 30 dias. Desses componentes conjuntos demanda de potência e/ou consumo e de acordo com a modalidade do fornecimento, estruturam-se os grupos de consumidores. O fornecimento se destina às unidades consumidoras, sendo estabelecidas para as seguintes classes ou setores e subclasses de consumo: Classe Residencial, Rural, Industrial, Comercial, Serviços Públicos e outros. i) Análise do consumo em MWh da distribuidora de energia elétrica Na busca de encontrar o melhor modelo que represente corretamente os diversos setores de consumo de CEEE, será utilizado a CP 1CEEE, que explica 6,3% desta companhia, e a CP CEEE, que explica 18,6%. ii) Análise do consumo da distribuidora de energia elétrica CEEE O consumo em MWh da CEEE é representado por duas componentes principais, a qual engloba um total de 80,90% de explicação. Esses componentes serão modelados nas etapas seguintes. CEEE CP 1 A Tabela 1 sugere o modelo ARIMA que melhor se ajustou e forma um ruído branco, cujos coeficientes são significativos no nível de significância adotado, a série em estudo. Foram testados e avaliados, e o melhor modelo foi aquele que atendeu

88 87 as estatísticas de validação, conforme Tabela 1. A Tabela 1 sugere o modelo SARIMA que melhor se ajustou e forma um ruído branco, cujos coeficientes são significativos no nível de significância adotado. Tabela 1 Modelo SARIMA, dos critérios AIC para distribuidora CEEE. CP 1CEEE Coeficiente D.Padrão t-statistic Prob. AIC ARI(1) 0,36 0,113 3,163 0,00 Durbin- Watson Jarque- Bera SAR(1) 1-0,6 0,070-8,895 0,000 1,934 1,944 7,469 MA(1) -0,88 0,054-16,81 0,000 Mediante os modelos concorrentes obtidos, o melhor modelo ajustado para a componente principal que explica a distribuidora de energia elétrica CEEE é SARIMA (1,1,1) (1,1,0) 1. Esse modelo foi determinado pelos critérios penalizadores AIC. A Figura 35 ilustra o comportamento temporal dos resíduos do modelo SARIMA (1,1,1) (1,1,0) 1. Figura 35 Comportamento residual da FAC e FACP SARIMA (1,1,1) (1,1,0) 1. Na Figura 35, determina-se que o processo é não autocorrelacionado, pois a FAC e FACP residual do modelo mostra que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95%, sinalizando um processo ruído brando. Dessa forma, para confirmar que os resíduos não são autocorrelacionados, utilizou-

89 88 se o teste de Ljung-Box Q*, analisando os p-valores maiores que o nível de significância adotado. Sendo assim, pode-se afirmar que os resíduos seguem um ruído branco. Como forma de testar a heterocedasticidade residual da série em estudo, as FAC e a FACP podem ser observadas na Figura 36. Figura 36 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo SARIMA (1,1,1) (1,1,0) 1 para a componente principal que explica a concessionária CP 1CEEE. Analisando a Figura 36, determina-se que o processo é estacionário, pois a FAC residual do modelo mostra que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95%, e os p-valores são maiores que o nível de significância adotado. Assim, a hipótese nula de que as 15 primeiras autocorrelações apresentam valor zero não é rejeitada, podendo os resíduos ser considerados ruído branco. Para testar estatisticamente a presença de heterocedasticidade condicional, aplicou-se o teste de hipótese ARCH-LM, Tabela, nos resíduos quadráticos do modelo SARIMA (1,1,1) (1,1,0) 1. Como não foi constatada a presença deste fenômeno, não há justificativa para a utilização de um modelo não linear da família ARCH para modelar a volatilidade. hipóteses: Para comprovar a presença de efeitos ARCH, foram testadas as seguintes H : 0 Não existem efeitos ARCH (homocedasticidade); H 1 : Existem efeitos ARCH (heterocedasticidade).

90 89 Tabela Resultados das estatísticas F e ARCH-LM. ARCH LM F-statistic 0,7 T.R 0,55 ARCH F-statistic 0,13 TR² 0,13 Prob.F(,115) 0,770 χ () 0,760 Prob.F(1,116) 0,7 χ () 0,719 A partir dos resultados encontrados, verifica-se que a estatística F e a estatística ARCH-LM não foram significativas. Assim, aceita-se a hipótese nula, implicando que não há heterocedasticidade condicional nos resíduos quadráticos deste modelo. A Figura 37 mostra os valores originais, os valores estimados e os resíduos para a série CP CEEE Mar./00 Jul./00 Nov./00 Mar./01 Jul./01 Nov./01 Mar./0 Jul./0 Nov./0 Mar./03 Jul./03 Nov./03 Mar./04 Jul./04 Nov.04 Mar./05 Jul./05 Nov./05 Mar./06 Jul./06 Nov./06 Mar./07 Jul./07 Nov.07 Mar./08 Jul./08 Nov./08 Mar./09 Jul./09 Nov./09 Residual Actual Fitted Figura 37 Valores originais, valores estimados e os resíduos para o modelo SARIMA (1,1,1) (1,1,0) 1. CEEE CP A Tabela 3 sugere o modelo ARIMA que melhor se ajustou e forma um ruído branco, cujos coeficientes são significativos no nível de significância adotado, a série em estudo. Foram testados vários modelos concorrentes, que foram testados e avaliados segundo a quantidade de parâmetros significantes e a estatística AIC, entre todos os modelos ARIMA concorrentes.

91 90 Tabela 3 Modelo ARIMA, dos critérios AIC para distribuidora CP CEEE. CP CEEE Coeficiente D.Padrão t-statistic Prob. AIC Durbin- Watson Jarque- Bera ARI(1) 0,57 0,095 5,950 0,000 MA(1) -0,89 0,050-17,813 0,000 1,879 1,961 6,060 Mediante os modelos concorrentes obtidos, o melhor modelo ajustado para a componente principal que explica a distribuidora de energia elétrica CP CEEE é ARIMA (1,1,1). A determinação desse modelo foi auxiliada pelo critério penalizador AIC. A Figura 38 ilustra o comportamento temporal dos resíduos do modelo ARIMA (1,1,1). Figura 38 Comportamento residual da FAC e FACP ARIMA (1,1,1). Analisando a Figura 38, determina-se que o processo é estacionário e não autocorrelacionado, pois a FAC e a FACP residual do modelo mostram que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95%, e os p- valores são maiores que o nível de significância adotado. Assim, a hipótese nula de que as 15 primeiras autocorrelações apresentam valor zero não é rejeitada, podendo os resíduos ser considerados ruído branco. Como forma de testar a heterocedasticidade residual da serie em estudo, as FAC e a FACP como mostra a Figura 39.

92 91 Figura 39 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo ARIMA (1,1,1) para a componente principal que explica a concessionaria CP CEEE. Analisando a Figura 39, determina-se que o processo é não autocorrelacionado e estacionário, pois a FAC residual do modelo mostra que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95%, e os p-valores são maiores que o nível de significância adotado, podendo os resíduos ser considerados ruído branco. Para testar estatisticamente a presença de heterocedasticidade condicional, aplicou-se o teste de hipótese ARCH-LM nos resíduos quadráticos do modelo ARIMA (1,1,1), conforme mostra a Tabela 4. Como foi constatada a presença deste fenômeno, há justificativa da utilização de um modelo não linear da família ARCH para modelar a volatilidade. Para comprovar a presença de efeitos ARCH, foram testadas as seguintes hipóteses: H : 0 Não existem efeitos ARCH (homocedasticidade); H 1 : Existem efeitos ARCH (heterocedasticidade). Tabela 4 Resultados das estatísticas F e ARCH-LM. ARCH LM F-statistic 0,136 TR² 0,000 ARCH F-statistic 0,16 TR² 0,19 Prob.F(,115) 0,87 χ () 1,000 Prob.F(1,116) 0,7 χ () 0,719

93 9 A partir dos resultados encontrados, verifica-se que a estatísticas F e a estatística ARCH-LM não foram significativas. Assim, aceita-se a hipótese nula, implicando que não há heterocedasticidade condicional nos resíduos quadráticos desse modelo. A Figura 40 mostra os valores originais, os valores estimados e os resíduos para a série CP RGE Mar./98 Jul./98 Nov./98 Mar./99 Jul./99 Nov./99 Mar./00 Jul./00 Nov./00 Mar./01 Jul./01 Nov./01 Mar./0 Jul./0 Nov./0 Mar./03 Jul./03 Nov./03 Mar./04 Jul./04 Nov.04 Mar./05 Jul./05 Nov./05 Mar./06 Jul./06 Nov./06 Mar./07 Jul./07 Nov.07 Mar./08 Jul./08 Nov./08 Mar./09 Jul./09 Nov./09 Residual Actual Fitted Figura 40 Valores originais, valores estimados e os resíduos para o modelo ARIMA (1,1,1). Análise do consumo da distribuidora de energia elétrica AES Sul Para encontrar o melhor modelo, que represente corretamente os diversos setores de consumo da AES-Sul, será utilizado a CP 1AES-Sul, que explica 74,83% desta companhia. A análise de todos os setores será englobada em uma única componente. A Tabela 5 sugere o modelo SARIMA que melhor se ajustou e forma um ruído branco, cujos coeficientes são significativos no nível de significância adotado, a série em estudo. Foram testados vários modelos concorrentes, avaliados segundo a quantidade de parâmetros significantes e a estatística AIC, entre todos os modelos ARIMA concorrentes. Tabela 5 Modelo SARIMA, dos critérios AIC para distribuidora AES-Sul. CP 1AES-Sul Coeficiente D.Padrão t-statistic Prob. AIC Durbin- Watson Jarque- Bera SARI(1) -0,410 0,077-5,313 0,000 MA(1) -0,857 0,041-0,860 0,000 1,165 1,811 7,469

94 93 Mediante os modelos concorrentes obtidos, o melhor modelo ajustado para a componente principal que explica a distribuidora de energia elétrica AES-Sul é SARIMA (0,1,1) (1,1,0) 1. Esse modelo foi determinado com o auxílio dos critérios penalizadores AIC. A Figura 41 ilustra o comportamento dos resíduos do modelo SARIMA (0,1,1) (1,1,1) 1. Figura 41 Comportamento residual da FAC e FACP do modelo SARIMA (0,1,1) (1,1,0) 1. Analisando a Figura 41, determina-se que o processo é estacionário e não autocorrelacionado, pois a FAC e FACP residual do modelo mostra que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95% e os p- valores são maiores que o nível de significância adotado. Assim, a hipótese nula de que as 15 primeiras autocorrelações apresentam valor zero não é rejeitada, podendo os resíduos ser considerados ruído branco. Buscando verificar a existência de heterocedasticidade residual, faz-se a FAC e FACP para os resíduos quadráticos conforme Figura 4. Figura 4 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo SARIMA (0,1,1) (1,1,0) 1 para a componente principal que explica a concessionária CP 1AES-Sul.

95 94 Analisando a Figura 4, determina-se que o processo é estacionário e não apresenta estrutura de dependência serial que necessite ser modelado, pois a FAC residual do modelo mostra que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95%, e os p-valores são maiores que o nível de significância adotado. Assim, a hipótese nula de que as 15 primeiras autocorrelações apresentam valor zero não é rejeitada, podendo os resíduos ser considerados ruído branco. Para testar estatisticamente a presença de heterocedasticidade condicional, aplicou-se o teste de hipótese ARCH-LM, Tabela 6, nos resíduos quadráticos do modelo SARIMA (0,1,1) (1,1,0) 1. Como foi constatada a presença desse fenômeno, há justificativa da utilização de um modelo não linear da família ARCH para modelar a volatilidade. hipóteses: Para comprovar a presença de efeitos ARCH, foram testadas as seguintes H : 0 Não existem efeitos ARCH (homocedasticidade); H 1 : Existem efeitos ARCH (heterocedasticidade). Tabela 6 Resultados das estatísticas F e ARCH-LM. ARCH LM F-statistic 1,334 TR²,43 ARCH F-statistic 1,645 TR² 1,650 Prob.F(,115) 0,67 χ () 0,96 Prob.F(1,116) 0,0 χ () 0,199 A partir dos resultados encontrados, verifica-se que a estatística F e a estatística ARCH-LM não foram significativas. Assim, aceita-se a hipótese nula, implicando que não há heterocedasticidade condicional nos resíduos quadráticos deste modelo. A Figura 43 mostra os valores originais, os valores estimados e os resíduos para a série CP AES-Sul.

96 Fev./00 Jun./00 Out./00 Fev./01 Jun./01 Out./01 Fev./0 Jun./0 Out./0 Fev./03 Jun./03 Out./03 Fev./04 Jun./04 Out./04 Fev./05 Jun./05 Out./05 Fev./06 Jun./06 Out./06 Fev./07 Jun./07 Out./07 Fev./08 Jun./08 Out./08 Fev./09 Jun./09 Out./09 Residual Actual Fitted Figura 43 Valores originais, valores estimados e os resíduos para o modelo SARIMA (0,1,1) (1,1,0) 1. Análise do consumo da distribuidora de energia elétrica RGE Para encontrar o melhor modelo que represente corretamente os diversos setores de consumo da RGE, será utilizado a CP1 REG, que explica 6,50% e CP RGE, que explica 17,8%. A análise de todos os setores será englobada em duas componentes. Mediante os modelos concorrentes obtidos, o melhor modelo ajustado para a componente principal que explica a distribuidora de energia elétrica CP1 RGE, Tabela 7, é um SARIMA (0,1,1) (1,1,1) 6. Esse modelo foi determinado pelos critérios penalizadores AIC. Tabela 7 Modelo SARIMA, dos critérios AIC para distribuidora AES-Sul. CP 1RGE Coeficiente D.Padrão t-statistic Prob. AIC SARI(6) -0,941 0,043-1,656 0,000 Durbin- Watson Jarque- Bera MA(1) -1,99 0, ,573 0,000 MA() 0,930 0,017 53,146 0,000,456 1,619 0,438 SMA(6) 0,431 0,098 4,387 0,000 Mediante os modelos concorrentes obtidos, o melhor modelo ajustado para a componente principal CP1 RGE, que explica a distribuidora de energia elétrica RGE em 65,65% é SARIMA (0,1,1) (1,1,1) 6. A Figura 44 ilustra o comportamento dos resíduos do modelo SARIMA (0,1,1) (1,1,1) 6.

97 96 Figura 44 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos do modelo SARIMA (0,1,1) (1,1,1) 6 para a componente principal que explica a concessionária CP1 RGE. Analisando a Figura 44, pode-se perceber que o processo é estacionário e não possui uma estrutura de dependência serial, pois a FAC e a FACP residual do modelo mostra que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95%, e os p-valores são maiores que o nível de significância adotado. Assim, a hipótese nula de que as 15 primeiras autocorrelações apresentam valor zero não é rejeitada, podendo os resíduos ser considerados ruído branco. Buscando verificar a existência de heterocedasticidade residual, faz-se a FAC e FACP para os resíduos quadráticos, conforme Figura 45. Figura 45 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo SARIMA (0,1,1) (1,1,1) 6 para a componente principal que explica a concessionária CP1 RGE. Para testar estatisticamente a presença de heterocedasticidade condicional, aplicou-se o teste de hipótese ARCH-LM, Tabela 8, nos resíduos quadráticos do modelo SARIMA (0,1,1)(1,1,1) 6. Como não foi constatada a presença desse

98 97 fenômeno, há justifica da utilização de um modelo não linear da família ARCH para modelar a volatilidade. hipóteses: Para comprovar a presença de efeitos ARCH, foram testadas as seguintes H : 0 Não existem efeitos ARCH (homocedasticidade); H 1 : Existem efeitos ARCH (heterocedasticidade). Tabela 8 Resultados das estatísticas F e ARCH-LM. ARCH LM F-statistic,303 TR² 4,060 ARCH F-statistic 0,86 TR² 0,90 Prob.F(,115) 0,104 χ () 0,131 Prob.F(1,116) 0,593 χ () 0,589 A partir dos resultados encontrados, verifica-se que a estatística F e a estatística ARCH-LM não foram significativas. Assim, aceita-se a hipótese nula, implicando que não há heterocedasticidade condicional nos resíduos quadráticos do modelo SARIMA (0,1,1) (1,1,1) 6. A Figura 46 mostra os valores originais, os valores estimados e os resíduos para a série CP1 RGE Fev./99 Jun./99 Out./99 Fev./00 Jun./00 Out./00 Fev./01 Jun./01 Out./01 Fev./0 Jun./0 Out./0 Fev./03 Jun./03 Out./03 Fev./04 Jun./04 Out./04 Fev./05 Jun./05 Out./05 Fev./06 Jun./06 Out./06 Fev./07 Jun./07 Out./07 Fev./08 Jun./08 Out./08 Fev./09 Jun./09 Out./09 Residual Actual Fitted Figura 46 Valores originais, valores estimados e os resíduos para o modelo SARIMA (0,1,1) (1,1,1) 6.

99 98 Para componente principal que explica a distribuidora CP RGE em 17,8%, o modelo que melhor representa é um modelo SARIMA (0,1,1) (1,1,1) 6. As estatísticas do modelo estão descritas na Tabela 9. Tabela 9 Modelo ARIMA, dos critérios AIC para distribuidora CP RGE. CP 1RGE Coeficiente D.Padrão t-statistic Prob. AIC SARI(6) -0,553 0,079-6,947 0,000 MA(1) -0,688 0,064-10,746 0,000 SMA(6) -0,783 0,060-13,007 0,000 Durbin- Watson Jarque- Bera 1,93,09 94,90 Mediante os modelos concorrentes obtidos, o melhor modelo ajustado para a componente principal CP RGE que explica a distribuidora de energia elétrica RGE é um modelo SARIMA (0,1,0) (1,1,1) 6. A Figura 47 ilustra o comportamento dos resíduos do modelo SARIMA (0,1,0) (1,1,1) 6. Figura 47 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos do modelo SARIMA (0,1,0) (1,1,1) 6 para a componente principal que explica a concessionária CP RGE. Analisando a Figura 47, determina-se que o processo é estacionário e não autocorrelacionado, pois a FAC e FACP residual do modelo mostra que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95%, e os p- valores são maiores que o nível de significância adotado. Assim, a hipótese nula de

100 99 que as 15 primeiras autocorrelações apresentam valor zero não é rejeitada, podendo os resíduos ser considerados ruído branco. Buscando verificar a existência de heterocedasticidade residual, faz-se a FAC e FACP para os resíduos quadráticos conforme Figura 48. Figura 48 Correlograma, estatística de Ljung-Box (Q(K)) e p-valor da série dos resíduos quadráticos do modelo SARIMA (0,1,0) (1,1,1) 6 para a componente principal que explica a concessionária CP RGE. Analisando a Figura 48, determina-se que o processo é estacionário e não apresenta uma estrutura de dependência serial, pois a FAC e a FACP residual do modelo mostra que os lag apresentam as autocorrelações dentro dos limites de confiabilidade de 95%, e os p-valores são maiores que o nível de significância adotado. Assim, a hipótese nula de que as 15 primeiras autocorrelações apresentam valor zero não é rejeitada, podendo os resíduos ser considerados ruído branco. Para testar estatisticamente a presença de heterocedasticidade condicional, aplicou-se o teste de hipótese ARCH-LM, Tabela 30, nos resíduos quadráticos do modelo SARIMA (0,1,0) (1,1,1) 6. Como não foi constatada a presença desse fenômeno, não há justifica da utilização de um modelo não linear da família ARCH para modelar a volatilidade. hipóteses: Para comprovar a presença de efeitos ARCH, foram testadas as seguintes H : 0 Não existem efeitos ARCH (homocedasticidade); H 1 : Existem efeitos ARCH (heterocedasticidade).

Metodologia de Box-Jenkins. Metodologia de Box-Jenkins. Metodologia de Box-Jenkins

Metodologia de Box-Jenkins. Metodologia de Box-Jenkins. Metodologia de Box-Jenkins Programa de Pós-graduação em Engenharia de Produção Análise de séries temporais: Modelos de Box-Jenkins Profa. Dra. Liane Werner Metodologia de Box-Jenkins Para os modelos de decomposição e os modelos

Leia mais

A Metodologia de Box & Jenkins

A Metodologia de Box & Jenkins A Metodologia de Box & Jenins Aula 03 Bueno, 0, Capítulo 3 Enders, 009, Capítulo Morettin e Toloi, 006, Capítulos 6 a 8 A Metodologia Box & Jenins Uma abordagem bastante utilizada para a construção de

Leia mais

Uso de séries temporais na análise da temperatura média mensal da cidade de Mossoró, RN

Uso de séries temporais na análise da temperatura média mensal da cidade de Mossoró, RN Uso de séries temporais na análise da temperatura média mensal da cidade de Mossoró, RN Ben Dêivide de Oliveira Batista 1 2 Tales Jesus Fernandes 2 Thelma Sáfadi 2 Wesley de Oliveira Santos 3 1 Introdução

Leia mais

Modulo I. Séries Temporais: ARIMA

Modulo I. Séries Temporais: ARIMA UNIVERSIDADE FEDERAL DO PARÁ INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS FACULDADE DE ESTATÍSTICA Modulo I Séries Temporais: ARIMA Curso: Bacharelado em Estatística Disciplina: Estatística Aplicada Nome: Verena

Leia mais

Econometria IV Modelos Lineares de Séries Temporais. Fernando Chague

Econometria IV Modelos Lineares de Séries Temporais. Fernando Chague Econometria IV Modelos Lineares de Séries Temporais Fernando Chague 2016 Estacionariedade Estacionariedade Inferência estatística em séries temporais requer alguma forma de estacionariedade dos dados Intuição:

Leia mais

Aplicação da metodologia Box & Jenkins para previsão de vendas de emulsificante

Aplicação da metodologia Box & Jenkins para previsão de vendas de emulsificante Aplicação da metodologia Box & Jenkins para previsão de vendas de emulsificante Eduardo Campana Barbosa1 Carlos Henrique Osório Silva2 Resumo: Utilizou-se a metodologia Box & Jenkins para previsão da demanda

Leia mais

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9 em Econometria Departamento de Economia Pontifícia Universidade Católica do Rio de Janeiro Aula 9 Data Mining Equação básica: Amostras finitas + muitos modelos = modelo equivocado. Lovell (1983, Review

Leia mais

Modelagem do preço da soja utilizando a metodologia de análise de séries temporais 1

Modelagem do preço da soja utilizando a metodologia de análise de séries temporais 1 Modelagem do preço da soja utilizando a metodologia de análise de séries temporais 1 Jair Wyzykowski 2 Maíra Rodrigues Villamagna 3 Thelma Sáfadi 4 Augusto Ramalho de Morais 5 1 Introdução Uma série é

Leia mais

2. Séries Temporais Definição

2. Séries Temporais Definição 23 2. Séries Temporais 2.1. Definição Um processo estocástico é uma função aleatória que evolui no tempo (e/ou no espaço), definida sob um espaço de probabilidades. Mais precisamente, um processo estocástico

Leia mais

Utilizando a função auto.arima em modelos de séries temporais

Utilizando a função auto.arima em modelos de séries temporais Utilizando a função auto.arima em modelos de séries temporais Erasnilson Vieira Camilo 1 2 Marina Rodrigues Maestre 1 Rick Anderson Freire Mangueira 1 Elias Silva de Medeiros 1 Cristian Villegas 1 1 Introdução

Leia mais

Análise e Previsão de Séries Temporais Aula 1: Introdução às séries temporais. Eraylson Galdino

Análise e Previsão de Séries Temporais Aula 1: Introdução às séries temporais. Eraylson Galdino Análise e Previsão de Séries Temporais Aula 1: Introdução às séries temporais egs@cin.ufpe.br Agenda Séries Temporais: Definições Exemplos Modelos simples com média zero: Ruído I.I.D Processo Binário Random

Leia mais

Análise de Séries Temporais. Modelos estacionários Processos puramente aleatórios, AR(p), MA(q) ARIMA(p,q)

Análise de Séries Temporais. Modelos estacionários Processos puramente aleatórios, AR(p), MA(q) ARIMA(p,q) UNIVERSIDADE DE SÃO PAULO Faculdade de Economia, Administração e Contabilidade de Ribeirão Preto Análise de Séries Temporais. Modelos estacionários Processos puramente aleatórios, AR(p), MA(q) ARIMA(p,q)

Leia mais

Análise do volume útil do reservatório de Furnas via modelos de séries temporais

Análise do volume útil do reservatório de Furnas via modelos de séries temporais Análise do volume útil do reservatório de Furnas via modelos de séries temporais Cristina Henriques Nogueira 1 3 Thelma Sáfadi 2 1 Introdução A energia elétrica é, sem dúvida, um recurso indispensável

Leia mais

Estimação no Domínio do tempo: Covariâncias e modelos ARIMA

Estimação no Domínio do tempo: Covariâncias e modelos ARIMA Estimação no Domínio do tempo: Covariâncias e modelos ARIMA Airlane Pereira Alencar 8 de Março de 2019 Alencar, A.P., Rocha, F.M.M. (IME-USP) Processos Estocásticos 8 de Março de 2019 1 / 26 Índice 1 Estacionariedade

Leia mais

Modelo de Regressão Múltipla

Modelo de Regressão Múltipla Modelo de Regressão Múltipla Modelo de Regressão Linear Simples Última aula: Y = α + βx + i i ε i Y é a variável resposta; X é a variável independente; ε representa o erro. 2 Modelo Clássico de Regressão

Leia mais

3 Metodologia 3.1. Tipo de pesquisa

3 Metodologia 3.1. Tipo de pesquisa 3 Metodologia 3.1. Tipo de pesquisa Este trabalho pode ser classificado como uma pesquisa descritiva, quantitativa, bibliográfica, experimental, exploratória e explicativa. Este estudo é descritivo, pois

Leia mais

Econometria em Finanças e Atuária

Econometria em Finanças e Atuária Ralph S. Silva http://www.im.ufrj.br/ralph/especializacao.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Maio-Junho/2013 Modelos condicionalmente

Leia mais

4 Modelos de Regressão Dinâmica

4 Modelos de Regressão Dinâmica 4 Modelos de Regressão Dinâmica Nos modelos de regressão linear (Johnston e Dinardo, 1998) estudados comumente na literatura, supõe-se que os erros gerados pelo modelo possuem algumas características como:

Leia mais

Análise de previsão da inflação no período pós-plano Real

Análise de previsão da inflação no período pós-plano Real Análise de previsão da inflação no período pós-plano Real Marina Rodrigues Maestre 1 Jayane Pereira de Oliveira 2 Raquel Castellucci Caruso Sachs 3 Vitor Augusto Ozaki 4 1 Introdução Durante a década de

Leia mais

Modelagem do comportamento da variação do índice IBOVESPA através da metodologia de séries temporais

Modelagem do comportamento da variação do índice IBOVESPA através da metodologia de séries temporais Modelagem do comportamento da variação do índice IBOVESPA através da metodologia de séries temporais João Eduardo da Silva Pereira (UFSM) jesp@smail.ufsm.br Tânia Maria Frighetto (UFSM) jesp@smail.ufsm.br

Leia mais

Ralph S. Silva

Ralph S. Silva ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S Silva http://wwwimufrjbr/ralph/multivariadahtml Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Revisão:

Leia mais

A análise de séries temporais é uma área da estatística dedicada ao estudo de dados orientados no tempo (MONTGOMERY, 2004).

A análise de séries temporais é uma área da estatística dedicada ao estudo de dados orientados no tempo (MONTGOMERY, 2004). 3 Séries temporais A análise de séries temporais é uma área da estatística dedicada ao estudo de dados orientados no tempo (MONTGOMERY, 2004). 3.1. Princípios fundamentais Conforme Box et al. (1994), uma

Leia mais

ANÁLISE DE SÉRIES TEMPORAIS

ANÁLISE DE SÉRIES TEMPORAIS ANÁLISE DE SÉRIES TEMPORAIS Ralph S. Silva http://www.im.ufrj.br/ralph/seriestemporais.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Estimação

Leia mais

Capítulo 3. Modelos Probabilísticos

Capítulo 3. Modelos Probabilísticos Capítulo 3 Modelos Probabilísticos 3.1 Introdução Neste capítulo serão descritos vários modelos adequados para dados de séries temporais. Tais modelos são chamados de processos estocásticos. Matematicamente

Leia mais

Análise e Previsão de Séries Temporais Aula 2: Introdução às séries temporais. Eraylson Galdino

Análise e Previsão de Séries Temporais Aula 2: Introdução às séries temporais. Eraylson Galdino Análise e Previsão de Séries Temporais Aula 2: Introdução às séries temporais egs@cin.ufpe.br Análise e Previsão de Séries Temporais Aula 1 Agenda Resumo da Aula anterior; Estimação e eliminação dos componentes

Leia mais

4 APLICAÇÕES À SÉRIE TEMPORAL DE CONSUMO RESIDENCIAL MENSAL DE ENERGIA ELÉTRICA

4 APLICAÇÕES À SÉRIE TEMPORAL DE CONSUMO RESIDENCIAL MENSAL DE ENERGIA ELÉTRICA 4 APLICAÇÕES À SÉRIE TEMPORAL DE CONSUMO RESIDENCIAL MENSAL DE ENERGIA ELÉTRICA No capítulo 4, são aplicados os métodos individuais e os combinados à projeção de curto prazo da série de consumo residencial

Leia mais

Previsão mensal do preço da saca de soja no sudoeste do estado do Paraná utilizando a metodologia de Box & Jenkis

Previsão mensal do preço da saca de soja no sudoeste do estado do Paraná utilizando a metodologia de Box & Jenkis Previsão mensal do preço da saca de soja no sudoeste do estado do Paraná utilizando a metodologia de Box & Jenkis Gabriel Tambarussi Avancini 1 Thiago Viana Flor de Santana 1 Vitor Augusto Ozaki 1 Djair

Leia mais

3 Modelos Comparativos: Teoria e Metodologia

3 Modelos Comparativos: Teoria e Metodologia 3 Modelos Comparativos: Teoria e Metodologia Para avaliar o desempenho do modelo STAR-Tree, foram estimados os modelos Naive, ARMAX e Redes Neurais. O ajuste dos modelos ARMAX e das redes neurais foi feito

Leia mais

MODELO APLICADO À PREVISÃO DA DEMANDA DE ENERGIA ELÉTRICA DO CAMPUS I DO CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA DE MINAS GERAIS (CEFET-MG).

MODELO APLICADO À PREVISÃO DA DEMANDA DE ENERGIA ELÉTRICA DO CAMPUS I DO CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA DE MINAS GERAIS (CEFET-MG). MODELO APLICADO À PREVISÃO DA DEMANDA DE ENERGIA ELÉTRICA DO CAMPUS I DO CENTRO FEDERAL DE EDUCAÇÃO. Introdução TECNOLÓGICA DE MINAS GERAIS (CEFET-MG). Luciane Teixeira Passos Giarola Fátima Oliveira Takenaka

Leia mais

Econometria Semestre

Econometria Semestre Econometria Semestre 2010.01 174 174 21.4. PROCESSOS ESTOCÁSTICOS INTEGRADOS O passeio aleatório é apenas um caso particular de uma classe de processos estocásticos conhecidos como processos integrados.

Leia mais

Econometria. Séries Temporais Lista de Exercícios

Econometria. Séries Temporais Lista de Exercícios Econometria Séries Temporais Lista de Exercícios 1. Estimação da Autocovariância e da Autocorrelação Tome a série de dados da planilha estimacao.xlsx e estime o que se pede sobre a série de tempo dada.

Leia mais

UTILIZAÇÃO DE MODELOS ARIMA PARA PREVISÃO DA ARRECADAÇÃO DE ICMS DO ESTADO DO RIO GRANDE DO SUL

UTILIZAÇÃO DE MODELOS ARIMA PARA PREVISÃO DA ARRECADAÇÃO DE ICMS DO ESTADO DO RIO GRANDE DO SUL UTILIZAÇÃO DE MODELOS ARIMA PARA PREVISÃO DA ARRECADAÇÃO DE ICMS DO ESTADO DO RIO GRANDE DO SUL Deise Scheffer Universidade Federal de Santa Maria scheffer.deise@gmail.com Adriano Mendonça Souza Universidade

Leia mais

3 Dados e metodologia

3 Dados e metodologia 3 Dados e metodologia 3.1 Apresentação de Dados Para a realização dessa pesquisa foram utilizados os dados da série histórica dos preços da soja (em grão) do Estado do Paraná, obtidos da base de dados

Leia mais

PREVISÃO DE PREÇO DO QUILO DO CAFÉ ARÁBICA: UMA APLICAÇÃO DOS MODELOS ARIMA E GARCH

PREVISÃO DE PREÇO DO QUILO DO CAFÉ ARÁBICA: UMA APLICAÇÃO DOS MODELOS ARIMA E GARCH VI Simpósio de Pesquisa dos Cafés do Brasil PREVISÃO DE PREÇO DO QUILO DO CAFÉ ARÁBICA: UMA APLICAÇÃO DOS MODELOS ARIMA E GARCH Alan Figueiredo de Arêdes 1 ; Matheus Wemerson Gomes Pereira ; Erly Cardo

Leia mais

Análise da série temporal do desemprego em regiões metropolitanas do Brasil

Análise da série temporal do desemprego em regiões metropolitanas do Brasil Análise da série temporal do desemprego em regiões metropolitanas do Brasil Érica Fernanda da Cruz 1 3 Tamara Aparecida Nogueira dos Anjos 2 Thelma Sáfadi 2 1 Introdução O desemprego no Brasil é uma constante

Leia mais

Econometria Financeira

Econometria Financeira Ralph S. Silva http://www.im.ufrj.br/ralph/econometriafinanceira.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Setembro-Dezembro/2015 Análise

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS fonte de graus de soma de quadrado variação liberdade quadrados médio teste F regressão 1 1,4 1,4 46,2 resíduo 28 0,8 0,03 total 2,2 A tabela de análise de variância (ANOVA) ilustrada acima resulta de

Leia mais

MODELAGEM ARIMA-ARCH PARA A OBTENÇÃO DE RESÍDUOS APTOS À APLICAÇÃO DE GRÁFICOS DE CONTROLE NA PRESENÇA DE CORRELAÇÃO E AUTO-CORRELAÇÃO

MODELAGEM ARIMA-ARCH PARA A OBTENÇÃO DE RESÍDUOS APTOS À APLICAÇÃO DE GRÁFICOS DE CONTROLE NA PRESENÇA DE CORRELAÇÃO E AUTO-CORRELAÇÃO MODELAGEM ARIMA-ARCH PARA A OBTENÇÃO DE RESÍDUOS APTOS À APLICAÇÃO DE GRÁFICOS DE CONTROLE NA PRESENÇA DE CORRELAÇÃO E AUTO-CORRELAÇÃO Adriano Mendonca Souza (UFSM) amsouza@smail.ufsm.br Francisca mendonca

Leia mais

Eixo Temático: Estratégia e Internacionalização de Empresas

Eixo Temático: Estratégia e Internacionalização de Empresas Eixo Temático: Estratégia e Internacionalização de Empresas PREVISÃO DA ARRECADAÇÃO DE ICMS DO ESTADO DO RIO GRANDE DO SUL: UMA ABORDAGEM COM MODELOS ARIMA RESUMO PREDICTING THE COLLECTION OF ICMS OF RIO

Leia mais

Modelos ARCH e GARCH Aula 8. Morettin e Toloi, 2006, Capítulo 1 e 14 Morettin, 2011, Capítulo 1 e 5 Bueno, 2011, Capítulo 8

Modelos ARCH e GARCH Aula 8. Morettin e Toloi, 2006, Capítulo 1 e 14 Morettin, 2011, Capítulo 1 e 5 Bueno, 2011, Capítulo 8 Modelos ARCH e GARCH Aula 8 Morettin e Toloi, 2006, Capítulo 1 e 14 Morettin, 2011, Capítulo 1 e 5 Bueno, 2011, Capítulo 8 Motivação Pesquisadores que se dedicam a prever séries temporais, tais como preços

Leia mais

Uma aplicação do modelo ARIMA para os preços do real estate nos municípios de São Paulo e Rio de Janeiro

Uma aplicação do modelo ARIMA para os preços do real estate nos municípios de São Paulo e Rio de Janeiro Uma aplicação do modelo ARIMA para os preços do real estate nos municípios de São Paulo e Rio de Janeiro 1 Introdução Everton Batista da Rocha 1 2 Marcelo Lopes Moraes 3 Marcos Aurelio Rodrigues 3 O real

Leia mais

ANÁLISE DE SÉRIES TEMPORAIS

ANÁLISE DE SÉRIES TEMPORAIS ANÁLISE DE SÉRIES TEMPORAIS Ralph S. Silva http://www.im.ufrj.br/ralph/seriestemporais.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Definição

Leia mais

AJUSTE DE UM MODELO DE SÉRIES TEMPORAIS PARA PREVISÃO DA TEMPERATURA MÍNIMA DO AR PARA LAVRAS/MG EM 2011

AJUSTE DE UM MODELO DE SÉRIES TEMPORAIS PARA PREVISÃO DA TEMPERATURA MÍNIMA DO AR PARA LAVRAS/MG EM 2011 AJUSTE DE UM MODELO DE SÉRIES TEMPORAIS PARA PREVISÃO DA TEMPERATURA MÍNIMA DO AR PARA LAVRAS/MG EM 2011 LUIZ G. CARVALHO 1, CAMILA C. ALVARENGA 2 DANIELA C. RODRIGUES 3 1 Eng. Agrícola, Prof. Adjunto,

Leia mais

PREVISÃO DO VOLUME DO CONSUMO DE ÁGUA NA CIDADE DE SANTA CRUZ DO SUL NO ESTADO DO RIO GRANDE DO SUL

PREVISÃO DO VOLUME DO CONSUMO DE ÁGUA NA CIDADE DE SANTA CRUZ DO SUL NO ESTADO DO RIO GRANDE DO SUL PREVISÃO DO VOLUME DO CONSUMO DE ÁGUA NA CIDADE DE SANTA CRUZ DO SUL NO ESTADO DO RIO GRANDE DO SUL Rogério Boza Medeiros 1 Jorge Marcelo Wohlgemuth 2 RESUMO O estudo realizado tem como objetivo encontrar

Leia mais

Análise do consumo de energia elétrica da cidade de Uberlândia MG, utilizando modelos de séries temporais

Análise do consumo de energia elétrica da cidade de Uberlândia MG, utilizando modelos de séries temporais Análise do consumo de energia elétrica da cidade de Uberlândia MG, utilizando modelos de séries temporais Guilherme Alvarenga Laia 1 Maria Imaculada de Sousa Silva 2 Nádia Giaretta Biase 3 1 Introdução

Leia mais

Previsão de taxas de falhas utilizando o Método de Box & Jenkins. Forecast of failure rates using the Box & Jenkins Method

Previsão de taxas de falhas utilizando o Método de Box & Jenkins. Forecast of failure rates using the Box & Jenkins Method Previsão de taxas de falhas utilizando o Método de Box & Jenkins Débora Morales1 (UFPR) debora_mo2@hotmail.com Naiara Fernanda Johnsson 2 (UFPR) nai_johnsson@hotmail.com Resumo: O presente artigo propõe

Leia mais

Aula 7 Métodos Quantitativos Avançados

Aula 7 Métodos Quantitativos Avançados Universidade de São Paulo Faculdade de Economia, Administração e Contabilidade de Ribeirão Preto Programa de Pós-Graduação em Controladoria e Contabilidade Aula 7 Métodos Quantitativos Avançados Autor:

Leia mais

MELHORA DO MODELO SARIMA PARA A PREVISÃO DA DEMANDA MÁXIMA DE CARGA DE ENERGIA DA PUC-RIO UTILIZANDO A SIMULAÇÃO PELO MÉTODO DE MONTE CARLO

MELHORA DO MODELO SARIMA PARA A PREVISÃO DA DEMANDA MÁXIMA DE CARGA DE ENERGIA DA PUC-RIO UTILIZANDO A SIMULAÇÃO PELO MÉTODO DE MONTE CARLO João Pessoa/PB, Brasil, de 03 a 06 de outubro de 2016 MELHORA DO MODELO SARIMA PARA A PREVISÃO DA DEMANDA MÁXIMA DE CARGA DE ENERGIA DA PUC-RIO UTILIZANDO A SIMULAÇÃO PELO MÉTODO DE MONTE CARLO SERGIO

Leia mais

Análise e previsão das taxas da população ocupada em Fortaleza, Ceará, de setembro de 1991 a dezembro de 2008

Análise e previsão das taxas da população ocupada em Fortaleza, Ceará, de setembro de 1991 a dezembro de 2008 Análise e previsão das taxas da população ocupada em Fortaleza, Ceará, de setembro de 1991 a dezembro de 2008 Daniela Bandeira, Paulo Germano, Filipe Formiga e Jeremias Leão Universidade Federal do Piauí

Leia mais

Tópicos de Estatística Espacial Geoestatística

Tópicos de Estatística Espacial Geoestatística Tópicos de Estatística Espacial Geoestatística Anderson Castro Soares de Oliveira Geoestatística A geoestatística é uma análise espacial que considera que a variável em estudo se distribui continuamente

Leia mais

UNIVERSDADE AGOSTINHO NETO FACULDADE DE ECONOMIA. Maio 2018 Aula 8

UNIVERSDADE AGOSTINHO NETO FACULDADE DE ECONOMIA. Maio 2018 Aula 8 1 UNIVERSDADE AGOSTINHO NETO FACULDADE DE ECONOMIA Maio 2018 Aula 8 Armando Manuel 09/29/2017 A PREVISÃO Armando Manuel 09/29/2017 11 1. A metodologia Box-Jenkins é um processo que se inicia com a analise

Leia mais

Uma Análise da Volatilidade nas Exportações Brasileiras

Uma Análise da Volatilidade nas Exportações Brasileiras ISSN 0798 1015 HOME Revista ESPACIOS! ÍNDICES! A LOS AUTORES! Vol. 38 (Nº 28) Año 2017. Pág. 7 Uma Análise da Volatilidade nas Exportações Brasileiras An Analysis of Volatility in Brazilian Exports Letícia

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS Em uma grande escola, 10% dos alunos são comprovadamente fracos. Um teste educacional conseguiu identificar corretamente 80% entre aqueles que são fracos e 85% entre aqueles que

Leia mais

Avaliação da produção de cana-de-açúcar no Brasil através do estudo de séries temporais

Avaliação da produção de cana-de-açúcar no Brasil através do estudo de séries temporais Avaliação da produção de cana-de-açúcar no Brasil através do estudo de séries temporais 1 Introdução Micherlania da Silva Nascimento 1 Leila Maria Ferreira 2 Tatiane Carvalho Alvarenga 3 4 O Brasil é o

Leia mais

Previsão da inflação do indicador IGP-M através de um modelo ARIMA

Previsão da inflação do indicador IGP-M através de um modelo ARIMA Previsão da inflação do indicador IGP-M através de um modelo ARIMA Mauricio Mattos Junho de 2014 Resumo Esse trabalho visa identificar um modelo ARIMA que seja efetivo na descrição e predição dos valores

Leia mais

3 A Modelagem Univariada por Box & Jenkins

3 A Modelagem Univariada por Box & Jenkins 3 A Modelagem Univariada por Box & Jenkins 3.1 Preliminares da modelagem por Box & Jenkins Serão a seguir apresentados alguns conceitos imprescindíveis para a compreensão da técnica Box & Jenkins (BJ)

Leia mais

PREVISÃO DOS CONSUMIDORES DE ENERGIA ELÉTRICA DO SETOR RESIDENCIAL NO RIO GRANDE DO SUL - UM ESTUDO COMPARATIVO ENTRE OS MODELOS ARIMA E ARFIMA.

PREVISÃO DOS CONSUMIDORES DE ENERGIA ELÉTRICA DO SETOR RESIDENCIAL NO RIO GRANDE DO SUL - UM ESTUDO COMPARATIVO ENTRE OS MODELOS ARIMA E ARFIMA. XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUÇÃO A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão. Salvador, BA, Brasil, 6 a 9 de outubro de 9 PREVISÃO DOS CONSUMIDORES

Leia mais

MÉTODO DE PREVISÃO DE DEMANDA APLICADO EM UMA EMPRESA REVENDEDORA DE COMBÚSTIVEL

MÉTODO DE PREVISÃO DE DEMANDA APLICADO EM UMA EMPRESA REVENDEDORA DE COMBÚSTIVEL MÉTODO DE PREVISÃO DE DEMANDA APLICADO EM UMA EMPRESA REVENDEDORA DE COMBÚSTIVEL Thais Rubiane Domingues Silva 1, Laryssa Ribeiro 2, Fábio Luis Figueiredo Fernandes 3, Danielle Mayumi Campos Tamaki 4 Centro

Leia mais

Análise de Regressão Linear Simples e

Análise de Regressão Linear Simples e Análise de Regressão Linear Simples e Múltipla Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução A análise de regressão estuda o relacionamento entre uma variável

Leia mais

Análise comparativa entre métodos estatístico e rede neural aplicados em séries temporais

Análise comparativa entre métodos estatístico e rede neural aplicados em séries temporais Análise comparativa entre métodos estatístico e rede neural aplicados em séries temporais Ana Paula de Sousa José Elmo de Menezes Introdução As formas funcionais dos modelos de previsão das redes neurais

Leia mais

PREVISÃO DO ÍNDICE DE VOLUME DE VENDAS NO VAREJO - COMBUSTÍVEIS E LUBRIFICANTES NO ESTADO DO RIO GRANDE DO SUL.

PREVISÃO DO ÍNDICE DE VOLUME DE VENDAS NO VAREJO - COMBUSTÍVEIS E LUBRIFICANTES NO ESTADO DO RIO GRANDE DO SUL. Eixo Temático: Inovação e Sustentabilidade PREVISÃO DO ÍNDICE DE VOLUME DE VENDAS NO VAREJO - COMBUSTÍVEIS E LUBRIFICANTES NO ESTADO DO RIO GRANDE DO SUL. PREDICTION OF VOLUME OF RETAIL SALES INDEX - FUELS

Leia mais

UNIVERSIDADE ABERTA ANÁLISE E PREVISÃO DE SÉRIES TEMPORAIS COM MODELOS ARIMA E ANÁLISE ESPECTRAL SINGULAR. Jorge Manuel Nunes Xavier

UNIVERSIDADE ABERTA ANÁLISE E PREVISÃO DE SÉRIES TEMPORAIS COM MODELOS ARIMA E ANÁLISE ESPECTRAL SINGULAR. Jorge Manuel Nunes Xavier UNIVERSIDADE ABERTA ANÁLISE E PREVISÃO DE SÉRIES TEMPORAIS COM MODELOS ARIMA E ANÁLISE ESPECTRAL SINGULAR Jorge Manuel Nunes Xavier Mestrado em Bioestatística e Biometria Dissertação orientada Profª Doutora

Leia mais

teoria de probabilidade e estatística, uma sequência de palavra série de tempo é usada alternativamente para

teoria de probabilidade e estatística, uma sequência de palavra série de tempo é usada alternativamente para Na teoria de probabilidade e estatística, uma sequência de variáveis aleatórias é independente e indenticamente distribuida (i.i.d) se cada variável aleatória tem a mesma distribuição de probabilidade

Leia mais

Correlação e Regressão

Correlação e Regressão Correlação e Regressão Vamos começar com um exemplo: Temos abaixo uma amostra do tempo de serviço de 10 funcionários de uma companhia de seguros e o número de clientes que cada um possui. Será que existe

Leia mais

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 12

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 12 em Econometria Departamento de Economia Pontifícia Universidade Católica do Rio de Janeiro Aula 12 Regressão com Variáveis Não-Estacionárias Considere três processos estocásticos definidos pelas seguintes

Leia mais

ECONOMETRIA AVANÇADA Prova Intermediária - 09/04/2015

ECONOMETRIA AVANÇADA Prova Intermediária - 09/04/2015 ECONOMETRIA AVANÇADA Prova Intermediária - 09/04/2015 Solução Questão I (2,0 pontos): Para o modelo y t = 0, 7y t 1 + ɛ t, com ruído branco ɛ t (0, 1), (a) (0,5) Obtenha a previsão h-passos a frente, ŷ

Leia mais

i j i i Y X X X i j i i i

i j i i Y X X X i j i i i Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão

Leia mais

Aula 2 Uma breve revisão sobre modelos lineares

Aula 2 Uma breve revisão sobre modelos lineares Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar

Leia mais

Conceitos Básicos de Séries Temporais para Modelagem Macroeconômica

Conceitos Básicos de Séries Temporais para Modelagem Macroeconômica Conceitos Básicos de Séries Temporais para Modelagem Macroeconômica Material de apoio à aula de RBC Referencia bibliográfica: Introduction to Econometrics G S Maddala e Kajal Lahiri 4a. Edição, John Wiley

Leia mais

Predição da Taxa de Desemprego Brasileira utilizando com Modelo de Regressão com Erros Autocorrelacionados

Predição da Taxa de Desemprego Brasileira utilizando com Modelo de Regressão com Erros Autocorrelacionados Predição da Taxa de Desemprego Brasileira utilizando com Modelo de Regressão com Erros Autocorrelacionados José Eduardo Holanda Ellery Coelho 1 Hellano Vieira de Almeida 2 Rafael Braz Azevedo Farias 3

Leia mais

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos 1 Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 27 de Setembro de 2016 2 3 O modelo de regressão linear é dado por 3 O modelo de regressão linear é dado por Y i = β

Leia mais

Regressões: Simples e MúltiplaM. Prof. Dr. Luiz Paulo Fávero 1

Regressões: Simples e MúltiplaM. Prof. Dr. Luiz Paulo Fávero 1 Regressões: Simples e MúltiplaM Prof. Dr. Luiz Paulo FáveroF Prof. Dr. Luiz Paulo Fávero 1 1 Técnicas de Dependência Análise de Objetivos 1. Investigação de dependências entre variáveis. 2. Avaliação da

Leia mais

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 1 de Setembro de 2014 3 O modelo de regressão linear é dado por Y i = β 0 + β 1 x i + ɛ i onde ɛ i iid N(0,σ 2 ). O erro

Leia mais

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 4

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 4 em Econometria Departamento de Economia Pontifícia Universidade Católica do Rio de Janeiro Aula 4 O Processo Média-Móvel Muitas vezes, a estrutura auto-regressiva não é suficiente para descrever totalmente

Leia mais

Combinação Geométrica de Métodos Preditivos; Aplicação à Previsão de Consumo Residencial Mensal de Energia Elétrica

Combinação Geométrica de Métodos Preditivos; Aplicação à Previsão de Consumo Residencial Mensal de Energia Elétrica Luiz Albino Teixeira Júnior Combinação Geométrica de Métodos Preditivos; Aplicação à Previsão de Consumo Residencial Mensal de Energia Elétrica Dissertação de Mestrado Dissertação apresentada como requisito

Leia mais

MODELOS DE PREVISÃO APLICADOS AO CONTROLE DE QUALIDADE COM DADOS AUTOCORRELACIONADOS

MODELOS DE PREVISÃO APLICADOS AO CONTROLE DE QUALIDADE COM DADOS AUTOCORRELACIONADOS UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE PRODUÇÃO MODELOS DE PREVISÃO APLICADOS AO CONTROLE DE QUALIDADE COM DADOS AUTOCORRELACIONADOS DISSERTAÇÃO

Leia mais

Mestrado Profissionalizante em Finanças as e Economia Empresarial FGV / EPGE Prof. Eduardo Ribeiro Julho Setembro 2007

Mestrado Profissionalizante em Finanças as e Economia Empresarial FGV / EPGE Prof. Eduardo Ribeiro Julho Setembro 2007 Projeções de Séries S Temporais Econometria dos Mercados Financeiros Mestrado Profissionalizante em Finanças as e Economia Empresarial FGV / EPGE Prof. Eduardo Ribeiro Julho Setembro 2007 Objetivo do curso

Leia mais

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas. 1. Inferência Estatística Inferência Estatística é o uso da informção (ou experiência ou história) para a redução da incerteza sobre o objeto em estudo. A informação pode ou não ser proveniente de um experimento

Leia mais

= p(x 1 )p(x 2 x 1 )p(x n,..., x 3 x 2, x 1 ). = p(x 1 ) t=2. Em particular para um modelo ARMA(p, q), denotando o vetor de parâmetros. t=p+1.

= p(x 1 )p(x 2 x 1 )p(x n,..., x 3 x 2, x 1 ). = p(x 1 ) t=2. Em particular para um modelo ARMA(p, q), denotando o vetor de parâmetros. t=p+1. Capítulo 4 Estimação No capítulo anterior foram estudados modelos probabilísticos que podem ser utilizados para descrever dados de séries temporais. Neste capítulo será discutido o problema de ajustar

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS 2003 2004 2005 2006 2007 2008 2009 2010 X 39,0 39,5 39,5 39,0 39,5 41,5 42,0 42,0 Y 46,5 65,5 86,0 100,0 121,0 150,5 174,0 203,0 A tabela acima mostra as quantidades, em milhões

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. viali@mat.ufrgs.br http://www.mat.ufrgs.br/~viali/ Em muitas situações duas ou mais variáveis estão relacionadas e surge então a necessidade de determinar a natureza deste relacionamento.

Leia mais

(iv) Ausência de correlação serial nos erros, dados dois valores quaisquer de X, X i e X j (i j), a correlação entre ε i e ε j é zero,, /,

(iv) Ausência de correlação serial nos erros, dados dois valores quaisquer de X, X i e X j (i j), a correlação entre ε i e ε j é zero,, /, 4 Metodologia O método de estimação por mínimos quadrados está fundamentado em algumas premissas, que são necessárias para realizar inferências estatísticas sobre a variável dependente Y. As principais

Leia mais

ANÁLISE DE SÉRIES TEMPORAIS

ANÁLISE DE SÉRIES TEMPORAIS ANÁLISE DE SÉRIES TEMPORAIS Ralph S. Silva http://www.im.ufrj.br/ralph/seriestemporais.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Referências

Leia mais

Notas de Aulas Econometria I ** Eduardo P. Ribeiro, 2010 PARTE II

Notas de Aulas Econometria I ** Eduardo P. Ribeiro, 2010 PARTE II Notas de Aulas Econometria I ** Eduardo P Ribeiro, 00 PARTE II Autocorrelação Autocorrelação: violação da hipótese: E [ε t ε t-s ] = 0, para s > 0, como por exemplo, ε t = ε t- + υ t, onde υ t é ruído

Leia mais

i j i i Y X X X i j 1 i 2 i i

i j i i Y X X X i j 1 i 2 i i Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão

Leia mais

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra Análise da Regressão múltipla: MQO Assintótico Capítulo 5 do Wooldridge Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades

Leia mais

Vetores Auto-Regressivos (VAR) Cristian Rafael Pelizza Estágio de docência

Vetores Auto-Regressivos (VAR) Cristian Rafael Pelizza Estágio de docência Vetores Auto-Regressivos (VAR) Cristian Rafael Pelizza Estágio de docência Forma estrutural e reduzida O método VAR busca capturar a interdependência entre múltiplas séries de tempo. Estrutura-se equações

Leia mais

Relatório do Seminário Data Mining em Séries Temporais

Relatório do Seminário Data Mining em Séries Temporais Universidade Federal de Santa Catarina Disciplina: INE5644 - Data Mining Professor: Luiz Otavio Alvares Alunos: Anderson Zapello Giovani Milanez Jean Pacher João Paulo Raittes Relatório do Seminário Data

Leia mais

Introdução Técnicas Descritivas. Modelos Probabilísticos. Previsão. Exercício 19/11/2012. Recursos Gráficos Decomposição Filtros Lineares

Introdução Técnicas Descritivas. Modelos Probabilísticos. Previsão. Exercício 19/11/2012. Recursos Gráficos Decomposição Filtros Lineares Professores: Paulo Maciel Ricardo Massa Aluno: Anderson Elias - aen@cin.ufpe.br Ayhalla Riceli carlp@cin.ufpe.br Introdução Técnicas Descritivas Recursos Gráficos Decomposição Filtros Lineares Modelos

Leia mais

4 Mecanismo gerador dos dados, quebras estruturais e cointegração

4 Mecanismo gerador dos dados, quebras estruturais e cointegração 4 Mecanismo gerador dos dados, quebras estruturais e cointegração 4.1. Mecanismo gerador de dados Eis alguns fatos destacados na literatura: A teoria da PPC prevê que a taxa de câmbio real deve convergir

Leia mais

CURSO DE ANÁLISE DE SÉRIES TEMPORAIS MODELO ARIMA MATERIAL DE APOIO

CURSO DE ANÁLISE DE SÉRIES TEMPORAIS MODELO ARIMA MATERIAL DE APOIO FACE Faculdade de Administração, Ciências Contábeis e Ciências Econômicas Curso de Ciências Econômicas Direção FACE Prof. Moisés Ferreira da Cunha Vice-Direção FACE Prof. Mauro Caetano de Souza Coordenação

Leia mais

Perspectiva de Produção Agrícola para a Região de Instalação do Complexo Petroquímico do Estado do Rio de Janeiro (COMPERJ) para o Ano de 2015

Perspectiva de Produção Agrícola para a Região de Instalação do Complexo Petroquímico do Estado do Rio de Janeiro (COMPERJ) para o Ano de 2015 Niterói, RJ, Brasil, 19-22 de outubro de 29 Perspectiva de Produção Agrícola para a Região de Instalação do Complexo Petroquímico do Estado do Rio de Janeiro (COMPERJ) para o de 215 1 Diogo da Rocha Vargas,

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

Previsão do consumo de eletricidade no nordeste brasileiro Forecast of electricity consumption in Brazilian Northeast

Previsão do consumo de eletricidade no nordeste brasileiro Forecast of electricity consumption in Brazilian Northeast Previsão do consumo de eletricidade no nordeste brasileiro Forecast of electricity consumption in Brazilian Northeast Luiz Moreira Coelho Junior 1 * Thiago Freire Melquíades 2 Kalyne de Lourdes da Costa

Leia mais

Estimação de Modelos ARMA e ARIMA

Estimação de Modelos ARMA e ARIMA Estimação de Modelos ARMA e ARIMA Estagiária Docente: Vívian dos Santos Queiroz Disciplina: Econometria Aplicada Professor: Sabino da Silva Porto Júnior Apresentação Inserindo Dados de Séries Temporais

Leia mais

Desenvolvimento de uma metodologia para avaliação da demanda e capacidade de carga nos principais aeroportos brasileiros

Desenvolvimento de uma metodologia para avaliação da demanda e capacidade de carga nos principais aeroportos brasileiros Desenvolvimento de uma metodologia para avaliação da demanda e capacidade de carga nos principais aeroportos brasileiros Michel de Oliveira Vasconcelos Instituto Tecnológico de Aeronáutica, São José dos

Leia mais

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012 1 AULA 09 Regressão Ernesto F. L. Amaral 17 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução à

Leia mais

2. Modelos periódicos autorregressivos 2.1. Planejamento da Operação do Sistema Interligado Nacional

2. Modelos periódicos autorregressivos 2.1. Planejamento da Operação do Sistema Interligado Nacional 24 2. Modelos periódicos autorregressivos 2.1. Planejamento da Operação do Sistema Interligado Nacional A energia de origem hídrica predomina na matriz elétrica brasileira. Isso devese ao fato de o país

Leia mais

PREVISÃO. Prever o que irá. acontecer. boas decisões com impacto no futuro. Informação disponível. -quantitativa: dados.

PREVISÃO. Prever o que irá. acontecer. boas decisões com impacto no futuro. Informação disponível. -quantitativa: dados. PREVISÃO O problema: usar a informação disponível para tomar boas decisões com impacto no futuro Informação disponível -qualitativa Prever o que irá acontecer -quantitativa: dados t DEI/FCTUC/PGP/00 1

Leia mais