UM SISTEMA INTEGRADO DE MONITORAÇÃO E PREVISÃO DE CARGA ELÉTRICA DE CURTO PRAZO. Hélio Francisco da Silva

Documentos relacionados
4 Filtro de Kalman. 4.1 Introdução

Séries temporais Modelos de suavização exponencial. Séries de temporais Modelos de suavização exponencial

3 Metodologia do Estudo 3.1. Tipo de Pesquisa

4 Método de geração de cenários em árvore

5.1. Filtragem dos Estados de um Sistema Não-Linear Unidimensional. Considere-se o seguinte MEE [20] expresso por: t t

Análise de séries de tempo: modelos de decomposição

4 O modelo econométrico

Universidade Federal do Rio de Janeiro

Cálculo do valor em risco dos ativos financeiros da Petrobrás e da Vale via modelos ARMA-GARCH

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

4 Análise de Sensibilidade

3 Modelos de Markov Ocultos

Modelagem e Previsão do Índice de Saponificação do Óleo de Soja da Giovelli & Cia Indústria de Óleos Vegetais

Prof. Lorí Viali, Dr. UFRGS Instituto de Matemática - Departamento de Estatística

Contabilometria. Séries Temporais

3 O Modelo SAGA de Gestão de Estoques

ANÁLISE DE SÉRIES TEMPORAIS NA PREVISÃO DA RECEITA DE UMA MERCEARIA LOCALIZADA EM BELÉM-PA USANDO O MODELO HOLT- WINTERS PADRÃO

Conceito. Exemplos. Os exemplos de (a) a (d) mostram séries discretas, enquanto que os de (e) a (g) ilustram séries contínuas.

3 Retorno, Marcação a Mercado e Estimadores de Volatilidade

4 Metodologia Proposta para o Cálculo do Valor de Opções Reais por Simulação Monte Carlo com Aproximação por Números Fuzzy e Algoritmos Genéticos.

EXAME DE ESTATÍSTICA AMBIENTAL Ano lectivo 2015/16-1ª Época (V1) 18 de Janeiro de 2016

MÉTODOS PARAMÉTRICOS PARA A ANÁLISE DE DADOS DE SOBREVIVÊNCIA

3 Uma metodologia para validação estatística da análise técnica: a busca pela homogeneidade

*UiILFRGH&RQWUROH(:0$

Capítulo 2: Proposta de um Novo Retificador Trifásico

Aplicações à Teoria da Confiabilidade

3 Modelo Teórico e Especificação Econométrica

Introdução ao Controle Ótimo: Otimização de funções e funcionais. Otimização paramétrica. Problema de controle ótimo com tempo final fixo.

5 Metodologia Probabilística de Estimativa de Reservas Considerando o Efeito-Preço

4 Modelo de fatores para classes de ativos

EXAME DE ESTATÍSTICA AMBIENTAL 2ª Época (V1)

Aplicação. Uma famosa consultoria foi contratada por uma empresa. que, entre outras coisas, gostaria de entender o processo

Modelos Não-Lineares

EXAME DE ESTATÍSTICA AMBIENTAL 1ª Época (v1)

1 Pesquisador - Embrapa Semiárido. 2 Analista Embrapa Semiárido.

forma em espaço de estado e filtro de Kalman

4 O Papel das Reservas no Custo da Crise

Função de risco, h(t) 3. Função de risco ou taxa de falha. Como obter a função de risco. Condições para uma função ser função de risco

3 Metodologia 3.1. O modelo

Capítulo 4. Propriedades dos Estimadores de Mínimos Quadrados

5 Método dos Mínimos Quadrados de Monte Carlo (LSM)

3 LTC Load Tap Change

IV. METODOLOGIA ECONOMÉTRICA PROPOSTA PARA O CAPM CONDICIONAL A Função Máxima Verosimilhança e o Algoritmo de Berndt, Hall, Hall e Hausman

UMA ALTERNATIVA TÉCNICO-ECONÔMICA PARA AUMENTAR A CAPACIDADE DE TRANSMISSÃO VIA MONITORAMENTO EM TEMPO REAL DE LINHAS AÉREAS

4 Aplicação do Modelo

Módulo de Regressão e Séries S Temporais

Circuitos Elétricos I EEL420

4 Análise dos tributos das concessionárias selecionadas

5 Aplicação da Modelagem Estrutural ao problema de previsão de Preço Spot de Energia Elétrica.

Instituto de Física USP. Física V - Aula 26. Professora: Mazé Bechara

REDUÇÃO DE DIMENSIONALIDADE

6 Análise do processo de filtragem

Séries de Tempo. José Fajardo. Agosto EBAPE- Fundação Getulio Vargas

CINÉTICA QUÍMICA LEI DE VELOCIDADE - TEORIA

2 Formulação do Problema

Teoremas Básicos de Equações a Diferenças Lineares

4 Modelagem e metodologia de pesquisa

Cap. 5 - Tiristores 1

Econometria Semestre

Capítulo 11. Corrente alternada

5.3 Escalonamento FCFS (First-Come, First Served)

III Congresso da Sociedade Portuguesa de Estatística Guimarães, 26 a 28 Junho 1995

Estimação de Hiperparâmetros para um Modelo de Previsão Holt-Winters com Múltiplos Ciclos por Algoritmos Genéticos

DEPARTAMENTO DE ESTATÍSTICA - UFSCar 6 a Lista de exercício de Teoria de Matrizes 28/06/2017

Grupo I (Cotação: 0 a 3.6 valores: uma resposta certa vale 1.2 valores e uma errada valores)

Problema de controle ótimo com equações de estado P-fuzzy: Programação dinâmica

3 Estudo da Barra de Geração [1]

Antes de mais nada, é importante notar que isso nem sempre faz sentido do ponto de vista biológico.

TRANSFORMADA DE FOURIER NOTAS DE AULA (CAP. 18 LIVRO DO NILSON)

Experiência IV (aulas 06 e 07) Queda livre

3 Metodologia. 3.1 Modelos em Espaço de Estado Lineares Gaussianos

Sistema de Apoio à Tomada de Decisão na Operação em Tempo Real do Sistema da CTEEP

MODELOS USADOS EM QUÍMICA: CINÉTICA NO NÍVEL SUPERIOR. Palavras-chave: Modelos; Cinética Química; Compostos de Coordenação.

DISCIPLINA SÉRIE CAMPO CONCEITO

Lista de Exercícios nº 3 - Parte IV

Utilização de modelos de holt-winters para a previsão de séries temporais de consumo de refrigerantes no Brasil

Características dos Processos ARMA

4. Modelagem (3) (4) 4.1. Estacionaridade

Estudo comparativo do fluxo de caminhões nos portos de Uruguaiana e Foz do Iguaçu

5 Erro de Apreçamento: Custo de Transação versus Convenience Yield

2.6 - Conceitos de Correlação para Sinais Periódicos

2 Os métodos da família X Introdução

Tabela: Variáveis reais e nominais

O Modelo Linear. 4.1 A Estimação do Modelo Linear

APLICAÇÃO DO MÉTODO DE HOLT NA PREVISÃO DE DADOS DE ÁGUA DA CIDADE DE RONDONÓPOLIS-MT

MATEMÁTICA APLICADA AO PLANEJAMENTO DA PRODUÇÃO E LOGÍSTICA. Silvio A. de Araujo Socorro Rangel

I INVESTIGAÇÃO DE MÉTODOS DE SELEÇÃO AUTOMÁTICA DE CIRCUITOS USANDO A TEORIA DOS GRAFOS PARA A ANÁLISE DE REDES HIDRÁULICAS

Critérios e Metodologia de Apuração de Superfície de Volatilidade

Rodolfo Santos Nunes Rodrigues

Interpolação e Extrapolação das ETTJ no Brasil

DEMOGRAFIA. Assim, no processo de planeamento é muito importante conhecer a POPULAÇÃO porque:

Prof. Carlos H. C. Ribeiro ramal 5895 sala 106 IEC

Controle estatístico de processo: soluções de um estudo de caso usando procedimentos estatísticos

CADEIAS DE MARKOV: UM TEMA COM APLICAÇÕES INTERESSANTES E POSSIBILIDADES INTERDISCIPLINARES NA EDUCAÇÃO BÁSICA

Universidade Federal do Rio Grande do Sul Escola de Engenharia de Porto Alegre Departamento de Engenharia Elétrica ANÁLISE DE CIRCUITOS II - ENG04031

ABORDAGEM MULTIOJETIVA PARA SOLUCIONAR UMA MATRIZ ENERGÉTICA CONSIDERANDO IMPACTOS AMBIENTAIS

Confiabilidade e Taxa de Falhas

6 Processos Estocásticos

Comportamento Assimptótico dos Mínimos Quadrados Questão: Será que a estimativa de mínimos quadrados converge para o valor verdadeiro dos parâmetros?

Exercícios Sobre Oscilações, Bifurcações e Caos

Transcrição:

UM SISTEMA INTEGRADO DE MONITORAÇÃO E PREVISÃO DE CARGA ELÉTRICA DE CURTO PRAZO Hélio Francisco da Silva Tese apresenada ao Deparameno de Engenharia Elérica da PUC-RIO como requisio parcial para a obenção do íulo de Douor em Ciências em Engenharia Elérica, na área de concenração Energia Elérica. Orienadores Reinaldo Casro Souza, PUC-Rio Lilian M. Menezes, Universiy of London Deparameno de Engenharia Elérica Ponifícia Universidade Caólica do Rio de Janeiro Rio de Janeiro, 27 de abril de 2001

aos pilois da puc, a minha Tara que o veno nunca levou, dedico.

Agradecimenos Agradeço à adminisração da UFJF, pela licença, mormene aos colegas dos deparamenos de Engenharia Elérica, agradeço à CAPES, pelo financiameno e em especial, à funcionária Valdee, pelo valioso apoio durane a minha esada em Londres, agradeço à adminisração da PUC, pelo apoio insiucional, aos funcionários das secrearias e dos laboraórios, pelo aendimeno presimonioso, e aos professores, pelo raameno sempre aencioso, principalmene à Mônica, Osório e Pedreira, que muio conribuiram nas minhas bancas examinadoras, agradeço à Universiy of London, pela acolhida durane a minha esada por lá, principalmene, à Rajia e à professora Lilian, amiga e orienadora, agradeço ao ONS, pelos dados, e ao pessoal do Rio e de Brasilia, por me mosrarem como funciona o sisema de aquisição de dados, agradeço ao pessoal do CEPEL, principalmene, ao Alber e Pluarco, pelas valiosas sugesões no exo final, agradeço aos colegas da PUC, pelo convívio, principalmene, ao Marcelo, Leo, Ana Paula e Lúcio, por me ensinarem a ser jovem como eles, e por fim, agradeço do fundo meu coração, ao meu orienador Reinaldo, que soube, anes de mim, que eu seria capaz.

UM SISTEMA INTEGRADO DE MONITORAÇÃO E PREVISÃO DE CARGA ELÉTRICA DE CURTO PRAZO RESUMO hélio francisco da silva helio@elerica.ufjf.br As alerações na legislação do Seor de Energia Elérica Brasileiro em fins do milênio passado, provocou profundas mudanças no planejameno da Operação do Sisema e na Comercialização de energia elérica no Brasil. O desmembrameno das aividades de geração, de ransmissão e de disribuição de energia elérica criou novas caracerísicas no comporameno dos Agenes Concessionários e as previsões de demanda por energia elérica, que sempre foram ferramena imporane, por exemplo, na programação da operação, passaram a ser indispensáveis ambém, na comercialização de energia elérica no mercado livre. Nese novo cenário, a obenção e o armazenameno de dados confiáveis passou a ser pare inegrane do parimônio das Empresas e um sisema eficiene de previsões de carga passou a ser um diferencial na mesa de negociações. Os Agenes concessionários e o Operador Nacional do Sisema Elérico vêm fazendo invesimenos para aperfeiçoar os seus sisemas de aquisição de dados, enreano em sisemas de muliponos algumas falhas imprevisas durane a sincronização da elemedição podem ocorrer, provocando defeios nas séries. Nas séries de minuo em minuo, por exemplo, uma falha de algumas horas acarrea cenenas de regisros defeiuosos e as principais publicações a respeio de modelagens de séries emporais para raameno de dados não abordam as dificuldades enconradas diane de grandes falhas consecuivas nos dados. i

Ese rabalho propõe um sisema inegrado de monioração da aquisição de dados e previsão de carga elérica usando algorimos ieraivos baseados nos modelos esruurais a variáveis de esado que, além de corrigir grandes lacunas das séries já armazenadas, permiem, em empo real, idenificar e corrigir os defeios de elemedições e fazer previsões da curva de carga para um horizone de previsão de aé 1440 passos-à-frene com erros percenuais da ordem de 2.5% com um empo de processameno de frações de segundos. Os eses de validação se concenraram nas séries de poência aiva de 10 minuos, mas se aplicam a qualquer oura axa, dos dados coleados pelo ONS/ELETROBRAS nos anos 1997-1999 da Ligh Serviços de Elericidade S.A. na região da Grande Rio. Palavras-chave: Irregularidades em Séries Temporais, Previsão de Carga, Filro de Kalman, Suavização.

ON ADDRESSING IRREGULARITIES IN ELECTRICITY LOAD TIME- SERIES AND SHORT TERM LOAD FORECASTING an Inegraed on-line Sysem hélio francisco da silva helio@elerica.ufjf.br ABSTRACT As a resul of he coninuing privaizaion process wihin he energy secor, elecriciy load forecasing is a criical ool for decision-making in he Indusry. Reliable forecass are now needed no only for developing sraegies for business planning and shor erm operaional scheduling, bu also o define he spo marke elecriciy price. The forecasing process is daa-inensive and ineres has been driven o shorer and shorer inervals. Large invesmens are being made in modernizing and improving meering sysems, so as o make more daa available o he forecaser. However, he forecaser is sill faced wih irregular ime-series. Gaps, missing values, spurious informaion or repeaed values in he ime-series can resul from ransmission errors or small failures in he recording process. These socalled irregulariies have led o research ha focused on eiher ieraive processes, like he Kalman filer and he EM algorihm, or applicaions of he saisical lieraure on reamen of missing values and ouliers. Neverheless, hese mehods ofen resul in large forecas errors when confroned wih consecuive failures in he daa. On he oher hand, he minue o minue series have a large amoun of poins and so he one day ahead forecas horizon becomes very large o handling wih he convenional mehods.

LISTA DAS ABREVIATURAS FK ME MAE RMSE MAPE ONS LT filro de Kalman erro médio percenual erro médio absoluo erro médio quadráico erro médio absoluo percenual Operador Nacional do Sisema Elérico Linha de Transmissão de Ala Tensão yr y7 yf ys yh ya yp ypf yps ym ymf yms yx yxs série real série com as falhas arificiais esimaivas do Filro de Kalman convencional esimaivas do Filro de Kalman convencional suavizadas esimaivas do Filro de Kalman convencional na série cruzada na hora esimaivas do Filro de Kalman convencional na série cruzada na hora suavizadas série do dia úil anerior esimaivas do Filro de Kalman com o apoio da priori do dia úil anerior esimaivas do Filro de Kalman com o apoio da priori do dia úil anerior suavizadas série baseada no padrão dos dias passados esimaivas do Filro de Kalman com o apoio da priori da comparação de padrões esimaivas do Filro de Kalman com o apoio da priori da comparação de padrões suavizadas esimaivas do Filro de Kalman com o apoio da priori das séries cruzadas na hora esimaivas do Filro de Kalman com o apoio da priori das séries cruzadas na hora suavizadas iii

SUMÁRIO INTRODUÇÃO 1 CAPÍTULO 1 OS DADOS 4 1.1 a origem dos dados 5 1.2 as imperfeições nos dados 7 1.3 a modelagem de dados 10 preliminares 10 o problema 13 as dificuldades 13 o encaminhameno da solução 15 a moivação para os modelos esruurais 16 o modelo de nível local 17 o modelo de nível local e endência linear 18 1.4 modelos em espaço de esados e filro de Kalman 19 a formulação geral dos modelos em espaço de esados 19 as caracerísicas do filro de Kalman 20 CAPÍTULO 2 O TRATAMENTO DOS DADOS EM TEMPO REAL 21 2.1 o modelo univariado 22 as inerpreações 22 o modelo em espaço de esados invariane no empo 24 2.2 formulação do filro de Kalman 24 2.3 o algorimo ieraivo 27 2.4 o raameno dos dados em empo real 30 as modificações 30 a esraégia de validação 31 iv

CAPÍTULO 3 A RECUPERAÇÃO DO BANCO DE DADOS 41 3.1 as écnicas de suavização 42 o lgorimo de suavização 45 CAPÍTULO 4 GENERALIZAÇÃO 53 4.1 baeria de eses para o algorimo em empo real 54 análise e comenários 1 55 análise e comenários 2 56 análise e comenários 3 57 4.2 baeria de eses para o algorimo de suavização 58 análise e comenários 4 59 análise e comenários 5 60 análise e comenários 6 61 CAPÍTULO 5 O SISTEMA DE PREVISÕES 63 5.1 o algorimo de previsão 64 CONCLUSÃO 67 C.1 o Sisema de Monioração das Medições em Tempo Real 68 C.2 o Sisema Previsor para Monioração da Operação em Tempo Real 70 C.3 o Sisema para o Resabelecimeno da Inegridade das Séries 71 Conclusão Final 72 REFERÊNCIAS BIBLIOGRÁFICAS 73 APÊNDICE - O SETOR DE ENERGIA ELÉTRICA BRASILEIRO 76 A.1 A Operação do Sisema Inerligado Nacional 77 A.2 Breve Hisória da Elericidade no Brasil 81 A.3 Os novos órgãos Brasileiros do Seor de Energia Elérica 92 v

LISTA DAS ABREVIATURAS FK ME MAE RMSE MAPE ONS LT filro de Kalman erro médio percenual erro médio absoluo erro médio quadráico erro médio absoluo percenual Operador Nacional do Sisema Elérico Linha de Transmissão de Ala Tensão yr y7 yf ys yh ya yp ypf yps ym ymf yms yx yxs série real série com as falhas arificiais esimaivas do Filro de Kalman convencional esimaivas do Filro de Kalman convencional suavizadas esimaivas do Filro de Kalman convencional na série cruzada na hora esimaivas do Filro de Kalman convencional na série cruzada na hora suavizadas série do dia úil anerior esimaivas do Filro de Kalman com o apoio da priori do dia úil anerior esimaivas do Filro de Kalman com o apoio da priori do dia úil anerior suavizadas série baseada no padrão dos dias passados esimaivas do Filro de Kalman com o apoio da priori da comparação de padrões esimaivas do Filro de Kalman com o apoio da priori da comparação de padrões suavizadas esimaivas do Filro de Kalman com o apoio da priori das séries cruzadas na hora esimaivas do Filro de Kalman com o apoio da priori das séries cruzadas na hora suavizadas vi

ÍNDICE DAS FIGURAS figura 1 Sisema Inerligado Brasileiro 6 figura 2 Esimaivas do FK convencional - lacuna arificial de 18 ponos 29 figura 3 Esimaivas do FKmodificado pela priori do dia anerior 36 figura 4 Efeio da suavização nas esimaivas do FK 46 ÍNDICE DAS TABELAS abela 1 falhas não consecuivas 8 abela 2 falas consecuivas 9 abela 3 resumo dos defeios 10 abela 4 esimaivas FK convencional 32 abela4a mariz cruzada na hora 34 abela 5 esimaivas FK modificado pelo apoio da priori do dia anerior 37 abela 6 esimaivas FK modificado pelo apoio da priori de padrões 39 abela 7 esimaivas FK com suavização 47 abela 8 FK modificado pela priori dia anerior, com suavização 49 abela 9 FK modificado pela priori de padrões, com suavização 50 abela 10 FK com priori cruzada na hora, com e sem suavização 52 abela 11 eses sem suavização lacunas 30 ponos fora do pico 54 abela 12 eses sem suavização lacunas 30 ponos incluindo o pico 56 abela 13 eses sem suavização lacunas 60 ponos 57 abela 14 eses com suavização lacunas 30 ponos fora do pico 58 abela 15 eses com suavização lacunas 30 ponos incluindo pico 59 abela 16 eses com suavização lacunas 60 ponos 60 vii

Inrodução As alerações na legislação do Seor de Energia Elérica Brasileiro em fins do milênio passado, provocaram profundas mudanças no Planejameno do Sisema e na Comercialização de energia elérica no Brasil. As aividades de geração, de ransmissão e de disribuição de energia elérica, aé enão perencenes ao Governo Federal, esão sendo desesaizadas e concedidas a Empresas pariculares. O desmembrameno desas aividades criou novas caracerísicas no comporameno dos Agenes Concessionários e as previsões de demanda por energia elérica, que sempre foram ferramena imporane, por exemplo, na programação da operação de curo prazo, passaram a ser consideradas, ambém, indispensáveis na dinâmica dos negócios e na comercialização de energia elérica no mercado livre. Nese novo cenário, a obenção e o armazenameno de dados confiáveis passou a ser pare inegrane do parimônio das Empresas e um sisema eficiene de previsões de carga passou a ser um diferencial na mesa de negociações. Somado a isso, a programação da operação na fase do pré-despacho exige algorimos com empo de resposa cada vez menores e análises de pós-operação cada vez mais acuradas.

A principal moivação para o presene rabalho é conseguir algorimos precisos para monioração da aquisição de dados em empo real e previsores de carga de curo prazo que operem em paralelo com a Operação do Sisema Elérico. O Capíulo 1 apresena uma descrição de algumas caracerísicas de um sisema de aquisição e regisro de dados, omando como exemplo o sisema do ONS em Brasília. Mosra os defeios naurais, suas causas prováveis e a exensão da falhas nas séries de poência elérica insanânea arquivadas ao longo de vários anos. Discorre sobre as principais publicações a respeio de raameno de dados em geral, e enumera as dificuldades enconradas diane das paricularidades apresenadas nos dados disponíveis, caracerizando o problema que se preende resolver. Apresena, ambém a moivação para uilização dos modelos esruurais e as principais caracerísicas do Filro de Kalman. O Capíulo 2 descreve um algorimo ieraivo baseado nos modelos esruurais a variáveis de esado para corrigir os defeios de séries de energia elérica em empo real. Advere para a inaplicabilidade do Filro de Kalman convencional para esimar grandes falas consecuivas nos regisros de dados e apresena, finalmene, uma modificação no Filro de Kalman que permie enconrar esimaivas razoáveis para as falhas de grande exensão. O Capíulo 3 raa de um algorimo de suavização para oimizar as esimaivas do filro de Kalman modificado e preencher as lacunas das séries armazenadas e, assim, resaurar o banco de dados. O Capíulo 4 mosra os resulados de várias baerias de eses, com milhares de simulações, para validar os resulados e confirmar a eficiência do processo proposo e encaminhar a conclusão com segurança. O Capíulo 5 propõe um algorimo para previsão da curva de carga de curo prazo para um horizone, a cada insane, de 1440 ponos com erros percenuais, esimados, da ordem de 2.5%, com um empo de processameno de frações de segundos, para 2

funcionar em paralelo com a Operação do Sisema Elérico, permiindo a monioração do despacho de carga em empo real. A Conclusão apresena uma sínese do Sisema de Monioração das Medições em empo real, do Sisema Previsor para Monioração da Operação em paralelo com o empo real e o Algorimo para Reesabelecer a Inegridade das Séries dos banco de dados. E encaminha algumas sugesões de fuuras aplicações da ecnologia aqui desenvolvida. Enender um pouco do funcionameno do seor elérico, hoje, é fundamenal para conexualizar as necessidades dos aprofundamenos dos esudos inerenes à nova realidade. Assim, no Apêndice, é apresenado um hisórico do Seor Elérico Brasileiro, desde os primórdios da sua implanação, no período Imperial, aé as mais recenes noícias sobre as privaizações. É apresenado, ambém, de maneira suscina, uma descrição dos novos órgãos governamenais e os novos papéis dos Agenes que auam no novo mercado de energia elérica do Brasil, no inuio de caracerizar a imporância de novos raamenos de incerezas nos modelos uilizados para apoio às omadas de decisão e nas análises de minimização de riscos. Vários projeos êm sido desenvolvidos juno às universidades e em paricular, o esudo que aqui se apresena, em origem num projeo eniulado Cahora, que raa de previsões meia-horárias, em convênio PUC/ONS, com a supervisão do CEPEL. 3

CAPÍTULO 1 Os Dados OS DADOS NÃO SÃO DADOS Os dados são vendidos, os dados são comprados. Os dados são escondidos, os dados são roubados. Os dados são sofridos e são suados. Os dados são perdidos e são guardados. Os dados são recuperados e são raados. Os dados são ransformados, são agregados e são consolidados. Os dados são corrompidos, são preenchidos e adulerados. Os dados são orurados. É, bacharéis, os dados não são dados. Os dados são lançados. Os dados são cruéis! helio puc do rio, 14 ou 99 4

1.1 a origem dos dados O Operador Nacional do Sisema Elérico, ONS, órgão responsável pela Operação Inerligada de odo o Sisema Elérico Brasileiro, é um dos principais ineressados pela aquisição e armazenameno de dados. Os dados de vazão, ensão, freqüência, poência aiva e reaiva, e muios ouros, necessários para a operação, manuenção e fuuros projeos, são coleados de diversos ponos do País e enviados por microondas para o Cenro Nacional de Operação e Supervisão, CNOS, localizado em Brasília, onde são armazenados em um compuador cenral. No caso da carga elérica, objeo do presene esudo, os ponos de medição esão localizados, principalmene nas usinas geradoras e nas barras de inercâmbio e são oalizados de diversas formas: por empresas, por áreas e por regiões. A figura 1 fornece uma visão geral do Sisema Inerligado Brasileiro, mosrando as mais imporanes Linhas de Transmissão em Ala Tensão. Noa-se a inerligação enre os dois (anigos) sisemas N/NE e S/SE aravés das subsações próximas a Tucuruí no Pará e Serra da Mesa, no esado de Goiás. O mapa desaca ambém a localização do cenro de medições do ONS, em Brasília e a região da grande Rio, cujos dados de energia elérica serão uilizados para validar os resulados das soluções proposas nesa ese. 5

O Sisema Inerligado Brasileiro ONS Brasília Área da Ligh Figura 1. Mapa de localização das principais Usinas de Geração e das principais Linhas de Transmissão do Sisema Elérico Brasileiro. 6

Um sisema de elemedição, em geral faz varreduras dos ponos de medição e oaliza os dados de empos em empos. No caso do ONS, esa varredura ocorre de 20 em 20 segundos e a cada rês leiuras os valores enviados pelos ponos de medição são oalizados, gerando uma série de poência aiva insanânea em MW de minuo em minuo. Paralelamene, o sisema arquiva ambém uma oura série omando os regisros de 10 em 10 minuos. As Empresas vem fazendo invesimenos no senido de aperfeiçoar os seus sisemas de elemedições e armazenameno de dados, enreano, em sisemas muliponos como eses, alguns imprevisos de sincronização sempre irão ocorrer, originando defeios nas séries. 1.2 as imperfeições nos dados Os defeios observados nas séries de poência aiva do ONS ocorrem, principalmene por falhas, dificilmene conroláveis, na ransmissão dos dados das geradoras ou na elemedição do inercâmbio. Os dados armazenados apresenam imperfeições, como valores falanes (abela1a) e falhas em pequenos inervalos (abela1b), que poderiam facilmene ser raados com os méodos esaísicos conhecidos. 7

mar/1997 jan/1997 dia hora carga dia hora carga 11 22:10 4283.9 6 10:10 3780.7 11 22:20 4299.1 6 10:20 3785.0 11 22:30 4256.6 6 10:30 3800.6 11 22:40 4251.1 6 10:40 3838.6 11 22:50 4259.1 6 10:50 3904.0 11 23:00-6 11:00 3801.3 11 23:10 4268.7 6 11:10 3744.5 11 23:20 4138.5 6 11:20 3801.6 11 23:30 4052.2 6 11:30 3825.2 11 23:40-6 11:40 3884.0 11 23:50 3990.1 6 11:50 3848.0 12 0:00 3929.9 6 12:00 3851.8 12 0:10 3832.7 6 12:10 3877.1 12 0:20 3737.8 6 12:20 0.0 12 0:30 3799.3 6 12:30 0.0 12 0:40 3790.0 6 12:40 0.0 12 0:50 3768.3 6 12:50 0.0 12 1:00 3724.6 6 13:00 0.0 12 1:10 3727.2 6 13:10 0.0 12 1:20 3657.0 6 13:20 0.0 12 1:30 3641.8 6 13:30 0.0 12 1:40-6 13:40 0.0 12 1:50 3615.3 6 13:50 0.0 12 2:00 3604.7 6 14:00 3942.4 12 2:10 3576.0 6 14:10 3963.1 abela 1 falhas na ransmissão (valores em MW) a) falas não consecuivas b) zeros consecuivos dados ONS-Ligh, Rio de Janeiro Enreano, se a falha na eleransmissão de algum dos ponos de medição persisir por algum empo, resula em uma grande sequência de valores repeidos, às vezes, fora do conexo da realidade, a que os especialisas da pós-operação chamam de ''dados congelados''. Esas sequências de dados congelados são facilmene idenificadas pela inconsisência na sua ordem de grandeza, podendo figurar como zero ou aé mesmo como um número negaivo, dependendo do cômpuo do inercâmbio (abelas 2a e 2b). 8

jan/1998 mai/1998 dia hora carga dia hora carga 3 1:10 3842.8 29 12:00 3671.0 3 1:20 3859.6 29 12:10 3671.0 3 1:30 3819.6 29 12:20 3671.0 3 1:40 3798.9 29 12:30 3671.0 3 1:50 3785.5 29 12:40 3671.0 3 2:00 3763.0 29 12:50 3671.0 3 2:10 3711.3 29 13:00 3671.0 3 2:20 3703.9 29 13:10 3671.0 3 2:30 3877.9 29 13:20 3671.0 3 2:40 3910.4 29 13:30 3671.0 3 2:50 3910.4 29 13:40 3671.0 3 3:00 636.4 29 13:50 3671.0 3 3:10 636.4 29 14:00 3671.0 3 3:20 757.0 29 14:10 3671.0 3 3:30 419.0 29 14:20 3671.0 3 3:40 419.0 29 14:30 3671.0 3 3:50 419.0 29 14:40 3671.0 3 4:00 419.0 29 14:50 3671.0 3 4:10 370.0 29 15:00 3671.0 3 4:20 370.0 29 15:10 3671.0 3 4:30 370.0 29 15:20 3671.0 3 4:40 370.0 29 15:30 3671.0 3 4:50 370.0 29 15:40 3671.0 3 5:00 370.0 29 15:50 3671.0 3 5:10 370.0 29 16:00 3671.0 abela 2 falas conssecuivas (valores em MW) a) falhas de inercâmbio b) dados congelados dados ONS-Ligh, Rio de Janeiro A abela 3, a seguir, mosra um resumo dos defeios ípicos enconrados na série de carga do ano 98, cia o início e fim da ocorrência dos defeios, suas prováveis causas e a exensão das lacunas. 9

inicio fim mes dia hora mes dia hora exensão ipo do defeio 1 3 3:00 1 3 6:10 20 erro na ransmissão 1 3 6:20 1 3 8:20 13 dados congelados 1 15 10:10 1 15 14:20 26 valores falanes 1 23 8:30 1 23 11:00 16 erro na ransmissão 2 1 8:40 2 1 14:00 33 erro na ransmissão 2 8 0:00 2 8 10:30 64 valores falanes 2 18 8:30 2 18 9:10 5 erro na ransmissão 2 23 1:10 2 23 2:30 9 valores falanes 2 25 10:20 2 25 14:00 23 erro no inercâmbio 2 27 8:20 2 27 9:00 5 erro na ransmissão 3 22 13:40 3 22 14:50 8 valores falanes 3 22 19:50 3 22 22:10 15 valores falanes 3 23 9:50 3 23 11:00 8 erro na ransmissão 3 24 1:00 3 24 1:50 6 valores falanes 3 29 6:20 3 29 9:40 21 erro na ransmissão 4 15 23:30 4 16 2:00 16 valores falanes 5 17 1:20 5 17 5:30 29 valores falanes 5 20 6:00 5 20 6:50 6 erro na ransmissão 5 29 12:00 5 29 17:00 31 dados congelados 6 28 0:50 6 28 3:50 19 erro no inercâmbio 11 3 9:10 11 3 10:10 7 valores falanes 11 16 1:50 11 16 3:00 8 valores falanes 11 23 16:10 11 23 19:00 19 dados congelados 12 21 9:50 12 21 11:20 10 valores falanes 12 23 18:20 12 23 19:30 8 erro no inercâmbio abela 3 resumo dos defeios dados Ligh-Rio ano 1998 1.3 a modelagem de dados preliminares Em diversas áreas como Economia, Biologia, Sociologia ou Meio Ambiene não é incomum enconrar dados incompleos ou mal especificados. Durane a aquisição dos dados, muios problemas podem ocorrer, como valores inconsisenes, dados irregularmene espaçados, processos de arquivameno diferenes, mudanças no sisema de medições ou simplesmene valores não regisrados. 10

Técnicas gerais são necessárias para inerpolar os valores nas posições onde ocorreram falhas nos regisros a fim de complear a série e conseguir esabelecer modelos que permiam exrair previsões razoáveis de valores fuuros. Há uma vasa bibliografia a respeio de modelagens de séries emporais em geral, e um grande número de abordagens é possível, baseadas nos mais diversos pressuposos. Modelos de regressão linear e não linear podem ser esabelecidos, como por exemplo em Mongomery (1982), que raz um raameno eórico bem compleo sobre modelos de regressão linear. Para séries não esacionárias pode-se usar as écnicas de amorecimeno exponencial, os bem conhecidos modelos de Hol, Winers ou Brown (cf. Granger 1986). Tais écnicas geralmene requerem dados igualmene espaçados e assumem que os parâmeros no procedimeno de amorecimeno podem ser especificados de anemão. Hendry (1997) por sua vez, publicou sobre dinâmicas em séries e Abeysinghe (2000) propõe uma eficiene ransformação para eviar os problemas de auocorrelação ao se modelar regressões dinâmicas com variáveis medidas em frequências diferenes. Pode-se, ambém, ajusar um modelo ARIMA de Box & Jenkins (1970), onde a previsão é definida como valor esperado condicional aos valores aé enão. Harvey e Pierse (1984) esimam, por máxima verossimilhança, os parâmeros de um modelo ARIMA aplicado a séries econômicas, quando algumas observações são omiidas ou sujeias à agregação emporal e usam ese resulado para esimar os valores falanes aravés de modelo a espaço de esados. Em arigo mais recene Harvey e Koopman (1997) se ocupam do problema da agregação emporal em séries econômicas que são regisradas num cero dia da semana e dificulam os ajuses sazonais porque o número de semanas do ano varia enre 52 e 53 e alguns feriados ambém mudam de posição de ano para ano. 11

A solução pare de um modelo esruural que permie ao padrão sazonal evoluir ao longo do empo, possibiliando a capação e o ajuse da sazonalidade aravés de algorimos de filragem e suavização a espaço de esados. Um ouro pono de visa é considerar as séries com valores falanes como se elas fossem séries de dados irregularmene espaçados, como por exemplo, Jones (1985) e Robinson (1997) ou enão, usar a eoria de variáveis conínuas como em Brockwell (1992) ou Jones (1987). Harvey e al. (1998) consolidam em uma única publicação os méodos baseados em modelos esruurais para raameno das anomalias em séries economéricas, incluindo variáveis auxiliares binárias para represenar as falas e Koopman (1992) propõe raar os efeios inra-dias com écnicas de splines varianes no empo para modelar séries periódicas usando o Filro de Kalman. Alguns auores adoam méodos esaísicos para comparação de padrões, como por exemplo Balachandra (1999), que uiliza a análise de discriminanes para classificar grupos de curvas ípicas e ouros preferem os processos de reconhecimeno de padrões usando Redes Neurais Arificiais. Zhang e al. (1998) apresenam uma coleânea recene de arigos uilizando as Redes Neurais para previsão de carga. 12

o problema Os especialisas dos Cenros de Operacões das Empresas necessiam de um insrumeno de previsão de curo prazo para acompanhar de pero a evolução da carga. Necessiam ambém de um algorimo que forneça previsões, em horizones suficienemene largos, que permiam em empo hábil, inerferir na operação, se necessário. De ouro lado, é preciso um algorimo de correção em empo real para arquivar as séries já corrigidas e o ouro aspeco imporane é recuperar séries já arquivadas a fim de se exrair informacões conidas em massa de dados armazenados. O problema dos dados pede, enão, uma solução que conemple vários aspecos: ieraividade, facibilidade de implemenação, rapidez na idenificação de falhas, esimaiva preliminar do valor falane no menor empo possível, esimaiva óima para preenchimeno definiivo da lacuna. Porano, há-que se buscar um procedimeno alernaivo para esimar valores falanes em grandes falhas consecuivas. Esa é a fore moivação dese rabalho. as dificuldades Os regisros de minuo em minuo produzem arquivos de 1440 (24x60) ponos a cada dia e 525 600 ponos por ano. As séries de 10min em 10min (daqui para a frene chamadas de série de 10min) êm 144 regisros a cada dia e 52 560 a cada ano. Uma falha em 30 posições consecuivas, por exemplo, em uma série de 10min, num deerminado dia (vide abela 3), significaria apenas 0.0571% da série do ano ineiro, mas 20.83% de um dia. Para uma falha mais grave, de amanho 60, o percenual de dados falanes em um dia subiria para 41.66%. 13

Se por um lado, a série de minuo em minuo é araenemene exensa, por ouro lado, uma falha de algumas horas na medição implica numa lacuna de exensão de cenenas de ponos. Como agravane, o manuseio de uma série desa dimensão, in genesis, i.e. na forma em que é gerada, requereria um compuador de grande pore especialmene para aender odos os requisios do problema. Modelos de regressão individuais para cada hora do dia, como os sugeridos por Ramanaan, Ganger e al. (1997), vencedores da compeição de Seale, USA em 1990, ornar-se-iam inviáveis devido ao grande número dos parâmeros a esimar em cada modelo, para cada minuo dos dias. Modelos de Box e Jenkins eriam de ser ajusados para rechos sem defeios, para depois serem usados em previsões, mas apresenam variância crescenes e grandes erros em horizones muio disanes, além de não aenderem os requisios de empo real. Enão, as écnicas que separam pare da série para esimação e pare da série para previsão devem ser descaradas por não conseguirem funcionar em paralelo com a operação e pelos impedimenos de amanho da série. A perspeciva de usar écnicas de ineligência compuacional se frusram, pois elas precisam de grande massa de dados e, paradoxalmene, apesar de haver uma aparene infinidade de dados cronologicamene regisrados, não os há em número suficiene de anos para serem apresenados às écnicas de reconhecimeno de padrões e além disso, as Redes Neurais arificiais requerem um empo enorme para reinameno. Porano, para lidar com séries desa dimensão é preciso um processo ieraivo, do ipo Markoviano, que passo a passo vai-se aualizando auomaicamene à medida que fornece esimaivas, mesmo que preliminares. É fundamenal, ambém, algum conhecimeno exra sobre a naureza deses dados para reduzir a dimensionalidade do problema. 14

o encaminhameno da solução Esudos aneriores, e.g. Lourenço (1998), mosram que a demanda por energia elérica em sazonalidades inra-dia, semanal e anual, sofrendo fore influência da emperaura, causada por exemplo, pela carga de ar condicionado no verão do Rio de Janeiro. Baseando-se neses conhecimenos, o banco de dados foi aqui, ambém, paricionado. A primeira parição divide a série cronológica inicialmene em duas grandes pares, segundo o Horário Brasileiro de Verão (obs.: o horário de verão é deerminado por decreo presidencial para os dias poseriores ao equinócio, cujos objeivos são de redução da carga de origem comercial e defasameno da pona em relação à enrada da iluminação pública nos períodos em que os dias são maiores do que as noies). O quadro abaixo mosra as daas em que ocorreram a implanação do horário de verão e a duração em dias para os anos das séries em esudo. vigência do horário verão 1995/1996 de 15.10 a 11.02 119 dias 1996/1997 de 06.10 a 16.02 133 dias 1997/1998 de 06.10 a 01.03 146 dias 1998/1999 de 11.10 a 21.02 133 dias Por sua vez, eses dois subconjunos sofreram nova cisão em dias úeis (erças-, quaras-, quinas- e sexas- feiras) e dias não-úeis (sábados, domingos e feriados). As segundas-feiras e os evenos especiais como carnaval, copa do mundo e horários políicos, devem er raameno especial. Para resulados mais apurados pode-se ainda dealhar o perfil da carga em rechos de carga leve, carga média e carga pesada denro do dia. Uma sugesão para ponos de core seriam os mosrados no quadro a seguir, observando que, no subconjuno que envolve o horário de verão, o perfil da carga é 15

deslocado de uma hora. Porém esa úlima divisão não foi feia aqui, mas serviu para definir as regiões da curva de carga onde foram feios os eses de validação que serão mosrados mais à frene. perfil da carga denro do dia leve de 0h a 6h média de 7h a 18h pesada de 19h a 23h Mesmo endo sido feia a parição da série cronológica original, ainda pairam as dificuldades mencionadas, pois as falhas que ocorrem nas séries originais se refleem nos subconjunos e a parição não diminui a exensão das lacunas. A parição apenas reduz a dimensionalidade do veor de dados e possibilia raar conjunos mais homogêneos, mas não reduz o amanho das lacunas. a moivação para os modelos esruurais Baseando-se na exigência de esimaivas em empo real procurou-se enão endereçar a solução via processo ieraivo. Os modelos esruurais a espaço de esados parecem ser os que mais se adapam a ese ipo de problema, porque, além de permiirem inerpreações das variáveis de esado, podem ser esimados, ieraivamene, por Filro de Kalman (Anderson e Moore, 1979). A idéia básica por derás dos modelos esruurais de séries emporais é que eles são configurados como modelos de regressão, cujas variáveis explanaórias são funções do empo com coeficienes ambém variáveis no empo. Denro dese conceio, uma endência simples seria modelada como linear superposa por uma perurbação aleaória, assim y = α + β + ε =1,..., T O modelo é facilmene esimado usando mínimos quadrados ordinários, mas em a desvanagem de er a endência deerminísica. Para superar esa resrição basa 16

permiir que os coeficienes α e β evoluam esocasicamene no empo permiindo que a endência se adape às mudanças inerenes ao processo. A esimaiva ou a previsão da endência é obida por Filro de Kalman, escrevendo-se o modelo na forma de espaço de esados. Algorimos relacionados são usados para fazer suavizações. Obs.: O ermo previsão, aqui e daqui para a frene, significará usar o modelo esimado para prever valores fuuros e o ermo suavização, para compuar a esimaiva óima da endência para odos os ponos da amosra, usando o conjuno ineiro das observações. A faixa de oscilação dos parâmeros é governada pelos hiperparâmeros que podem ser esimados por maximação da verossimilhança. o modelo de nível local O modelo esruural mais simples enfoca a siuação em que o nível da série varia no empo. Ese nível pode ser modelado por um passeio aleaório superposo a um ruído branco. As equações são: y 2 = µ + ε ε N(0, σ ε ) = 1,..., T 2 µ = µ 1 + η η N(0, ) σ η onde T é o amanho da série de dados. Os ruídos são independenes e idenicamene disribuídos e as duas perurbações são descorrelaadas. Uma caracerísica imporane dese modelo é que o esimador do nível, baseado na informação correne, é dado por uma média móvel exponencialmene ponderada das observações passadas, cuja consane de amorecimeno é função da razão sinal-ruído q = σ η σ. 2 2 / ε Previsores para horizones largos são dados pelas mesmas expressões. Para um passeio aleaório puro, q é infinia levando a previsão igual à úlima observação e à medida que q ende a zero a previsão se aproxima da média amosral. 17

o modelo de nível local e endência linear O modelo de endência linear subsiui a endência deerminísica por uma endência esocásica, como sugerido no iem anerior. As equações são: y 2 = µ + ε ε N(0, σ ε ) = 1,..., T µ + 2 = µ 1 + β 1 η η N(0, σ η ) 2 β = β 1 + ς ς N(0, ) σ ς com os ruídos do nível e da inclinação η e ζ muuamene descorrelaados e descorrelaados de ε. O passeio emporal do nível µ e da inclinação β são governados pelos hiperparâmeros relaivos q η 2 = σ η 2 / σ ε 2 e q ζ 2 = σ ζ 2 / σ ε 2. A função de previsão é uma linha rea que pare da esimaiva do nível com a inclinação do final da amosra. No limie, quando ambos os hiperparâmeros são nulos, o modelo de endência deerminísica é obido com α=µ 0. Ouros casos de ineresse aparecem quando q ζ =0, em que a endência é um passeio aleaório sobreposo a um deslocameno, e quando q η =0, onde a endência suavizada é similar a uma spline cúbica. 18

1.4 modelos em espaço de esados e filro de Kalman O raameno esaísico dos modelos esruurais na forma de espaço de esados é baseado no Filro de Kalman e nos algorimos de suavização a ele associados. A verossimilhança é consruída do Filro de Kalman (FK) em ermos dos erros de previsão um passo à frene e maximizada em relação aos hiperparâmeros por oimização numérica. O veor dos parâmeros pode ser obido via um algorimo de suavização associado ao FK. Uma vez esimados os hiperparâmeros, o filro é usado para produzir os resíduos das previsões um-passo-à-frene, que permie calcular diagnósicos esaísicos para normalidade, correlação serial e adequação do ajuse. O suavizador é usado para esimar componenes não observáveis como endências e sazonalidades e para compuar diagnósicos esaísicos de deeção de valores inconsisenes e quebras esruurais. A abordagem a espaço de esados se orna muio araiva quando os dados apresenam omissão nos regisros ou esão sujeios à agregação emporal. a formulação geral dos modelos em espaço de esados Todos os modelos lineares de séries emporais êm uma represenação na forma de Espaço de Esados. A represenação relaciona o veor de disúrbios {e } ao veor de observações {Y } aravés de um proceso Markoviano {q }. A formulação em espaços de esados em, enão, a forma geral: θ = 1 + η N 0, H ) = 1,..., T (2.1a) Y Tθ η A ( = θ + ε ε N(0, Q ) (2.1b) 19

onde q é o veor de esados, mx1; h um veor qx1 dos disúrbios dos esados, normalmene disribuídos e muuamene descorrelaados, com média zero e mariz mxm de covariâncias H ; Y o veor mx1 das séries de observações; e o veor qx1 de ruídos das observações, normalmene disribuídos, com média zero e mariz qxq de covariâncias Q, muuamene descorrelaados e descorrelaados dos ruídos dos esados. A equação (2.1a) é chamada equação de ransição de esados e a equação (2.1b), equação das observações. A mariz T (mxm) é a mariz de ransição dos esados, e a mariz A (qxm) é a mariz de aualização das previsões um passo à frene. as caracerísicas do filro de Kalman Em modelos a espaço de esados Gaussianos, o Filro de Kalman avalia o esimador médio quadráico mínimo do veor de esados q usando o conjuno de observações aé o insane anerior Y -1 = { y 1, y 2,, y -1 }, denoado por θ =E(θ -1 Y -1 ) e a correspondene mariz de covariâncias P =V(θ -1 Y ) para = 1,, T. Os erros de previsão um passo à frene são dados por ν = y - E(y Y -1 ) com mariz de covariâncias F = V(y Y -1 ). A saída do filro é usada para compuar a função de máxima verossimilhança, l(y;ψ), condicional ao veor de hiperparâmeros ψ dado por: T 1 l( y; ψ ) = log 2π 2 2 T T 1 log F ν F = 1 2 = 1 ' ν 1 A maximização numérica de l(y;ψ) em relação ao veor de hiperparâmeros conduz ao esimador de máxima verossimilhança Ψ. O próximo capíulo inroduz as paricularizações e as formulações do modelo univariado invariane no empo que será a base das ransformações proposas para o Filro de Kalman convencional. Eses modelos serão uilizados quando da presença de grandes falhas consecuivas nos dados, quer seja para os raamenos em empo real, quer seja nos algorimos de suavização para recuperar os dados já arquivados. 20

CAPÍTULO 2 O Traameno dos Dados em Tempo Real

2.1 o modelo univariado as inerpreações O modelo esruural parece ser, nauralmene, a configuração adequada denro da qual paramerizar os problemas de previsão e suavização para raameno das falhas nas séries em quesão. Tem a sua moivação em represenar, separadamene, as incerezas das observações e as incerezas do modelo. A inerpreação é um ouro araivo dos modelos esruurais e eles podem er seus parâmeros esimados ieraivamene pela poderosa ferramena Filro de Kalman. O modelo esruural de nível e endência (3.1) é enão enendido no conexo das séries aqui sob invesigação, como um nível ruidoso µ da Poência Elérica Aiva Insanânea associada à axa β da variação, ambém ruidosa, da poência a parir dese nível. As perurbações ε das medidas e as perurbações ξ e ζ do modelo são pressuposos normais, muuamene descorrelaados e independenes enre si. y 2 = µ + ε ε N(0, σ ε ) = 1,..., T µ + 2 = µ 1 + β 1 ξ ξ N(0, σ ξ ) (3.1) 2 β = β 1 + ς ς N(0, ) σ ς Na represenação em espaço de esados a série de ineresse não é observada direamene, mas somene como uma componene no modelo de regressão esocásica: y = θ + ε, ε N(0, Q ) = 1, L, T (3.2a) A 22

Onde A é uma mariz de aualização que expressa o padrão pelo qual se convere o veor esocásico não observável, θ na série observável y ; µ θ = é o veor dos β esados da média e da endência e ε os erros associados às medições da grandeza poência, com média zero e mariz de covariâncias Q, ambém pressuposos normais, muuamene independenes e independenes dos ruídos do modelo. Os esados são enão modelados como um processo mulivariado de primeira ordem da forma: θ = Tθ 1 + η η N( 0, H ) = 1, L, T (3.2b) onde T é uma mariz de ransição que descreve o modo como os esados se movem ξ sucessivamene ao longo do empo e η = é o veor dos ruídos do modelo, ς suposos normais, muuamene descorrelaados, com média zero e mariz de covariâncias H ; O processo θ pode ser esacionário ou não esacionário, uma vez que não há resrições imposas aos auo-valores de T. Pode-se ambém enender (3.2a) como uma espécie de modelo de efeios randômicos para séries emporais, onde o veor de efeios θ em uma esruura de correlação, no empo, imposa pelo modelo auoregressivo mulivariado (3.2b). Nese conexo, seria uma generalização dos modelos AR ordinários que represenam os ruídos das observações assim como os ruídos induzidos do modelo. 23

o modelo em espaço de esados invariane no empo Se as marizes A e T do sisema são feias fixas, o sisema orna-se invariane no empo e o modelo univariado de média e endência em uma represenação na forma espaço de esados invariane no empo: θ = 1 + η N 0, H ) = 1,..., T (3.3a) Tθ η ( Y = Aθ + ε ε N(0, Q ) (3.3b) Um modelo em paricular é deerminado por consrução, dependendo da escolha que se fizer da mariz de aualização e da mariz de ransição. Assim uma escolha adequada das marizes T e A no modelo a espaço de esados (3.3) conduz ao modelo univariado de nível e endência (3.1). 2.2 formulação do filro de Kalman Na formulação do Filro de Kalman (cf. Anderson e Moore, 1979), o veor de esados θ e o veor das observações y consiuem uma normal bivariada ( θ, ) N( µ, Σ) com y média µ µ = µ θ y a = Aa 1 1 e covariâncias Σθθ Σθy P 1 P 1A' Σ= = yθ yy AP 1 AP 1A' Q Σ Σ + onde, designando a = E(θ ) e P =V(θ ) esimadores da média e das variâncias dos esados, as expressões da média condicional a = 1 Ta 1 e da variância condicional P + 1 = TP 1T ' H bem como dos ouros elemenos das marizes µ e Σ acima, são de derivação imediaa a parir das equações (3.3) que definem o modelo. As equações de aualização do FK que esimam ieraivamene a, P e y são enão deduzidas a parir da disribuição condicional, θ y N( a, P ), dos esados, em relação às observações. Esas equações, exraídas de Harvey(1999, pp.109-110) são: 24

a = a + Kν ˆ 1 = ( y y 1) ν =1,..., T (3.4a) P = P 1 KAP 1 K (3.4b) 1 = P 1A' F y ˆ Aa (3.4c) = 1 1 onde yˆ 1 é a previsão de y um-passo-à-frene e ν ( ˆ = y y 1) é o erro de previsão um-passo-a-frene, ambém conhecido como inovação. A mariz F = AP 1 A' + Q é simplesmene a submariz Σ yy da normal bivariada ( θ, y ) N( µ, Σ) que, junamene com (3.3b), mosra-se facilmene ser a variância da inovação. Assim, as inovações são normal e idenicamene disribuídas ν N 0, F ). A inovação ( funciona enão, como um faor de correção dos passos ieraivos, onde K é o ganho do Filro. O objeivo primário dos procedimenos de suavização ou previsão é esimar as séries não observáveis θ, para = 1, 2,.., T (suavização) e para = T+1, T+2,... (previsão) usando a série observada y 1, y 2,..., y T. Se se conhecem os parâmeros a 0 e P 0, T, H e Q, i.e se forem conhecidas a média e a variância iniciais dos esados, a mariz do sisema e as covariâncias dos erros, o esimador convencional de Kalman pode ser calculado como valor esperado condicional e erá erro médio quadráico mínimo. Iso equivale a considerar o processo θ como um veor randômico no senido Bayesiano, que depende dos valores a priori esipulados para os parâmeros. Uma vez que os valores do esimador do Filro de Kalman dependerão dos valores iniciais assumidos pelos parâmeros do modelo, é imperioso considerar as formas pelas quais eses parâmeros podem ser esimados. Em muios casos iso é conseguido por maximizações da verossimilhança envolvendo, por exemplo, as écnicas de Newon-Raphson para resolver as equações não lineares que resulam das diferenciações das funções de log-verossimilhança. 25

Esas écnicas, no enano, podem apresenar caracerísicas pouco araivas, dependendo da dimensão do veor das séries de ineresse. Primeiro, porque as correções nas sucessivas ierações geralmene envolvem inversões de marizes de derivadas parciais de segunda ordem que podem ser um ano grandes se houver um número significane de parâmeros. Segundo, porque as sucessivas passagens envolvidas no Newon-Raphson podem, não necessariamene, incremenar a verossimilhança. O máximo ser local ou global depende da superfície onde a maximização da verosimilhança é feia, e de cera forma, da inicialização da busca. Expressões da maximização da verossimilhança podem ser visas, por exemplo, em Harvey(1999, pp. 140-141). Os passos do algorimo EM (Expecaion Maximizaion) de Dempser e al.(1977), por ouro lado, sempre incremenam a verossimilhança e garanem a convergência do processo, mas apesar da aparência mais leve das equações e das facilidades de implemenação, o algorimo EM pode er convergência basane lena nos úlimos eságios do processo ieraivo. Shumway e al. (1982) apresenam um novo algorimo recursivo para lidar com esas dificuldades. Casals, J., e al. (2000) deduzem uma relação analíica enre os momenos suavizados e aqueles obidos de uma inicialização arbirária e, combinando os resulados com um suavizador convencional, obêm uma expressão exaa que pode ser aplicada a séries esacionárias e não esacionárias. Em resumo, a arefa de suavização e previsão pode ser inerpreada basicamene como o problema de esimar o processo θ, no modelo a espaço de esados (3.3). 26

A média condicional provê uma solução de erro médio quadráico mínimo baseada nos dados observados se os parâmeros do modelo são conhecidos. Se os parâmeros do modelo não puderem ser especificados de anemão eles deverão ser esimados por máxima verossimilhança usando o algorimo EM com a modificação sugerida por Shumway (1982). No enano como será mosrado, o algorimo de Kalman que funciona bem para falhas esporádicas, acumula grandes erros de previsão quando se depara com falhas consecuivas de grande exensão. 2.3 o algorimo ieraivo Para as séries em esudo, o algorimo de Kalman mosrou convergência em poucas ierações, a despeio dos valores iniciais dos parâmeros dos esados. Assim, 1. num insane inicial =0, y0 1 0 a = 0 e P 0 = y1 y0 0 1 2. Dados a média e a variância, a 0 e P 0 do veor de esados, para o insane inicial =0, faz-se a ransição dos esados: a = Ta 1 0 0 P = TPT ' + H 1 0 0 0 3. e deermina-se a previsão um-passo-a-frene y ˆ1 0 = Aa0. 4. Com a chegada da nova observação, y 1 calcula-se o erro de previsão umpasso-à-frene, a inovação ν 1 = y1 ŷ1 0. 5. De posse da inovação ν 1, aualiza-se os parâmeros para o insane seguine a 1 1 = a + Kν 1 0 P = P 1 0 1 KAP 6. e de posse do novo valor do veor de esados, no insane =1, reorna-se ao passo 1 para nova ransição de esados. 1 0 27

7. E assim por diane para odos os valores de aé o final da série dos dados. Ao se deparar com uma imperfeição na série, i.e. quando um deerminado y for uma observação idenificada previamene como um dado não confiável ou simplesmene uma lacuna na série, o procedimeno adoado na lieraura, e.g. Harvey (1999, p.145) sugere passar para o passo seguine sem fazer a aualização do passo.3, que corresponde à equação (3.4a) da formulação geral. Em ouras palavras, os auores propõem zerar o ganho do filro naquela posição e coninuar as ierações. ˆ O valor esimado para aquele y seria, enão, omado como a previsão um-passoa-frene feia no insane anerior, y 1. Mas, lacunas sucessivas conduzem o FK sobre uma rea. A figura 2 mosra a curva de carga de um dia da série de 10 minuos e o resulado da aplicação do filro de Kalman convencional a uma lacuna simulada de 18 ponos consecuivos, siuada enre 10:00 e 12:50. A curva ponilhada represena as previsões um passo-à-frene esimadas pelo filro de Kalman. Noa-se que, quando se aplica o procedimeno sugerido aneriormene, o FK convencional perde a sua capacidade de acompanhar os movimenos da curva original e lança esimaivas em linha rea. 28

4000 3800 3600 carga em MW 3400 3200 3000 esimaivas do FK convencional na ausência de inovação 2800 00 02 04 06 08 10 12 14 16 18 20 22 axa de aquisição 10 em 10 min horas Figura 2. aplicação do filro de Kalman convencional a uma lacuna arificial de 18 ponos. Se se preende, enão, uilizar os recursos ieraivos do algorimo de Kalman, é preciso alguma modificação no procedimeno de esimação, diane da ausência da inovação. A próxima seção raa desas modificações. 29

2.4 o raameno dos dados em empo real as modificações Modificações nos parâmeros do modelo geral, equação 3.3, podem ser o caminho adequado para se lidar com problemas específicos. Por exemplo, pode-se inerprear a mariz de aualização, A, como uma mariz fixa no empo que define o modo como se observa as componenes do veor θ. Shumway e al. (1982) apresenam uma aplicação onde esa mariz A mosrou ser o pono onde inserir modificações para se ober um méodo razoável para raar os dados de seguridade social, medidos em duas épocas diferenes por duas fones diferenes. Numa eapa de refinameno, propõe uma nova ieração para o suavizador de Kalman para esimar as marizes de ransmissão e aualização do filro de forma a permiir fazer previsões mesclando esas duas informações. O que será apresenado aqui é o desenvolvimeno de uma meodologia de processo ieraivo com o enfoque de modelo esruural descrio por Harvey (1999) e inspirada ambém numa modificação do Filro de Kalman, para lidar com falhas em séries de Poência Elérica e preencher lacunas onde houve inerrupção ou falha de grandes exensões nos regisro de dados. A idéia básica consise em enconrar uma informação a priori para aualizar o veor de esados na ausência do dado real. Obs.: Noe-se que a expressão a priori, nese exo, é usada com o significado da sua essência laina, sendo ligeiramene diferene do conexo Bayesiano. Aqui, quer dizer 30

simplesmene: anerior, anecedene, prévia, passada, já conhecida anes do insane presene. Os eses de validação uilizarão as séries da carga própria do agene concessionário Ligh Serviços de Elericidade S.A. na região da Grande-Rio de Janeiro, nos anos 97, 98 e 99. Ouros rabalhos poderão uilizar esas séries compleadas. Embora o foco seja dado às séries de 10min, por simples quesões de apresenação dos resulados no papel, o méodo não faz resrições quano à axa de aquisição dos dados e pode perfeiamene ser aplicado a qualquer oura cronomeria de regisros. a esraégia de validação A esraégia para avaliar a aplicabilidade da proposiura consise em: 1. desacar uma faia da série onde os regisros esão perfeios e criar falsas lacunas consecuivas, 2. aplicar o algorimo de Kalman para preencher a lacuna arificial e 3. comparar eses valores esimados com aqueles valores reais, analisando os erros percenuais relaivos. A abela 4 mosra um recho do dia 13 de maio de 1998, uma quara-feira, onde foi aplicada a esraégia proposa. OBS. Todas as abelas dese ipo que serão aqui mosradas, apresenam várias colunas em comum. A primeira coluna coném a hora, a segunda, de cabeçalho yr, raz os dados reais de um recho sem defeios e a erceira, de íulo y7, as falhas arificiais. Nas colunas seguines serão arroladas as esimaivas do FK modificado pelos diversos ipos de informação a priori, marcadas por y e uma lera da priori, conforme explicado no rodapé de cada abela. Cada coluna de esimaivas é seguida de uma coluna e% que são os respecivos erros percenuais das previsões, em relação aos valores reais. 31

hora yr y7 yf e% yh e% 9:00 3551.4 3551.4 3534.0-0.5 3340.8-5.9 9:10 3605.0 3605.0 3595.4-0.3 3466.6-3.8 9:20 3585.3 3585.3 3654.4 1.9 3445.2-3.9 9:30 3584.8 3584.8 3619.6 1.0 3522.9-1.7 9:40 3637.4 3637.4 3598.3-1.1 3594.7-1.2 9:50 3554.2 3554.2 3654.2 2.8 3610.2 1.6 10:00 3644.6-3553.6-2.5 3525.7-3.3 10:10 3638.7-3535.2-2.8 3551.9-2.4 10:20 3679.1-3516.7-4.4 3609.0-1.9 10:30 3722.0-3498.3-6.0 3516.0-5.5 10:40 3684.5-3479.9-5.6 3684.3 0.0 10:50 3678.6-3461.5-5.9 3592.4-2.3 11:00 3698.5-3443.1-6.9 3713.2 0.4 11:10 3677.4-3424.6-6.9 3750.1 2.0 11:20 3734.2-3406.2-8.8 3766.7 0.9 11:30 3730.7-3387.8-9.2 3708.5-0.6 11:40 3793.0-3369.4-11.2 3714.6-2.1 11:50 3703.9-3350.9-9.5 3660.3-1.2 12:00 3766.9-3332.5-11.5 3735.9-0.8 12:10 3692.3-3314.1-10.2 3647.6-1.2 12:20 3708.8-3295.7-11.1 3517.3-5.2 12:30 3742.4-3277.2-12.4 3630.5-3.0 12:40 3764.2-3258.8-13.4 3540.8-5.9 12:50 3704.1-3240.4-12.5 3532.2-4.6 13:00 3658.1 3658.1 3222.0-11.9 3562.6-2.6 13:10 3805.6 3805.6 3671.4-3.5 3461.7-9.0 média 3709.1 3397.0-8.4 3633.1-2.0 variância 1693.6 9673.5 11.5 7682.5 5.1 abela 4 esimaivas via FK - lacunas de 18 ponos (dados em MW) yf esimaivas na série consecuiva de 10 em 10 min yh esimaivas para a série cruzada a cada 10min. e% erro percenual das esimaivas em relação aos valores reais De vola à abela 4. A coluna yf lisa os valores esimados pelo FK sem aualizar o veor de esados a = a + Kν 1 nas sucessivas ierações onde enconram as omissões arificiais, nese exemplo com exensão de 18 ponos fora do horário de pico da curva de carga. Observa-se claramene na abela 4, bem como na figura 2, que os erros percenuais das esimaivas são linearmene crescenes, o que descara a sugesão de omar as esimaivas, yf, dos valores omiidos para subsiuir o valores reais, quando na ignorância dos reais valores. 32