Técnicas de Mineração de Dados Aplicadas a Reservatórios visando à Gestão Ambiental na Geração de Energia

Técnicas de Mineração de Dados Aplicadas a Reservatórios visando à Gestão Ambiental na Geração de Energia Aluno: Gabriel Leite Mariante Orientador: Marley Maria Bernardes Rebuzzi Vellasco Introdução e Objetivos O projeto GERABIO, financiado pela Light, é desenvolvido pela PUC-Rio em parceria com outras universidades do Rio de Janeiro. Seu objetivo é o desenvolvimento de uma ferramenta computacional que será utilizada para controle ambiental da água de reservatórios de usinas hidrelétricas pertencentes à Light no interior do estado do Rio de Janeiro. Este trabalho tem como objetivo o desenvolvimento de uma das funcionalidades que poderá ser utilizada pela referida ferramenta computacional. Neste trabalho, foi desenvolvido um sistema de previsão de séries temporais que se aplica de duas maneiras ao objetivo do projeto: previsão do nível de água dos reservatórios das usinas e do índice pluviométrico mensal nos mesmos. Para a realização das previsões, foi utilizada a tecnologia de Redes Neurais Artificiais, que tem inúmeras aplicações tanto acadêmicas como comerciais, sendo a previsão de séries temporais uma das mais comuns. O trabalho foi desenvolvido na forma de códigos no programa MatLab, que possui uma extensa biblioteca de funções para o uso de Redes Neurais ( nntool ) e que está disponível nos computadores do Departamento de Engenharia Elétrica da PUC. Aqui estão apresentados o procedimento e os principais resultados encontrados no desenvolvimento dos códigos. Redes Neurais na Previsão de Séries Temporais Redes Neurais, como o próprio nome indica, são algoritmos computacionais que têm como inspiração a forma de aprendizado desenvolvida pelos neurônios humanos, isto é, o aprendizado por experiência. De uma maneira geral, uma rede neural precisa de dados de entrada com seus respectivos resultados para ser treinada e, a partir daí, pode receber dados de entrada desconhecidos e realizar previsões. Neste caso específico, o objetivo da rede neural é prever uma série temporal, isto é, prever valores futuros de uma determinada variável baseado em uma base de dados que contém valores passados da referida variável. Nestas circunstâncias, deve-se escolher uma janela de previsão, isto é, o número de valores anteriores que serão usados como dados de entrada para a realização a previsão. Trata-se de um parâmetro muito importante neste caso, pois consiste em uma decisão a respeito do número de valores passados que é relevante para a previsão de um valor futuro. Foram testadas, como será visto mais a frente, uma variedade de janelas de previsão em cada reservatório analisado, tendo sido escolhida aquela na qual a Rede apresentou melhor desempenho. A janela de previsão, uma vez definida, é a principal componente dos dados de entrada de uma rede neural. Pode-se, caso se julgue necessário, acrescentar outras entradas que se considere relevante na previsão de um determinado valor. No caso das previsões realizadas neste trabalho, relativas a fatores meteorológicos (nível de água e precipitação), optou-se por incluir nos dados de entrada na rede o mês do ano referente ao valor final a ser previsto.

Outro aspecto importante a ser destacado a respeito da previsão de séries temporais utilizando Redes Neurais é o chamado horizonte de previsão. O horizonte de previsão é o número de valores futuros que se deseja prever a partir da série de valores passados. Neste trabalho, todas as previsões realizadas têm um horizonte de previsão ajustável que pode ser configurado através de um valor atribuído a uma variável do código escrito. Uma Rede Neural tem, naturalmente, uma única saída, que seria referente ao próximo valor da série temporal em questão. Trata-se da chamada previsão single-step (um passo a frente). No entanto, em certas aplicações (como é o caso deste trabalho), pode ser interessante prever resultados mais a frente, não se limitando ao próximo valor. Para atingir tal objetivo, é necessário partir de uma previsão single-step e, assumindo que seu valor é de fato o valor correto, utilizá-lo na entrada da rede para, então, prever o valor seguinte. É importante notar que o primeiro valor previsto (singlestep) não será, evidentemente, o valor exato mas, como não se sabe qual será o número correto, a previsão é utilizada como estimativa. Desta maneira, quando um valor previsto e, portanto, incorreto é utilizado como entrada para uma nova previsão, o erro do valor seguinte será ainda maior. Este processo pode ser repetido para o número de valores à frente que se desejar prever; trata-se da previsão multi-step (vários passos a frente). Como a previsão multi-step é, por definição, uma sequência de previsões single-step tomadas como verdadeiras (quando, na verdade, não o são), quanto maior o horizonte de previsão, maior será o erro no valor final, visto que o erro final é uma acumulação dos diversos erros das previsões single-step realizadas. Neste trabalho, foram realizadas previsões dos dois tipos: single-step e multi-step. Considerando as aplicações práticas do projeto final, é interessante que se possa realizar previsões que não se limitem a um único passo a frente. No entanto, é fácil perceber que, a partir de um certo número de passos a frente (lembrando que o horizonte de previsão, como já mencionado, é ajustado através de um valor atribuído a uma variável no código do programa desenvolvido), o erro do valor previsto passa a ser tão grande que a previsão passa a ter pouco valor. Não existe uma solução definitiva para isso, de modo que o horizonte de previsão deve, portanto, ser menor ou igual a um valor cujo erro final de previsão seja aceitável. Medidas de erro e desempenho da Rede Neural serão discutidas mais a fundo no próximo item. Medidas de Desempenho da Rede Neural Para avaliar a qualidade da previsões realizadas por uma Rede Neural, é necessário estabelecer uma (ou mais) medidas de desempenho. Existem inúmeras possiblidades de medição de desempenho de uma Rede. Neste trabalho escolhemos, como principal indicador, o erro absoluto médio percentual ou, como é mais conhecido por sua sigla em inglês, o MAPE (Mean Absolute Percentage Error). O MAPE é calculado tirando-se a média dos erros percentuais, em módulo, de todos os valores previstos pela Rede Neural, segundo a Equação 1. MAPE = 100% n n At Ft At t=1 Equação 1: Cálculo do MAPE, na qual At é o valor real, Ft é o valor previsto e n é o número de previsões

Para previsões single-step, o MAPE foi calculado levando-se em conta os diversos valores usados para teste da Rede Neural e seus erros na previsão do valor seguinte. Para previsões multistep, o MAPE foi calculado levando-se em conta os n (ver Eq. 1) valores do horizonte de previsão previstos a partir do último valor disponível da série histórica. A escolha do MAPE se deu, principalmente, em razão de sua natureza percentual. Isto significa que o erro é normalizado em relação ao valor real da série, permitindo, portanto, a comparação direta de desempenho entre séries temporais com valores diferentes. Neste trabalho, esta propriedade é particularmente útil, visto que os diferentes reservatórios de água tem níveis de água e índices pluviométricos médios bem diferentes entre si. É trivial perceber que o desempenho de uma dada Rede Neural será melhor quanto menor for o valor obtido para o MAPE. Outra medida de desempenho considerada neste trabalho, embora sem a mesma importância do MAPE, foi o coeficiente R de correlação, fornecido automaticamente pelo toolbox de Redes Neurais do MatLab. O coeficiente R, ao contrário do MAPE, só foi considerado para previsões single-step do conjunto de valores usados como teste da Rede (Equação 2). O coeficiente de correlação é uma medida que varia entre -1 e 1. Como, neste caso, o coeficiente é calculado entre o valor previsto e o valor real, quanto mais próximo de 1 for seu valor, mais próximo eles estão e, consequentemente, melhor é o desempenho da Rede. R = σ xy σ x σ y Equação 2: O coeficiente R é a divisão da covariância entre os valores previstos e os valores reais pelo produto de suas variâncias amostrais Previsão do Nível dos Reservatórios A primeira aplicação para Redes Neurais utilizada no trabalho foi, como já mencionado, a previsão diária do nível da água em reservatórios de hidrelétricas. Foram fornecidos, pela Light, dados de medições diárias do nível dos reservatórios no período de Janeiro de 2003 até Março de 2013. Os dados recebidos foram divididos da seguinte maneira: - 70% para treinamento dados usados para treinar a Rede Neural, isto é, formação dos valores internos dos pesos da Rede a partir de dados de entrada com seus respectivos resultados conhecidos - 15% para validação a cada ciclo de treinamento, este grupo de dados é utilizado como forma de teste instantâneo de desempenho da Rede eu dados conhecidos; a configuração final da rede vai ser aquela na qual o índice de acerto neste grupo for maior - 15% para teste dados utilizados para obter um resultado de desempenho da Rede para valores totalmente desconhecidos; o teste é aplicado após o final do treinamento/validação Inicialmente, dados relativos a dois anos de previsão (2011 e 2012) foram utilizados para o desenvolvimento de um código que serviu como base para o código final. Nesse estágio, a programação relativa a entrada e formatação de dados, configuração da Rede, janela de previsão, horizonte de previsão e avaliação de desempenho foi desenvolvida. A janela de previsão que, como já mencionada acima, é um dos parâmetros mais importantes para a previsão de séries temporais, foi estabelecida em 4 valores passados. Foram testados diversos

valores e concluiu-se que, de uma maneira geral, 4 era o número que proporcionava melhores resultados de desempenho na Rede Neural. Quanto ao horizonte de previsão, os testes multi-step foram realizados com um horizonte de 15 valores futuros (lembrando que, nesse estágios, os valores utilizados são diários). Este valor é configurável no código, bastando a alteração de um valor para que o horizonte mude (no código do MatLab a variável passos representa o horizonte). Após testes com diferentes valores de horizonte, estabeleceu-se que 15 era um valor razoável por ser grande o suficiente para ter utilidade prática em previsões futuras, mas não grande demais para apresentar erros inaceitáveis. Optou-se também por incluir o mês relativo ao dado a ser previsto de maneira binária. Como o ano tem 12 meses, foram necessários 4 dados de entrada para a inclusão de tal informação na Rede Neural (um para cada bit relativo à representação binária do mês). Incluiu-se também o dia do mês como dado de entrada. Dessa maneira, a Rede Neural passou a ter um total de 9 dados de entrada (4 dados da janela de previsão + 4 dados referentes aos bits do mês + 1 valor para o dia do mês = 9 dados). Outro procedimento importante realizado neste estágio foi a correção de dados faltantes na série temporal. A série histórica fornecida pela Light, por se tratar de um período longo de tempo, possui dados faltantes. Para corrigir este problema, cada dado faltante foi substituído pela média aritmética entre o dado anterior e o dado seguinte. Quanto ao número de neurônios (unidades processadoras) da camada escondida da Rede, optou-se, também após testes com diferentes valores, utilizar 4 neurônios. Desta maneira, a figura 1 esquematiza a configuração final da Rede Neural utilizada. Figura 1: Diagrama da Rede Neural: 9 dados de entrada, 4 neurônios na camada escondida e 1 dado de saída (valor previsto) Como os valores inicializados dos pesos da Rede Neural são aleatórios, a cada vez que a Rede é criada e treinada, mesmo que os dados utilizados sejam iguais, o resultado obtido é diferente. Para contornar esse problema, o código foi programado para que a Rede seja criada, treinada e aplicada um número ajustável de vezes (controlado pela variável iter ). O MAPE final utilizado é, então, a média dos valores de MAPE de todas as vezes que a Rede foi utilizada.

Reservatório Local de Medição MAPE Multi-Step MAPE Single-Step Ilha dos Pombos Montante 0,1727% 0,1393% Jusante 1,0313% 0,2489% Lajes Montante 0,0980% 0,0111% Ponte Coberta Montante 0,1767% 0,1952% Jusante 0,1057% 0,1326% Santa Branca Montante 0,1275% 0,0316% Jusante 0,0566% 0,0103% Santa Cecília Vargem Alegre 0,0358% 0,0232% Tomada D'água 0,0485% 0,0329% Barra do Piraí 0,0381% 0,0317% Santana Nova Esperança 0,0641% 0,0297% Montante 0,0372% 0,0179% Tocos Montante 0,1101% 0,1022% Vigário Canal de Vigário 0,0266% 0,0308% Descaga D'água 0,0253% 0,0308% Tomada D'água 0,0253% 0,0242% Média 0,1362% 0,0683% Tabela 1: Valores de MAPE para as previsões de nível diário dos reservatórios analisados A Tabela 1 mostra os resultados finais de MAPE encontrados para os diversos locais de medição dos diversos reservatórios avaliados. O MAPE Multi-Step foi calculado realizando a previsão dos últimos 15 valores cronologicamente da série temporal. A rede utilizada teve, como dados entrada (treinamento, validação e teste), todo os dados exceto os últimos 15 e, então, foi realizada uma previsão futura de 15 passos, na qual o MAPE foi calculado. Já o MAPE Single-Step foi calculado para a previsão um passo a frente de todos os valores do grupo de teste (isto é, 15% dos valores). É importante notar que os valores tanto do MAPE Multi-Step quanto do MAPE Single- Step são, na verdade, uma média de 30 iterações de Redes Neurais para cada ponto de medição de cada reservatório. Isto significa que 30 Redes diferentes foram criadas, treinadas, validadas, testadas e realizaram a previsão, obtendo, na média, o valor tabelado acima. Este número, como já mencionado, é totalmente programável, sendo apenas o valor atribuído a uma variável (a variável iter ; neste caso, fez-se iter=30). Como esperado, o valor médio do MAPE Multi-Step é maior do que o do MAPE Single- Step. Em alguns poucos casos, isto não ocorre, pois a Rede Neural diminui o erro com o passar do tempo, isto é, o erro do primeiro passo é maior que o dos passos seguinte. Não é o esperado, mas é possível.

Previsão do Índice Pluviométrico A outra aplicação para as previsões realizadas por Redes Neurais neste trabalho foi, como já mencionado, a previsão de séries temporais referentes ao índice pluviométrico mensal (medido em milímetros) dos mesmos reservatórios para os quais foram medidos os níveis de água. Os dados de entrada foram provenientes das mesmas planilhas fornecidas pela Light com dados relativos aos meses de Janeiro de 2003 até Março de 2013. Como o princípio é o mesmo, isto é, previsão de valores futuros a partir de uma série histórica, tentou-se usar, inicialmente, as mesmas configurações do código anterior, apenas com algumas adaptações relativas, naturalmente, à entrada dos dados utilizados na previsão. Com os mesmos valores de janela de previsão, horizonte e neurônios na camada escondida, porém, o resultado para a previsão multi-step foi muito ruim, com valores de MAPE altíssimos, muito superiores a 100%. Com o objetivo de melhorar o desempenho, fez-se, então, alterações na estrutura das Redes Neurais usadas, bem como nos dados de entrada. A variação no valor mensal da quantidade de chuva é, claramente, muito mais brusca do que a variação diária do nível de água de um reservatório. É intuitivo pensarmos que é muito mais fácil prever o nível de um reservatório amanhã a partir de seu nível hoje do que prever o quanto choverá no próximo mês a partir da quantidade de chuvas deste mês. Além disso, a quantidade de dados de entrada utilizados na previsão é 12 vezes menor, visto que a previsão do nível é feita a partir de dados diários, enquanto a previsão do índice pluviométrico é feita a partir de dados mensais. Dessa maneira, o desempenho muito pior sob as mesmas condições é esperado. A primeira e mais óbvia alteração feita é a diminuição do horizonte de previsão. A previsão, que era realizada 15 passos a frente, passou a ser realizada apenas 3 passos a frente. Tal valor é mais razoável com as condições mais complexas e variáveis da série temporal sem, porém, deixar de ser uma previsão futura condizente com as aplicações práticas. Para alguns reservatórios, ainda assim o resultado ficou muito ruim. Nestes casos, diminuiu-se para 2 passos o numero de previsões futuras. O horizonte de previsão de cada reservatório está tabelado abaixo junto com o resultado final da previsão multi-step. Um dos dados de entrada utilizado anteriormente já não se aplica mais nesse novo caso. Trata-se do dia do mês referente ao nível do reservatório. Tal entrada foi substituída por um novo dado, que representa a média dos índices pluviométricos do mês em questão a ser previsto, calculada com base nos dados fornecidos (por exemplo, se o objetivo é a previsão do índice do mês de abril, esse valor será a média de todos os meses de abril entre 2003 e 2012 fornecidos pela Light). Mudou-se também o modo como o mês a ser previsto é incluído nos dados de entrada da Rede. Na previsão do nível diário, o mês era codificado de maneira binária utilizando 4 bits. Nesta nova aplicação, optou-se por uma codificação binária utilizando 12 bits. Para cada mês específico, um dos 12 bits, referente ao número do mês, terá valor 1, enquanto os outros 11 bits terão valor 0. Por exemplo, o mês de abril, representado pelo número 4, será codificado da seguinte maneira: 0 0 0 1 0 0 0 0 0 0 0 0. Outra alteração importante foi realizada na estrutura de neurônios e camadas das Redes Neurais. Por causa da já mencionada complexidade da série temporal em questão, resolveu-se acrescentar mais uma camada escondida de neurônios antes da saída dos dados. As Redes usadas possuem agora, portanto, duas camadas escondidas (figura 2) de processamento dos dados. Após vários testes, concluiu-se que o número de neurônios nestas camadas que apresentava melhor resultado foi diferente para cada reservatório. Estes números estão tabelados junto com os resultados finais das Redes. Outra alteração na estrutura interna na Rede foi a divisão de todos os valores iniciais aleatórios atribuídos aos pesos da Rede Neural por 100. Tal ajuste foi realizado como forma

de diminuir a variância do MAPE Multi-Step final pois percebia-se que, nas 30 iterações da Rede, o valor de MAPE encontrado variava de maneira muito intensa se fossem mantidos os valores originais atribuídos aleatoriamente pelo MatLab. Dividindo esses valores por 100, a variância diminuiu bastante, fazendo com o que o valor do MAPE ficasse sempre mais próximo do valor médio. Figura 2: Representação esquemática da Rede Neural com 2 camadas escondidas. A rede em questão possui 16 entradas: 12 bits de codificação do mês + 3 da janela de previsão + 1 da média mensal A última alteração foi relacionada à janela de previsão. Esta, assim como o número de neurônios nas camadas escondidas, provou-se diferente para cada reservatório. Foram testados, em cada um deles, diferentes valores de janela e aquele que apresentava o melhor resultado multi-step foi mantido. Tais valores também estão tabelados junto aos resultados finais de previsão. O resultado final das previsões multi-step, bem como os valores que diferem entre os reservatórios, estão expostos na Tabela 2. Reservatório MAPE Multi-Step Janela Horizonte Neurônios Ilha dos Pombos 60,23% 12 2 20 e 6 Lajes 21,40% 3 3 8 e 2 Ponte Coberta 33,32% 3 3 8 e 2 Santa Branca 26,54% 3 2 8 e 2 Santa Cecília 9,20% 3 3 8 e 2 Santana 18,05% 3 3 8 e 2 Tocos 22,10% 3 3 8 e 2 Vigário - UEL 24,03% 3 3 8 e 2 Canal de Vigário 14,76% 3 3 8 e 2 Média: 26% Tabela 2: Resultados multi-step e outros dados relevantes para a previsão nos diferentes reservatórios A tabela 2 mostra que, mesmo após diversos ajustes e alterações nos dados de entrada e na estrutura das Redes Neurais utilizadas, nem todos os reservatórios tiveram seus índices pluviométricos previstos de maneira satisfatória. Considera-se que MAPE s Multi-Step da ordem entre 10% e 30%, para três valores futuros, são resultados satisfatórios. A maior parte dos reservatórios analisados está dentro desta margem. Alguns, porém, não estão. O esforço de ajuste técnico conseguiu reduzir o erro, mas não a ponto de poder considerá-lo satisfatoriamente baixo. Percebe-se claramente que o reservatório de Ilha dos Pombos tem um resultado muito pior do que

os outros, mesmo com um horizonte de previsão menor. Analisando a série temporal, percebe-se que ela é de fato mais complexa e com padrões mais irregulares do que as outras. A média dos valores de MAPE Multi-Step sem levar em conta este reservatório foi de 21,18%, que é um resultado bastante satisfatório. Alguns Gráficos Utilizados na Avaliação do Trabalho A seguir, estão anexados alguns exemplos de gráficos gerados pelo MatLab a partir dos códigos escritos que foram utilizados na avaliação de desempenho das previsões das Redes Neurais que tabeladas aqui. Gráfico 1: Previsão Multi-Step da Rede Neural e valores reais da série temporal para o nível em Santa Branca-Montante

Gráfico 2: Previsão single-step da Rede Neural (em verde) e valores reais da série (em azul) para o nível do reservatório de Lajes. O gráfico teve que ser aproximado, pois o erro single-step é tão pequeno nesta previsão que não se viam duas curvas separadas, apenas uma. Gráfico 3: Valores do MAPE Multi-Step para as 30 iterações da Rede Neural na previsão do índice pluviométrico do reservatório de Santa Cecília. Cada valor é o MAPE Multi-Step de uma Rede diferente que foi terinada, validade e testada com os mesmo dados de entrada. O valor médio (aqui, em torno de 9%) foi tabelado na Tabela 2

Gráfico 4: Aqui, são representados os valores do coeficiente R, citado como uma forma de avaliação single-step da Rede Neural, para a última (trigésima) iteração da previsão para o índice de chuvas do Reservatório de Lajes. Deve-se lembrar que o valor R pode variar entre 0 e 1, e quanto mais perto de 1 melhor é a previsão single-step. Conclusão Este trabalho permite concluir a respeito da eficácia do uso de Redes Neurais na previsão de séries temporais relativas a índices meteorológicos, tais como nível de água e índice pluviométrico. Redes Neurais, da maneira que foram utilizadas aqui, podem ser utilizadas para realizar previsões bastante acuradas de séries que têm até um certo grau de complexidade.

Como já dito, o resultado foi excelente quando da aplicação das Redes para prever o nível diário de água para um número razoavelmente grande (15) de passos a frente. A série temporal relativa a este dado é relativamente bem comportada e apresenta padrões de variação mais facilmente reconhecíveis por Redes Neurais. Na série relativa ao índice pluviométrico mensal, o resultado não foi tão bom. Tal diferença, como já citado neste relatório, é esperada devido à diferença da natureza dos dois dados previstos. O índice mensal de chuvas apresenta uma maior variação mensal e a correlação com os meses anteriores (é importante lembrar que os dados passados são a principal fonte de informação utilizada pela Rede para realizar a previsão) é, naturalmente, muito menor. Ainda assim pôde-se fazer, para a maior parte dos reservatórios medidos, uma previsão com um nível satisfatório de acerto. É possível que outros ajustes técnicos e computacionais pudessem ser feitos para melhorar ainda mais os resultados não satisfatórios. Tais eventuais ajustes estão, porém, fora do escopo deste trabalho. Finalmente, pode-se destacar as diversas aplicações de cunho científico que tecnologias semelhantes a esta aqui descrita podem ter. Aqui, Redes Neurais foram aplicadas, por sua capacidade preditiva, a uma importante ferramenta de controle ambiental. Existem, porém, inúmeros outros fins para os quais o mesmo tipo de previsão pode ser usada. Encontra-se diversos exemplos na indústria, no mercado, na academia e em qualquer outro campo que necessite de análise e tratamento de dados objetivando previsões futuras. Referências 1 VELLASCO, Marley M. B. R. Notas de Aula de Redes Neuaris. ICA PUC-Rio. Notas de Aula 2 SIQUEIRA, Jan K. Curso de MatLab. Notas de Aula 3 BATISTA, André Luiz F. Modelos de Séries Temporais e Redes Neurais Artificais na Previsão de Vazão. 2009. Dissertação (Mestrado em Engenharia de Sistemas) Universidade Federal de Lavras, Minas Gerais. 2009