PREVISÃO DE TEMPERATURA ATRAVÉS DE REDES NEURAIS ARTIFICIAIS Alexandre Pinhel Soares 1 André Pinhel Soares 2 Abstract : The temperature monitoring is a quasi-continuous and judicious task that gives a long and meaningful record. The temporal nature, the quality and the size of this record are good characteristcs for pattern recognition forecast methods. This paper presents a connexionist approach using Artificial Neural Networks for the temperature forecast problem. The record used corresponds to the 199 hourly temperature of the meteorological station of the Universidade do Estado do Rio de Janeiro (UERJ). Resumo : O monitoramento da temperatura é uma tarefa quase ininterrupta e muito criteriosa que resulta em um registro longo e confiável. A natureza temporal, a qualidade e o tamanho desse registro são características bastante adequadas à utilização de métodos de reconhecimento de padrões voltados para previsão. Este trabalho apresenta uma abordagem conexionista, onde procurou-se uma rede neural com desempenho aceitável na previsão da temperatura. O registro empregado foi fornecido pela Universidade do Estado do Rio de Janeiro (UERJ) e corresponde à temperatura horária do ano de 199 da Estação Meteorológica do Maracanã, situada na cidade do Rio de Janeiro. Palavras-chave : Previsão de temperatura - Redes Neurais 1 Engenheiro Eletrônico pela UFRJ com especialização em Climatologia pela UERJ. Trabalha em Furnas Centrais Elétricas S.A., no Departamento de Equipamentos Eletroeletrônicos e é pesquisador contratado pela UERJ. Tel.: (21) 28-48 - email: pinhel@furnas.com.br 2 Engenheiro Sanitarista pela UERJ. Trabalha no Departamento de Climatologia e Meteorologia da UERJ. Tel.: (21) 87-7687 - email : pinhel@uerj.br
1 - INTRODUÇÃO : A previsão de temperatura tem as mais diversas aplicações como o auxílio à agricultura e à pecuária, alertas à população e informações para turistas. Dentre os métodos utilizados existem os que se baseiam em Redes Neurais Artificiais (ANN) e, como exemplos destes, pode-se citar [1] e [2]. Uma ANN é uma estrutura computacional baseada em arquiteturas de processamento distribuído encontradas em seres vivos. É composta pela interligação de elementos processadores muito simples, chamados neurônios, e podem ser construídas em meios elétricos, óticos e híbridos ou simuladas por software. Os tipos de redes existentes são caracterizadas pelo modelo do neurônio, pela topologia das interligações e pelo algoritmo de treinamento. Uma visão geral pode ser encontrada em [3] e [4]. Neste trabalho utilizou-se a multilayered perceptron (MLP). 2 - A REDE : 2.1 - Generalidades : Uma MLP é composta por neurônios que possuem n entradas com pesos variáveis (sinapses), uma saída (axônio) e três funções internas (entrada, ativação e saída) que diferem conforme a posição dentro da rede. Tipicamente a função de entrada calcula a soma ponderada dos sinais aplicados nas sinapses e a função de ativação recebe essa soma e fornece o nível de atividade do neurônio para a função de saída que o aplica ao axônio. A retenção do conhecimento se dá pela variação dos valores numéricos (pesos) das sinapses no decorrer do treinamento. entrada saída de entrada Sinapses ativação Axônio intermediária Dados de entrada de saída Saída FIGURA. 1 : NEURÔNIO USADO NA REDE MLP FIGURA 2 : REDE MLP O potencial da MLP é conhecido há bastante tempo, porém a sua popularização só veio a ocorrer em 1986, com o trabalho de Humelhart, Hinton e Willians [], pois até então era desconhecida qualquer estratégia de treinamento. Esses autores desenvolveram a generalized delta rule, conhecida também como backpropagation error correction algorithm. Essa técnica aplica um padrão na entrada, compara a saída encontrada com a esperada e recalcula os pesos das sinapses a partir da retropropagação do erro.
2.2 - Especificidades : Em uma MLP a saída é função da entrada, de forma que os dados utilizados devem ter alguma correlação. Neste trabalho a saída final é o valor estimado para o tempo t, em graus centígrados, da temperatura na estação meteorológica da Universidade Estadual do Rio de Janeiro, UERJ. A rede recebe em sua camada de entrada os valores de temperatura em t-1 até t-24. Nota-se que o futuro da grandeza em questão (temperatura) está sendo tratado como função unicamente de seu passado. 3 - O SISTEMA NEURAL DE PREVISÃO : O Sistema Neural de Previsão (SNP) foi desenvolvido em Turbo Pascal 7. para DOS e consiste em dois programas. Um será chamado de TREINADOR, e é o responsável pelo treinamento da rede, e o outro será chamado de PREVISOR, e se utiliza da rede treinada para efetuar a previsão em si. O TREINADOR lê dois arquivos, um com as condições do treinamento e a configuração da rede e outro com os padrões de entrada e as saídas desejadas. Esses arquivos devem ser compatíveis entre si, i.e., a topologia descrita deve ser apropriada ao formato do arquivo de dados. A condição inicial da rede é dada pela inicialização randômica dos pesos das sinapses e o treinamento pode ser interrompido a qualquer momento para alteração de algum parâmetro. Ao término do treinamento tem-se o arquivo de configuração da rede devidamente alterado. Esse arquivo é então utilizado pelo PREVISOR que gera um arquivo de saída com a previsão para as próximas 24 horas. A primeira hora é obtida através de dados reais aplicados à entrada da rede, porém da segunda hora em diante as previsões anteriores são usadas na composição do vetor de entrada que fornecerá o valor subsequente. Todos os arquivos envolvidos são texto (ASCII), com isso consegue-se praticamente total independência da plataforma computacional a que o SNP for acoplado. O arquivo de configuração obtido pode ser acessado, via rede local, pelo micro responsável pela previsão de forma que retreinamentos de rotina sejam transparentes ao operador do PREVISOR. IBM micros gateway P T hub Rede corporativa hub.ann - arquivo de configuração da rede.in - arquivo de dados de treinamento.prv - arquivo de previsões P - micro on-line rodando o PREVISOR T - micro off-lina rodando o TREINADOR.prv.ann.in LAN Workstations LAN Vax FIGURA 3 : O SNP EM UMA PLATAFORMA GENÉRICA 4 - RESULTADOS : Para exemplificação dos resultados obtidos escolheu-se aleatoriamente períodos do ano de 199, tentando a correlação do valor futuro com os últimos 24 valores passados. Os pares de gráficos a seguir apresentam o resultado do aprendizado da rede sobre o conjunto de treinamento (48 amostras) e a previsão para 24 horas obtida pelo PREVISOR, utilizando a respectiva rede treinada.
Aprendizado para a previsão de 22 de fevereiro Dia 22 de fevereiro de 199, às 9 hs 3 4 3 3 2 2 3 2 2 1 4 7 13 16 19 22 2 28 31 34 37 4 43 46 1 3 7 9 11 13 17 19 21 23 futura Aprendizado para a previsão de 9 de abril Dia 9 de abril de 199, às hs 3 3 3 3 2 2 2 2 1 4 7 13 16 19 22 2 28 31 34 37 4 43 46 1 3 7 9 11 13 17 19 21 23 futura Aprendizado para a previsão de 2 de maio Dia 2 de maio de 199, às 16 hs 3 2 2 2 2 1 4 7 13 16 19 22 2 28 31 34 37 4 43 46 1 3 7 9 11 13 17 19 21 23 futura Aprendizado para a previsão de 1 de julho Dia 1 de julho de 199, às 11 hs 3 3 2 2 2 2 1 4 7 13 16 19 22 2 28 31 34 37 4 43 46 1 3 7 9 11 13 17 19 21 23 futura
Aprendizado para a previsão de 12 de agosto Dia 12 de agosto de 199, às 13 hs 4 3 3 3 3 2 2 2 2 1 4 7 13 16 19 22 2 28 31 34 37 4 43 46 1 3 7 9 11 13 17 19 21 23 futura - CONCLUSÕES : Em vista dos resultados obtidos, parecem válidas tentativas de uso de redes neurais na previsão de temperatura. O PREVISOR é vulnerável a propagação de erro, portanto o SNP deve ser usado, sempre que possível, em conjunto com outras ferramentas, ficando com o meteorologista a palavra final, inclusive quanto a utilização parcial da previsão (primeiras 6 horas, por exemplo). Por fim, para futuros experimentos tem-se em vista uma série de aperfeiçoamentos tais como : - Outro tipo de pré-processamento de dados. Pode-se, por exemplo, transpor os dados para uma escala logarítmica antes de aplicá-los à rede. - O uso de outra função de ativação, por exemplo a tangente hiperbólica e um algoritmo que ajuste cada função de ativação individualmente. - A utilização de outras variáveis, meteorológicas ou não, como dados de entrada. 6 - REFERÊNCIAS : [1] F. Buffa, I. Porceddu, Temperature Forecast and Dome Seeing Minimization, Telescopio Nazionale Galileo, Technical Report 67, Itália, 1997, Internet www.pd.astro.it/tng/public.html [2] G. Schaffar, S. Hertl, Major Developments for the Autonomous Forecast Model HS4Cast, Research Institute for Technical Physics, Áustria, 1998, Internet www.retzer-land.co.at/zikschaffar/hs4cast_b_arti.htm. [3] R. P. Lippman, "An Introduction to Computing with Neural Nets", IEEE ASSP Magazine, pp. 4-22, Abril 1989. [4] Z. L. Kovács, Redes Neurais Artificiais - Fundamentos e Aplicações, Edição Acadêmica, Brasil, 1996. [] D. Rumelhart, G. Hinton, R. Willians, Learning Internal Representations by r Propagation, in Parallel Distributed Processing Explorations in Microstrutures of Cognition, vol. 1 : Foundations, pp. 318-362, MIT Press, 1986.