Utilização de Redes Neurais Artificiais para Preenchimento de Falhas em Séries Horárias de Dados Meteorológicos Rodrigo Yoiti Tsukahara 1 Thomas Jensen 1 Paulo Henrique Caramori 1 Fundação ABC Pesquisa e Desenvolvimento Agropecuário Rodovia PR 11, km, Bom Sucesso, 1-9, Castro PR Brasil, email: rodrigo@fundacaoabc.org.br Instituto Agronômico do Paraná, Rodovia Celso Garcia Cid, km 37, Três Marcos, 7-9, Londrina PR - Brasil, email: caramori@iapar.br ABSTRACT: To solve the problem of data absence in weather series, several computational methods have been developed. This paper proposes an application of Artificial Neural Network technology to fill failures found in this kind of series. The data used in this paper were collected from automatic weather stations located around Paraná. This method was tested with a MLP neural network trained with the learning algorithm Resilient. In accordance with the results, artificial neural network can be used to fill data absence in weather series. Palavras-chave: Estações Meteorológicas Automáticas, Correção de Dados, Redes Neurais 1 INTRODUÇÃO A ausência de registros meteorológicos é um problema freqüente na maioria das séries climatológicas brasileiras, seja por falhas dos equipamentos, manutenção do sistema, calibração de instrumentos, coleta de dados, telemetria, controle de qualidade, entre outros. Entre os diversos métodos utilizados para preenchimento de falhas de dados meteorológicos podemos citar a utilização de procedimentos estatísticos, geoestatísticos ou computacionais. Especificamente sobre os métodos computacionais, os mais utilizados atualmente são os geradores de dados meteorológicos diários como o WGEN (Richardson & Wright, 19) ou geradores de dados mensais como o SIMMETEO (Geng et al., 19). Segundo Chibana et al. (), estes métodos computacionais (geradores) apresentam resultados satisfatórios para correção de falhas, dependendo da variável meteorológica a ser corrigida e do período de falha de dados (dias ou meses). Entretanto mesmo com estes resultados descritos em literatura, ainda existe uma dúvida sobre os métodos para preenchimento de falhas horárias em registros obtidos em estações meteorológicas automáticas, fato este agravado em função da crescente substituição das estações meteorológicas convencionais pelas automáticas. Soma-se ainda a este fato o desenvolvimento de técnicas computacionais como a inteligência artificial para reconhecimento de padrões de comportamento das variáveis meteorológicas, principalmente as redes neurais artificiais citadas por Haykin (), foco do presente trabalho. - MATERIAL E MÉTODOS Os dados utilizados neste estudo foram registrados pelas estações meteorológicas automáticas pertencentes ao Instituto Tecnológico SIMEPAR e posicionadas nos municípios de Curitiba, Entre Rios, Foz do Areia, Guarapuava, Jaguariaíva, Lapa, Palmas, Piraquara, Ponta Grossa, Teixeira Soares e União da Vitória-PR. Para cada localidade, foram utilizados os registros horários de pressão média (mb), temperatura média (ºC), temperatura mínima (ºC), temperatura máxima (ºC), radiação solar (W.m - ), umidade relativa, velocidade
instantânea do vento 1m (m.s -1 ), direção do vento 1m (m.s -1 ), velocidade de rajada do vento 1m (m.s -1 ) e precipitação, referentes ao mês de Novembro de 9. Inicialmente foram aplicados filtros individualizados por variável meteorológica registrada nas 11 estações automáticas, considerando a variação dos dados dentro deste intervalo de 3 dias. Finalizada esta fase inicial, determinou-se que as 11 entradas da rede neural seriam os dados observados para cada estação e variável, em um determinado horário. Já as saídas da rede neural, em número igual à entrada, seriam os dados corrigidos para cada horário e variável, através da utilização dos dados obtidos nas outras 1 estações meteorológicas. O treinamento da rede neural consistiu na utilização dos dados observados pelas estações automáticas somente nos dias pares, totalizando 1 épocas/ciclos para cada treinamento. Os dados observados nos dias ímpares foram utilizados somente para comparação entre os valores estimados pela rede neural artificial e os realmente observados nas estações automáticas. O desempenho das redes neurais foi avaliado através dos cálculos do erro médio (EM), o desvio padrão do erro médio (DP), a raiz do erro quadrado médio (REQM) e a correlação dos dados (CORR). O treinamento e os testes foram realizados através do software Encog Workbench criado pela Heaton Research (ENCOG, 9), configurado para uma rede neural do tipo MLP (Multi Layer Perceptron), com algoritmo de aprendizagem Resilient, composta por uma única camada oculta com neurônios. 3 RESULTADOS E DISCUSSÃO Os resultados obtidos através da comparação entre os dados meteorológicos estimados pela rede neural com os dados reais observados nas estações meteorológicas automáticas são apresentados na Tabela 1. Nesta podemos observar que a pressão atmosférica apresentou pequeno erro quando foram comparados a estimativa através da rede neural artificial com o valores originais, com erro máximo de +,mb para Palmas e mínimo de -,11mb para Curitiba, evidenciando a variabilidade dos resultados estatísticos de comparação em função da posição geográfica da estação meteorológica automática. Para a temperatura média e máxima, a rede neural apresentou tendência de subestimar, com a magnitude do erro (REQM) da ordem de 1,7ºC e 1,ºC respectivamente. Já a temperatura mínima apresentou erro médio (EM) de -,ºC, com uma fraca tendência de superestimar os valores. Quando analisamos o desempenho da rede neural para estimativa da radiação solar, visualizamos ainda na Tabela 1 um coeficiente de correlação (CORR) de,9, indicando que esta metodologia proposta conseguiu acompanhar as tendências observadas nas demais estações e conseqüentemente realizar uma boa estimativa da radiação, com EM de,1wm -. Da mesma forma como todas as variáveis anteriores, a umidade relativa do ar estimada através das redes neurais artificiais também apresentou elevados níveis de CORR. O comportamento observado nestas estimativas obteve forte tendência de subestimar os valores reais observados, uma vez que com 91% das estações apresentaram valores reais maiores do que os estimados. Em relação ao vento médio e máximo, observa-se na Tabela 1 comportamentos semelhantes, com níveis de CORR intermediários, da ordem de,71 e,77 e REQM de 1,m/s e 1,m/s respectivamente. A direção do vento, variável esta dependente muito da rugosidade do terreno e condições de relevo apresentou EM de -3,79º, tendência de subestimar os valores reais e baixos valores de CORR. Finalizando este trabalho, observamos que a precipitação pluvial apresentou uma estimativa não satisfatória através das redes neurais, com baixos níveis de correlação (,) e tendência de subestimar os dados reais. Vale ressaltar que estes resultados foram obtidos
através da técnica de redes neurais, utilizando 1 dias intercalados para treinamento e os demais dias para estimativa. Futuros trabalhos devem analisar os demais fatores como o treinamento da rede neural com dados de um período maior que um mês, efeito de ausência de um número maior de estações, determinação de estações climatologicamente parecidas. Tabela 1 Valores de EM, DP, REQM e CORR dos dados estimados pela RNA em relação aos dados observados nas estações automáticas, considerando os 1 dias para treinamento e os outros 1 dias para testes. Variável/Estação Pres média (mb) Tmédia (ºC) Tmin (ºC) Tmax ( C) Rad UR Vtmed (m/s) DirVtmed (graus) Vtmax (m/s) Parâmetro Curitiba Entre Rios Foz do Areia Guarapuava Lapa Palmas Pinhão Piraquara Ponta Grossa Teixeira Soares União da Vitória Média Geral Valor Máximo Valor Mínimo Freq.Negativos Freq.Positivos EM -,11,33,37,7 -,7,,7,,1,3,,, -,11 1% % DP,,1,7,,,7,71,,,7,7,,7, REQM,7,9,,7,3 1,11,71,9,,7,7, 1,11,3 CORR,9,9,93,93,99,9,9,9,97,9,9,9,99,9 EM -,37,3 -,3 -,3,1, -,9, -,,1 -,7 -,1,3 -,9 % % DP,9 1,7 1,7, 1,1 1,1 1,7 1,1 1,17 1,7 1, 1, 1,, REQM,97 1,19 1,,9 1,1 1, 1, 1,11 1,7 1,7 1, 1,7 1,,9 CORR,9,97,9,9,97,9,9,9,9,97,9,9,9,9 EM -,3, -,3 -,,11, -,3,1 -,1,,17 -,, -,3 % % DP,9,19 1,, 1,19 1, 1,,97 1,19 1,1 1,3 1,31,19, REQM 1,3,7 1,,9 1,19 1, 1,,9 1,9 1,1 1, 1,3,7,9 CORR,97,,9,9,97,93,9,97,9,97,9,9,9, EM -,37,7 -,1 -, -,11,33 -,7,1 -,,, -,11,7 -,7 % % DP, 1, 3,1,9 1, 1, 1,1 1,1 1,19 1, 1,7 1,1 3,1, REQM,93 1,17 3,1,97 1, 1,3 1, 1, 1,9 1,11 1, 1, 3,1,93 CORR,9,97,1,9,97,9,9,9,9,9,9,9,9,1 EM,1 -, 13,1,9, -39,,9 11, -1,1, 17,, 17, -39, 7% 73% DP 71, 77, 77, 7,9,7 131,7 91,1 7,3 1,, 11, 9, 131,7 7,9 REQM 71, 77, 7, 7,,7 137,3 91, 77, 1,,3 11,7 9, 137,3 7, CORR 1, 1, 1, 1, 1,,9 1, 1,,9 1,,9,9 1,,9 EM -1,1 -,9,3 -, -,7 -,1-1, -3,9 -,3-3, -, -3,,3-1, 91% 9% DP,3,,3 7,,3,3 1,,, 7,, 7,3 1,, REQM, 7,,3 7,,,,1,, 7,,,,1,3 CORR 1, 1,,9,9 1,,9, 1,,9,9 1,,9 1,, EM -,9 -,7 -,11 -, -, -,33 -,3,1 -,3,19,9 -,1,9 -, 73% 7% DP,1 1, 1,,99,,9 1,,7 1,,1,,99 1,,1 REQM, 1,11 1,3 1,1,,99 1,,77 1,,,9 1, 1,, CORR,,,1,,7,77,,9,9,,,71,,9 EM 1, -3, -9, -, -7, -,,, -1, -19, -, -3, 1, -19, 73% 7% DP, 7,9,1 1, 7, 9, 1,1,,7 9,3 7,,1 1,, REQM 7, 7,9, 1, 7,7 9,3 1,1,, 1,1 7,,7 1, 7, CORR,7,7,,,7,3,,7,7,,,,7,3 EM -,9 -,,19 -,73,7 -,,,1 -,3,7,77 -,7,77 -,73 % % DP 1,3 1,39 1,7 1,3 1,3 1, 1, 1,1 1,71 1,1 1,7 1,7 1,7 1,1 REQM 1,33 1, 1,7 1,7 1,3 1, 1, 1,1 1, 1, 1,9 1, 1,9 1,1 CORR,3,,7,3,7,7,77,3,7,7,9,77,,9
Precip EM -,13 -,1 -, -, -,1 -,7, -,9 -,1 -,, -,1, -,9 % % DP 3, 1,,7,, 1, 1,3,7 1,7,11 1,79 1, 3,,7 REQM 3, 1,3,7,, 1,7 1,3,7 1,7,11 1,7 1, 3,,7 CORR,11,3 -,1,,9,11,3,3,,7,,, -,1 A título de demonstração da variabilidade temporal das estimativas versus os valores reais, a Figura 1 representa para os melhores e os piores resultados obtidos no presente estudo. Figura 1 - Representação temporal do comportamento das estimativas realizadas através das redes neurais artificiais versus as observações, demonstrando os piores resultados (coluna da esquerda) e melhores resultados (direita) obtidos para cada variável meteorológica e estação automática, referente ao mês de Novembro/9. Pressão Média (hpa) PALMAS 9 9 9 9 Pressão Média (hpa) PONTA GROSSA 91 91 91 91 91 9 9 Mínima ( C) ENTRE RIOS 3 3 1 1 Mínima ( C) 3 3 1 1 Máxima ( C) FOZ DO AREIA Máxima ( C) 3 1 Radiação Solar PALMAS 1 1 Radiação Solar 1 1 Umidade Relativa PINHÃO 1 1 Umidade Relativa FOZ DO AREIA 1 Velocidade Média Vento (m/s) PONTA GROSSA 1 Velocidade Média Vento (m/s) TEIXEIRA SOARES 3 1
Direção Vento (º) 3 3 1 1 Direção Vento (º) 3 1 Velocidade de Rajada (m/s) UNIÃO DAVITÓRIA 1 1 Velocidade de Rajada (m/s) LAPA 1 Precipitação 7 3 1 Precipitação 1 1 1 CONCLUSÕES A partir dos resultados obtidos é possível dizer que a tecnologia de redes neurais artificiais pode ser adotada como um novo método no contexto da correção de dados meteorológicos horários. REFERÊNCIAS BIBLIOGRÁFICAS ENCOG. Encog Workbench. Disponível em <http://www.heatonresearch.com/> Data de Acesso: dez 9. CHIBANA, Eduardo Yasuji ; FLUMIGNAN, D. L. ; MOTA, Renata Gonçalves ; VIEIRA, André de Souza ; FARIA, Rogério Teixeira de. Estimativa de falhas em dados meteorológicos. In: V Congresso Brasileiro de Agroinformática,, Londrina,. GENG, S., PENNING DE VRIES, F.W., SUPIT, I., A simple method for generating daily rainfall data. Agricultural and Forest Meteorology, v.3, p.33 37, 19. HAYKIN, S. Redes Neurais: princípios e práticas. ª Edição. Canadá: Prentice Hall inc.,. RICHARDSON, C.W. and WRIGHT, D.A. WGEN: A model for generating daily weather variables. U.S. Department of Agriculture, Agriculture Research Service, Washington, D.C., ARS-, p., 19.