PREVISÃO DE CASOS DE DENGUE EM ITAJAÍ SC UTILIZANDO REDES NEURAIS ARTIFICIAIS COM SAÍDAS RECORRENTES ÀS ENTRADAS Munyque Mittelmann 1, Lucas Grigolon Varela 1, Daniel Gomes Soares 1 1 Instituto Federal Catarinense Campus Rio do Sul munyque@gmail.com,lucasgvarela@gmail.com,daniel@ifc-riodosul.edu.br Abstract. Objective: Use of Artificial Neural Networks (ANN) for the forecast dengue cases in the city of Itajaí - Santa Catarina. Method: The RNAs were trained and tested with various configurations of variables and data set. To evaluate the performance of the network was used metric RMSE (Root Mean Squared Error). Result: The best RMSE in the test set was 1,57E-04 and in the training set was 3,06E-13. Conclusion: The results demonstrate that it is possible to forecast dengue cases with error and antecedence acceptable, using RNAs and with the input meteorological data. Keywords: Artificial Intelligence; Artificial Neural Networks; Forecasting Dengue. Resumo. Objetivo: Utilização de Redes Neurais Artificiais (RNAs) para a previsão de casos de dengue no município de Itajaí - Santa Catarina. Metodologia: As RNAs foram treinadas e testadas com diversas configurações de variáveis e conjunto de dados. Para avaliar o desempenho das redes foi utilizada a métrica RMSE (Root Mean Squared Error). Resultado: O melhor RMSE no conjunto de testes foi 1,57E-04 e no conjunto de treinamento foi 3,06E-13. Conclusão: Os resultados demonstram que é possível fazer a previsão de casos de dengue, com erro e antecedências aceitáveis, utilizando-se RNAs e tendo como entrada dados meteorológicos. Palavras-chave: Inteligência Artificial; Redes Neurais Artificiais; Previsão de Dengue. 1. Introdução A dengue é uma doença transmitida pelo mosquito fêmea do gênero Aedes, principalmente o Aedes aegypti. Nos últimos anos houve um aumento significativo no número de casos confirmados, principalmente em países tropicais como o Brasil, causando sobre a população das áreas endêmicas prejuízos, não só a saúde, como também sociais e econômicos. A morbidade, mortalidade e implicação econômica da dengue a estabelecem como a mais importante arbovirose mundial (CARDOSO et al., 2011). A Organização Mundial de Saúde (OMS) estima que entre 50 e 100 milhões de pessoas se infectem anualmente em mais de 100 países, de todos os continentes, exceto Europa. Cerca de 550 mil doentes necessitam de hospitalização e 20 mil morrem em consequência da dengue.
Não há tratamento específico para a doença, mas cuidado médico apropriado pode salvar vidas (DIVE, 2014). O alerta precoce de surtos de dengue poderia melhorar a eficiência das campanhas de controle dos vetores da doença e contribuir no direcionamento de ações preventivas. Intervenções precoces poderiam reduzindo o impacto de uma epidemia no sistema de saúde. Assim, instituições de saúde poderiam adaptar a sua resposta em termos de disponibilidade de leitos e de mobilização de recursos humanos e materiais (GHARBI et al., 2011). Diversas técnicas de previsão de séries temporais podem ser utilizadas para previsão de casos de dengue, dentre as quais se encontram as Redes Neurais Artificiais (RNAs). RNAs são modelos computacionais inspirados no sistema nervoso de seres vivos. Possuem a capacidade de aquisição e manutenção do conhecimento e podem ser definidas como um conjunto de unidades de processamento, caracterizadas por neurônios artificiais, que são interligados por um grande número de interconexões (SILVA; SPATTI; FLAUZINO, 2010). RNAs podem ser descritas como sistemas paralelos distribuídos compostos por unidades de processamento simples (neurônios artificiais) que calculam determinadas funções não-lineares. Estas unidades são dispostas em uma ou mais camadas e interligadas por um grande número de conexões, geralmente unidirecionais (BRAGA; CARVALHO; LUDERMIR, 2011). A arquitetura de uma RNA define a maneira como os seus neurônios estão dispostos, uns em relação aos outros. Em uma arquitetura recorrente ou realimentada, as saídas dos neurônios são realimentadas como sinais de entrada para outros neurônios. Arquiteturas recorrentes incluem as redes auto-regressivas não-lineares com entradas exógenas (nonlinear autoregressive with external input - NARX), dentre outras. (SILVA; SPATTI; FLAUZINO, 2010). A saída da NARX no tempo t é dada por: y 1 = f(y t 1,, y t p, u t b,, u t b k+1 ) Onde u t e y t representam entradas e saídas do modelo no tempo t, compostas por p atrasos na saída, b atrasos na entrada, k o tempo morto da séria e a função f não-linear (BRAGA; CARVALHO; LUDERMIR, 2011). Redes NARX são aplicadas, principalmente, na previsão de séries temporais. Redes deste tipo têm superado outros modelos tradicionais de previsão de séries temporais, tais como, as redes do tipo Elman, as redes com atraso de tempo e os modelos estáticos (ADNAN et al., 2014). Uma rede NARX, representada pela Figura 1, permite a recuperação de respostas passadas a partir da realimentação de sinais produzidos em instantes anteriores (SILVA; SPATTI; FLAUZINO, 2010).
Figura 1 Exemplo de rede NARX. Fonte: Silva; Spatti; Flauzino (2010, p. 144). Este trabalho aplica a técnica de Redes Neurais Artificiais, especificamente redes NARXs, no contexto de previsão de dengue para o município de Itajaí SC. 2. Metodologia 2.1. Fonte de dados Neste trabalho, foram empregados dados meteorológicos e o número mensal de casos de dengue do município de Itajaí - Santa Catarina, referentes ao intervalo de junho de 2010 a julho de 2015. Os dados de casos confirmados de dengue foram obtidos através da Diretoria de Vigilância Epidemiológica de Santa Catarina (DIVE). Os dados de precipitação, temperatura máxima, temperatura mínima, temperatura do ar e umidade foram disponibilizados pelo Instituto Nacional de Meteorologia (INMET). Para evitar a saturação das funções de ativação utilizadas na RNAs modeladas, os dados foram normalizados nos intervalos de 0 a 1 e -1 e 1. 2.2. Configuração e treinamento da NARX As redes NARX foram construídas e treinadas por meio do Neural Network Toolbox do software Matlab. Dessa forma, a nomenclatura adotada para as funções de ativação e algoritmos de treinamento foi a mesma usada pelo software. Para encontrar a RNA com melhor desempenho, diversas configurações foram treinadas e testadas. Assim, os treinamentos foram realizados aplicando de 5 a 15 neurônios na camada intermediária. Além disso, foram empregados os algoritmos de treinamento TrainLM (Levenberg-Marquardt backpropagation) e TrainBR (Bayesian
regularization backpropagation). Na camada oculta, foram utilizadas as funções de ativação logística (LOGSIG) e tangente hiperbólica (TANSIG). Na camada de saída utilizada a função PURELIN (linear). A opção pela utilização de 5 a 15 neurônios na camada intermediária foi definida após a realização de alguns testes preliminares, em que se observou que o uso de menos de 5 e mais de 15 neurônios nesta mesma camada, não produzia melhoras significativas nos resultados, apenas aumentava significativamente o tempo de treinamento. A fim de minimizar a aleatoriedade das condições iniciais da rede, cada configuração da rede foi treinada 50 vezes, dentre as quais foi escolhida a rede que possuísse o menor RMSE. 3. Resultados e Discussão As redes NARX foram treinadas com diversas combinações de variáveis de entrada, por exemplo, removendo variáveis que pudessem ter menor relação com a previsão de dengue ou utilizando dados do mês anterior para prever o mês atual. O ano de 2015, no qual houve um grande surto da doença no local de interesse das previsões, foi atípico em relação aos outros anos. Devido a essa particularidade, diferentes treinamentos utilizaram os intervalos de dados de 2010 a 2014 ou de 2010 a 2015. A rede que obteve o menor RMSE durante os treinamentos utilizou como variáveis de entrada os dados de precipitação, temperatura máxima, temperatura mínima e temperatura do ar, durante o intervalo de 2010 a 2015. Esta RNA utilizou 13 neurônios na camada oculta, algoritmo de treinamento TrainLM e a função de ativação tangente hiperbólica. O RMSE no conjunto de teste foi 7,46E-02 e no conjunto de treinamento, 3,06E-13. A Figura 2 apresenta o gráfico da previsão dos casos de dengue pela NARX, em relação aos casos reais por mês. Figura 2 - Previsão de casos confirmados de dengue de junho de 2010 a julho de 2015, utilizando NARX. Fonte: Acervo dos autores.
Figura 3 - Previsão de casos confirmados de dengue de junho de 2010 a dez. de 2014, utilizando NARX. Fonte: Acervo dos autores. A RNA com menor RMSE na fase de testes utilizou os dados de temperatura máxima, temperatura mínima, temperatura do ar e a umidade com um mês de atraso, durante o intervalo de 2010 a 2014. Este treinamento utilizou 15 neurônios na camada oculta, algoritmo de treinamento TrainBR e a função de ativação logística. O RMSE no conjunto de teste foi 1,57E-04 e no conjunto de treinamento, 4,40E-04. A Figura 3 apresenta o gráfico da previsão dos casos de dengue pela NARX, em relação aos casos reais por mês. 4. Conclusão Neste trabalho, aplicou-se uma técnica de inteligência artificial, a saber, Redes Neurais Artificiais do tipo NARX, para previsão de casos mensais de dengue. A área de estudo escolhida foi o município de Itajaí SC, que possui uma das maiores incidências de dengue em Santa Catarina. Como variáveis de entrada do modelo, foram utilizados dados meteorológicos (precipitação, temperatura máxima, temperatura mínima, temperatura do ar e umidade). Diversas configurações de redes foram treinadas e testadas. O melhor desempenho dentre todas as configurações foi o da rede com 15 neurônios na camada oculta, algoritmo de treinamento TrainBR e função de ativação logística. Esta rede produziu as previsões de melhor qualidade dentre todas as RNAs testadas com RMSE de 1,57E-04. Apesar de uma rede ter obtido o melhor desempenho, no geral, praticamente todas as alternativas modeladas apresentaram baixo erro, com RMSE próximo de 0, demonstrando a eficiência e aplicabilidade das RNAs NARX neste tipo de problema, principalmente em regiões com poucos dados disponíveis, como é o caso da região de estudo deste trabalho, onde não é possível a utilização de modelos mais sofisticados.
Referências ADNAN, R. et al. 5 hours flood prediction modeling using improved NNARX structure: Case study Kuala Lumpur. Proceedings of the 2014 IEEE 4th International Conference on System Engineering and Technology, ICSET 2014, n. March 2016, 2014. BRAGA, A. DE P.; CARVALHO, A. P. DE L. F. DE; LUDERMIR, T. B. Redes Neurais Artificiais: Teoria e Aplicações. 2. ed. Rio de Janeiro: LTC, 2011. CARDOSO, I. M. et al. Dengue: clinical forms and risk groups in a high incidence city in the Southeastern region of Brazil. Revista Da Sociedade Brasileira De Medicina Tropical, v. 44, n. 4, p. 430 435, 2011. DIRETORIA DE VIGILÂNCIA EPIDEMIOLÓGICA DE SANTA CATARINA (DIVE). NOTA TÉCNICA Nº001 DIVE/SES/2014: orienta sobre as condutas frente à nova classificação de dengue, alterações na ficha de investigação e implantação do Sinan Online. Florianópolis, 2014. GHARBI, M. et al. Time series analysis of dengue incidence in Guadeloupe, French West Indies: forecasting models using climate variables as predictors. BMC infectious diseases, v. 11, n. August 2015, p. 166, 2011. SILVA, I. N. DA; SPATTI, D. H.; FLAUZINO, R. A. Redes Neurais Artificiais para engenharia e ciências aplicadas. São Paulo: Artliber, 2010.