Previsão da Temperatura da Água no Reservatório de Itaipu Utilizando o Método Não-Linear k-nearest Neighbor
|
|
- Vera Wagner Fidalgo
- 7 Há anos
- Visualizações:
Transcrição
1 Previsão da Temperatura da Água no Reservatório de Itaipu Utilizando o Método Não-Linear k-nearest Neighbor Carlos Andres Ferrero 1,2,4, Maria Carolina Monard 2,4, Huei Diana Lee 1,4, Simone Frederigi Benassi 3,4, Wu Feng Chung 1,4 1 Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Laboratório de Inteligência Computacional LABIC Caixa Postal 668, São Carlos, SP, Brasil 2 Centro de Engenharias e Ciências Exatas Universidade Estadual do Oeste do Paraná Laboratório de Bioinformática LABI Caixa Postal 39, Foz do Iguaçu, PR, Brasil 3 Superintendência de Meio Ambiente, Divisão de Reservatórios Itaipu Binacional Caixa Postal 39, Foz do Iguaçu, PR, Brasil 4 Centro de Estudos Avançados em Segurança de Barragens CEASB Parque Tecnológico Itaipu PTI {anfer,mcmonard}@icmc.usp.br,huei@pti.org.br Abstract. The goal of time series forecasting is extrapolating past behavior into the future. To this end, several methods have been proposed, among them nonlinear forecasting methods. Some nonlinear forecasting methods are based on the k-nearest Neighbor algorithm, and have been used to model environmental behaviors. In this work, we applied a k-nearest Neighbor forecasting methodology to predict future Itaipu lake s water temperature. Our methodology considers two prediction functions as well as different numbers of nearest neighbors. Experimental results show that the proposed methodology is suitable to implement decision support systems. Resumo. A previsão de dados temporais é uma tarefa de interesse para diversas áreas, inclusive para o monitoramento ambiental. Métodos para realizar essa tarefa têm sido propostos e aplicados. Especificamente os que permitem prever comportamentos não lineares têm apresentado-se apropriados para a previsão de comportamentos ambientais. Neste trabalho, é apresentada uma metodologia para a previsão de dados temporais utilizando o algoritmo k-nearest Neighbor para a previsão de dados ambientais. Foram utilizadas duas funções para o cálculo do valor futuro e avaliadas para diferentes valores do parâmetro k do algoritmo. Os resultados mostraram que a metodologia e as funções de predição são promissoras para a construção de sistemas de suporte à previsão de dados. 1. Introdução Sistemas computacionais para gerenciamento de dados permitem, cada vez mais, o armazenamento de informações de diversas áreas do conhecimento. Esse acúmulo de
2 informações faz com que haja a necessidade de utilizar métodos computacionais que permitam organizá-los e analisá-los, com o objetivo de extrair informações adicionais que permitam, por exemplo, auxiliar especialistas em processos de tomada de decisão. Na área de Seguranca de Barragens, essa análise é de grande importância devido ao fato de que os dados coletados periodicamente por sensores contêm informações a respeito do estado da barragem. Como esses dados coletados por sensores constituem observações realizadas seqüencialmente ao longo do tempo, é fundamental considerar a ordem dos dados. Essa restrição não permite a aplicação direta do processo de mineração de dados. Desse modo, é necessário o desenvolvimento e a aplicação de métodos de pré-processamento, extração de padrões e interpretação de bases de dados temporais. Assim, os dados temporais referentes à Segurança de Barragens necessitam ser pré-processados para, posteriormente, serem analisados por meio do processo de mineração de dados [Witten and Frank 2005]. Nesse sentido, está sendo desenvolvido o projeto Análise Inteligente de Dados de Séries Temporais para Segurança de Barragens, em uma parceria entre o Laboratório de Inteligência Computacional LABIC da Universidade de São Paulo USP / São Carlos, o Laboratório de Bioinformática LABI da Universidade Estadual do Oeste do Paraná UNIOESTE / Foz do Iguaçu e o Centro de Estudos Avançados em Segurança de Barragens CEASB do Parque Tecnológico Itaipu PTI. O projeto contempla três etapas, ilustradas na Figura 1. A primeira consiste no pré-processamento dos dados temporais. A idéia é utilizar diversos métodos de limpeza e transformação de dados, bem como métodos de extração e seleção de características, com o objetivo de obter uma descrição estruturada dos dados a serem analisados, além de construir modelos matemáticos que representem o comportamento das Séries Temporais ST. Posteriormente, na Etapa 2, com base nessa descrição estruturada dos dados, pode ser aplicado o processo de mineração de dados. Os padrões extraídos nesse processo, conjuntamente com os modelos matemáticos construídos, podem ser considerados para a realização de diversas tarefas de interesse, tais como a análise comportamental de fenômenos, a detecção de anomalias, a predição de eventos e a detecção de padrões, entre outras. Na terceira etapa, avaliação de riscos, o conhecimento extraído e os padrões encontrados na etapa anterior, podem ser utilizados para realizar as atividades de identificação, estimação, avaliação e controle de riscos. O objetivo deste trabalho em andamento, o qual está inserido dentro da etapa de descoberta de padrões, é apresentar uma metodologia que utiliza o algoritmo k-nearest Neighbor knn para a previsão de dados temporais relacionados ao tema Segurança de Barragens. A metodologia foi aplicada a uma série de dados limnológicos 1, utilizando duas funções para o cálculo do valor futuro e diferentes valores do parâmetro k do algoritmo. A partir dos resultados foi possível observar que a metodologia e as funções de predição são promissoras para a construção de sistemas de suporte à previsão de dados. O restante deste trabalho está organizado do seguinte modo: na Seção 2 é descrita a metodologia proposta; na Seção 3 é apresentado o estudo de caso em dados ambientais; e, na Seção 4, são apresentados a conclusão e os trabalhos futuros. 1 A limnologia é a ciência que estuda as aguas continentais.
3 Figura 1. Projeto de Análise Inteligente de Dados de Séries Temporais para Segurança de Barragens. 2. Metodologia de Previsão de Dados Temporais Uma das tarefas de maior interesse para qualquer área de conhecimento que esteja interessada em analisar fenômenos do ponto de vista temporal, consiste na previsão de valores futuros a partir do histórico da série em questão. Dependendo do objetivo da tarefa, as previsões podem apresentar características específicas. Por exemplo, em problemas de monitoramento, é desejável que as previsões sejam realizadas a curto prazo. O problema de previsão em séries temporais consiste em predizer o valor de x t+1 de uma série temporal X = (x 1, x 2,..., x n ), utilizando os valores anteriores a t + 1, isto é, x t, x t 1, x t 2,..., x t m+1, onde m corresponde ao número de valores prévios da série X utilizados para realizar a previsão. De acordo com [Sorjamaa et al. 2007], o cálculo do próximo valor de uma série temporal pode ser definido conforme a Equação 1. x t+1 = f 1 (x t, x t 1, x t 2,..., x t m+1 ) (1) As técnicas de previsão utilizam, de modo geral, duas abordagens. A primeira corresponde à utilização de métodos lineares, que consistem em ajustar aos dados modelos Auto-regressivos (AR); Médias Móveis (MA Moving Average); Auto-regressivos
4 de Médias Móveis (ARMA Auto-regressive Moving Average) e Auto-regressivos de Médias Móveis Integrados (ARIMA Auto-regressive Integrated Moving Average). A segunda abordagem corresponde à utilização de modelos não lineares, isto é, métodos que permitem prever comportamentos e encontrar padrões não lineares [Yankov et al. 2006]. Exemplos desse tipo de métodos são os baseados no algoritmo k-nearest Neighbor e em redes neurais artificiais [Karunasinghe and Liong 2006]. Os baseados no método knn podem ser apropriados para a modelagem de comportamentos da natureza e constituem o foco deste trabalho. O método k-nearest Neighbor é um método de aprendizado que permite realizar previsões de valores futuros baseando-se nos valores registrados do passado. A idéia consiste em, considerando os últimos N u registros ocorridos, encontrar as M s seqüências de tamanho N u que apresentam comportamentos similares no passado. Com base nas informações dessas M s seqüencias, é realizado o cálculo do valor futuro x t+1. A metodologia proposta neste trabalho para a aplicação do knn consiste de quatro fases: (1) Preparação do conjunto de treinamento, (2) Obtenção dos k vizinhos mais próximos, (3) Cálculo do valor futuro e (4) Avaliação do método de previsão. Essas fases são descritas a seguir Preparação do Conjunto de Treinamento Para que o método knn possa ser aplicado, é necessário construir o conjunto de séries de treinamento, i.e, todos os exemplos de séries que devem ser lembrados pelo algoritmo knn para encontrar as seqüências similares. Considerando a ST X = (x 1, x 2,..., x n ) e U = (x n Nu, x n Nu+1,..., x n ) os últimos N u valores de X, cada elemento do conjunto de séries de treinamento S = {s 1, s 2, s n Nu } é definido pela Equação 2. s 1 = (x 1, x 2,..., x Nu, x Nu+1) s 2 = (x 2, x 3,..., x Nu+1, x Nu+2) s 3 = (x 3, x 4,..., x Nu+2, x Nu+3). s n Nu = (x n Nu, x n Nu+1,..., x n 1, x n ) (2) 2.2. Obtenção dos k Vizinhos mais Próximos Para a aplicação do knn em séries temporais, três características importantes devem ser consideradas: (a) o número de registros que devem ser lembrados (tamanho do conjunto de treinamento); (b) a medida a ser utilizada para quantificar a similaridade entre a seqüencia procurada e cada série do conjunto de treinamento; e (c) o número de vizinhos mais próximos utilizado para o cálculo do valor futuro. Essas características, as quais influenciam fortemente o desempenho dos métodos de previsão, são descritas a seguir: Tamanho da série de treinamento: a complexidade de knn em tempo e espaço depende do tamanho do conjunto de treinamento [Alpaydin 2004]. Assim, se todos os registros são memorizados, a procura pelas seqüências similares pode tornar-se um processo lento. Para contornar esse problema podem ser consideradas apenas as séries mais representativas do conjunto de treinamento, resumindo a informação mais importante em um conjunto menor de dados. Outra abordagem é considerar apenas as séries mais recentes.
5 Medida de similaridade: a noção de similaridade é um aspecto decisivo no contexto de análise de dados. Entretanto, o critério de decisão a respeito do que deve ser considerado similar é bastante subjetivo, pois depende de diversos fatores como o domínio de aplicação e do método para o cálculo dessa similaridade. No contexto de séries temporais são usadas distintas medidas para calcular a similaridade entre duas séries temporais, as quais variam de acordo com as características da série e com o modo como essa série é representada [Fink 2004, Vlachos and Gunopulos 2004]. Dentre essas medidas, a distância Euclidiana é a mais utilizada para a comparação de séries temporais [Keogh and Kasetty 2002], determinando a distância no espaço R m entre dois pontos, onde m corresponde ao tamanho da seqüência considerada. Cardinalidade do conjunto de vizinhos mais próximos: o cálculo do valor futuro depende do número de vizinhos mais próximos (k) que é considerado pelo algoritmo. Os k vizinhos mais próximos constituem o conjunto S = {s 1, s 2,..., s k } S de cardinalidade S = k Cálculo do Valor Futuro A partir do conjunto S, que contém k séries temporais de comportamento mais próximo, uma função f(s 1, s 2,..., s k ) é utilizada para o cálculo do valor futuro. Diversas funções foram propostas na literatura e, neste trabalho, são utilizadas duas. A primeira, média local, consiste no cálculo da média dos valores que sucedem a cada seqüência [McNames 1999], neste trabalho denominada Média de Valores Absolutos MVA. A segunda função consiste em, a partir da diferença ocorrida entre o último valor de cada seqüência e o valor que a sucede, calcular o valor futuro pela soma do último valor amostrado e a média das diferenças encontradas. Essa última função é denominada neste trabalho Média de Valores Relativos MVR Avaliação do Método de Previsão Nesta etapa, o método de previsão construído é avaliado e validado, utilizando duas abordagens. A primeira consiste na utilização de medidas objetivas e, a segunda, no parecer dos especialistas do domínio. Medidas para avaliar a qualidade de métodos de previsão permitem auxiliar na análise do desempenho desses métodos de modo mais objetivo. Essa análise pode ser realizada por meio de diversas métricas amplamente divulgadas na literatura [Daliakopoulosa et al. 2004, Karunasinghe and Liong 2006]. Uma análise a respeito das características dessas medidas de avaliação é apresentada em [Hyndman and Koehler 2006]. Quatro métricas são utilizadas neste trabalho, três delas, Erro Médio Absoluto EMA, Desvio-Padrão Absoluto DPA e Coeficiênte de Correlação R 2, são definidas, respectivamente, pelas Equações 3, 4 e 5, onde Z(t) = (z 1, z 2,..., z No ) é a série temporal de valores observados; Ẑ(t) = (ẑ 1, ẑ 2,..., ẑ No ) é a série temporal correspondente calculada; N o corresponde ao número de valores observados; e e(t) = Ẑ(t) Z(t) é a diferença entre os valores preditos e os observados. EMA = média( e ) (3) DP A = desvio-padrão( e ) (4)
6 R 2 = 1 No i=1 (z i ẑ i ) 2 No i=1 z2 i No i=1 ẑ2 i N o (5) A terceira medida de avaliação utilizada neste trabalho, denominada Erro de Direção ED, consiste na percentagem de valores previstos que cresceram ou decresceram conforme esperado. Para a construção dessa medida são considerados o último valor observado, o valor de previsão observado e o valor previsto. Se o valor de previsão observado e o valor previsto são ambos maiores (ou menores) do que o último valor observado, então a direção do valor de previsão observado e do valor previsto é a mesma, caso contrário, ocorre um ED devido à previsão em direção contraria à esperada. 3. Aplicação da Metodologia para a Previsão de Dados Ambientais A avaliação de riscos em uma barragem deve ser capaz de identificar problemas e recomendar soluções para esses problemas, tais como estratégias corretivas e operacionais [Pan and He 2000]. Para auxiliar nesse processo de avaliação de riscos, é necessário que sejam realizadas coletas de dados através de monitoramentos freqüentes, com o objetivo de manter a integridade de todas as áreas relacionadas à barragem. Como os dados são temporais, uma solução adequada consiste em representar o problema por meio de séries temporais e análisá-las utilizando técnicas desse tipo de dados. O monitoramento ambiental é definido como o conjunto de dados físicos, químicos e biológicos de um ecossistema em estudo, que permite obter informações a respeito da qualidade das águas, um tema de importância para a segurança de barragens. O monitoramento consiste de repetidas observações, medidas, registros ambientais e parâmetros operacionais em um período de tempo. A Itaipu Binacional possui uma equipe de especialistas e uma rede de monitoramento de qualidade de água que está distribuída entre o reservatório e os seus afluentes. Os dados coletados pela Itaipu Binacional envolvem a medição de variáveis físicas e químicas climatológicas e da água. As amostras de água são coletadas na superfície e em diferentes profundidades. A partir das amostras coletadas são medidas as seguintes variáveis: alcalinidade total, clorofila a, condutividade, Demanda Bioquímica de Oxigênio (5 dias) DBO 5, Demanda Química de Oxigênio DQO, fósforo total, nitrato, nitrito, nitrogênio amoniacal, nitrogênio Kjedahl, oxigênio dissolvido, ph, saturação de oxigênio, sólidos suspensos, temperatura, turbidez e transparência da água e temperatura do ar. Dentre esses dados, neste trabalho foram considerados registros trimestrais de temperatura da água, coletados em superfície, na estação E5, localizada a 15 km a montante da barragem, no período compreendido entre 1994 e Nesse períoddo foram coletadas 44 observações, as quais constituem a série temporal de temperaturas T (t) = {x 1, x 2,..., x 44 } a ser analisada. A metodologia apresentada na Seção 3 para a previsão de dados utilizando o algoritmo k-nearest Neighbor foi aplicada a essa série temporal. Assim, a partir de T foram criados dez conjuntos de experimentação, definidos por E = {e 1, e 2,..., e 10 }, em que cada elemento de E é definido por e i = {X i, x j }, onde X i corresponde a uma subsérie de X e x j ao valor a ser previsto. Esses conjuntos foram construídos conforme a Equação 6.
7 e 1 = {(x 1, x 2,..., x 34 ), x 35 } e 2 = {(x 1, x 2,..., x 35 ), x 36 }. e 10 = {(x 1, x 2,..., x 43 ), x 44 } (6) Para cada um destes experimentos foi realizada a previsão de x j utilizando a metodologia apresentada na Seção 3. Na Etapa (1) da metodologia, preparação do conjunto de treinamento, foi utilizada a série de treinamento contida em cada experimento para construir o conjunto de séries de treinamento S i e, conseqüêntemente, a série dos últimos valores registrados U i. Neste trabalho, a cardinalidade de U i foi definida como N u = 4, que representa o período de um ano de coleta. Na Etapa (2), obtenção dos k vizinhos mais próximos, foram procuradas as subseqüências de S i mais próximas de U i. Na questão (a), sobre o número de subseqüências em S i a serem consideradas, foi utilizado o conjunto completo, pois o tamanho da amostra não é suficientemente grande para influenciar no desempenho do algoritmo knn. Em relação à medida de similaridade questão (b) foi utilizada a distância Euclidiana e, para obter uma medida orientada à morfologia da seqüência, foi realizada uma tranformação de translação, a qual consiste na subtração do valor médio da seqüência a cada valor da seqüência, antes do cálculo da distância. Para a questão (c), de escolha do número k de vizinhos mais próximos, foram utilizados os valores de k = 1, 2, 3, 4 e 5, no intuito de encontrar o número de vizinhos mais próximos que poderia proporcionar melhores valores de previsão. Temperatura da água ( C) Dados registrados Última seqüência Seqüências similares MVA MVR Tempo (anos) Figura 2. Exemplo do resultado da aplicação das funções MVA e MVR para o cálculo do valor de futuro em dados de temperatura da água. Na etapa (3), cálculo do valor futuro, foram utilizadas as duas funções apresentadas na Seção 2.3, média dos valores absolutos (MVA) e média dos valores relativos
8 (MVR). Na Figura 2 é apresentado um exemplo da aplicação do método knn utilizando k = 3. No gráfico, a linha cinza representa os valores registrados; a linha vermelha, a seqüência dos 4 últimos valores ocorridos, isto é, os registros de um período de um ano; e, a linha verde, as seqüências similares ao período em questão, encontradas pelo algoritmo. Utilizando os valores sucessores de cada uma das seqüências mais similares foi realizada a previsão do valor do quarto trimestre de Nessa figura, é ilustrado o resultado da aplicação de duas funções diferentes de previsão (representadas por círculo e quadrado vermelhos, respectivamente). Os valores de temperatura resultantes da aplicação das funções MVA e MVR para cada k e os correspondentes coeficientes de correlação R 2, são apresentados na Tabela 1. Tabela 1. Valores de previsão resultantes da aplicação das funções MVA e MVR para cada k. Valor Valores de previsão ( o C) real k = 1 k = 2 k = 3 k = 4 k = 5 Registro ( o C) MVA MVR MVA MVR MVA MVR MVA MVR MVA MVR x 35 19, 8 20, 0 21, 4 20, 4 21, 9 19, 8 22, 2 20, 1 22, 8 20, 4 23, 1 x 36 26, 5 28, 2 28, 0 27, 8 27, 2 27, 7 27, 7 27, 3 26, 9 27, 3 26, 8 x 37 28, 8 28, 5 26, 8 28, 5 27, 2 28, 4 27, 7 28, 4 27, 6 28, 5 27, 8 x 38 23, 3 24, 8 25, 1 24, 1 24, 4 23, 6 24, 0 24, 2 24, 7 23, 8 24, 2 x 39 20, 2 20, 8 19, 6 19, 7 19, 7 19, 8 19, 3 20, 3 19, 9 20, 5 20, 2 x 40 25, 9 27, 4 26, 8 27, 5 28, 0 27, 0 27, 0 26, 6 26, 7 26, 7 26, 7 x 41 28, 9 28, 2 28, 0 28, 4 27, 5 28, 4 28, 1 28, 4 27, 8 28, 5 27, 8 x 42 20, 8 22, 2 22, 5 24, 2 24, 7 23, 5 23, 8 23, 8 24, 1 24, 0 24, 1 x 43 18, 1 19, 7 18, 3 19, 1 17, 8 19, 8 18, 2 19, 9 18, 1 20, 1 17, 9 x 44 24, 7 25, 3 23, 7 26, 5 25, 4 26, 3 24, 9 26, 2 24, 4 26, 5 24, 4 Coeficiente R 2 0, 95 0, 87 0, 90 0, 80 0, 92 0, 87 0, 93 0, 84 0, 93 0, 84 Como pode ser observado, a função MVA apresentou sempre valores de correlação maiores para as previsões, considerando cada k, em relação à função MVR. Em relação a MVA, o menor valor de correlação foi 0, 90 correspondepente a k = 2, enquanto o maior valor foi de 0, 95 correspondente a k = 1. No caso de MVR, o menor R 2 foi de 0, 80 referente a k = 2 e, o maior, de 0, 87, referente a k = 1 e 3. Posteriormente, foi realizada uma análise sobre os erros de previsão correspondentes à aplicação de cada função de previsão. Para uma análise mais clara desses erros foi conservado o sinal positivo (+) ou negativo ( ), conforme o valor previsto estivesse acima (+) ou abaixo ( ) do valor real de temperatura. Na Tabela 2, são apresentados os erros dos valores de previsão de temperatura utilizando as funções MVA e MVR para cada k e os respectivos erro médio absoluto, desvío-padrão absoluto e erro de direção. Com base nessas informações pode ser evidenciado que, em relação ao erro médio absoluto, a função MVA apresentou o menor valor (0, 99 com DPA de 0, 83) para k = 3 e o maior valor (1, 18 com DPA 0, 93), para k = 2. A função MVR, apresentou menor valor de EMA (1, 12 com DPA de 1, 21), correspondente a k = 5 e maior valor (1, 44 com DPA de 1, 07) para k = 2. O teste estatístico ANOVA para dados emparelhados foi aplicado para verificar a existencia de diferença estatisticamente significativa entre os erros de previsão considerando os diferentes valores de k. Os p valores para as funções MVA e MVR foram 0, 8399 e 0, 6205, respectivamente, não sendo possível afirmar que para
9 Tabela 2. Erros de previsão utilizando as funções MVA e MVR para cada k. Valor Erros de previsão ( o C) real k = 1 k = 2 k = 3 k = 4 k = 5 Registro ( o C) MVA MVR MVA MVR MVA MVR MVA MVR MVA MVR x 35 19, 8 +0, 2 +1, 6 +0, 6 +2, 1 +0, 0 +2, 4 +0, 3 +3, 0 +0, 6 +3, 3 x 36 26, 5 +1, 7 +1, 5 +1, 3 +0, 7 +1, 2 +1, 2 +0, 8 +0, 4 +0, 8 +0, 3 x 37 28, 8 0, 3 2, 0 0, 3 1, 6 0, 4 1, 1 0, 4 1, 2 0, 3 1, 0 x 38 23, 3 +1, 5 +1, 8 +0, 8 +1, 1 +0, 3 +0, 7 +0, 9 +1, 4 +0, 5 +0, 9 x 39 20, 2 +0, 6 0, 6 0, 5 0, 5 0, 4 0, 9 +0, 1 0, 3 +0, 3 +0, 0 x 40 25, 9 +1, 5 +0, 9 +1, 6 +2, 1 +1, 1 +1, 1 +0, 7 +0, 8 +0, 8 +0, 8 x 41 28, 9 0, 7 0, 9 0, 5 1, 4 0, 5 0, 8 0, 5 1, 1 0, 4 1, 1 x 42 20, 8 +1, 4 +1, 7 +3, 4 +3, 9 +2, 7 +3, 0 +3, 0 +3, 3 +3, 2 +3, 3 x 43 18, 1 +1, 6 +0, 2 +1, 0 0, 3 +1, 7 +0, 1 +1, 8 +0, 0 +2, 0 0, 2 x 44 24, 7 +0, 6 1, 0 +1, 8 +0, 7 +1, 6 +0, 2 +1, 5 0, 3 +1, 8 0, 3 EMA 1, 01 1, 22 1, 18 1, 44 0, 99 1, 15 1, 00 1, 18 1, 07 1, 12 DPA 0, 58 0, 58 0, 93 1, 07 0, 83 0, 91 0, 88 1, 13 0, 96 1, 21 ED 0, 00 0, 00 0, 00 0, 00 0, 00 0, 00 0, 00 0, 00 0, 00 0, 00 algum valor de k os erros de previsão sejam menores em relação aos erros de previsão dos outros valores de k. Por outro lado, em relação ao erro de direção, tanto a função MVA quanto a função MVR não apresentaram ED. 4. Conclusão O desenvolvimento de sistemas computacionais que permitem o armazenamento e a organização de informação tem promovido um aumento das bases de dados em todas as áreas do conhecimento. Nesse sentido, diversas áreas de pesquisa têm se interessado em compreender fenômenos que transcendem no tempo. Neste trabalho foi apresentada uma metodologia para a previsão de dados temporais utilizando o método k-nearest Neighbor. A metodologia foi aplicada a uma série de dados ambientais de temperatura da água, utilizando as funções de cálculo de valor de previsão, média de valores absolutos e média de valores relativos. O parâmetro k do método Nearest Neighbor, o qual especifica a cardinalidade do conjunto de vizinhos mais próximos utilizado para o cálculo do valor futuro, foi avaliado com os valores k = 1, 2, 3, 4 e 5, no intuito de encontrar o melhor valor de k para a série de dados utilizada. Os resultados evidenciam que a função de média de valores absolutos teve melhor desempenho que a função de média de valores relativos, para o conjunto de dados considerado neste trabalho, em relação à medida de coeficiente de correlação. Os melhores valores de k em para o coeficiente de correlação R 2 foram, k = 1 para a função MVA e k = 1 e 3 para MVR. Por outro lado, em relação ao erro médio absoluto, o melhor valor de k foi k = 3 para MVA e k = 5 para MVR, em que para cada função não foi possível encontrar diferença estatisticamente significativa em relação à variação do parâmetro k de 1 até 5. Isso indicou que, tanto para a função MVA quanto para a função MVR, nenhum valor k apresentou erro de previsão significativamente menor. Considerando o erro de direção, ambas funções de previsão apresentaram erro de previsão igual a 0, independemente do valor de k. Desse modo, não foi possível determinar qual função. juntamente com um valor de k, permite obter previsões significativamente mais precisas. Além disso, os especialistas da área de domínio consideraram os resultados pro-
10 missores para a construção de sistemas computacionais de suporte à previsão. Trabalhos futuros incluem a aplicação da metodologia para a previsão de outras variáveis coletadas, como alcalinidade total, clorofila a, entre outras, a utilização de períodos maiores de coleta para aumentar o tamanho do conjunto de séries de treinamento, a utilização de outras funções de cálculo de valor futuro e a aplicação de outros métodos de previsão de comportamentos lineares e não lineares. 5. Agradecimentos Ao Programa de Desenvolvimento Tecnológico Avançado PDTA-FPTI/BR e ao Centro de Estudo Avançados em Segurança de Barragens CEASB, pelo auxilio mediante a linha de financiamento de bolsas. Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico CNPq pelo apoio fincanceiro. Referências Alpaydin, E. (2004). Introduction to Machine Learning. MIT Press, Cambridge MA, England. Daliakopoulosa, I. N., Coulibalya, P., and Tsanis, I. K. (2004). Groundwater level forecasting using artificial neural networks. Journal of Hydrology, 309(1 4): Fink, E. (2004). Data Mining in Time Series Databases, volume 57 of Machine perception and artificial intelligence, chapter Indexing of Compressed Time Series, pages World Scientific, Singapore. Hyndman, R. J. and Koehler, A. B. (2006). Another look at measures of forecast accuracy. International Journal of Forecasting, 22(4): Karunasinghe, D. S. K. and Liong, S.-Y. (2006). Chaotic time series prediction with a global model: Artificial neural network. Journal of Hydrology, 323(1-4): Keogh, E. and Kasetty, S. (2002). On the need for time series data mining benchmarks: a survey and empirical demonstration. In Proceedings of the 8th International Conference on Knowledge Discovery and Data Mining, pages , New York, USA. McNames, J. (1999). Innovations in Local Modeling for Time Series Prediction. Tese de doutorado, Stanford. Disponível em: mcnames/ Publications/Dissertation.pdf. Pan, J. and He, J. (2000). Large Dams in China: a fifty year review. China WaterPower Press, Beijing, China. Sorjamaa, A., Hao, J., Reyhani, N., Ji, Y., and Lendasse, A. (2007). Methodology for long-term prediction of time series. Neurocomputing, 70(16-18): Vlachos, M. and Gunopulos, D. (2004). Data Mining in Time Series Databases, chapter Indexing Time-Series Under Conditions of Noise, pages Machine perception and artificial intelligence. World Scientific. Witten, I. H. and Frank, E. (2005). Data Mining: Practical Machine Learning Tools and Techniques. Elsevier, San Francisco CA, USA, 2 edition. Yankov, D., DeCoste, D., and Keogh, E. J. (2006). Ensembles of nearest neighbor forecasts. In European Conference on Machine Learning, pages
Proposta de uma Função de Previsão de Dados Temporais para o Algoritmo dos Vizinhos mais Próximos
Proposta de uma Função de Previsão de Dados rais para o Algoritmo dos Vizinhos mais Próximos Carlos Andres Ferrero 1,2, Maria Carolina Monard 1, Huei Diana Lee 2, and Wu Feng Chung 2 1 Instituto de Ciências
Extração de Padrões e Construção de Modelos Simbólicos para Previsão de Dados Temporais
Extração de Padrões e Construção de Modelos Simbólicos para Previsão de Dados Temporais Carlos Andres Ferrero 1, André Gustavo Maletzke 1, Huei Diana Lee 1, Gustavo E. A. P. A. Batista 2, Wu Feng Chung
Ontologias Como Apoio Ao Mapeamento De Laudos Médicos De Endoscopia Digestiva Alta Para Bases De Dados Estruturadas
Ontologias Como Apoio Ao Mapeamento De Laudos Médicos De Endoscopia Digestiva Alta Para Bases De Dados Estruturadas Luiz Henrique Dutra da Costa (PIBIC/Unioeste), Carlos Andres Ferrero, Cláudio Saddy Rodrigues
Avaliação do Algoritmo de Força-Bruta para a Identificação de Padrões Freqüentes em Séries Temporais
Avaliação do Algoritmo de Força-Bruta para a Identificação de Padrões Freqüentes em Séries Temporais Daniel Moreira Cestari 1, André Gustavo Maletzke 1,2,3, Gustavo E.A.P.A Batista 1,3 1 Instituto de Ciências
Estudo da Influência de diversas Medidas de Similaridade na Previsão de Séries Temporais utilizando o Algoritmo knn-tsp
Estudo da Influência de diversas Medidas de Similaridade na Previsão de Séries Temporais utilizando o Algoritmo knn-tsp Jorge Aikes Junior 1, Huei Diana Lee 1, Carlos Andrés Ferrero 1, Feng Chung Wu 12
Aplicação de Métodos de Séries Temporais para a Identificação de Seções em Exames de Manometria Anorretal
Aplicação de Métodos de Séries Temporais para a Identificação de Seções em Exames de Manometria Anorretal Carlos Andres Ferrero 1,2, Huei Diana Lee 1, Maria Carolina Monard 2, Wu Feng Chung 1,3, Cláudio
Estudo e Avaliação da Seleção de Atributos para Pré-processamento no Processo de Mineração de Dados
Estudo e Avaliação da Seleção de Atributos para Pré-processamento no Processo de Mineração de Dados Silvani Weber da Silva Borges 1 (PIBIC/CNPq/Unioeste), Renato B. Machado (Orientador), Newton Spolaôr
Previsão de séries temporais através da combinação de modelo híbrido ARIMA e redes neurais artificiais
Universidade Federal de Pernambuco Centro de Informática Graduação em Ciências da Computação Previsão de séries temporais através da combinação de modelo híbrido ARIMA e redes neurais artificiais Pedro
Uma Avaliação sobre a Identificação de Motifs em Séries Temporais
Uma Avaliação sobre a Identificação de Motifs em Séries Temporais André Gustavo Maletzke 1,2,3, Gustavo E.A.P.A Batista 1,3, Huei Diana Lee 2,3 1 Instituto de Ciências Matemáticas e de Computação Universidade
Mineração de Séries Temporais por meio da Extração de Características e da Identificação de Motifs
Mineração de Séries Temporais por meio da Extração de Características e da Identificação de Motifs André Gustavo Maletzke 1,2, Gustavo E.A.P.A Batista 1, Huei Diana Lee 2, Feng Chung Wu 2 1 Instituto de
Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais
Universidade de São Paulo Biblioteca Digital da Produção Intelectual - BDPI Departamento de Ciências de Computação - ICMC/SCC Comunicações em Eventos - ICMC/SCC 2015 Identificação de Pontos Perceptualmente
CÁLCULO DO EQUILIBRIO DE TROCA-IÔNICA DO SISTEMA Na + -Pb 2+ -Cu 2+ USANDO REDES NEURAIS ARTIFICIAIS.
CÁLCULO DO EQUILIBRIO DE TROCA-IÔNICA DO SISTEMA Na + -Pb 2+ -Cu 2+ USANDO REDES NEURAIS ARTIFICIAIS. A. B. B. GIOPATTO 1, E. A. SILVA 2, T. D. MARTINS 1 1 Universidade Federal de São Paulo, Departamento
Aprendizagem de Máquina
Aprendizagem de Máquina Apresentação da Disciplina Alessandro L. Koerich 2008 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem
18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA
18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio
Uma Abordagem de Extração de Terminologia Para a Construção de uma Representação Atributo-valor a Partir de Documentos Não Estruturados
Uma Abordagem de Extração de Terminologia Para a Construção de uma Representação Atributo-valor a Partir de Documentos Não Estruturados Daniel de Faveri Honorato 1, Maria Carolina Monard 1, and Huei Diana
PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING
PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING OBJETIVOS Na era da informação, as empresas capturam e armazenam muitos dados, e existe a real necessidade da aplicação de técnicas adequadas para a rápida tomada de
Uma Aplicação de Meta-Aprendizagem no Mercado Euro/Dólar
Uma Aplicação de Meta-Aprendizagem no Mercado Euro/Dólar Felipe de Almeida Duarte Renato Cesar Sato Ana Carolina Lorena Universidade Federal de São Paulo Instituto Tecnológico Aeronáutico Programa de Pós-Graduação
Aprendizagem de Máquina
Plano da Apresentação Aprendizagem de Máquina Alessandro L. Koerich 2007 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Professor & Experiência Acadêmica Horários
Fundamentos de Mineração de Dados
Fundamentos de Mineração de Dados Prof. Ricardo Fernandes ricardo.asf@ufscar.br O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento
Análise comparativa entre métodos estatístico e rede neural aplicados em séries temporais
Análise comparativa entre métodos estatístico e rede neural aplicados em séries temporais Ana Paula de Sousa José Elmo de Menezes Introdução As formas funcionais dos modelos de previsão das redes neurais
6. QUADRIMESTRE IDEAL 7. NÍVEL Graduação 8. Nº. MÁXIMO DE ALUNOS POR TURMA
Universidade Federal do ABC Rua Santa Adélia, 166 - Bairro Bangu - Santo André - SP - Brasil CEP 09.210-170 - Telefone/Fax: +55 11 4996-3166 1. CÓDIGO E NOME DA DISCIPLINA MC5004 - APRENDIZADO DE MÁQUINA
Algumas Abordagens para Mineração de Séries Temporais aplicadas a Dados de Segurança de Barragens
Algumas Abordagens para Mineração de Séries Temporais aplicadas a Dados de Segurança de Barragens André Gustavo Maletzke 1,2, Huei Diana Lee 1, Maria Carolina Monard 2, Wu Feng Chung 1,3 1 Centro de Engenharias
Metodologia de Mapeamento de Laudos Médicos para Bases de Dados: Aplicação em Laudos Colonoscópicos
Metodologia de Mapeamento de Laudos Médicos para Bases de Dados: Aplicação em Laudos Colonoscópicos Everton Alvares Cherman 1, Huei Diana Lee 1,2, Daniel de Faveri Honorato 2, João José Fagundes 3, Juvenal
Profissinais que desejam adquirir ou aprimorar seus conhecimentos em modelagem de dados, analytics e estatística aplicada
MBA ANALYTICS OBJETIVOS Na era da informação, as empresas capturam e armazenam muitos dados, e existe a real necessidade da aplicação de técnicas adequadas para a rápida tomada de decisão com base nas
Descoberta de Conhecimento em Bancos de Dados - KDD
Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação
SIMULAÇÃO DE BANDAS DO SENSOR MSI/SENTINEL-2 EM LAGOS DA AMAZÔNIA E RIO GRANDE DO SUL
SIMULAÇÃO DE BANDAS DO SENSOR MSI/SENTINEL-2 EM LAGOS DA AMAZÔNIA E RIO GRANDE DO SUL 1. INTRODUÇÃO As geotecnologias estão cada vez mais inseridas nos estudos de cunho ambiental, servindo de suporte para
MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL
MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL Pedro Henrique Bragioni Las Casas Pedro.lascasas@dcc.ufmg.br Apresentação baseada nos slides originais de Jussara Almeida e Virgílio Almeida
Uma Aplicação de Árvores de Decisão, Redes Neurais e KNN para a Identificação de Modelos ARMA Não-Sazonais e Sazonais
Luiza Maria Oliveira da Silva Uma Aplicação de Árvores de Decisão, Redes Neurais e KNN para a Identificação de Modelos ARMA Não-Sazonais e Sazonais Tese de Doutorado Tese apresentada ao Programa de Pós-graduação
Aplicação da metodologia Box & Jenkins para previsão de vendas de emulsificante
Aplicação da metodologia Box & Jenkins para previsão de vendas de emulsificante Eduardo Campana Barbosa1 Carlos Henrique Osório Silva2 Resumo: Utilizou-se a metodologia Box & Jenkins para previsão da demanda
Aprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
Aprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento
Descritores de Imagens
Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 17 Introdução Excelentes pesquisas sobre descritores
MONITORAMENTO DA QUALIDADE DA ÁGUA DE ALGUNS AFLUENTES DO RIO IGUAÇU NA REGIÃO METROPOLITANA DE CURITIBA - PARANÁ
MONITORAMENTO DA QUALIDADE DA ÁGUA DE ALGUNS AFLUENTES DO RIO IGUAÇU NA REGIÃO METROPOLITANA DE CURITIBA - PARANÁ Wosiack, A.C.; Pagioro, T.A.; Dias, L.N.; Azevedo, J.C., Silva, E. F. da IAP (Instituto
Aplicação de Clustering de Séries Temporais em Exames de Manometria Ano-retal no Estudo da Incontinência Fecal
Aplicação de Clustering de Séries Temporais em Exames de Manometria Ano-retal no Estudo da Incontinência Fecal Carlos Andres Ferrero 1, André Gustavo Maletzke 1, Huei Diana Lee 1, Newton Spolaôr 1,3, Cláudio
PREVISÃO EM SÉRIES TEMPORAIS COMBINANDO MODELOS ESTATÍSTICOS E CONCEITOS FUZZY
Especial Innovation Day 2015 PREVISÃO EM SÉRIES TEMPORAIS COMBINANDO MODELOS ESTATÍSTICOS E CONCEITOS FUZZY FORECASTING IN TIME SERIES COMBINING STATISTICAL MODELS AND FUZZY CONCEPTS Data de entrega dos
CRI Minas Indústria 4.0. Case Vallourec: Golden Batch na produção de tubos
CRI Minas Indústria 4.0 Case Vallourec: Golden Batch na produção de tubos 02 05 2018 G o l d e n B a t c h A n a l y s i s Case Vallourec Líder mundial em soluções tubulares premium, a Vallourec assegura
Aprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo k-nearest Neighbors (knn) Como os filmes são categorizados em gêneros? O que
Informática Parte 19 Prof. Márcio Hunecke
Escriturário Informática Parte 19 Prof. Márcio Hunecke Informática NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês: "machine learning") ou aprendizagem
Avaliação de um método de mapeamento de laudos médicos para uma representação estruturada: estudo de caso com laudos de endoscopia digestiva alta
Avaliação de um método de mapeamento de laudos médicos para uma representação estruturada: estudo de caso com laudos de endoscopia digestiva alta Daniel de Faveri Honorato 1, Maria Carolina Monard 2, Huei
AVALIAÇÃO DA QUALIDADE DA ÁGUA DO RESERVATÓRIO DE PEDRA DO CAVALO BA.
UNIVERSIDADE FEDERAL DO RECÔNCAVO DA BAHIA CENTRO DE CIÊNCIAS AGRÁRIAS AMBIENTAIS E BIOLÓGICAS V SEMINÁRIO INTERNO DE INICIAÇÃO CIENTÍFICA AVALIAÇÃO DA QUALIDADE DA ÁGUA DO RESERVATÓRIO DE PEDRA DO CAVALO
Proposta de desenvolvimento de um novo medidor de nível piezométrico
Proposta de desenvolvimento de um novo medidor de nível piezométrico Maksoel A. Krauspenhar Niz 1,2,3, Armando Albertazzi Gonçalves Jr. 1,3, Huei Diana Lee 2,3, Feng Chung Wu 2,3 1 Laboratório de Metrologia
Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas
Sistemas Inteligentes Aplicados Carlos Hall Programa do Curso Limpeza/Integração de Dados Transformação de Dados Discretização de Variáveis Contínuas Transformação de Variáveis Discretas em Contínuas Transformação
Um Método para Melhoria de Dados Estruturados de Imóveis
Universidade Federal de Pernambuco Centro de Informática Graduação em Ciência da Computação Um Método para Melhoria de Dados Estruturados de Imóveis Lucas Nunes de Souza Proposta de Trabalho de Graduação
Profs.: Eduardo Vargas Ferreira Walmes Marques Zeviani
Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Introdução Profs.: Eduardo Vargas Ferreira Walmes Marques Zeviani O que é Machine Learning? Estatística Machine Learning
Time Series Trend Detection and Forecasting Using Complex Network Topology Analysis
WAIAF 2018 Time Series Trend Detection and Forecasting Using Complex Network Topology Analysis Leandro Anghinoni Universidade de São Paulo DCM/RP Liang Zhao Universidade de São Paulo DCM/RP AGENDA Introdução
Estudo do Parâmetro Tamanho de Motif para a Classificação de Séries Temporais de ECG
Estudo do Parâmetro Tamanho de Motif para a Classificação de Séries Temporais de ECG André Gustavo Maletzke 1, Huei Diana Lee 1,2, Willian Zalewski 1, Jefferson Tales Oliva 1, Renato Bobsin Machado 1,3,
Aprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo (knn) Um algoritmo supervisionado usado para classificar
Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017
Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas
Protótipo de um Sistema Móvel para a Extração de. Características em Fragmentos de Imagem de Tecido. Cólico
Protótipo de um Sistema Móvel para a Extração de Características em Fragmentos de Imagem de Tecido Cólico Application Prototype for Mobile Devices to Features Extraction in Image Fragments Colic Tissue
Análise comparativa dos modelos knn-tsp e Série de Fourier para previsão de demanda horária para abastecimento de água
Análise comparativa dos modelos knn-tsp e Série de Fourier para previsão de demanda horária para abastecimento de água Frederico Keizo Odan, Carlos Andrés Ferrero 2, Luisa Fernanda Ribeiro Reis 3 & Maria
SCC0173 Mineração de Dados Biológicos
SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:
2COP229 Inteligência Computacional. Aula 3. Clusterização.
Aula 3 Clusterização Sumário (Clusterização) - Introdução - Aprendizado Não Supervisionado - Aprendizado Supervisionado - Introdução: Clusterização - Etapas para o processo de Clusterização - Distância
Echo State Networks. Fabricio Breve João Bertini
Echo State Networks Fabricio Breve João Bertini RNN Tarefas Filtragem e predição Classificação de Padrões Modelagem de Seqüências Estocásticas Memória Associativa Compressão de Dados RNN Aplicações Telecomunicações
Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS
6ª Jornada Científica e Tecnológica e 3º Simpósio de Pós-Graduação do IFSULDEMINAS 04 e 05 de novembro de 2014, Pouso Alegre/MG Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS
Caracterização de Imagens via Redes Neurais Artificiais
Caracterização de Imagens via Redes Neurais Artificiais Autor: Eduardo Ferreira Ribeiro 1, Orientadora: Celia Zorzo Barcelos 1 1 Programa de Pós-Graduação em Ciência da Computação Universidade Federal
Proposta de Desenvolvimento de um Sistema para a Coleta Automatizada de Dados em Processos de Instrumentação em Segurança de Barragens
Proposta de Desenvolvimento de um Sistema para a Coleta Automatizada de Dados em Processos de Instrumentação em Segurança de Barragens Willian Zalewski 1,2,3, Armando Albertazzi Gonçalvez Jr. 1,2, Huei
Padrões, Modelagem e Neurocomputação
Escola Politécnica Universidade de São Paulo Departamento de Engenharia Elétrica Sistemas Eletrônicos PSI2672 Práticas em Reconhecimento de Padrões, Modelagem e Neurocomputação APRESENTAÇÃO FINAL 21/06/2016
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:
3 Redes Neurais Artificiais
3 Redes Neurais Artificiais 3.1. Introdução A capacidade de implementar computacionalmente versões simplificadas de neurônios biológicos deu origem a uma subespecialidade da inteligência artificial, conhecida
SANEAMENTO AMBIENTAL EXPERIMENTAL - TH 758
Programa de Pós Graduação em Engenharia de Recursos Hídricos e Ambiental Departamento de Hidráulica e Saneamento Universidade Federal do Paraná Profª. Heloise G. Knapik Luciane Prado SANEAMENTO AMBIENTAL
Introdução a Visão Computacional. Prof. Dr. Geraldo Braz Junior DEINF - UFMA
Introdução a Visão Computacional Prof. Dr. Geraldo Braz Junior DEINF - UFMA O que é Visão Computacional? Você já viu? 2 O que se espera? Visão é sobre entender imagens Coloridas ou em tons de cinza Pequenas
Uma Metodologia para Auxiliar no Processo de Construção de Bases de Dados Estruturadas a partir de Laudos Médicos
Uma Metodologia para Auxiliar no Processo de Construção de Bases de Dados Estruturadas a partir de Laudos Médicos Daniel de Faveri Honorato 1,4, Huei Diana Lee 1,2, Maria Carolina Monard 2, Feng Chung
aula ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES
ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES 18 aula META Fazer com que o aluno seja capaz de realizar os procedimentos existentes para a avaliação da qualidade dos ajustes aos modelos. OBJETIVOS Ao final
RELATÓRIOS TÉCNICOS DO LABORATÓRIO DE BIOINFORMÁTICA UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ
Centro de Engenharias e Ciências Exatas Descrição do Protótipo de Telas (versão 1.0) para o Sistema de Gerenciamento de Protocolo de Cirurgia Coloproctológica Huei Diana Lee Wilson Jung Adrieli Cristina
Sensoriamento Remoto no Estudo da Água
Sensoriamento Remoto no Estudo da Água Autores do seminário: Amanda Leone Amanda Pereira Beatriz Stadler Maria Julia Battaglini Metodologia para Monitoramento da Qualidade da Água de Reservatórios utilizando
Um Estudo Sobre a Efetividade do Método de Imputação Baseado no Algoritmo k-vizinhos Mais Próximos
Um Estudo Sobre a Efetividade do Método de Imputação Baseado no Algoritmo k-vizinhos Mais Próximos Gustavo Enrique de Almeida Prado Alves Batista Maria Carolina Monard Laboratório de Inteligência Computacional
CRÉDITOS DO CURSO. Carga Horária Créditos IN1030 Seminários 30 2
UNIVERSIDADE FEDERAL DE PERNAMBUCO PRÓ-REITORIA PARA ASSUNTOS DE PESQUISA E PÓS-GRADUAÇÃO ESTRUTURA CURRICULAR STRICTO SENSU (baseada na Res. 10/2008 do CCEPE) NOME DO CURSO: Pós-Graduação em Ciência da
Grupode Inteligência Computacional
XII Simpósio de Teses e Dissertações Programa de Pós-Graduação em Ciências de Computação e Matemática Computacional Grupode Inteligência Computacional Instituto de Ciências Matemáticas e de Computação
AJUSTE DE UM MODELO DE SÉRIES TEMPORAIS PARA PREVISÃO DA TEMPERATURA MÍNIMA DO AR PARA LAVRAS/MG EM 2011
AJUSTE DE UM MODELO DE SÉRIES TEMPORAIS PARA PREVISÃO DA TEMPERATURA MÍNIMA DO AR PARA LAVRAS/MG EM 2011 LUIZ G. CARVALHO 1, CAMILA C. ALVARENGA 2 DANIELA C. RODRIGUES 3 1 Eng. Agrícola, Prof. Adjunto,
VÁ ALÉM DO BI TRADICIONAL ADICIONANDO PODER ANALÍTICO... MARIANA FONTANEZI ESTATÍSTICA
Business Inteligence & Analytics VÁ ALÉM DO BI TRADICIONAL ADICIONANDO PODER ANALÍTICO... MARIANA FONTANEZI ESTATÍSTICA Apresentação Agenda O Big Data O ciclo analítico Técnicas de Data Mining Técnicas
UM SISTEMA DE GERENCIAMENTO DE DADOS PARA EXAMES DE ENDOSCOPIA DIGESTIVA ALTA 1
UM SISTEMA DE GERENCIAMENTO DE DADOS PARA EXAMES DE ENDOSCOPIA DIGESTIVA ALTA 1 CARLOS ANDRÉS FERRERO 2, HUEI DIANA LEE 3, FENG CHUNG WU 4, RENATO BOBSIN MACHADO 5, DANIEL DE FAVERI HONORATO 6, ANTONIO
INTELIGÊNCIA ARTIFICIAL
INTELIGÊNCIA ARTIFICIAL Engenharia da Computação Professor: Rosalvo Ferreira de Oliveira Neto Dados pessoais Rosalvo Ferreira de Oliveira Neto Dr. em ciência da computação (UFPE) rosalvo.oliveira@univasf.edu.br
Utilização da Indexação Automática para Auxílio à Construção de uma Base de Dados para a Extração de Conhecimento aplicada à Doenças Pépticas
Utilização da Indexação Automática para Auxílio à Construção de uma Base de Dados para a Extração de Conhecimento aplicada à Doenças Pépticas Daniel de F. Honorato 1, Huei D. Lee 1, Renato B. Machado 1,4,
Face Recognition using RGB-D Images
Face Recognition using RGB-D Images Helder C. R. de Oliveira N.USP: 7122065 Polyana Nunes N.USP: 9043220 Sobre o Artigo Publication: 2013 IEEE Sixth International Conference Author(s) Goswami, G. (Índia
Consultas por Similaridade em Domínios de Dados Complexos
Consultas por Similaridade em Domínios de Dados Complexos Guilherme Felipe Zabot Orientador: Profº Dr Caetano Traina Jr Roteiro Objetivo Introdução Dados Complexos Representação de Dados Complexos Extração
Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da. Sylvio Barbon Jr
Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da Computação Sylvio Barbon Jr barbon@uel.br (2/20) Tema Aula 1 Introdução ao Reconhecimento de Padrões 1 Introdução 2 Referências
CC-226 Introdução à Análise de Padrões
CC-226 Introdução à Análise de Padrões Apresentação do Curso Carlos Henrique Q. Forster 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica 25 de fevereiro de 2008 C. H. Q. Forster
Um Estudo sobre Métodos de Classificação Multirrótulo
Um Estudo sobre Métodos de Classificação Multirrótulo Everton Alvares Cherman 1, Maria Carolina Monard 1 1 Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Laboratório de Inteligência
ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA
CURTA DURAÇÃO ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof.ª Dr.ª Alessandra de Ávila Montini OBJETIVOS Introduzir o conceito de Big Data,
Descoberta de conhecimento em redes sociais e bases de dados públicas
Descoberta de conhecimento em redes sociais e bases de dados públicas Trabalho de Formatura Supervisionado Bacharelado em Ciência da Computação - IME USP Aluna: Fernanda de Camargo Magano Orientadora:
PREVISÃO DA DEMANDA BIOQUÍMICA DE OXIGÊNIO POR MEIO DE VARIÁVEIS LIMNOLÓGICAS UTILIZANDO MODELOS DE APRENDIZADO DE MÁQUINA EM PYTHON
PREVISÃO DA DEMANDA BIOQUÍMICA DE OXIGÊNIO POR MEIO DE VARIÁVEIS LIMNOLÓGICAS UTILIZANDO MODELOS DE APRENDIZADO DE MÁQUINA EM PYTHON L. O. M. DA SILVA 1, D. L. C. DA SILVA 1, L. A. VANDERLEI 1, M. C. O.
Reconhecimento de Padrões aplicado à Bioinformática
Reconhecimento de Padrões aplicado à Bioinformática Dr. Leandro Carrijo Cintra CNPTIA Embrapa Informática Agropecuária Curso de Verão 2010 Bioinformática USP CNPTIA - Centro Nacional de Pesquisas Tecnológicas
Aprendizagem Ativa para Seleção de Exemplos em Meta-Aprendizado
Aprendizagem Ativa para Seleção de Exemplos em Meta-Aprendizado Ricardo B. C. Prudêncio and Teresa B. Ludermir 1 Centro de Informática, Universidade Federal de Pernambuco Caixa Postal 7851 - CEP 50732-970
Desenvolvimento de uma metodologia para avaliação da demanda e capacidade de carga nos principais aeroportos brasileiros
Desenvolvimento de uma metodologia para avaliação da demanda e capacidade de carga nos principais aeroportos brasileiros Michel de Oliveira Vasconcelos Instituto Tecnológico de Aeronáutica, São José dos
Previsão de Vazões utilizando Redes Neurais Artificiais MLP e NSRBN
Previsão de Vazões utilizando Redes Neurais Artificiais MLP e NSRBN Alan Caio Rodrigues MARQUES 1, Gelson da Cruz JUNIOR 2, Cassio Dener Noronha VINHAL 3 Escola de Engenharia Elétrica e de Computação 1
Modelagem do comportamento da variação do índice IBOVESPA através da metodologia de séries temporais
Modelagem do comportamento da variação do índice IBOVESPA através da metodologia de séries temporais João Eduardo da Silva Pereira (UFSM) jesp@smail.ufsm.br Tânia Maria Frighetto (UFSM) jesp@smail.ufsm.br
PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA
PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e
TP-DISCOVER: um ambiente computacional para auxílio no pré-processamento de laudos médicos não-estruturados
TP-DISCOVER: um ambiente computacional para auxílio no pré-processamento de laudos médicos não-estruturados Daniel de Faveri Honorato 1, Maria Carolina Monard 2, Huei Diana Lee 1, Carlos Andres Ferrero
APLICAÇÃO DE NÚMEROS FUZZY TRIANGULARES EM ANÁLISES DE INVESTIMENTOS EM SITUAÇÕES DE INCERTEZA - MÉTODO BASEADO NA TEORIA DOS JOGOS
APLICAÇÃO DE NÚMEROS FUZZY TRIANGULARES EM ANÁLISES DE INVESTIMENTOS EM SITUAÇÕES DE INCERTEZA - MÉTODO BASEADO NA TEORIA DOS JOGOS Alexandre Ferreira de Pinho, Mestrando Escola Federal de Engenharia de
TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro
TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro www.acasadoconcurseiro.com.br Informática PRÉ-PROCESSAMENTO DE DADOS EM DATA MINING Técnicas de pré-processamento e transformação de dados
Utilização de Atributos Baseados em Textura para a Caracterização de Tecidos Cólicos em Imagens de Colonoscopia
Utilização de Atributos Baseados em Textura para a Caracterização de Tecidos Cólicos em Imagens de Colonoscopia Carlos Andres Ferrero 1,3, Huei Diana Lee 1, Everton Alvares Cherman 1, Cláudio Sady Rodrigues
Etapas da Modelagem. Modelagem e Controle da Qualidade da Água Superficial Regina Kishi, 11/11/2014, Página 1
Etapas da Modelagem Modelagem e Controle da Qualidade da Água Superficial Regina Kishi, 11/11/2014, Página 1 Classificação dos modelos Medição de dados Conhecimento do processo físico Totalmente orientado
Jorge Caiado CEMAPRE/ISEG, Universidade Técnica de Lisboa Web:
CEMAPRE/ISEG, Universidade Técnica de Lisboa Email: jcaiado@iseg.utl.pt Web: http://pascal.iseg.utl.pt/~jcaiado/ 1 Uma série temporal (time series) consiste num conjunto de observações de uma variável,
Mineração de Dados. Eduardo Raul Hruschka. Baseado no curso de Gregory Piatetsky-Shapiro, disponível no sítio
Mineração de Dados Eduardo Raul Hruschka Baseado no curso de Gregory Piatetsky-Shapiro, disponível no sítio http://www.kdnuggets.com Visão Geral: Introdução: motivação, aplicações, conceitos básicos. Agrupamento
A Qualidade da Água Superficial e Subterrânea
A Qualidade da Água Superficial e Subterrânea José do Patrocinio Hora Alves Programa de Pós-Graduação em Recursos Hídricos Universidade Federal de Sergipe 1 SUMÁRIO A Qualidade da Água; Estrutura de um
Transferência de Formulários de Informações Médicas para Bases de Dados Estruturadas: Estudo de Caso
Transferência de Formulários de Informações Médicas para Bases de Dados Estruturadas: Estudo de Caso André G. Maletzke 1,3, Huei D. Lee 1, Willian Zalewski 1, Edson T. Matsubara 3, Richardson F. Voltolini
Modelagem empírica de funções multivariáveis por redes neurais artificiais
[~][/~][~][/~][~] [/~][ Blucher Proceedings Modelagem empírica de funções multivariáveis por redes neurais artificiais Cansian, A. B. M. 1* ; Costa, A. O. S. 2 ; Costa Jr, E. F. C. 2 1 Curso de Graduação
Comparação entre uma neuroprevisão(empírica) e um modelo físico simplificado para estimação hidrológica
Trabalho apresentado no XXXVII CNMAC, S.J. dos Campos - SP, 2017. Proceeding Series of the Brazilian Society of Computational and Applied Mathematics Comparação entre uma neuroprevisão(empírica) e um modelo
UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO
UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO Aluno: Larissa Lages de Oliveira (llo@cin.ufpe.br) Orientador: Daniel Carvalho da Cunha (dcunha@cin.ufpe.br)
APLICAÇÕES DE ESTATÍSTICA PARA TOMADA DE DECISÃO
CURTA DURAÇÃO APLICAÇÕES DE ESTATÍSTICA PARA TOMADA DE DECISÃO CARGA HORÁRIA: 92 horas COORDENAÇÃO: Prof.ª Dr.ª Alessandra de Ávila Montini OBJETIVOS O curso tem como objetivo apresentar algumas técnicas