Identificação de padrões de itinerários e de pontos intermediários em dados espaço-temporais utilizando busca por similaridade



Documentos relacionados
BRENO NAODI KUSUNOKI IDENTIFICAÇÃO DE PADRÕES DE ITINERÁRIOS E DE PONTOS INTERMEDIÁRIOS EM DADOS ESPAÇO-TEMPORAIS UTILIZANDO BUSCA POR SIMILARIDADE

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

UNIVERSIDADE F EDERAL DE P ERNAMBUCO ANÁLISE DE UM MÉTODO PARA DETECÇÃO DE PEDESTRES EM IMAGENS PROPOSTA DE TRABALHO DE GRADUAÇÃO

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

Tecnologia e Comércio de Equipamentos Eletrônicos LTDA PORTAL DE TELEMETRIA SYSTEMTEK PARA GERENCIAMENTO DE FROTAS

ARQUITETURA DE UM SISTEMA SPATIO-TEXTUAL. PALAVRAS-CHAVE: banco de dados espaciais, busca spatio-textual. aplicativo.

Descoberta de Domínio Conceitual de Páginas Web

Universidade Católica Dom Bosco

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

PLATAFORMA URBANMOB Aplicativo para captura de trajetórias urbanas de objetos móveis

ADM041 / EPR806 Sistemas de Informação

COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS

DATA WAREHOUSE. Introdução

A Grande Importância da Mineração de Dados nas Organizações

MANUAL RASTREAMENTO 2013

Objetos Móveis. Clodoveu Davis

Universidade Federal do Ma Pós-Graduação em Eng. Elétrica

XXX Congresso da SBC II Workshop de Computação Aplicada em Governo Eletrônico

Identificando Comportamentos Anômalos em Trajetórias de Objetos Móveis

Push Technologies. Caixa Postal CEP Londrina PR Brasil.

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

4 Segmentação Algoritmo proposto

Protocolo de comunicação para redes móveis aplicado ao trânsito

Guia de Especificação de Caso de Uso Metodologia CELEPAR

Ferramentas para Simulação e Avaliação de Processadores. de Alto Desempenho

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade

SIMULAÇÃO DE TRÁFEGO DE VEÍCULOS INTELIGENTES PARA PREVENÇÃO DE ACIDENTES

Aula 02: Conceitos Fundamentais


TRANSDATA SMART RASTREAMENTO E GESTÃO FROTA

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios

Introdução. Geral. Sumário Localização Trajetos Últimos registros Comandos Configurações. Relatórios

Microsoft Innovation Center

SOFTWARE DE GERENCIAMENTO DA SECRETARIA DA SAUDE PROJETO DE TRABALHO

SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS

A importância do PDTI na implantação da Governança de TI nas Prefeituras Brasileiras

PROJETO DE PESQUISA MODALIDADE INICIAÇÃO CIENTÍFICA (BOLSA PIC/FACIT/FAPEMIG)

Sistemas Operacionais e Introdução à Programação. Vetores e matrizes

Desenvolvimento do Módulo de Pré-processamento e Geração de Imagens de. Imagens de Teste do Sistema DTCOURO

Rastreamento Veícular

15 Computador, projeto e manufatura

INTRODUÇÃO AO GEOPROCESSAMENTO. Profª Iana Alexandra Alves Rufino

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

ONTOLOGIA E SUAS APLICAÇÕES EM MODELAGEM CONCEITUAL PARA BANCO DE DADOS PROPOSTA DE TRABALHO DE GRADUAÇÃO

GesToc Gestão de Transferências entre Estoques Versão 7.1 Roteiro: Programação Diária

Auto Gerenciamento utilizando a Web ou Celular

Nathalie Portugal Vargas

3 Metodologia para Segmentação do Mercado Bancário

Gráficos no MU e MUV. E alguns exercícios de vestibulares

ANÁLISE CRÍTICA DO PROCESSO DE CERTIFICAÇÃO ISO DA CONFIANÇA CIA. DE SEGUROS

Grupo de Banco de Dados da UFSC

5 Experiência de implantação do software de roteirização em diferentes mercados

INFLUÊNCIA DA TECNOLOGIA DA INFORMAÇÃO NA GESTÃO DA ÁGUA E ESGOTO

STUDY ABOUT INFLUENCE ON ACADEMIC PERFORMANCE OF STUDENTS USERS OF SOCIAL NETWORKS

APLICAÇÃO DE MÉTODOS HEURÍSTICOS EM PROBLEMA DE ROTEIRIZAÇÃO DE VEICULOS

ISO/IEC 12207: Gerência de Configuração

Uma análise de ferramentas de modelagem e gerência de metadados aplicadas ao projeto de BI/DW-UFBA

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

RECONHECIMENTO DE PLACAS DE AUTOMÓVEIS ATRAVÉS DE CÂMERAS IP

A seguir são apresentadas as etapas metodológicas da Pesquisa CNT de Rodovias.

Módulo 4: Gerenciamento de Dados

MANUAL DO NOVO PORTAL GRUPO NEW VISION RASTREAMENTO E CONTROLE DE VEICULOS E FROTAS.

UNIVERSIDADE FEDERAL DE SANTA CATARINA SISTEMAS DE INFORMAÇÃO E CIÊNCIAS DA COMPUTAÇÃO INE CTC DATA MINING Prof.: Luis Otavio Campos Alvares

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1

Técnicas para Programação Inteira e Aplicações em Problemas de Roteamento de Veículos 14

Em 2012, a Prosoft planejou o lançamento da Versão 5 dos seus produtos.

Universidade Paulista

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado

Sistemas Distribuídos

SEGURANÇA NO TRANSPORTE RODOVIÁRIO DE CARGAS

Projeto de Sistemas I

Uso de Localizador GPS Aplicado à Manutenção de Linhas de Transmissão de 69kV e 138kV.

O tornado de projeto é admitido, para fins quantitativos, com as seguintes características [15]:

MÓDULO 7 Modelo OSI. 7.1 Serviços Versus Protocolos

Documento de Arquitetura

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS

O Software Face Match

SOLUÇÕES TELEMÁTICAS

PROPOSTA DE RASTREAMENTO E MONITORAMENTO HÍBRIDO SATELITAL

Manual TDMax Web Commerce VERSÃO: 0.2

Gerenciamento de Projetos Modulo II Ciclo de Vida e Organização do Projeto

FACULDADE DE ENGENHARIA DE COMPUTAÇÃO. PROJETO FINAL I e II PLANO DE TRABALHO <NOME DO TRABALHO> <Nome do Aluno> <Nome do Orientador>

Capítulo 4 - Roteamento e Roteadores

TMS e Roteirizadores. Breno Amorim brenoamorim@hotmail.com

Experiência: Implantação da Política de Materiais

UNIVERSIDADE FEDERAL DE PERNAMBUCO

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

Sua frota menor. maior. eficiência

Demanda por um sistema integrado de mobilidade urbana, acessível por órgãos gestores, operadoras de transporte e população!

Padronização de Processos: BI e KDD

ATENAS: Um Sistema Gerenciador de Regras de Negócio

Introdução ao Geoprocessamento

Georreferenciamento de Informações Econômicas

SERVICE DESK MANAGER SDM. Manual do Sistema - DPOI

Transcrição:

Identificação de padrões de itinerários e de pontos intermediários em dados espaço-temporais utilizando busca por similaridade Breno Naodi Kusunoki 1, Daniel dos Santos Kaster 1 1 Departamento de Computação Universidade Estadual de Londrina (UEL) Caixa Postal 10.011 CEP 86057-970 Londrina PR Brasil brenokusunoki@gmail.com, dskaster@uel.br Abstract. The problem of pattern recognition is extremely widespread and exist in many works dealing with this problem and their variants. The research will consist in finding itinerary and intermediate point patterns in space-temporal data using similarity search and data mining techniques. The main motivation for this research is the possibility to solve real problems, about the pattern recognition problem of a vehicle tracking company where the process to find these patterns is manual and expensive. The final objective is the pattern recognition that were mentioned earlier automatically. Resumo. O problema de reconhecimento de padrões é extremamente difundido e existem inúmeros trabalhos que abordam esse problema e suas variantes. Esta pesquisa consistirá na busca de padrões de itinerários e de pontos intermediários em dados espaço-temporais utilizando busca por similaridade e técnicas de mineração de dados. A principal motivação para esta pesquisa é a possibilidade de solucionar um problema real, referente ao problema de reconhecimento de padrões, de uma empresa de rastreamento de veículos onde o processo de se encontrar esses padrões é manual e oneroso. O objetivo final é o reconhecimento dos padrões que foram citados anteriormente de forma automática. 1. Introdução Atualmente, existem diversas soluções que fornecem o rastreamento e gerenciamento de veículos de forma inteligente visando a diminuição de gastos com manutenções, combustível, pneus, entre outros fatores que poderiam ser evitados com o uso correto do veículo. A pesquisa está ambientada na área de buscas por similaridade em dados espaçotemporais e será baseada em um problema real que ocorre em uma dessas soluções existentes no mercado. No sistema que existe hoje no qual será aplicado o resultado desta pesquisa, grande parte das funcionalidades como o gerenciamento e rastreamento dos veículos dependem do cadastramento manual e exaustivo dos itinerários a serem percorridos pelos veículos, pois sem esses itinerários delineados previamente, não é possível inferir se o veículo está percorrendo o trajeto correto, se o mesmo está na velocidade correta para o trecho, se o motorista está gastando combustível além do necessário, entre outras conclusões. O problema consiste em encontrar itinerários padrões a partir de uma base de dados espaço-temporais e efetuar a extração de pontos intermediários, que podem ser pontos

de ônibus de tranporte coletivo ou paradas obrigatórias em viagens interestaduais, dos itinerários identificados de forma automática. Esses dados são gerados a partir de veículos que possuem um módulo de GPS que envia posições a cada um minuto e quarenta e cinco segundos ou em intervalos menores quando o direcional do módulo está ativado. O direcional é uma configuração do módulo que quando habilitada, o veículo passa a reportar uma maior quantidade de posições quando o mesmo efetua curvas com mais de vinte e cinco graus. Essas posições que descrevem em que localidade o automóvel se encontra no globo terrestre contêm informações como latitude, longitude, data em que foi enviada, velocidade do veículo, direção em graus, eventos como ignição ligada ou desligada, porta aberta ou fechada, entre outras. Essas posições são enviadas para um gateway onde são processadas e persistidas em sistemas de gerenciamento de banco de dados relacionais e que são utilizadas pelo software existente para efetuar o gerenciamento e rastreamento de veículos. A seção 2 apresenta a fundamentação teórico-metodológica para o trabalho a ser desenvolvido. A seção 3 se refere aos objetivos a serem alçançados após o término do trabalho de conclusão de curso. A seção 4 descreve como será dividido a execução do trabalho. A seção 5 mostra como será conduzido o trabalho durante o ano. 2. Fundamentação Teórico-Metodológica e Estado da Arte Antigamente, as informações como a disposição das malhas ferroviárias e dos recursos minerais em determinada região eram armazenadas somente em documentos e mapas em papel. Com o advento da tecnologia, foi possível transcrever e armazenar essas informações em ambiente computacional de tal forma que as mesmas pudessem ser representadas e analisadas com maior facilidade. Desta maneira, surgiu o geoprocessamento. Com o aumento das informações coletadas e o avanço no armazenamento de grandes quantidades de dados, surgiu a necessidade de se ter formas de se processar e extrair informações relevantes de forma automática que antes eram desconhecidas, a partir disso, surgiu a mineração de dados. 2.1. Geoprocessamento Geoprocessamento é um processo que utiliza técnicas com fundamentação matemática e computacional para o processamento dos dados geográficos e que vem influenciando de forma crescente várias áreas como cartografia, telecomunicações, transportes, planejamento urbano, análise de recursos naturais possibilitando assim o processamento, análise e tomadas de decisão baseadas nas informações retiradas desses dados [2]. 2.2. Mineração de dados Mineração de dados é o processo automático de descoberta de informações úteis em grandes quantidades de dados que não eram conhecidas antes da aplicação das técnicas de extração de informações relevantes da base de dados [13]. 2.3. Busca por similaridade A busca por similaridade surgiu da necessidade de se ter consultas mais inteligentes, que possam comparar dados complexos e estabelecer relações de similaridade entre eles. Esse tipo de busca pode ser utilizado para verificar semelhanças entre imagens, vídeos, séries temporais, dados genéticos, entre outros dados complexos [12].

Uma das aplicações da busca por similaridade é a detecção de semelhanças entre imagens médicas como ressonância magnética, mamografia e tomografia. Essa busca pode auxiliar o diagnóstico do paciente, pois o médico pode recuperar imagens semelhantes da base de dados, comparar com a do paciente e verificar os diagnósticos de cada imagem recuperada ajudando o médico na tomada de decisão e no prognóstico [11, 4]. 2.4. Dados espaço-temporais Antes, pesquisas em modelos de dados espaciais e temporais eram desenvolvidas separadamente, atualmente essas pesquisas estão correlacionadas. Quando existe a integração de espaço e tempo, temos dados geométricos evoluindo ao longo do tempo. Em banco de dados existem três abstrações fundamentais de dados espaço-temporais, pontos que descrevem a localização de um objeto, linhas que descrevem conexões no espaço ou a evolução de determinados objetos no espaço-tempo que podem ser representadas como polilinhas e regiões onde a medida é relevante representadas por polígonos [5]. No âmbito desta dissertação, trajetória é uma linha contendo a localização geográfica de um determinado veículo à cada instante em um intervalo de tempo, demonstrando o deslocamento do mesmo conforme a evolução do tempo. Itinerário é uma polilinha a ser percorrida por determinado veículo composta por pontos iniciais, intermediários e finais. Um itinerário também tem comprimento, direção e sentido. 2.5. Trabalhos relacionados Através de uma simples análise dos dados espaço-temporais pode-se retirar diversas informações de objetos em movimento como velocidade, aceleração, trajetória entre determinado espaço de tempo. Assim, existe a possibilidade de se agrupar essas informações de tal forma que se possa distinguir quais objetos estão em movimento que podem ser carros, caminhões, ônibus, motocicletas ou pedestres [3]. Existem diversos trabalhos que utilizam o reconhecimento de padrões em dados espaço-temporais para identificar trajetórias mais utilizadas [1, 14], recomendação de roteiros de viagens de acordo com o comportamento dos usuários buscando uma maior satisfação do turista durante a viagem[8], reconhecimento de outliers entre determinadas áreas determinadas por polígonos compostos por vários pontos[6]. Outro trabalho relacionado ao reconhemento de padrões entre trajetórias utilizando comparações entre objetos que estiveram no mesmo lugar e em instantes muito próximos [10]. Aplicação de métodos que fazem o alinhamento de posições de GPS enviados pelo usuário à malha rodoviária, obtendo as trajetórias com uma baixa taxa de amostragem de posições [9]. O artigo [7] utiliza um método de clusterização para agrupar rotas realizadas por táxis com objetivo de identificar outliers que podem ser rotas fraudulentas que têm maiores distâncias em relação as rotas comumente utilizadas para se ir à um determinado lugar. 3. Objetivos O principal objetivo a ser desenvolvido neste trabalho de conclusão de curso é obter uma solução que encontre os itinerários e pontos intermediários padrões de tal forma que essa solução seja extraída dos dados espaço-temporais e processada gerando as trajetórias de cada itinerário juntamente com os respectivos pontos intermediários de forma automática.

Primeiramente, existe a necessidade de efetuar um pré-processamento para separar os dados que só foram inseridos para teste dos que realmente foram enviados pelos veículos e filtrar todas as posições quando o direcional estava ligado nos veículos. Um dos objetivos específicos é o reconhecimento dos pontos onde cada itinerário começa e termina, para que se possa delimitar todas as trajetórias que passam por esses pontos. Também será necessário identificar e remover outliers. Outro objetivo seria a identificação de regiões semelhantes entre as trajetórias para inferir se determinadas regiões são pontos intermediários ou são somente pontos de tráfego intenso em determinados horários. Por fim a identificação dos pontos intermediários de cada itinerário padrão reconhecido, que podem ser pontos de transporte coletivo de determinada linha de ônibus, locais de entrega de mercadorias, pontos de parada em viagens interestaduais, entre otros. 4. Procedimentos metodológicos/métodos e técnicas Atividade 1: Pesquisa bibliográfica, análise e estudo detalhado sobre buscas por similaridade Consiste em efetuar buscas por trabalhos relacionados e um estudo aprofundado sobre as técnicas abordadas nos trabalhos durante todo período do trabalho de conclusão de curso. Atividade 2: Elaboração do algoritmo de identificação de pontos iniciais e finais Elaboração do algoritmo para identificar os pontos iniciais e finais de todas as trajetórias a partir dos dados pré-processados. Atividade 3: Elaboração do algoritmo de reconhecimento de todos os itinerários e os padrões entre eles Desenvolvimento do método que efetuará o reconhecimento de todos os itinerários e os padrões que se repetem entre as trajetórias identificadas. Atividade 4: Desenvolvimento do método para identificação de regiões semelhantes entre trajetórias Será a elaboração de um método de classificação de regiões semelhantes entre as trajetórias padrões reconhecidas. Atividade 5: Criação de um método de classificação de pontos intermediários Consistirá no desenvolvimento de um método que faça a classificação entre os pontos dentro de determinada região se aquela região é um ponto intermediário. Atividade 6: Desenvolvimento da modelagem Elaboração da arquitetura da solução proposta e modelagem para implementação. Atividade 7: Implementação da solução Codificação da solução de acordo com a modelagem feita anteriormente, respeitando as normas que são adotadas pela empresa. Atividade 8: Aplicação de testes e análise dos resultados Aplicação de testes para aferir se o resultado obtido pela solução proposta atingiu a acurácia desejada. Atividade 9: Modificações finais Correção de eventuais problemas derivados da implementação proposta. Atividade 10: Desenvolvimento da parte escrita do trabalho de conclusão de curso

Refere-se ao desenvolvimento da parte escrita do trabalho de conclusão de curso. 5. Cronograma de Execução Tabela 1. Cronograma de Execução fev mar abr mai jun jul ago set out nov Atividade 1 Atividade 2 Atividade 3 Atividade 4 Atividade 5 Atividade 6 Atividade 7 Atividade 8 Atividade 9 Atividade 10 6. Contribuições e/ou Resultados esperados Os resultados esperados deste trabalho são a melhoria substancial no processo de cadastramento das linhas, itinerários, pontos intermediários do software existente e a criação de possibilidades de se aplicar os métodos utilizados na pesquisa em outros problemas reais que envolvem o reconhecimento de padrões em dados espaço-temporais. 7. Espaço para assinaturas Londrina, 15 de abril de 2013. Aluno Orientador

Referências [1] Arthur.A.Shaw and N.P. Gopalan. Article: Frequent pattern mining of trajectory coordinates using apriori algorithm. International Journal of Computer Applications, 22(9):1 7, May 2011. Published by Foundation of Computer Science. [2] Gilberto Câmara e Clodoveu Davis, Miguel Vieira Monteiro. Introdução à Ciência da Geoinformação. 2001. [3] Somayeh Dodge, Robert Weibel, and Ehsan Forootan. Revealing the physics of movement: Comparing the similarity of movement characteristics of different types of moving objects. Computers, Environment and Urban Systems, 33(6):419 434, 2009. [4] Daniel dos Santos Kaster. Tratamento de condições especiais para busca por similaridade em bancos de dados complexos. PhD thesis, Universidade de São Paulo, Instituto de Ciências Matemáticas e de Computação, São Carlos, 2012. [5] Martin Erwig, Ralf Hartmut Güting, Markus Schneider, and Michalis Vazirgiannis. Spatio-temporal data types: An approach to modeling and querying moving objects in databases. Geoinformatica, 3(3):269 296, September 1999. [6] Vitor Cunha Fontes and Vania Bogorny. Discovering semantic spatial and spatio-temporal outliers from moving object trajectories. CoRR, abs/1303.5132, 2013. [7] Yong Ge, Chuanren Liu, Hui Xiong, and Jian Chen. A taxi business intelligence system. In Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining, KDD 11, pages 735 738, New York, NY, USA, 2011. ACM. [8] Wen He, Deyi Li, Tianlei Zhang, Lifeng An, Mu Guo, and Guisheng Chen. Mining regular routes from gps data for ridesharing recommendations. In Proceedings of the ACM SIGKDD International Workshop on Urban Computing, UrbComp 12, pages 79 86, New York, NY, USA, 2012. ACM. [9] Yin Lou, Chengyang Zhang, Yu Zheng, Xing Xie, Wei Wang, and Yan Huang. Mapmatching for low-sampling-rate gps trajectories. In Proceedings of the 17th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems, GIS 09, pages 352 361, New York, NY, USA, 2009. ACM. [10] Costas Panagiotakis, Nikos Pelekis, and Ioannis Kopanakis. Trajectory voting and classification based on spatiotemporal similarity in moving object databases. In Proceedings of the 8th International Symposium on Intelligent Data Analysis: Advances in Intelligent Data Analysis VIII, IDA 09, pages 131 142, Berlin, Heidelberg, 2009. Springer-Verlag. [11] E.G.M. Petrakis and C. Faloutsos. Similarity searching in medical image databases. Knowledge and Data Engineering, IEEE Transactions on, 9(3):435 447, 1997. [12] Roberto Figueira Santos Filho, Elaine Parros Machado Sousa, Agma Juci Machado Traina, and Caetano Traina Jr. Desmistificando o conceito de consultas por similaridade: A busca de novas aplicações na medicina. In 2 o Workshop de Informática Médica - WIM 2002, pages in CD ROM, Gramado, RS, 2002.

[13] Pang-Ning Tan, Michael Steinbach, and Vipin Kumar. Introduction to Data Mining, (First Edition). Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA, 2005. [14] Ling-Yin Wei, Yu Zheng, and Wen-Chih Peng. Constructing popular routes from uncertain trajectories. In Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining, KDD 12, pages 195 203, New York, NY, USA, 2012. ACM.