UNIVERISADE FEDERAL DE OURO PRETO Departamento de Computação Aluno: Lucas Schmidt Orientador: Prof. Dr. Ricardo Rabelo Co-orientador: Prof. Dr. Fabrício Benevenuto Ouro Preto 2013
Introdução Problemas Objetivos Contribuições do Trabalho Trabalhos Relacionados Concepção e implementação Estudos de casos Protótipo Conclusões e Trabalhos Futuros
Introdução Problemas Objetivos Contribuições do Trabalho Trabalhos Relacionados Concepção e implementação Estudos de caso Protótipo Conclusões e Trabalhos Futuros
Twittraffic Trânsito Cidades Inteligentes
Dificuldade de se obter informações sobre o trânsito. Explora o compartilhamento da informação em redes sociais. Indicador e alerta de eventos no trânsito.
Atende a desafios da comunidade e gestão de uma cidade. Integração com sensores veiculares. Perfil do trânsito em grandes centros urbanos: Belo Horizonte, Rio de Janeiro e São Paulo.
Introdução Problemas Objetivos Contribuições do Trabalho Trabalhos Relacionados Concepção e implementação Estudos de caso Protótipo Conclusões e Trabalhos Futuros
Fonte: http://fubango.blog.uol.com.br/
Mobilidade urbana. Grande investimento. Iniciativas de diversos agentes (públicos/ privados). Conturbação e insatisfação.
Belo Horizonte: aumento de 4 a 7% ao ano (1,1 milhões de veículos). 1 veículo para cada 2,4 habitantes. Rio de Janeiro: segunda maior frota de veículos do país (1,3 milhões de veículos). 1 veículo para cada 3,28 habitantes. São Paulo: 5 milhões de veículos. 1 veículo para cada 2 habitantes. (IBGE, 2009)
Introdução Problemas Objetivos Contribuições do Trabalho Trabalhos Relacionados Concepção e implementação Estudos de caso Protótipo Conclusões e Trabalhos Futuros
Atender um dos desafios da comunidade e da gestão governamental. Propor recurso capaz de monitorar, visualizar e identificar ocorrências no trânsito. Reduzir custos na obtenção de informações.
Introdução Problemas Objetivos Contribuições do Trabalho Trabalhos Relacionados Concepção e implementação Estudos de caso Protótipo Conclusões e Trabalhos Futuros
Identificação de termos relevantes. Estudo do trânsito com tweets de 2006 a 2009. Estudo do trânsito com tweets coletados pela Twittraffic. Estudo do trânsito com dados de sensores veiculares.
Correlação entre os dados estudados. Apresentação e disponibilização da Twittraffic. Submissão, aprovação e apresentação do trabalho no XL Seminário Integrado de Software e Hardware, principal fórum científico do XXXIII Congresso da Sociedade Brasileira de Computação.
Introdução Problemas Objetivos Contribuições do Trabalho Trabalhos Relacionados Concepção e implementação Estudos de caso Protótipo Conclusões e Trabalhos Futuros
Monitoramento no Twitter Terremoto (Sakaki et al., 2010) Dengue (Gomide et al., 2011) H1N1 (Chew and Eysenbach, 2010) Eleições (Tumasjan et al., 2010)
Extração de dados de trânsito através de PLN (Endarnoto et al., 2011) (Albuquerque et al., 2012) Arquitetura para identificar o estado atual do trânsito no Rio de Janeiro: Avaliação dos usuários. (Lauand e Oliveira, 2013) Sistema para detecção e localização de eventos de trânsito no Twitter: Avaliação de tweets. (Ribeiro Jr. et al., 2012)
Introdução Problemas Objetivos Contribuições do Trabalho Trabalhos Relacionados Concepção e implementação Estudos de caso Protótipo Conclusões e Trabalhos Futuros
Coleta de dados: Baseado em um dicionário controlado. Filtragem e Extração: Métodos simplistas de PLN (pacote Natural Language Toolkit - NLTK / Python). Separação de locais, ruas, avenidas, bairros e regiões. Condição / evento do trânsito (entidade de interesse).
Filtragem e Extração:
Identificação geográfica Consulta em base de dados de localidades. Verificação direta na API do Google Maps. Exportação JSON KML Visualização Web Mobile Android
Compartilhamento via IVI (In-Vehicle Infotainmen) Internet GPS / rádio Rastreador digital middleware mobile CAN, RS485 client Twittraffic
Introdução Problemas Objetivos Contribuições do Trabalho Trabalhos Relacionados Concepção e implementação Estudos de caso Protótipo Conclusões e Trabalhos Futuros
Estudo 1 Estudo 2 Estudo 3 Relevância de novos termos Relevância dos termos iniciais Seleção de novos termos Estudo 4 Estudo 5 Estudo 6 Estudo 7 Twitter Twittraffic Sensores veiculares Correlação
Estudo 1: Relevância dos termos do dicionário de busca inicial. Baeza-Yates e Ribeiro-Neto, 1999 Fonte: Dados obtidos no estudo
Estudo 2: Seleção de novos termos para o dicionário de busca. Dados da plataforma Twittraffic. Período: 10/12/2012 a 10/01/2013.
Estudo 2: Fonte: Dados obtidos no estudo
Estudo 2: Fonte: Dados obtidos no estudo
Estudo 2: Fonte: Dados obtidos no estudo
Estudo 2: Novo dicionário! Fonte: Dados obtidos no estudo
Estudo 3: Relevância dos termos do novo dicionário de busca. Dados da plataforma Twittraffic. Período: 18/06/2013 a 18/09/2013.
Dicionário inicial: 76,32% Novo dicionário: 87,13% Melhora: ~15% Fonte: Dados obtidos no estudo
Estudo 4: Perfil do trânsito nas cidades com dados antigos do Twitter. Base completa do Twitter. Novo dicionário de busca. Período: 2006 à 2009. 460.406 tweets de trânsito.
Mapeamento geográfico local dos dados de trânsito coletados no período de 2006 à 2009 Fonte: Dados obtidos no estudo
Tweets de trânsito por cidade estudada Fonte: Dados obtidos no estudo
Usuários distintos que postaram sobre o trânsito no Twitter Fonte: Dados obtidos no estudo
Avaliação dos tweets Fonte: Dados obtidos no estudo
Tweets agrupados por dia Fonte: Dados obtidos no estudo
Tweets agrupados por dia da semana Fonte: Dados obtidos no estudo
Tweets agrupados por hora Fonte: Dados obtidos no estudo
Tweets agrupados por mês Fonte: Dados obtidos no estudo
Estudo 5: Perfil do trânsito nas cidades com dados da Twittraffic. Novo dicionário de busca. Período: 18/06/2013 a 18/09/2013. 58.865 tweets para Belo Horizonte. 99.634 tweets para o Rio de Janeiro. 317.092 tweets para São Paulo.
Tweets de trânsito por cidade estudada Fonte: Dados obtidos no estudo
Usuários distintos que postaram sobre o trânsito no Twitter Fonte: Dados obtidos no estudo
Tweets agrupados por dia Fonte: Dados obtidos no estudo
Tweets agrupados por dia da semana Fonte: Dados obtidos no estudo
Tweets agrupados por hora Fonte: Dados obtidos no estudo
Porcentagem de eventos por cidade Manutenção Blitz/Polícia Pessoas Perigo Incêndio/Fogo Fonte: Dados obtidos no estudo Acidente Normal Batida Água/chuva
Estudo 6: Perfil do trânsito nas cidades com dados de sensores veiculares. Período: 08/04/2012 a 08/08/2013. Velocidade. Longitude e latitude (GPS). Data / hora. Detecção de chuva. Motor ligado / movimento.
Total de veículos por cidade 381 veículos Fonte: Dados obtidos no estudo
Total de registros de sensores por cidade Fonte: Dados obtidos no estudo
Velocidade média por dia Fonte: Dados obtidos no estudo
Velocidade média por dia da semana Fonte: Dados obtidos no estudo
Velocidade média por hora Fonte: Dados obtidos no estudo
Velocidade média por mês Fonte: Dados obtidos no estudo
Velocidade média com e sem chuva Fonte: Dados obtidos no estudo
Estudo 7: Correlação entre os dados de trânsito das redes sociais e sensores veiculares. Dias da semana > Tweets < Velocidade média São Paulo Rio de Janeiro Belo Horizonte Segunda-feira, Quinta-feira e Sextafeira Segunda-feira, Quinta-feira e Sextafeira Quarta-feira e Sexta feira Segunda-feira e Sextafeira Segunda-feira e Sextafeira Segunda-feira Fonte: Dados obtidos no estudo
Estudo 7: Correlação entre os dados de trânsito das redes sociais e sensores veiculares. Hora > Tweets < Velocidade média São Paulo Rio de Janeiro Belo Horizonte 06 horas / 09 horas e 17 horas / 19 horas 06 horas / 09 horas e 17 horas / 19 horas 06 horas / 09 horas e 17 horas / 19 horas 06 horas / 09 horas e 17 horas / 19 horas 06 horas / 09 horas e 17 horas / 19 horas 06 horas / 09 horas e 17 horas / 19 horas Fonte: Dados obtidos no estudo
Introdução Problemas Objetivos Contribuições do Trabalho Trabalhos Relacionados Concepção e implementação Estudos de caso Protótipo Conclusões e Trabalhos Futuros
Twittraffic na versão Web.
Rota pré definida pelo usuário na versão Web
Eventos de trânsito (Web).
Twittraffic: Uma plataforma de monitoração, visualização e identificação de ocorrências no trânsito Mobile
Introdução Problemas Objetivos Contribuições do Trabalho Trabalhos Relacionados Concepção e implementação Estudos de caso Protótipo Conclusões e Trabalhos Futuros
Plataforma Twittraffic. Análises e métodos de avaliação, através de estudos e observações sobre o trânsito. A ferramenta oferece bons recursos de monitoração, visualização e identificação de ocorrências no trânsito.
Precisão dos termos relevantes. Correlação entre os dados. Permite integração, complementação e validação de dados. Perfil e características do trânsito. Atende bem a um dos desafios da comunidade (trânsito).
Necessidade de novos métodos de PLN. Exploração do sentimento associado a cada um dos eventos de trânsito. (Gonçalves et al., 2013) Novos estudos dos termos a serem utilizados na busca = aumentar a confiança. Recursos gráficos das análises em tempo real.
Demirbas, M., Bayir, M. A., Akcora, C. G., Yilmaz, Y. S., and Ferhatosmanoglu, H. (2010). Crowd-sourced sensing and collaboration using twitter. In Proceedings of the 2010 IEEE International Symposium on A World of Wireless, Mobile and Multimedia Networks (WoWMoM), WOWMOM 10, pages 1 9, Washington, DC, USA. IEEE Computer Society. Endarnoto, S. K., Pradipta, S., Nugroho, A. S., and Purnama, J. (2011). Traffic condition information extraction visualization from social media twitter for android mobile application. In Syaichu-Rohman, A., Hamdani, D., Akbar, S., Adiprawita, W., Razali, R., and Sahari, N., editors, ICEEI, pages 1 4. IEEE. Gomide, J., Veloso, A., Jr., W. M., Almeida, V., Benevenuto, F., Ferraz, F., and Teixeira, M. (2011). Dengue surveillance based on a computational model of spatio-temporal locality of twitter. In ACM Web Science Conference (WebSci).
Aggarwal, C. C. and Abdelzaher, T. F. (2011). Integrating sensors and social networks. In Social Network Data Analytics, pages 379 412. Albuquerque, F. C., Bacelar, F. C., Tapia, X. A. C., and Carvalho, M. T. M. (2012). Extrator de fatos relacionados ao tráfego. SBBD 12 Simpósio Brasileiro de Bancos de Dados, pages 169 176. Baqer, M. (2009). S-sensors: Integrating physical world inputs with social networks using wireless sensor networks. In 5th International Conference on Intelligent Sensors, Sensor Networks and Information Processing (ISSNIP), 2009, pages 213 218. IEEE Computer Society. Chew, C. and Eysenbach, G. (2010). Pandemics in the age of twitter: Content analysis of tweets during the 2009 h1n1 outbreak. PLoS ONE, 5(11):e14118.
Kosala, R., Adi, E., and Steven (2012). Harvesting real time traffic information from twitter. Procedia Engineering, 50(0):1 11. International Conference on Advances Science and Contemporary Engineering 2012. Rosi, A., Mamei, M., Zambonelli, F., Dobson, S., Stevenson, G., and Ye, J. (2011). Social sensors and pervasive services: Approaches and perspectives. In PerCom Workshops, pages 525 530. Sakaki, T., Okazaki, M., and Matsuo, Y. (2010). Earthquake shakes twitter users: realtime event detection by social sensors. In Proceedings of the 19th international conference on World wide web, WWW 10, pages 851 860, New York, NY, USA. ACM. Tumasjan, A., Sprenger, T. O., Sandner, P. G., and Welpe, I. M. (2010). Predicting elections with twitter: What 140 characters reveal about political sentiment. In ICWSM 10, pages 1 1.