Redes Sociais como Fonte de Informação para Cidades Inteligentes



Documentos relacionados
DESENVOLVIMENTO DE UM REPOSITÓRIO DE DADOS DO FUTEBOL BRASILEIRO

OBTENDO CONHECIMENTO A PARTIR DOS TWITTES PESSOAIS. FRANTZ, Miguel Airton 1 ; FROZZA, Angelo Augusto 2 Instituto Federal Catarinense, Camboriú/SC

2 Fundamentação Conceitual

UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 14 PROFª BRUNO CALEGARO

Computador E/S, Memória, Barramento do sistema e CPU Onde a CPU Registradores, ULA, Interconexão interna da CPU e Unidade de controle.

Sistema de Controle de Posicionamento de Estações Móveis via Internet e GPS

Trabalho de Implementação Jogo Reversi

3.1 Definições Uma classe é a descrição de um tipo de objeto.

UFG - Instituto de Informática

Mineração de Opinião / Análise de Sentimentos

Itens estruturais/caso de uso. Itens estruturais/classe ativa. Itens estruturais/componente. Itens estruturais/artefatos. Itens comportamentais

REDE SOCIAL DE MAPEAMENTO COLABORATIVO DE PROBLEMAS AMBIENTAIS E URBANOS NAS CIDADES Resultados preliminares

Arquimedes e Controle de Obra

PRÓ-REITORIA DE EXTENSÃO, PESQUISA E INOVAÇÃO DIRETORIA DE INOVAÇÃO E PESQUISA FORMULÁRIO II: Relatório de Atividades de Pesquisa

Nesta seção apresentamos protótipos que desenvolvemos com o objetivo de levantar os requesitos necessários para um sistema para apresentações

5.1. Análise Comparativa

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining.

Introdução a Banco de Dados Aula 03. Prof. Silvestri

Observatório da Saúde

Há 17 anos no mercado, a PREMIUN Tecnologia desenvolve soluções para o gerenciamento e controle de gastos em telefonia.

ASSUNTO DA APOSTILA: SISTEMAS DE INFORMAÇÃO E AS DECISÕES GERENCIAIS NA ERA DA INTERNET

Estudo de Caso Bicicletada Curitiba

Backsite Serviços On-line

O Processo de Engenharia de Requisitos

Metadados. 1. Introdução. 2. O que são Metadados? 3. O Valor dos Metadados

Especificação do Trabalho Prático

TECNOLOGIA WEB Aula 1 Evolução da Internet Profa. Rosemary Melo

QUALIDADE DE SOFTWARE

PESQUISA DE PERCEPÇÃO SMARTCITIES / CIDADES INTELIGENTES

Identificar as características de funcionamento do sistema operacional;

Sistema de Reserva de Laboratório Trabalho Semestral Versão 1.0

UM ESTUDO SOBRE OS FRAMEWORKS JSF E PRIMEFACES NO DESENVOLVIMENTO DE SOFTWARE WEB

É importante que nos atenhamos a alguns aspectos importantes sobre banco de dados:

Sistema de Proteção para Servidores de Jogos Online Contra Softwares Clientes Não Oficiais

Aula 2 Revisão 1. Ciclo de Vida. Processo de Desenvolvimento de SW. Processo de Desenvolvimento de SW. Processo de Desenvolvimento de SW

O ENSINO DE CÁLCULO NUMÉRICO: UMA EXPERIÊNCIA COM ALUNOS DO CURSO DE CIÊNCIA DA COMPUTAÇÃO

Armazenamento e Pesquisa de Topic Maps em Banco de Dados Relacional

Sistemas Operacionais. Prof. André Y. Kusumoto

Ferramenta para Geração de Código a partir da Especialização do Diagrama de Classes

04/07/2015 UML. Prof. Esp. Fabiano Taguchi DEFINIÇÃO DE REQUSIITOS

Evolução da cooperação em populações modeladas por autômatos celulares com o uso de teoria de jogos

Aula 03-04: Modelos de Sistemas Distribuídos

1 O Problema 1.1 Introdução

ANEXO V Edital nº 03508/2008

A TNT Garante a Entrega de 4,4 Milhões de Pacotes por Semana

Aprimoramento através da integração

agility made possible

JinSol, uma interface em Java para solvers lineares.

Disciplina: Redes de Comunicação. Curso Profissional Técnico de Gestão e Programação de Sistemas Informáticos. Setembro 2013

QUALIDADE DE SOFTWARE

Normatização de Métricas. 3. Taxa de. engajamento

Manual do Teclado de Satisfação Online WebOpinião

Uso das ferramentas de monitoramento de gerência de redes para avaliar a QoS da rede.

CAPÍTULO 2. Entendendo a Internet

SISTEMAS DISTRIBUIDOS. Prof. Marcelo de Sá Barbosa

TÍTULO: DESENVOLVIMENTO DE UM CONTADOR VOLUMÉTRICO DE VEÍCULOS E PESSOAS COM ARDUINO

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO TÓPICOS AVANÇADOS EM SISTEMAS INTEGRADOS E DISTRIBUÍDOS II

PROCESSOS DE CRIAÇÃO DE APLICATIVOS

Fórum de Software Livre. Capacitação em Software Livre 2014 Nelson Luiz Cesário UNESP/FCAV Jaboticabal/SP

JavaServer Faces. Parte 2

6 Ferramenta de Apoio ao Processo de Desenvolvimento de Sistemas Multi-Agentes

Projeto "Aqui Tem Cultura"

Gestão de projectos na Web

ORGANIZAÇÃO DE COMPUTADORES MÓDULO 1

REGULAMENTO DA UTILIZAÇÃO DA REDE DE COMPUTADORES DA FACULDADE CENECISTA DE OSÓRIO

Guia do Usuário. idocs Content Server v

Engenharia de Software. Tema 1. Introdução à Engenharia de Software Profa. Susana M. Iglesias

Especificação Técnica Sistema ABS TEM+

Eixo Temático ET Gestão Ambiental PROJETO DE MINIMIZAÇÃO DO IMPACTO AMBIENTAL EM UMA INDÚSTRIA DO ALTO SERTÃO DA PARAÍBA

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE SISTEMAS DE INFORMAÇÃO BACHARELADO

CA Mainframe Chorus for Storage Management Versão 2.0

Cinco restrições de desenvolvimento/teste que afetam a velocidade, o custo e a qualidade dos seus aplicativos

AUXILIAR ADMINISTRATIVO CONHECIMENTOS GERAIS. A Inteligência Animal

Projeto de Banco de Dados. Disciplina: Banco de Dados I José Antônio da Cunha

c. Técnica de Estrutura de Controle Teste do Caminho Básico

EE531 - Turma S. Diodos. Laboratório de Eletrônica Básica I - Segundo Semestre de 2010

7 Mudanças Realizadas

Internet. Gabriela Trevisan Bacharel em Sistemas de Infomação

perspectivas e abordagens típicas de campos de investigação (Senra & Camargo, 2010).

2 Engenharia de Software

Política de Privacidade do Serviço OurSound para Estabelecimentos

2 Gerenciamento de Log 2.1 Definições básicas

BLOG CONVERGÊNCIA DIGITAL E COMUNICAÇÃO COMUNITÁRIA: SOCIALIZANDO CONHECIMENTO 1

GBD PROF. ANDREZA S. AREÃO

POLÍTICA DE RESPONSABILIDADE SOCIOAMBIENTAL

Análise de Pontos de Função. Por Denize Terra Pimenta

UNIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA

ADMINISTRAÇÃO E SERVIÇOS DE REDE

Introdução a Web Services

Projeto mgov2 Redes Sociais e Dispositivos Móveis. Projeto mgov2 Redes Sociais e Dispositivos Móveis

Disciplina de Redes de Computadores Estudo Dirigido para a Prova II Professor Dr Windson Viana de Carvalho

Siga o seu próprio caminho

Sistemas supervisórios

Serviços Web: Arquitetura

GM IMOBILIZADO. O parceiro ideal nas tecnologias de Informação. O GM Imobilizado é a solução para a eficaz gestão do Imobilizado de uma organização.

BIOSYS: sistema de captura e armazenamento de imagens para exames oftalmológicos em biomicroscópios - Fase 1 1

Transcrição:

Redes Sociais como Fonte de Informação para Cidades Inteligentes Mickael R. C. Figueredo 1, Nélio Cacho 2, Carlos A. Prolo 2 1 Escola de Ciência e Tecnologia Universidade Federal do Rio Grande do Norte (UFRN) 2 Departmento de Informática e Matemática Aplicada Universidade Federal do Rio Grande do Norte 1. Introdução mickaelfigueredo@hotmail.com.br, {neliocacho,prolo}@dimap.ufrn.br As grandes cidades possuem uma grande complexidade para serem administradas por seus governantes, tanto no sentido social, como econômico. Existem formas de tornar todo o processo o mais automatizado possível quando se trata do âmbito social. No contexto presente, a abordagem de smart city se aplica. Para [1], uma cidade pode ser definida como inteligente quando há investimento em capital humano e social, bem como em infraestrutura de Tecnologias da Informação e Comunicação. A grande dificuldade para a inserção da ideia de Cidades Inteligentes é o alto custo dos métodos de coleta de dados, sejam câmeras ou sensores, por exemplo. Desta forma, a utilização das redes sociais para a coleta de dados com o objetivo alimentar à análise das ferramentas no meio de smart cities é uma boa opção para superar as dificuldades encontradas, aplicando os dados em uma ferramenta de detectação. Foram divididas etapas para o processo visando o funcionamento ideal do código. O objetivo da ferramenta citada é trabalhar como um sensor capaz de apresentar a localização de eventos espalhados pela cidade, demonstrando quais possuem uma tendência negativa ou positiva. Os resultados apresentados pela solução proposta foram condizentes com as pesquisas oficiais realizadas no mesmo período, demonstram como uma rede social e os dados oriundos dela podem ser utilizados como sensores no contexto de Cidades Inteligentes. Nesse caso, foi escolhido o Twitter como base do estudo devido a grande quantidade de dados que expressam diretamente opiniões de usuários, além de ser capaz de disponibilizar informações importantes para o processo de validação dos dados obtidos. 2. Abordagem Foi criada uma ferramenta de detecção de eventos na região metropolitana de Natal em tempo real. Para tornar possível a utilização dessa infraestrutura foi utilizado o Apache Storm[2], ferramenta livre de código aberto produzido para tornar viável o processamento em tempo real. Inserido dentro da infraestrutura do Storm estão uma série de etapas da ferramenta. Primeiramente é necessário alimentar a aplicação com dados oriundos de uma rede social. Foi utilizado o Twitter4j[3] para a captura de mensagens do Twitter. Essa coleta é feita dentro da estrutura já citada que utiliza uma API em Java para integrar a plataforma com um twitter service. Usando a função Stream da API, é possível coletar dados de acordo com um conjunto de filtros que podem ser definidos pelo componente de análise

e visualização. Por exemplo, pode-se definir filtros para capturar apenas tweets emitidos em uma determinada região geográfica, ou que contenham determinadas hash tags, ou palavras específicas. Na aplicação foi criado um arquivo o qual eram passadas determinadas tags para a filtragem, entretanto era possível modificar esses parâmetros para filtros dependentes de localização ou idioma. O arquivo tornava possível a não interrupção do código para a mudança do filtro utilizado, entretanto, o mesmo filtro foi mantido durante toda a copa. Após a coleta, os dados são separados por idioma, em inglês ou português, para receberem o processamento de linguagem natural(pln) específico para cada caso. Definese PLN [4], em um sentido amplo, a área que cobre qualquer tipo de manipulação de um computador, ou máquina, sobre uma linguagem utilizada para a comunicação entre seres humanos. No caso dessa ferramenta foi utilizada a Polarização. As separação da linguagem é feita utilizando uma biblioteca da google, que é chamada no código através de um arquivo de extensão.jar. A biblioteca utiliza um filtro Bayesiano e garante um precisão de 98% para 52 línguas na versão utilizada. Já a polarização consiste em identificar se uma postagem tem sentimento positivo, negativo ou neutro sobre determinado assunto. Na versão atual da plataforma são suportados os polarizadores em inglês e português. Para a polarização dos dados inglês foi utilizada a biblioteca Stanford CorePLN. A ferramenta baseia-se na implementação do modelo de mineração sentimento de Socher et. al. [5] e utiliza inúmeras classes de processamento de linguagem natural. Neste caso, foi utilizada a classe Sentiment [6] que estrutura a frase em uma árvore sintática, marcando em particular cada palavra com sua classe gramatical (Part Pf Speech Tagger), como verbo, adjetivo, nome e pronome considerando a devida importância de cada palavra no processo de análise do sentimento, para que por fim, seja retornado a polaridade da frase passada como parâmetro. Nomes de pessoas públicas e até mesmo cidades e países influenciam no processo e seu resultado final. Para a polarização das postagens em português foi criado um componente de análise de sentimento que atendesse a estrutura de execução definida pela infraestrutura de processamento em tempo real. A base desse componente é o SentiLex [7], um léxico de sentimento para o português, constituído por 7.014 lemas e 82.347 formas flexionadas. As classes de palavras presentes nesse contexto são adjetivos, nomes, verbos e expressões idiomáticas. Após o devido processamento, é necessário o armazenamento dos resultados. Para isso o MongoDB[8], um banco de dados de alta performance e orientado a documentos, foi utilizado nessa etapa. O último passo consiste na visualização, no qual foi utilizado uma interface WEB no formato de dashboard implementada em HTML/JavaScript utilizando as bibliotecas Google Maps API V3 e Google Charts para gerar os mapas e os gráficos, respectivamente. 3. Estudo de Caso Com objetivo de testar a ferramenta, durante o período da Copa do Mundo FIFA 2014 foram coletados tweets em todo o mundo. A coleta se inicio em 00:00:00 do dia de início do evento esportivo e se estendeu até dois dias após o fim do mesmo. Optou-se por coletar os dados durante a copa para que fosse possível comparar os resultados fornecidos pela análise das postagens com estatísticas oficiais produzidas para grandes eventos como a

copa do mundo. O filtro utilizado na nossa ferramenta foram tags que faziam referência a cidades que recebiam jogos do evento, como Natal, Rio de Janeiro e Manaus. Figura 1. Mapa de Localização dos Tweets Podem-se identificar focos específicos de mensagens durante o período da Copa Do Mundo. O estádio que sediou os jogos é um deles, com uma razoável concentração de dados oriundos da mesma região. Entretanto, um local específico foi considerado fora do padrão. Uma casa de show foi detectada nesse processo, local o qual foi utilizado por turistas americanos como ponto de concentração durando os jogos da Seleção Americana. Figura 2. Polaridade dos Tweets em Inglês Partindo para a análise de polaridade do tweets de idioma inglês, verifica-se que os tweets positivos predominaram durante todo o processo, demonstrando a aceitação da Copa do Mundo. Entretanto, no dia 08/07/2014, um pico de negatividade foi apresentado, coincidindo com o jogo do Brasil vs Alemanha, o qual resultou no 7x1 histórico. Além disso, pode-se verificar que os picos de polaridade condizem com os jogos da seleção dos Estados Unidos. Durante a análise de dados, foi claro o expressivo número de usuários norte americanos que utilizaram o Twitter para expor opiniões durando o período de captura de dados. Por outro lado, os dados oriundos da língua portuguesa percebe-se a superioridade dos tweets em negativo, provavelmente devido à onda de protestos e revoltas relacionadas à Copa do Mundo do Brasil.

Figura 3. Polaridade dos Tweets em Português 4. Conclusão A iniciativa teve como objetivo principal demonstrar que as redes sociais podem ser utilizadas na iniciativa de Cidades Inteligentes devido à veracidade e quantidade de dados oferecidos pela mesma. No estudo apresentado no resumo, foi demonstrado através da aplicação introduzida na Copa do Mundo FIFA 2014, que focos de concentração de turistas e picos de polaridade relacionados ao evento foram detectados pela ferramenta utilizadora dos dados do Twitter, demonstrando a eficácia do processo.

Referências [1]Caragliu, A., Del Bo, C., and Nijkamp, P. 2011. Smart cities in Europe. Journal of Urban Technology, 18(2), 65?82. [2]Apache Software Foundation. Apache Storm. Disponível em: https://storm.apache.org/. Acessado em Junho/2015: [3]Twitter4J. Twitter4J. 2015. Disponível em: http://twitter4j.org/en/index.html. Acesso em: 25 jun. 2015. [4] Bird, S., Klein, E. and Loper, E. 2009. Natural Language Processing with Python. O?Reilly, CA. Disponível em: http://victoria.lviv.ua/html/fl5/naturallanguageprocessingwithpython.pdf [5] Socher, R., Perelygin, A., Wu, J., Chuang, J. Manning, C. Ng, A. and Potts, C. 2013. Recursive deep models for semantic compositionality over a sentiment Treebank. In Proceedings of the Conference on Empirical Methods in Natural Language. [6] The Stanford Natural Language Processing Group. 2014. Stanford CorePLN: a suite of core PLN tools. Disponível em: http://pln.stanford.edu/software/corepln.shtml. [7] Silva, M. J., Carvalho, P. and Sarmento, L. 2012. Building a Sentiment Lexicon for Social Judgement Mining. In International Conf. on Computational Processing of the Portuguese Language (PROPOR), Springer, pp. 218-228. [8] MongoDB. MongoDB. 2015. Disponível em: https://www.mongodb.org/. Acesso em: 25 jun. 2015.