Investigando a Influência de Tweets em Programas de Votação Popular no Brasil

Documentos relacionados
Aluno: Lucas Schmidt. Orientador: Prof. Dr. Ricardo Rabelo Co-orientador: Prof. Dr. Fabrício Benevenuto

A utilização de redes sociais da internet para obtenção de dados.

Predição de links em uma rede heterogênea baseada em dados geolocalizados e de relacionamentos

Análise de Difusão de Influência em redes sociais com foco na Hipótese dos Influentes

Mensuração de Resultados em Comunicação

Uma Análise Empírica de Interações em Redes Sociais

Universidade Federal de Pernambuco

Análise de métodos de Inferência Ecológica

TECNOLOGIAS PARA ANÁLISE E INVESTIGAÇÃO DE DADOS PÚBLICOS DA INTERNET

Análise Comparativa entre Modelos de. Predição de Eleições no Twitter

Mineração de Textos na Web

Acesso Aberto. Gabriel Coelho Lucas Schmidt Juliana Coelho Matheus Chung Nin

Bots Sociais: Como robôs podem se tornar pessoas influentes no Twitter?

M&M elege a melhor campanha

Revisão Sistemática: Conceitos Básicos

DEFINING METRIC THRESHOLDS FOR SOFTWARE PRODUCT LINES: A COMPARATIVE STUDY

UBIBUSANALYSIS UMA FERRAMENTA DE INTERPRETAÇÃO DE

Bots Sociais: Como robôs podem se tornar pessoas influentes no Twitter?

Seiji Isotani CURRICULUM VITAE

Information Cascades. Ana Paula Fabrício Benevenuto

Rivanilson da Silva Rodrigues*, Wilkerson de Lucena Andrade, Dalton Dario Serey Guerrero, Lívia Maria Rodrigues Sampaio Campos

Um Comparativo entre Ferramentas para o Desenvolvimento de Jogos Educativos Computacionais Rogério Paulo Marcon Júnior, Giani Petri

Desenvolvimento de Aplicações Móveis Multiplataforma Utilizando Ionic 2

INE5403 FUNDAMENTOS DE MATEMÁTICA DISCRETA

UTILIZANDO A INVESTIGAÇÃO MATEMÁTICA COM O GEOGEBRA PARA CARACTERIZAR FUNÇÕES DE UMA VARIÁVEL REAL QUE SÃO INVERSAS DE SI MESMAS

ANÁLISE DA ATUALIZAÇÃO DOS CURRÍCULOS LATTES Uma análise macro sobre as datas das últimas atualizações dos currículos Lattes

2 2 / j a n / 1 9 a 1 8 / a b r / 1 9

Aprendizagem informal

SALA DE MONITORAMENTO DO ATENDIMENTO AO TURISTA TOURISM DATA MONITORING OFFICE

Jacqueline Mayumi Akazaki 1 ; Letícia Rodrigues Bueno 2 ; Jesús Pascual Mena-chalco 3

@Roseana2010 Dino 1 O uso do Twitter nas Eleições Maranhense de 2010

Predição de Utilização de Recursos Computacionais Usando Séries Temporais

IA346 M Métodos de Pesquisa Para Engenharia de Computação. Atividade 07

SALA DE MONITORAMENTO DO ATENDIMENTO AO TURISTA TOURISM DATA MONITORING OFFICE

Análise de sentimentos para português brasileiro usando redes neurais recursivas

TEMPLATE PARA TCC IFFAR - SVS

Sigam-me os bons! Transformando robôs em pessoas influentes no Twitter

Francisco Benjamim Filho. XHITS: Estendendo o Algoritmo HITS para Extração de Tópicos na WWW DISSERTAÇÃO DE MESTRADO

Avaliação de Desempenho de Sistemas Operacionais em dispositivos embarcados para a provisão de serviços em Internet das Coisas

Utilizando Características Semânticas e Espaço-Temporais de Dados de Social Media para Descoberta de Conhecimento em Smart Cities

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

NCE/16/00189 Decisão de apresentação de pronúncia - Novo ciclo de estudos

ACEF/1112/24182 Decisão de apresentação de pronúncia

Analise da Confiabilidade da Informação Propagada em Mídias Sociais

Aprendizagem de máquina: Regressão Linear em uma instituição de Ensino

Manual de Gerenciamento

Por que anunciar? Entre as marcas que já anunciaram estão Norton (Symantec), Sebrae e TIM.

Identificando SPAM no Twitter através da Análise Empírica dos Tópicos de Tendência do Brasil

A influência das novas tecnologias. Mirella M. Moro UFMG

Autor 1 Orientador: 1. dia de mês de ano

Cap. 6. Introdução a Lógicas Modais

MySQL: Comece com o principal banco de dados open source do mercado (Portuguese Edition)

UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO

Twitter Passo a Passo para Iniciantes. Área Local Agência Digital

2COP355 INTELIGÊNCIA COMPETITIVA. Introdução. Sylvio Barbon Junior 14 de novembro de 2015 DC-UEL Sylvio Barbon Jr 1

Um Método para Melhoria de Dados Estruturados de Imóveis

MÉTRICAS EM MÍDIAS DIGITAIS PROF. ME. WESLEY MOREIRA PINHEIRO

PREMIAÇÕES MTV MOVIE AWARDS_ VIDEO MUSIC AWARDS_ EUROPEAN MUSIC AWARDS_

Sistemas Colaborativos na Gestão de Desastres. MSc. Lívia Castro Degrossi

Customer Insights 2016:

Introdução. Relatório de Mídias Sociais Unesp outubro/2012

propõe a Twittraffic: uma plataforma de monitoração, visualização e

Marketing Digital. Publicidade e Marketing. Aula 11

Procedimentos para Eleição de Distrito

A/ART casa/n caiu/v./. Figura 3.1: Frase com anotação morfossintática.

Interface Humano-Computador

UMA ANÁLISE DESCRITIVA PARA MENSURAR AS AÇÕES DO SUBPROJETO DE LICENCIATURA EM MATEMÁTICA DO PIBID/UFCG

Iam Vita Jabour. O Impacto de Atributos Estruturais na Identificação de Tabelas e Listas em Documentos HTML. Dissertação de Mestrado

Análise e conversão de tabloides de. Igor dos Santos Montagner Orientador: Prof. Dr. Roberto Marcondes Cesar Junior. promoções

Predição do resultado das eleições presidenciais do Brasil baseado em tuítes

Carnaval Desse total de menções, 50,2% foram do gênero masculino e 49,8% feminino. Av. Paulista, cj. 162 São Paulo, São Paulo

Software Testing with Visual Studio 2013 (20497)

Nesta disciplina aprenderemos. HTML CSS JavaScript Jquery PHP

ANÁLISE DAS REDES DE COAUTORIA DO IFSP A PARTIR DOS CURRÍCULOS LATTES

Influência de Avaliações Online Negativas na Atitude e na Intenção de Compra

Utilizando Análise de Sentimentos para Definição da Homofilia Política dos Usuários do Twitter durante a Eleição Presidencial Americana de 2016

Caracterização Remota de Comportamento de Roteadores IPv6

Descoberta de conhecimento em redes sociais e bases de dados públicas

Caracterização Temporal das Redes de Colaboração Científica nas Universidades Brasileiras: Anos

Versão 3.1br. Foundation Level Model Based Tester

Workload Characterization Practical Examples

Tipos para uma Linguagem de Transformação

Em 25 de julho de 2010, no aniversário do PSDB, nascia a Turma do Chapéu.

UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO

Conflitos Interpessoais Entre Idosos Institucionalizados

LIDERANÇA SINDICAL e suas REDES SOCIAIS

The Role of Faubai In the Internationalization of Education - a Portuguese Perspective. João Falcão e Cunha

ACESSIBILIDADE PARA DEFICIENTES VISUAIS NO AMBIENTE VIRTUAL MOODLE: UM ESTUDO DE CASO NO CURSO DE SISTEMAS DE INFORMAÇÃO DA UEG

Pocket Switched Networks: Real World Mobility and its consequences for opportunistic forwarding

Estimativa de demanda potencial de matrículas em ensino superior usando dados públicos e múltiplos modelos de regressão

RESUMO. Palavras-chave: Forró; Universitário; Eletrônico; Salvador; Música; Popular.

UNIVERSIDADE DE SÃO PAULO GIOVANA CRISTINA COTRIN LORO. A Popularidade dos Governadores Brasileiros

NOSSA VISÃO, MISSÃO E VALORES

O novo tema Red & White oferece uma nova cara para o sistema. Mais uma opção de visualização para deixar o sistema ao seu agrado. Figura 1: Novo tema

Os motivos que podem levar um usuário a criar gráficos variam desde simplesmente mostrar seus dados de maneira diferente, até facilitar análises dos

Geração semi-automática de massas de testes funcionais a partir da composição de casos de uso e tabelas de decisão

Sensoriamento Participativo na Composição de Pontos de Interesse

Transcrição:

Investigando a Influência de Tweets em Programas de Votação Popular no Brasil Igleson F. Figueredo, Leandro B. Marinho, Leonardo A. Santos 1 Departamento de Sistemas e Computação Universidade Federal de Campina Grande (UFCG) Campina Grande-PB Brazil {igleson.figueredo,leonardo.santos}@ccc.ufcg.edu.br,lbmarinho@dsc.ufcg.edu.br Abstract. Twitter has been used as a data source by researchers for the investigation and prediction of various aspects of human behaviour in social networks. We investigate in this work the interplay between the performance of participants of popular vote programs in Brazil and their popularity in Twitter. As study case, we collected data from Twitter about the latest editions of two popular vote programs, Superstar and Big Brother Brasil, and found out that the popularity of the participants in Twitter is an important indicator of their respective performances in these programs. Another interesting discovery is the observation that the participants who have better performances, have more positive tweets than the other competitors during the program. Resumo. O Twitter tem sido utilizado por pesquisadores como uma importante fonte de dados para investigação e predição de diversos aspectos do comportamento humano em redes sociais. Investigamos neste trabalho a sinergia entre o desempenho de s de programas de votação popular no Brasil e a sua popularidade no Twitter. Como estudo de caso, nós coletamos dados do Twitter acerca das edições mais recentes de dois programas de votação popular de grande audiência no Brasil, são eles o Superstar e o Big Brother Brasil, e descobrimos que a popularidade dos s destes programas no Twitter é um importante indicador dos seus respectivos desempenhos. Outra descoberta interessante foi o fato dos s de melhor desempenho terem mais tweets positivos que os demais competidores durante o programa. 1. Introdução O Twitter 1 é uma rede social em formato de microblog onde os usuários escrevem livremente e interagem por meio de retweets, likes e mensagens privadas. Dado o grande fluxo de postagens (aka tweets) e de usuários, o Twitter tem se tornado um instrumento importante na caracterização e predição do comportamento humano em redes sociais. Além disso, ele tem sido usado para elucidar opiniões acerca de diversas entidades do mundo real, tais como empresas, artistas, políticos (eleitos e candidatos à eleição), eventos e muitos outros [Gayo-Avello et al. 211], [He et al. 213], [Gomide et al. 211]. Neste trabalho nós investigamos a sinergia entre o desempenho de s de programas de votação popular do Brasil e a sua popularidade no Twitter. Como estudo de caso, coletamos dados do Twitter acerca de dois programas de votação popular 1 http://www.twitter.com

de grande audiência no Brasil, o Superstar 214 e do Big Brother Brasil (BBB) 215, e descobrimos que a popularidade dos s no Twitter é um importante indicador dos seus desempenhos nesses programas, podendo até mesmo ser usada para predizer com alguma antecedência o resultado da votação. Além disso, utilizando análise de sentimento dos tweets no período da votação constatamos que, em geral, o candidato de maior desempenho possui mais tweets positivos do que os competidores durante o programa. O artigo está organizado da seguinte forma. Na Seção 2 apresentamos brevemente os trabalhos relacionados. Na Seção 3 apresentamos a metodologia empregada na coleta dos dados. Na Seção 4 apresentamos os resultados desta pesquisa, discutimos os resultados e, finalmente na Seção 5, concluímos o artigo e apresentamos direções para trabalhos futuros. 2. Trabalhos Relacionados Não encontramos na literatura revisada nenhum trabalho sobre a influência de tweets nos programas de votação populares brasileiros. Todavia, há uma grande quantidade de trabalhos que analisam dados do Twitter para a predição de outros aspectos do comportamento humano, como, por exemplo, tráfego em uma cidade [He et al. 213], incidência de dengue [Gomide et al. 211], eleições políticas [Gayo-Avello et al. 211] e quão popular um tweet irá se tornar no futuro [Szabo and Huberman 21], [Bandari et al. 212], [Hong et al. 211]. Diferentemente destes, este trabalho tem como objetivo principal investigar se a popularidade, assim como o sentimento, acerca de uma dada entidade (e.g. uma banda) no Twitter é útil para predizer seu desempenho em programas de votação popular no Brasil. 3. Coleta e Preparação dos Dados Por limitações da API do Twitter a coleta de dados foi feita de forma semi-manual. Para isso foi usada a página de busca avançada. Como a página restringe o número de respostas por página, foi criado um script em Javascript para que fosse gerado todas as requisições até a data desejada. Assim o html da página foi baixado e suas informações extraídas via Jsoup (um parser de html em Java). Os dados extraídos foram: id, texto, data e o sentimento do tweet (positivo ou negativo) quando disponível. O sentimento foi extraído por meio da própria ferramenta de busca do Twitter, utilizando emoticons (exemplos são :) para positivo e :( para negativo). Para o Superstar foram coletados tweets de Fevereiro até Outubro de 214, período que precede o início e sucede o término do programa em exatos três meses respectivamente. Consideramos neste estudo somente as quatro bandas finalistas (em negrito), cujos tweets foram coletados por meio dos seguintes conjuntos de hashtags: Suricato={Suricato, SuricatoBanda, BandaSuricato e suricatooficial}, Jamz={ Jamz, Jamz- Banda, BandaJamz, Jamerz e jamzoficial}, Luan Estilizado={LuanEstilizado, LuanE- OForroEstilizado, LuanEForroEstilizado}, Malta={ AvanteMalta, ExercitoAzul, Malta- Campea, Malta, BandaMalta, MaltaBanda,malta_oficial}. Já para o BBB foram coletados tweets no período de 1 de Janeiro a 1 de Abril de 215, que corresponde a vinte dias antes do início do programa e três dias após o término do programa respectivamente. A busca foi feita utilizando o nome do seguido de BBB, por exemplo Fernando BBB. No total foram coletados 193.415 tweets sobre o BBB e 9.938 sobre o Su-

perstar. No caso do Superstar foram coletados 73 tweets com data anterior, 5.93 durante e 3.935 com data posterior ao programa. Como os períodos de exibição dos programas são diferentes, o BBB é um programa diário enquanto o Superstar é semanal, nossas análises levam em consideração que os dados do Superstar são agrupados por semana e os do BBB por dia. Outra observação importante é que ao analisar manualmente o texto dos tweets com sentimentos do Superstar, é possível notar que a grande maioria dos tweets classificados como negativos tinham na verdade teor positivo em relação à banda. A negatividade do tweet se dava por outros motivos, como, por exemplo, alguma impossibilidade de votar a favor da banda. O tweet a seguir coletado sobre a banda Malta exemplifica essa situação: Gente, a Banda Malta tem twitter? Não achei :((((. Por esse motivo, consideramos todos os tweets negativos do Superstar como sendo na realidade positivos. 4. Resultados e Discussão Nesta seção nós conduzimos uma ampla análise dos dados coletados com o objetivo principal de responder as seguintes perguntas: P1. A popularidade dos s em termos de quantidade de tweets apresenta alguma relacão com o desempenho dos mesmos no programa? P2. A quantidade de tweets positivos dos s apresenta alguma relação com o desempenho dos mesmos no programa? 4.1. Análise de tweets do Superstar A Figura 1.a mostra a série temporal da quantidade de tweets para cada banda. Note que todas as bandas apresentam a mesma tendência, isto é, possuem poucos tweets antes do programa, durante o programa tem um pico de popularidade e após o programa tem uma queda porém continuam mais populares que anteriormente ao programa. Na final do programa (transição entre o fundo rosa e verde no gráfico) a banda Malta tem uma quantidade muito maior de tweets que as outras bandas. É interessante notar que a quantidade total de tweets durante o programa, casa exatamente com a ordem do resultado final do programa, isto é, a banda Malta em primeiro com 1738 tweets, seguida da bandas Jamz com 429, Luan Estilizado com 265 e Suricato com 123. A Figura 1.b mostra a mesma série temporal para os tweets positivos, que apresenta basicamente a mesma tendência da Figura 1.a. Observando apenas a banda campeã, nota-se que desde o início do programa ela já vinha sendo a mais comentada, aumentando a diferença para as outras bandas na metade do programa. Isso indica que nesse momento já teríamos fortes indícios de que ela seria a campeã. Por volta de três quartos do programa a quantidade de tweets de cada banda se encontra na mesma ordem do resultado final do programa. 4.2. Análise de twees do BBB No caso do BBB, concentramos nossa análise nos últimos quatro paredões (eliminação por votação do público). A Figura 2 mostra as distribuições da quantidade de tweets positivos para cada paredão. Note que, em todos os paredões, o que teve menor número de tweets sempre foi o eliminado, o que nos leva a conjecturar que quanto mais tweets positivos maior a chance do continuar no programa.

Figura 1. (a) Série temporal dos tweets dos finalistas do Superstar & (b) Série temporal dos tweets positivos dos finalistas do Superstar A Figura 3 contrasta as totais de tweets, tweets positivos e votação real 2 nos quatro últimos paredões do programa, considerando somente o período que compreende a definição do paredão e dia de votação (regiões cinza da Figura 2). Para uma melhor visualização a quantidade de menções está representada em porcentagem. É interessante notar que no BBB os eliminados do programa são aqueles que tem menos tweets positivos. 4.3. Discussão É importante ressaltar que o formato dos programas investigados é diferente. O Superstar é um programa semanal onde cada banda se apresenta e tem basicamente o mesmo tempo de exposição. Dessa forma, os tweets basicamente tendem a endorsar as preferências do público pelas bandas. Já os tweets do BBB tratam de vários assuntos muitos dos quais não estão relacionados com intenções de voto. Por exemplo, a existência de um triângulo amoroso envolvendo os s do BBB Fernando, Amanda e Aline, acabou gerando vários tweets sobre esses s 3. Outra observação importante é o fato de que no Superstar todas as bandas se esforçavam para conseguir popularidade no Twitter, por meio de hashtags oficiais, enquanto apenas alguns s do BBB fizeram isso, por exemplo o Fernando por meio da hashtag #FernandoProtagonistaDoBBB. Temos as seguintes considerações às perguntas elencadas no início desta Seção. Para a pergunta P1, conforme foi mostrado e discutido durante toda a seção, a quantidade de tweets tem de fato uma forte relação com o desempenho dos s em ambos os programas, especialmente nos dias de votação. Em relação à pergunta P2, observamos que a quantidade de tweets positivos está de fato diretamente relacionada ao desempenho dos s em ambos os programas. 2 A votação diz respeito à eliminação, ou seja, sai do programa quem recebe mais votos. Com exceção da final, que é o contrário. 3 http://www.bbb-215.com/215/4/votacao-final-cezar-ou-amanda-quem-vai-ganhar. html

2 Tweets positivos no paredão 9 Tweets positivos no paredão 1 6 6 4 Cezar 49.78% Mariza 5.22% 4 Adrilles 65% Cezar 2 55 6 65 64 68 72 (a) 9 (b) 1 Tweets positivos no paredão 11 Tweets positivos na final 1. 12 7.5 5. Amanda 22% Fernando 78% 8 Amanda 35% Cezar 65% 4 2.5 7 72 74 76 (c) 11 76 77 78 79 8 (d) Final Figura 2. Análise temporal dos tweets positivos para os quatro últimos paredões 5 6 4 3 2 1 4 2 8 Mariza Cézar Cézar Adrilles. (a) 9 (b) 1 6 6 4 2 4 2 Amanda Fernando (c) 11 Amanda Cézar (d) Final Figura 3. Quantidades de tweets totais e positivos em porcentagem

5. Conclusões e Trabalhos Futuros Neste artigo nós investigamos a sinergia entre o desempenho de s de programas de votação popular da grande mídia no Brasil e a sua popularidade no Twitter durante o programa. Para isso, nós coletamos dados do Twitter acerca das edições mais recentes do Superstar e Big Brother Brasil, dois programas de grande audiência na mídia brasileira. Notamos que a quantidade total de tweets tem uma forte relação com o desempenho dos s dos programas. Enquanto no Superstar a quantidade total de tweets está relacionada a quem fica no programa, no BBB está relacionada a quem é eliminado. Já a quantidade de tweets no dia da votação, nos dois programas, é mais discriminativa para determinar quem receberá mais votos do que os tweets agregados ao longo de todo o programa. Em ambos os programas, a quantidade de tweets positivos está diretamente relacionada ao desempenho dos s do programa. Como trabalhos futuros pretendemos repetir os experimentos do presente artigo para as próximas edições do Superstar e BBB de forma a verificar se as conclusões aqui tiradas continuam válidas. Também pretendemos, a partir dos resultados aqui apresentados, construir modelos de predição para estes programas. Finalmente, também pretendemos aplicar/desenvolver métodos mais sofisticados de análise de sentimento para os tweets acerca desses programas. Agradecimentos Gostaríamos de agradecer a Ana Caroina Cabral de Paiva e Matheus Santos Sampaio por terem contribuído com a coleta e análises preliminares dos dados. Este artigo foi desenvolvido em cooperação com a Hewlett-Packard Brasil Ltda., no contexto do projeto HP/UFCG Analytics 215, e utilizou incentivos da Lei deinformática brasileira (lei n. 8.2.48 de 1991). Este trabalho também foi apoiado (em parte) pelo Instituto Nacional de Ciência e Tecnologia para Engenharia de Software (INES 4 ), financiado pelo CNPq e FACEPE, processos 573964/28-4 e APQ-137-1.3/8. Referências Bandari, R., Asur, S., and Huberman, B. A. (212). The pulse of news in social media: Forecasting popularity. CoRR, abs/122.332. Gayo-Avello, D., Metaxas, P. T., and Mustafaraj, E. (211). Limits of electoral predictions using twitter. In Proc. of ICWSM. Gomide, J., Veloso, A., Meira, Jr., W., Almeida, V., Benevenuto, F., Ferraz, F., and Teixeira, M. (211). Dengue surveillance based on a computational model of spatiotemporal locality of twitter. In Proc. of Web Science Conference, pages 3:1 3:8. He, J., Shen, W., Divakaruni, P., Wynter, L., and Lawrence, R. (213). Improving traffic prediction with tweet semantics. In Proc. of IJCAI, pages 1387 1393. Hong, L., Dan, O., and Davison, B. D. (211). Predicting popular messages in twitter. In Proceedings of the 2th International Conference Companion on World Wide Web, WWW 11, pages 57 58, New York, NY, USA. ACM. Szabo, G. and Huberman, B. A. (21). Commun. ACM, 53(8):8 88. 4 www.ines.org.br Predicting the popularity of online content.