Data Science A ciência de dados em redes sociais: uma análise sobre o Facebook Leonardo Sápiras

Documentos relacionados
Descoberta de conhecimento em redes sociais e bases de dados públicas

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

2011 Profits Consulting. Inteligência Computacional

Análise de Sentimentos. Arthur Carlos Deyvirson Rafael

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

Plataforma de Ciência de Dados. aplicada à Saúde. Pesquisador em Saúde Pública

Análise de Sentimentos em Tweets: um estudo de caso da Copa do Mundo de Futebol 1

Universidade do Sul de Santa Catarina Ciência da Computação Aula 09 Introdução a Análise de Textos Prof. Max Pereira

Análise de Sentimento - Parte I

GRADE HORÁRIA 2º SEMESTRE DE 2017

1 No decorrer do ano de 2010, a Coordenação do Curso de Letras: No decorrer do ano letivo

Mineração de Opiniões Baseada em Aspectos em Fontes de Opiniões Fracamente Estruturadas

Fundamentos de Mineração de Dados

Mineração de Opinião Aplicada ao Cenário Político

Inteligência Artificial ta complicada? Vamos descomplicar!

INFORMÁTICA EM SAÚDE

UFV Catálogo de Graduação SISTEMAS DE INFORMAÇÃO. COORDENADORA Liziane Santos Soares

Minerando dados com o Facebook. Zalba Monteiro

Oportunidades na Ciência da Computação: Uma visão na perspectiva de Ciência de Dados

Metodologia de Desenvolvimento de Sistemas Informação

RNA aplicadas. Sistemas que aprendem sobre tendências e regras de negócio

Sistemas de Informação Campus de Três Lagoas

KDD E MINERAÇÃO DE DADOS:

SQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina

TECNOLOGIAS PARA ANÁLISE E INVESTIGAÇÃO DE DADOS PÚBLICOS DA INTERNET

Classificação de Sentença

6 Atributos. A dívida da empresa subiu.

Contribuição da TI para as Operações Financeiras. Edilson Reis, Bradesco


Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes

Uma ferramenta para expansão do vocabulário com base em coocorrência

Desenvolvimento de Carreira Aula Evandro Deliberal

Introdução à Informática. Aula 1

UNIVERSIDADE PRESBITERIANA MACKENZIE

Relatório Anual de Atividades 2011

Chatbot para negócios GETBOTS A NOVA GERAÇÃO DE BOTS NO BRASIL

T-MAPS: Modelo de Descrição

Currículos dos Cursos UFV CIÊNCIA DA COMPUTAÇÃO. COORDENADOR José Augusto Miranda Nacif

Visualização de Texto e Documento

Profª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni

Introdução a Ciência de Dados Com Linguagem R

informação enviada (ex. Facebook) ou que a rede social utilize essa informação para sugerir locais de interesse próximos ao usuário (ex. Foursquare).

Construindo um chatbot com Retrieval-based models. Bárbara

UFV Catálogo de Graduação CIÊNCIA DA COMPUTAÇÃO. COORDENADOR José Augusto Miranda Nacif

MINISTÉRIO DA EDUCAÇÃO SECRETARIA DE EDUCAÇÃO PROFISSIONAL E TECNOLÓGICA INSTITUTO FEDERAL DO NORTE DE MINAS GERAIS CAMPUS MONTES CLAROS 1 PERÍODO

Os cruzamentos tributários e a inteligência fiscal na RFB

PROCESSAMENTO DE TEXTO

Caminhos de Amizades pelo Facebook:

Redes P2P. Apresentadora: Luciana Pereira Oliveira. Duração: 40 minutos Data: 20/07/

1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a

Caminhos de Amizades pelo Facebook: Dualidade Computacional entre Curto e Longo

Ferramenta de apoio a identificação de eventos utilizando Linguagem Natural. Aluno: Ricardo Tomelin Orientador: Everaldo Artur Grahl

BIG DATA: UMA INTRODUÇÃO. Prof. Ronaldo R. Goldschmidt

FERRAMENTA PARA VISUALIZAÇÃO DA REDE SOCIAL DE PROFESSORES DO IFSP COM ENFOQUE NAS RELAÇÕES DE PESQUISA

Introdução à Computação

Escalonamento Adaptativo para o Apache Hadoop

2 Mineração de Textos: Fundamentos e Aplicações

ANÁLISE DAS REDES DE COAUTORIA DO IFSP A PARTIR DOS CURRÍCULOS LATTES

Computação e Imagens: PI, CG e Visualização. Computação Visual

1 Computação (2.º Semestre): Documentos para consulta no exame N.º. Nome completo: Curso: Foto:

Combinando Mineração de Textos e Análise de Redes Sociais para a Identificação das Áreas de Atuação de Pesquisadores

Especialização em MBA em Inteligência de Negócios

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais

Informática Parte 10 Prof. Márcio Hunecke

Minerando Padrões Sequenciais para Bases de Dados de Lojas Virtuais

Processamento Digital de Imagens

Recomendação de Produtos Financeiros. Unindo Inteligência Artificial ao conhecimento de especialistas

Processamento Digital de Imagens

Abrindo os dado públicos da Universidade Federal do Maranhão Um breve estudo

Uso de Anotações Semânticas para Exploração de Paralelismo em Workflows Intensivos em Dados

Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da. Sylvio Barbon Jr

API DE INTEGRAÇÃO VERSÃO 2. Janeiro/2017. Manual de Integração. Setor de Desenvolvimento

Observatório da Web: Uma Plataforma para Monitoramento de Eventos em Tempo Real. Gisele L. Pappa Outubro/2013

Utilização do console WEB de Administração de Usuários [Version 04/02/2013]

PROTÓTIPO PARA SUMARIZAÇÃO AUTOMÁTICA DE TEXTOS ESCRITOS EM LÍNGUA PORTUGUESA ALEXANDRE BUSARELLO JOYCE MARTINS

Introdução às Redes Neurais

Pesquisa e Extração de Informação de Grupos de Discussão na Web

CINEMAN.ULTRA. Manual de usuário

Construindo Aplicações Node com MongoDB e Backbone Mike Wilson

Política de Privacidade Este aplicativo coleta alguns dados pessoais de seus usuários. Resumo

REDES NEURAIS. Marley Maria B.R. Vellasco. ICA: Núcleo de Pesquisa em Inteligência Computacional Aplicada CONTEÚDO

Coleções Científicas e Biodiversidade. A contribuição da rede specieslink na divulgação da biodiversidade brasileira

Extração de Alvos em Comentários de Notícias em Português baseada na Teoria da Centralização

Programa 25/02/2019. Objetivo Geral: Processamento Digital de Imagens I Turma A. Objetivos Específicos:

APLICAÇÃO DA TÉCNICA TEXT MINING PARA AUXÍLIO NA CLASSIFICAÇÃO DE INCIDENTES DE SERVICE DESK

Análise Estatística e Topológica do Webgraph

Banco de Dados? Banco de Dados Professor Vanderlei Frazão

Compressão de Textos. Introdução. Introdução. Introdução. O volume de informação textual disponível on-line é imenso:

EDITAL Nº 007/ O processo seletivo será realizado pela Coordenação do PPG-CCM.

Extração de dados altmétricos das mídias sociais

Como novas tecnologias podem impactar seu negócio?

Mineração de Texto Educacional

MACHINE LEARNING E DATA SCIENCE NA SAÚDE. aprendendo a usar as ferramentas da inovação sem precisar programação

Mineração de Opinião / Análise de Sentimentos

Disciplinas Eletivas do Curso de Sistemas de Informação

Não é bem assim. Mirella M. Moro. Muuuuuita info em pooooouco tempo

INFORMAÇÃO SISTEMAS DE INFORMAÇÃO

Objetivo: Desenvolver algoritmos a partir de problemas

FORMAÇÃO DO BACHAREL EM ESTATÍSTICA À LUZ DAS CIÊNCIAS DE DADOS

MCZA Processamento de Linguagem Natural Introdução

Transcrição:

Data Science A ciência de dados em redes sociais: uma análise sobre o Facebook Leonardo Sápiras Mestre em Ciência da Computação

Apresentação Bacharel em Sistemas de Informação (FACCAT) Mestre em Ciência da Computação (UFRGS) Coordenador de TI (FACCAT) Professor universitário (FACCAT) Áreas de interesse Desenvolvimento WEB Mineração de dados Big Data Ciência de dados Inteligência Artificial Contatos leonardosapiras@gmail.com https://www.facebook.com/leonardosapiras https://www.linkedin.com/in/leonardosapiras/ https://www.leonardosapiras.com.br

Roteiro Facebook Como obter dados GraphAPI Estrutura de dados Privacidade Case - Análise de dados de grupos regionais

Facebook Lançamento em fevereiro de 2004 Maior rede social do mundo 2,23 bilhões de usuários 150 milhões de usuários diários

Facebook Por minuto: 317.000 atualizações de status 400 novos usuários 147.000 fotos publicadas 54.000 compartilhamentos

Dados Muitos, muitos dados!!!

É possível extrair informação útil para meu negócio?

https://developers.facebook.com/docs/graph-api/

Graph API Nós "objetos" individuais Usuário, Foto, Página ou Comentário Arestas conexões entre uma coleção de objetos e um objeto único Fotos em uma Página Comentários em uma Foto Campos dados a respeito de um objeto Ex: data de aniversário do Usuário ou o nome de uma Página

É possível extrair qualquer dado?

Dados Feed Grupos Publicações Comentários Páginas Comentários de comentários Usuários Reações

Como fica a privacidade?

Unsupported get request. Object with ID '<ID> does not exist, cannot be loaded due to missing permissions, or does not support this operation. Please read the Graph API documentation at https://developers.facebook.com/docs/graph-api

É possível extrair informação útil para meu negócio?

É possível extrair informação útil para nossa sociedade?

CASE Análise de dados em redes sociais

Objetivos Obter de grupos de discussão a percepção de uma população regional sobre: Educação Saúde Segurança

Metodologia de pesquisa Estudo de caso aplicado em grupos de discussão do Vale do Paranhana

Problema

Como? Mineração de opiniões

Mineração de opiniões Estudo computacional de opiniões, sentimentos e emoções descritos textualmente (LIU, 2010). Tem como objetivo extrair e processar opiniões sobre produtos e outras entidades (TSYTSARAU, 2010). Classificação da polaridade da opinião. Pode ser realizada em diferentes níveis Documento Sentença Entidade ou aspecto

Mineração de opiniões Opinião é uma quíntupla (ej, ajk, sijkl, hi, tl) onde: ej é a entidade alvo ajk é um aspecto da entidade ej sijkl é o valor da polaridade do sentimento que o detentor da opinião hi tem sobre o aspecto ajk da entidade ej no instante tl hi é o detentor da opinião tl é o instante de tempo no qual a opinião foi expressa

Como? Alvo da opinião Opinião

Desafios Sarcasmo Ironia Recursos escassos de léxicos com qualidade para o português Acrônimos Problemas de escrita iscola, postão, robaro a móto Emojis

Proposta

Ferramentas

Extração Dados extraídos em json Salvos em base MongoDB 3GB de dados brutos

Extração de dados Grupo Publicações Comentários Total de documentos Fala Taquara 02 4337 13895 18232 FalaTaquara 8236 89163 97399 Fala Igrejinha 9899 96440 106339 Fala Rolante!!!!! 1031 131 1162 23503 199629 223132

Pré-processamento Quebra de documentos em sentenças Remoção de documentos duplicados ou com 90% de similaridade (Método cosseno) Remoção de caracteres especiais Stemming Part-of-speech -> identificação de substantivos

Fala sobre quais dos assuntos analisados? Expressa opinião positiva ou negativa? Menciona algo relacionado ao Vale do Paranhana?

Anotação

Algoritmos SearchGridCV XGBOOST CountVectorizer NaiveBayes TfidfTransformer Random Forest SVM SGD

Classificação

Resultados

Conclusões Em 7,67% das publicações é possível identificar menções ao Vale do Paranhana.

Conclusões Dos 223.132 documentos extraídos, 52.410 (23,48%) foram classificados para: Educação Saúde Segurança

Conclusões Dos 223.132 documentos extraídos, 52.410 (23,48%) foram classificados para: Educação Saúde Assunto mais mencionado Segurança

Conclusões Dos 223.132 documentos extraídos, 52.410 (23,48%) foram classificados para: Educação Saúde Segurança Mais opiniões negativas (83%)

Conclusões Dos 223.132 documentos extraídos, 52.410 (23,48%) foram classificados para: Educação Saúde Mais opiniões positivas Segurança (59%)

Obrigado