Análise de Sentimento - Parte I

Documentos relacionados
Análise de Sentimentos. Arthur Carlos Deyvirson Rafael

Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes

6 Atributos. A dívida da empresa subiu.

2 Sentiment Analysis 2.1

A/ART casa/n caiu/v./. Figura 3.1: Frase com anotação morfossintática.

DATA MINING & MACHINE LEARNING (I) Thiago Marzagão

Descoberta de conhecimento em textos - Análise semântica. Diogo Cardoso Eduardo Camilo Inácio Eduardo Monteiro Dellandréa Guilherme Gomes

PROPOSTA COMERCIAL. Marketing digital PARA VOCÊ MAIS MARKETING PARA EMPRESAS MAIS VENDAS

PROPAGANDAS. Dihego Pansini de Souza

ISCED Mobile Direcção Académica, Junho/2017

Descoberta de conhecimento em redes sociais e bases de dados públicas

VALORES Site Pronto 700,00 Site Semipersonalizado 1.600,00. FORMA DE PAGAMENTO À vista com 10% 03 x cartão ou boleto site pronto somente á vista

Informação-Prova de Equivalência à Frequência

Mineração de Textos na Web

Análise de conteúdo. São Paulo: Edições 70, 2004, 229p.] Adriana Santos

Curso GeneXus - Deploying. Veremos a seguir os detalhes de como colocar em Produção e Publicar aplicativos para Smart Devices.

Seis graus de separação

FIC Introdução à Programação de Computadores

UNIVERSIDADE FEDERAL DO CEARÁ CAMPUS QUIXADÁ BACHARELADO EM CIÊNCIA DA COMPUTAÇÃO RÔMULO CÉSAR COSTA DE SOUSA

Dicas do Google AdWords para sua conta

Data Science A ciência de dados em redes sociais: uma análise sobre o Facebook Leonardo Sápiras

Três razões indiscutíveis para anunciar online!

GUIA PRÁTICO DO FRANQUEADO MARKETING DIGITAL FACEBOOK E POSTAGENS PATROCINADAS

CALENDÁRIO DE PROVAS FINAIS 2º SEMESTRE/2017 TURMA M1-1D-1N

OS DIFERENTES CRITÉRIOS UTILIZADOS PARA CLASSIFICAÇÃO DE PALAVRAS EM GRAMÁTICAS ESCOLARES

MCZA Processamento de Linguagem Natural Introdução

LIDERANÇA SINDICAL e suas REDES SOCIAIS

O Guia Definitivo para Profissionais de Marketing de Conteúdo. por SEMrush

LIDERANÇA SINDICAL e suas REDES SOCIAIS

Significação das palavras

PORTUGUÊS PRÁTICO ORG

LIDERANÇA SINDICAL e suas REDES SOCIAIS

ESPANHOL (LE II) 2017

A P R E S E NTA Ç Ã O C O M E R C I A L

LIDERANÇA SINDICAL e suas REDES SOCIAIS

Sistemas Especialistas (SE)

Análise de Sentimentos em Notícias Utilizando Dicionário Léxico e Aprendizado de Máquina

CALENDÁRIO DE PROVAS FINAIS 1º SEMESTRE/2018 TURMA M1-1D-1N

Conceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional

METADE DOS CAPIXABAS TROCARIAM FIXO POR CELULAR

Expectativas de Aprendizagem dos Cursos oferecidos pelo INCO

Informação - Prova de Equivalência à Frequência

Informação - Prova de Equivalência à Frequência

Informação-Prova de Equivalência à Frequência

Aulas de Inglês para Executivos.

Tutorial sobre o MineraFórum

ESPANHOL 1ª e 2ª fase de 2014

SEMÂNTICA PARTE 3 ANÁLISE SEMÂNTICA 14/06/2012. SCC5908 Tópicos em Processamento de Língua Natural. Até agora, significado da sentença

Aplicação de uma Técnica Tradicional de Expansão de Consulta ao Modelo TR+

Apresentação pessoal

O tipo de tarefa a ser feita em cada redação depende do módulo IELTS que você realiza:

Informação - Prova de Equivalência à Frequência de. Inglês

Informação Prova de Equivalência à Frequência INGLÊS PROVA ESCRITA E PROVA ORAL Prova 21

Grupo de Usuários Java do Noroeste Paulista. Tópicos Avançados em Java

PROGRAMA PARA ADMISSÃO DE NOVOS ALUNOS 2º Ano ENSINO FUNDAMENTAL ANO LETIVO DE 2017

Eleições 2016 Sistema Conselhos de Psicologia Manual do Analisador de Carta-Voto

Análise de Sentimentos em Tweets: um estudo de caso da Copa do Mundo de Futebol 1

tomada de decisão de compra está relacionada a uma resposta a partir de um estímulo inicial

HABILIDADES DO 1 o TRIMESTRE DE os ANOS

Artigos científicos Roteiro para elaboração e estruturação

EMPRESA ASSOCIADA EMPRESA CERTIFICADA EMPRESA CERTIFICADA

LINGUAGEM C: ARRAY: VETORES E MATRIZES

Semântica no Reconhecedor Gramatical Linguístico

1. Como faço para acessar o AVA - Ambiente Virtual de

Exame a Nível de Escola de Línguas Estrangeiras Equivalente a Exame Nacional

Aprenda a fazer uma campanha atrativa de Marketing Digital para sua loja

CALENDÁRIO DE PROVAS FINAIS 1º SEMESTRE/2017 TURMA M1-1D-1N

INFORMAÇÃO DE PROVA EQUIVALENTE A EXAME NACIONAL

Informação Prova Prova código15 deespanhol (LE II)

MANUAL. Localizador: Página: MN 016 SGI-INFRA- . Informação)

Mineração de Opinião / Análise de Sentimentos

DISCIPLINA: INGLÊS CÓDIGO DA PROVA: 367. Ensino Secundário ANO DE ESCOLARIDADE: 11.º

EDITAL COMPLEMENTAR Nº 001/2015 DO EDITAL DE PROCESSO SELETIVO SIMPLIFICADO Nº 001/2015

Informação Prova de Equivalência à Frequência Espanhol

Agrupamento de Escolas Piscinas Olivais PORTUGUÊS. Planificação Anual / Mensal 2º ANO

5 FERRAMENTAS. 10sec. Para turbinar seu negócio no Instagram. 5 ferramentas para turbinar seu negócio no instagram

MANUAL. Localizador: SGI-INFRA-

Informação Prova Prova código 375 deespanhol I (LE III)

POLÍTICA DE PRIVACIDADE

VERB TENSES PAZ NA ESCOLA

Aprendizado Bayesiano Anteriormente...

PORTUGUÊS Prova Escrita (90 minutos) + Prova Oral (15 minutos)

Informação Prova de Equivalência à Frequência 9º Ano

Como construir seu Infoproduto do Zero. Pesquisas

CRITÉRIOS DE AVALIAÇÃO E CLASSIFICAÇÃO Disciplina: Inglês

Anexo B Relação de Assuntos Pré-Requisitos à Matrícula

MINISTÉRIO DA DEFESA EXÉRCITO BRASILEIRO DEPARTAMENTO DE EDUCAÇÃO E CULTURA DO EXÉRCITO DIRETORIA DE EDUCAÇÃO PREPARATÓRIA E ASSISTENCIAL

Língua Portuguesa UNIDADE DE REVISÃO E RECUPERAÇÃO

2 Mineração de Textos: Fundamentos e Aplicações

Informática - Processadores de Texto- - Microsoft Word - Profª. Me. Valéria Espíndola Lessa

01. B 07. B 13. C 19. A 02. C 08. A 14. C 20. B 03. D 09. D 15. D 21. A 04. D 10. D 16. D 22. D 05. A 11. B 17. B 06. C 12. A 18.

14 DICAS PARA PESQUISAR NO GOOGLE COMO UM ESPECIALISTA

Portal Senac/SC. Outubro de 2010

Definição IHC. Disciplina ou campo de estudo interessada no design, implementação e avaliação de sistemas computacionais interativos para uso humano.

Divulgação de Resultados

FACULDADE VALE DO CRICARÉ CURSO DE PSICOLOGIA

Planejamento estratégico Special Hair

Transcrição:

Análise de Sentimento - Parte I Erica Castilho Rodrigues 26 de Março de 2014

3 O que será visto nessa aula? O que é análise de sentimento? Vale a pena aplicar essa técnica? Quais são desafios? De maneira geral, como é feita?

O que queremos dizer com sentimento aqui? atitudes; emoções; opiniões. Impressões subjetivas e não fatos.

5 Em geral, assume-se que as opiniões assumem um caráter binário: a favor/ contra; gosta/ não gosta; bom/ruim. Termos muito usados nessa área: Orientação Semântica ; Polaridade. Se referem a quão negativa ou positiva uma palavra é. ótimo é muito positiva. péssimo é muito negativa.

6 Objetivo da Análise de Sentimento: Usar técnicas de: Processamento Natural de Linguagem; Estatística; Aprendizagem de Máquina para extrair a opinião de um texto. Também chamada de Mineração da Opinião.

Tipos de perguntas que busca responder A resenha desse produto é positiva ou negativa? Nesse e-mail o consumidor parece satisfeito ou não? Usando uma amostra de tweets: como as pessoas estão respondendo à campanha desse produto? Como tem mudado a atitude dos blogueiros em relação ao presidente?

8 Exemplo: Uma empresa está analisando suas vendas de notebooks. Ele tem dados sobre: vendas, preços, especificações, etc. Deseja saber qual opinião do consumidor sobre o produto e os serviços prestados: o design é feio? o serviço prestado ao consumidor deixa a desejar?

9 Exemplo: Verificar se os consumidores não entenderam algum aspecto sobre os serviços prestados: acreditam que alguma atualização não está disponível quando na verdade está. É difícil obter informações de consumidores que não compraram o produto. Podemos aplicar as técnicas de Análise de Sentimento para: procurar opiniões de cliente na internet; buscar por resenhas deste e outros notebooks em Blogs, rede sociais, sites de lojas, etc; resumir toda essa informações e tirar conclusões sobre opinião das pessoas sobre o produto.

10 A Análise de Sentimento também pode ser aplicada em outras áreas: política; sociologia; psicologia; esportes. Exemplo: busca de tweets homofóbicos. Verificar como muda a opinião de um usuário após um evento.

Aplicações na Política Analisar tendências. Identificar viéses ideológicos. Dar publicidade a mensagens e propagandas. Avaliação das opiniões públicas/eleitores. Analisar discussões políticas.

Por que usar a Análise de Sentimentos? Os seres humanos são criaturas subjetivas. É muito importante coletar suas opiniões. Porém é custoso obter essa informação. Quando não é fornecida de maneira espontânea, nem sempre condiz com a realidade.

13 Desafios da Análise de Sentimento As pessoas expressam opiniões de maneira complexa. Podem usar ironias, sarcasmo, etc. Inversão na ordem das frases também dificulta. Erros de digitação e gírias. Pessoas mudam de tópico bruscamente.

O que queremos classificar? Há muitas possibilidades do que nós podemos querer classificar: Usuários; Textos; Sentenças (parágrafos, pedaços de texto); Palavras; tweets.

15 Para classificar textos e sentenças, precisamos primeiro: classificar palavras e expressões. Não basta classificar palavras. baixo poderia ser classificada como negativa. A expressão preço baixo é positiva. Uma forma simples de classificar um texto: contar o número de palavras positivas e negativas. Problemas com essa abordagem? Claro! Ironia, sarcasmo, etc.

16 Precisamos então de: uma lista de palavras positivas e negativas. Existem listas extensas para o inglês. Muitos métodos automáticos buscam expandir essas listas - tópico de pesquisa. Para o porguês as listas não são tão grandes. O processamento de linguagem para o português ainda está sendo desenvolvido.

Emoticons/Smiles Em textos curtos como tweets a análise de sentimento é mais complicada. Existe pouca informação nas mensagens. Os sentimentos são representados através de smiles/emoticos. : ) : / : ( Vejamos algumas ferramentas já disponíveis na internet.

18 General Inquirer Ferramenta de análise de conteúdo. Criado em 1966. Banco de palavras criado manualmente. Classifica a conotação positiva e negativa das palavras. Disponível em http://www.wjh.harvard.edu/~inquirer.

19 LIWC Busca linguística e contagem de palavras. Semelhante ao GI. Conta palavras pertencentes às categorias positiva e negativa. Disponível em http://www.liwc.net/.

20 Wordnet Banco de sinônimos de palavras em inglês. Substantivos, verbos, adjetivos e adjetivos são agrupados em conjuntos de sinônimos. Uma rede é criada. Palavras são ligadas de acordo com relações conceituais e lexicais. Não foi desenvolvido especificamente para Análise de Sentimento. Tem sido usado para aumentar a lista de palavras positivas e negativas. Busca sinônimos de palavras que já estão na lista. Disponível em http://wordnet.princeton.edu/.

SentiWordNet Recurso desenvolvido para mineração da oponião. Utiliza a base de dados do Wordnet. A cada sentença se atribui um dos sentimentos: positividade, negatividade e objetividade. Disponível em http://sentiwordnet.isti.cnr.it/.

General Sentiment Coletam opiniões dos consumidores na internet. Sintetizam e extraem informação dos resultados obtidos. Auxiliam na tomada de decisões.

23 Exemplo de um Relatório

Exemplo de um Relatório

25 Exemplo de um Relatório

26 Sentiment140 Aplicativo desenvolvido para Análise de Sentimento de dados do Twitter. Coletam os tweets que mencionam determinado termo. Contam o número de palavras positivas e negativas em cada um deles.

Método mais simples... Tem uma lista de palavras positivas e negativas. Conta a frequência em cada sentença. Problemas com essa metodologia: não considera níveis de positividade/negatividade diferente entre as palavras bom e ótimo são considerados iguais; só considera o nível da palavra; desconsidera o contexto.

Função em R para calcular o sentimento: score.sentiment = function(sentences, pos.words, neg.words,.progress= none ) { require(plyr) require(stringr) # recebe como entrada um vetor de sentenças e uma lista de palavras positivas e negativas # plyr - pacote para aplicar funções em vetores, listas, matrizes rapidamente # laply - aplica a função em cada sentença e retorna um vetor correspondente ao score # de cada uma scores = laply(sentences, function(sentence, pos.words, neg.words) { # clean up sentences with R s regex-driven globa 28