Deep Learning na Detecção de Posicionamento em Notícias Online

Documentos relacionados
Detecção de Posicionamento no contexto de Fake News

Um Método para Melhoria de Dados Estruturados de Imóveis

UNIVERSIDADE FEDERAL DE PERNAMBUCO Graduação em Sistemas de Informação Centro de Informática

"Análise de Extratores de Característica para Reconhecimento de Face"

Predição de links em uma rede heterogênea baseada em dados geolocalizados e de relacionamentos

U NIVERSIDADE F EDERAL DE P ERNAMBUCO

Aprendizagem de Máquina

SQLLOMining: Obtenção de Objetos de Aprendizagem utilizando técnicas de Aprendizado de Máquina

Desenvolvimento de Aplicações Móveis Multiplataforma Utilizando Ionic 2

UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO

Bruno Loureiro Rezende. Um Framework para a Automação de Testes com Linguagens de Especificação Configuráveis DISSERTAÇÃO DE MESTRADO

Aprendizagem de Máquina

Análise de Difusão de Influência em redes sociais com foco na Hipótese dos Influentes

UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO

Avaliação do desempenho das ConvNets na detecção de ovos de esquistossomose PROPOSTA DE TRABALHO DE GRADUAÇÃO

Universidade Federal de Pernambuco Centro Informática Graduação em Sistemas de Informação

Aprendizagem de Máquina

U NIVERSIDADE F EDERAL DE P ERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA

PROJETO DE INTERFACES PARA ÁLGEBRA DE MAPAS EM GEOPROCESSAMENTO NO AMBIENTE SPRING

Universidade Federal de Pernambuco

Inteligência Artificial

Aplicação de Deep Learning em Análise de Sentimento em Textos de Microblogging

Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática

Realidade Aumentada aplicada ao ensino da simetria molecular

Técnicas de Inteligência Artificial

Ética na Propaganda (Portuguese Edition)

Reconhecimento Ótico de Caracteres em Placas Veiculares

Prof. Dr. Jarley Nóbrega

Aprendi A Fazer Sexo Na Bíblia (Portuguese Edition)

Uma Avaliação Crítica de Ferramantas de Analytics para aplicações Móveis

Aprendizagem de Máquina

Manual dos locutores esportivos: Como narrar futebol e outros esportes no rádio e na televisão (Portuguese Edition)

DIOGO ÂNGELO VIEIRA DA NÓBREGA

Redes Neurais Convolucionais

Universidade Federal de Pernambuco Graduação em Engenharia da Computação Centro de Informática

Técnicas de Inteligência Artificial

Estudo Qualitativo da Meta-Plataforma KNoT para IoT

A Evolução da Inteligência Artificial Fabio G. Cozman Escola Politécnica, USP

Universidade Federal de Pernambuco

Fundamentos Básicos e Avançados de SEO (Portuguese Edition)

Meditacao da Luz: O Caminho da Simplicidade

MLaaS com Azure: Que tipo de flor de íris é essa?

Estudo Comparativo de Estratégias de Classificação de Páginas Web

Desenvolvimento de Aplicações para o Consumo de Dados Abertos Conectados da Universidade Federal de Pernambuco

Uma metodologia para aprimoramento do Video Colortoning

Rickson Guidolini Orientador: Nivio Ziviani Co-orientador: Adriano Veloso

Utilização de técnicas de Process Mining em Sistemas de Middleware Adaptativos Proposta de Trabalho de Graduação

Extração de atributos usando o método LBP - Local Binary Pattern

PROCESSAMENTO E ANÁLISE DE IMAGENS DE MICROARRANJOS DE DNA

COMO ESCREVER PARA O ENEM: ROTEIRO PARA UMA REDAçãO NOTA (PORTUGUESE EDITION) BY ARLETE SALVADOR

RECONHECIMENTO DE CARACTERES MANUSCRITOS JAPONESES

PROCESSAMENTO DE TEXTO

Tratado de Enfermagem Médico Cirúrgica (Em Portuguese do Brasil)

UNIVERSIDADE FEDERAL DE PERNAMBUCO. Análise da Eficiência da Codificação de Huffman em Extensões de Fontes de Informação

Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática

Inteligência Artificial. Aula 2

Como Mudar a Senha do Roteador Pelo IP o.1.1. Configure e Altere a Senha do seu Roteador acessando o IP Acesse o Site e Confira!

Dilogo Brasil Livro Texto: Curso Intensivo De Portugues Para Estrangeiros (Dialogo Brasil) (Portuguese Edition)

USANDO XML PARA CARGA AUTOMÁTICA DE DADOS EM BANCOS DE DADOS DE PROJETO INDUSTRIAL DE MAQUETE ELETRÔNICA PROPOSTA DE TRABALHO DE GRADUAÇÃO

Detecção de Posicionamento no contexto de Fake News

Gestão da comunicação - Epistemologia e pesquisa teórica (Portuguese Edition)

UM PROCESSO PARA MANUTENÇÃO DA CONSISTÊNCIA DE INTERFACES INTEGRADAS AO AMADEUS

Fundamentos da Informática Aula 04 Introdução à Internet Simulado com Questões de Concursos Públicos Professor: Danilo Giacobo - GABARITO

SEMINÁRIO Visão Computacional Aluno: Afonso Pinheiro

Computação social é uma área da ciência da computação que se preocupa com a intersecção de comportamento social e sistemas computacionais.

Previsão de séries temporais através da combinação de modelo híbrido ARIMA e redes neurais artificiais

Transformando Pessoas - Coaching, PNL e Simplicidade no processo de mudancas (Portuguese Edition)

Reconhecimento de Sinais de Trânsito Utilizando Deep Learning

PCS 5869 INTELIGÊNCIA ARTIFICIAL

MCZA Processamento de Linguagem Natural Introdução

Resolução da Questão 1 (Texto Definitivo)

IN Redes Neurais

EGAN. FUNDAMENTOS DA TERAPIA RESPIRATÓRIA (EM PORTUGUESE DO BRASIL) BY CRAIG L. SCANLAN

Um Estudo Sobre Middlewares Adaptáveis

A UTILIZAÇÃO DE APLICATIVOS PARA O APRENDIZADO DA LÍNGUA INGLESA

Redes Neurais Convolucionais

Reconstrução 3D com auxílio de segmentações múltiplas

Introdução A Delphi Com Banco De Dados Firebird (Portuguese Edition)

Os 7 Hábitos das Pessoas Altamente Eficazes (Portuguese Edition)

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo

Proposta. Sistemas de Gerência de Cursos. Sistemas Hipermídia Adaptativos

Software Testing with Visual Studio 2013 (20497)

Bíblia do Obreiro - Almeida Revista e Atualizada: Concordância Dicionário Auxílios Cerimônias (Portuguese Edition)

Modelagem de Sistemas Complexos para Políticas Públicas. Patrícia A. Morita Sakowski 29/09/2017

Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino

Mineração de Opinião Aplicada ao Cenário Político

MODELAGEM E OTIMIZAÇÃO DE SOFTWARE AUTOMOTIVOS PROPOSTA DE TRABALHO DE GRADUAÇÃO

Otimizando o processo de criação de personagens 2D em pixel art para jogos digitais através da ferramenta SpriteGen

Felipe de Andrade Batista. Microservice Architecture: A Lightweight Solution for Large Systems in the Future

DCC851 - Tópicos Especiais de Ciência da Computação Elaboração e Apresentação de Artigos Científicos

Dermatologia Clínica. Guia Colorido Para Diagnostico e Tratamento (Em Portuguese do Brasil)

Verificação de Fake News com uso de Deep Learning

Painel: O uso abusivo de dados pessoais e a falta de transparência de algoritmos na distribuição de "fake news"

TDD Desenvolvimento Guiado por Testes (Portuguese Edition) Kent Beck

Pesquisa e Extração de Informação de Grupos de Discussão na Web

PL/SQL: Domine a linguagem do banco de dados Oracle (Portuguese Edition)

Francisco Benjamim Filho. XHITS: Estendendo o Algoritmo HITS para Extração de Tópicos na WWW DISSERTAÇÃO DE MESTRADO

REGRAS PARA SUBMISSÃO ATENÇÃO! 1 Áreas Temáticas

Pesquisa Qualitativa do Início ao Fim (Métodos de Pesquisa) (Portuguese Edition)

Erros que os Pregadores Devem Evitar (Portuguese Edition)

Transcrição:

Universidade Federal de Pernambuco Centro de Informática Graduação em Ciência da Computação Deep Learning na Detecção de Posicionamento em Notícias Online João Pedro de Carvalho Magalhães Proposta de Trabalho de Graduação Orientador: Prof. Tsang Ing Ren Recife Abril de 2017

Resumo O compartilhamento de notícias falsas vêm aumentando demasiadamente na web, principalmente em redes sociais. Isso é alarmante pois informações falsas repassadas e entendidas como verdadeiras causam um forte impacto negativo na sociedade. Portanto, existe a necessidade de se criar um sistema automatizado capaz de detectar afirmações falsas para que se evite a acelerada propagação desse tipo de notícia. Este trabalho propõe que uma das partes desse sistema seja um classificador de abordagem deep learning que detecte posicionamento opinativo em notícias online. Objetiva-se que tal classificador seja implementado, sua performance analisada, e seu papel no sistema discutido. Palavras-chave: notícias online, notícias falsas, detecção de posicionamento, classificação de texto, deep learning, processamento de linguagem natural, aprendizagem de máquina 2

Abstract Fake news sharing has overly increased in the web, mainly in social networks. This is threatening because false information which are passed on and believed to be true cause a strong negative impact to society. Thus, there is a need to create an automated system capable of detecting false claims in order to avoid an accelerated propagation of this kind of news. This work proposes one part of this system to be a classifier based on deep learning for stance detection in online news. The goal is to implement such classifier, analyze its performance, and discuss its role in the system. Keywords: online news, fake news, stance detection, text classification, deep learning, natural language processing, machine learning 3

Sumário 1 Contexto 1 2 Objetivo 2 3 Cronograma 3 4 Possíveis Avaliadores 4 5 Assinaturas 5 4

CAPÍTULO 1 Contexto A World Wide Web é uma enorme fonte de dados. A cada segundo que passa milhares de novos arquivos e informações são colocadas online por pessoas do mundo inteiro. E essa produção vêm crescendo ainda mais com a popularização de blogs e redes sociais, pois agora cada indivíduo possui um espaço próprio e interconectado para elaborar e compartilhar seu conteúdo ou o de outras pessoas e veículos de comunicação. E ele pode fazer isso de qualquer lugar se em posse de um smartphone e acesso à internet móvel. Ou seja, qualquer pessoa nessas condições é um divulgador instantâneo e global de informações, sejam elas factuais ou opinativas. Esse poder que cada um tem, apesar de impressionante e animador, também pode ser perigoso quando os usuários não conseguem checar a veracidade das informações [1], o que é complicado até para alguns experts [2]. Essa incapacidade junto da acelerada propagação de notícias ou informações falsas podem afetar a sociedade negativamente, influenciando a opinião pública e até o mercado financeiro [3][4][5]. Neste conjuntura, grandes empresas estão se juntando para estudar o problema [6], e a detecção de posicionamento surgiu como um passo importante para possibilitar o avanço na detecção automática de notícias falsas [7]. A detecção de posicionamento é a tarefa de identificar o tipo de relação entre dois discursos. Um discurso pode ser apenas um tópico, um argumento ou uma afirmação, e essa relação pode ser de concordância, discordância, ou neutralidade quando o discurso de um autor mostra que este não têm uma posição opinativa acerca do discurso do outro. Utilizando essa relação, pode-se comparar o que veículos diferentes estão dizendo sobre um mesmo tópico em suas notícias. A automação da tarefa pode ser alcançada através de abordagens computacionais. Uma que vêm tendo sucesso em tarefas de detecção, passando a ser bastante usada em processamento de linguagem natural, é chamada de deep learning. Essa técnica consiste em adicionar muitas camadas escondidas em uma rede neural para aumentar o aprendizado sobre a tarefa, exigindo um grande poder de processamento e vasta quantidade de dados. 1

CAPÍTULO 2 Objetivo O propósito deste trabalho é construir um classificador que utilize uma abordagem deep learning para determinar o tipo de posicionamento opinativo que títulos de notícias online têm com relação às afirmações presentes em seu corpo. Ele também responderá se o posicionamento está de fato presente, e por esse motivo, essa tarefa descrita inicialmente em [7] estende a proposta feita por [8]. Pretende-se também realizar experimentos sobre as features e técnicas de deep learning para poder analisar a performance do classificador implementado com respeito ao baseline existente [9]. O conjunto de dados a ser utilizado contém somente notícias na língua inglesa e em forma de texto [10]. Além disso, propõe-se discutir o papel desse classificador no processo de identificação automatizada de notícias falsas online. 2

CAPÍTULO 3 Cronograma Cronograma baseado no calendário acadêmico disponível no site da UFPE [11]. 3

CAPÍTULO 4 Possíveis Avaliadores Um possivel avaliador do trabalho proposto é o professor Luciano de Andrade Barbosa (CIn/UFPE). 4

CAPÍTULO 5 Assinaturas João Pedro de Carvalho Magalhães (Aluno) Tsang Ing Ren (Orientador) 5

Referências Bibliográficas [1] Many Americans Believe Fake News Is Sowing Confusion. Disponível em: <http://www.journalism.org/2016/12/15/many-americansbelieve-fake-news-is-sowing-confusion/>. Acesso em: 4 abr. 2017. [2] Introducing Factmata Artificial intelligence for automated fact-checking. Disponível em: <https://medium.com/factmata/introducing-factmataartificial-intelligence-for-political-fact-checkingdb8acdbf4cf1>. Acesso em: 4 abr. 2017. [3] Fake news: an insidious trend that s fast becoming a global problem. Disponível em: <https://www.theguardian.com/media/2016/dec/02/fakenews-facebook-us-election-around-the-world>. Acesso em: 4 abr. 2017. [4] Can Fake News Impact The Stock Market?. Disponível em: <https: //www.forbes.com/sites/kenrapoza/2017/02/26/can-fake-newsimpact-the-stock-market/#17700ba12fac>. Acesso em: 4 abr. 2017. [5] H. Allcott and M. Gentzkow, Social media and fake news in the 2016 election, tech. rep., National Bureau of Economic Research, 2017. [6] What is fake news, what are Facebook and Google doing about it, why is the Government boycotting YouTube and how can I tell if a site is legitimate?. Disponível em: <https://www.thesun.co.uk/news/2188911/fake-newsinquiry-facebook-google-boycott/>. Acesso em: 4 abr. 2017. [7] FNC - Fake News Challenge. Disponível em: <http://www. fakenewschallenge.org/>. Acesso em: 2 fev. 2017. [8] W. Ferreira and A. Vlachos, Emergent: a novel data-set for stance classification, in Proceedings of the 2016 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, ACL, 2016. [9] A baseline implementation for FNC-1. Disponível em: <https://github.com/ FakeNewsChallenge/fnc-1-baseline>. Acesso em: 10 mar. 2017. [10] Stance Detection dataset for FNC-1. Disponível em: <https://github.com/ FakeNewsChallenge/fnc-1>. Acesso em: 7 fev. 2017. 6

REFERÊNCIAS BIBLIOGRÁFICAS 7 [11] Calendário Acadêmico 2017 - UFPE. Disponível em: <https://www.ufpe.br/ proacad/images/calendario_academico/universidade_federal_ DE_PERNAMBUCO calend\%c3\%a1rio_acad\%c3\%aamico_2017. pdf>. Acesso em: 4 abr. 2017. [12] Nas redes, mentiras sobre pleito nos EUA superam notícias reais. Disponível em: <http://www1.folha.uol.com.br/mundo/2016/11/1833158- nas-redes-mentiras-sobre-pleito-nos-eua-superam-noticiasreais.shtml/>. Acesso em: 4 abr. 2017.