Mineração da opinião sobre aspectos de candidatos a eleições em comentários de notícias

Tamanho: px
Começar a partir da página:

Download "Mineração da opinião sobre aspectos de candidatos a eleições em comentários de notícias"

Transcrição

1 paper:78 Mineração da opinião sobre aspectos de candidatos a eleições em comentários de notícias Leonardo Augusto Sápiras, Karin Becker Instituto de Informática Universidade Federal do Rio Grande do Sul (UFRGS) Caixa Postal Porto Alegre RS Brazil {lasapiras,karin.becker}@inf.ufrgs.br Resumo. A classificação automática da opinião pública sobre aspectos de candidatos a eleições, a partir de opiniões disponíveis na web, é um problema complexo para a Mineração de Opiniões. Este artigo descreve uma experiência de mineração de opiniões em nível de aspecto no contexto de comentários de leitores de jornais sobre notícias eleitorais. Nosso desafio é identificar e sumarizar a opinião baseada em aspectos a partir de fontes de opiniões fracamente estruturadas. Mostramos ser possível identificar, classificar a polaridade e sumarizar a opinião de leitores de um jornal sobre os aspectos Saúde e Educação relacionados a candidatos de uma eleição municipal. Abstract. The automatic classification of opinions about aspects of political candidates, from public web data, is a complex Opinion Mining problem. This paper describes a case study of aspect-based opinion mining in the context of comments that newspaper readers express about political news. Our challenge is to identify and summarize opinions on aspects of election candidates, using an ill-structured source of opinion. Our case study propose techniques that can be used to identify, classify and summarize opinions on Health and Education issued by readers about political candidates. 1. Introdução A opinião pública sobre entidades e seus aspectos expressa em documentos textuais pode ser analisada e sintetizada através de Mineração de Opiniões, que realiza essas atividades combinando técnicas de mineração de dados com processamento de linguagem natural [Liu 2012]. Os trabalhos pioneiros nessa área buscaram identificar a opinião global contida em revisões sobre produtos e serviços, escritas por usuários [Pang and Lee 2008, Tsytsarau and Palpanas 2012]. Como um substancial avanço, a opinião passou a ser detalhada em termos dos diferentes aspectos de produtos/serviços [Hu and Liu 2004, Guo et al. 2009, Qiu et al. 2011, Liu et al. 2013], tais como o preço, capacidade ou desempenho de um computador. Essas opiniões detalhadas são extremamente úteis e influenciam potenciais consumidores. Revisões de produto são fontes de opinião bem estruturadas e possibilitam obter a opinião pública sobre entidades e seus aspectos mais facilmente [Tsytsarau and Palpanas 2012, Liu 2012], porque o alvo da opinião é a entidade sendo revisada. Por outro lado, as opiniões expressas em fontes de opiniões menos estruturadas, tais como redes sociais [Tumasjan et al. 2010, Castellanos et al. 2011], blogs e notícias [Balahur et al. 2010], são mais difíceis de serem mineradas porque as tarefas de 117

2 encontrar o conteúdo de opinião, e o seu alvo, são bem mais complexas. Ao contrário do contexto de revisão de produtos, no qual o objeto da revisão é a entidade alvo da opinião, documentos nessas mídias podem conter opiniões sobre múltiplas entidades, sobre aspectos específicos destas, ou mesmo podem não conter nenhuma opinião. Este artigo descreve uma experiência de mineração de opiniões em nível de aspecto no contexto de comentários de leitores de jornais sobre notícias eleitorais. Nosso desafio é identificar e sumarizar a opinião baseada em aspectos a partir de fontes de opiniões fracamente estruturadas. Aplicamos a mineração de opiniões em fontes de dados relacionadas com eleições, já que a plataforma eleitoral de candidatos inclui propostas relevantes para a população em diversas áreas, tais como saúde, educação, segurança, as quais são exploradas durante uma campanha com o intuito de obter votos. Essas áreas são tratadas neste trabalho como os aspectos de um candidato sobre os quais os leitores podem opinar. Assim, partimos da premissa que, além da percepção global de um candidato, é possível identificar a opinião pública em relação a aspectos específicos deste. Por exemplo, desejase identificar que a percepção sobre um candidato X em relação à saúde é mais positiva que a do candidato Y, mas no que se refere à educação a percepção é mais negativa. A contribuição do presente trabalho é uma abordagem para minerar e sumarizar, em nível de aspecto, opiniões sobre candidatos a eleições, a qual foi aplicada a um estudo de caso. Ela integra resultados parciais de experimentos sobre extração de aspectos [Sapiras and Becker 2014], e de mineração de opiniões em nível de sentença sobre a mesma fonte de opiniões fracamente estruturada [Tumitan and Becker 2013, Tumitan and Becker 2014], a saber, opiniões expressas por leitores de jornal em comentários como reações a notícias. Em nosso conhecimento, este é um trabalho pioneiro de mineração de opiniões em nível de aspecto fora do contexto de revisões de produtos. O restante deste artigo está estruturado como segue: a Seção 2 descreve os trabalhos relacionados; a Seção 3 detalha um estudo de caso para minerar a opinião sobre aspectos de entidades políticas; a Seção 4 apresenta conclusões e trabalhos futuros. 2. Trabalhos relacionados A mineração de opiniões pode ser dividida em três grandes tarefas [Tsytsarau and Palpanas 2012]: a) identificação de conteúdo subjetivo e do alvo das opiniões; b) classificação da polaridade das opiniões; c) sumarização das opiniões através de métricas e/ou recursos visuais. A mineração de opiniões pode ser realizada em nível de documento, sentença ou aspecto, sendo este último o foco deste trabalho. Métodos para classificação da polaridade de opiniões incluem abordagens baseadas em dicionário, aprendizagem de máquina, estatísticas e semânticas [Tsytsarau and Palpanas 2012], sendo as duas primeiras as mais frequentemente empregadas [Liu 2012]. A abordagem baseada em dicionários requer bons léxicos sentimento para a língua alvo, e pesquisas mostram a importância de dicionários de domínio (e.g. [Hu and Liu 2004]). Já para bons resultados usando aprendizagem de máquina, é necessário um extenso corpus anotado para treino. O trabalho pioneiro na identificação de opinião em nível de aspecto foi o de [Hu and Liu 2004], o qual utiliza regras de associação envolvendo substantivos. [Qiu et al. 2011] utilizam dependências sintáticas para identificar o alvo da opinião, mas 118

3 bons analisadores sintáticos não estão disponíveis para o português. Modelos mais sofisticados de co-ocorrência (e.g. [Guo et al. 2009]) também foram propostos com o mesmo fim. Essas pesquisas exploram revisão de produtos, que são fontes de opinião mais estruturadas, pois: (i) geralmente apresentam opiniões sobre uma única entidade, (ii) explicitam a entidade-alvo da opinião, (iii) pertencem ao mesmo domínio (e.g. informática, cinema). Não se pode assumir tais características em fontes de dados menos estruturados, como blogs ou redes sociais, pois esses tipos de documentos podem apresentar opiniões sobre múltiplos alvos (ou mesmo não conter opinião) e em domínios sem relação entre si. Trabalhos que usam fontes de opinião fracamente estruturadas (e.g. tweets, comentários) identificam o alvo de opinião no momento da extração, usando um conjunto de termos que representam a entidade alvo. Trabalhos que se propõem a fazer previsões sobre eleições políticas baseadas em sentimentos usando tweets [Tumasjan et al. 2010, O Connor et al. 2010] ou comentários de jornais [Tumitan and Becker 2014] usam essa estratégia e realizam a mineração de opiniões em nível de documento ou sentença. LCI [Castellanos et al. 2011] monitora o sentimento em tweets, agrupando os termos mais frequentes em tópicos e sumarizando as opiniões envolvendo esses termos. O Observatório da Web 1 monitora tweets sobre vários assuntos, incluindo eleições, sumarizando os principais tópicos, mas sem envolver mineração da opiniões. Modelos visuais para a tarefa de sumarização são propostos em trabalhos como [Hu and Liu 2004, Castellanos et al. 2011]. Em nível de aspecto, um modelo comum mostra a quantidade de opiniões positivas/negativas para cada um dos aspectos de um produto frequentemente citados [Hu and Liu 2004]. LCI [Castellanos et al. 2011] usa este modelo de sumarização para entidades e seus aspectos, além de propor uma nuvem de termos para os aspectos mais comentados. O presente artigo integra contribuições desenvolvidas em trabalhos prévios dos autores. Experimentos para extrair aspectos de comentários de notícias foram reportados em [Sapiras and Becker 2014], mas não envolveram mineração de opiniões. Observamos como comportamento dos leitores que os comentários não necessariamente têm relação com o conteúdo da notícia (e.g. uma notícia sobre transportes pode ter comentários opinando sobre saúde, transportes ou corrupção). Assim, optamos por considerar todos comentários, e experimentamos diferentes técnicas probabilísticas de co-ocorrência para identificar aspectos. O processo de mineração de opiniões para o mesmo estudo de caso foi detalhado em [Tumitan and Becker 2013], incluindo a extração e pré-processamento de comentários, identificação dos candidatos alvo, e classificação da opinião em nível de sentença. A classificação da polaridade usando léxicos de sentimento e aprendizado supervisionado foi comparada em [Tumitan and Becker 2014], também em nível de sentença. O presente trabalho diferencia-se destes ao propor uma abordagem para minerar e sumarizar opiniões em nível de aspecto para a mesma fonte de opiniões fracamente estruturada, a saber, comentários de jornais sobre candidatos a eleições. 3. Estudo de caso 3.1. Objetivo Neste estudo de caso realizamos uma experiência pioneira de mineração de opiniões em nível de aspecto fora do contexto de revisão de produtos. Tal como em

4 [Tumitan and Becker 2013], usamos como fonte de opinião comentários sobre notícias envolvendo eleições municipais de 2012 da cidade de São Paulo, e os três candidatos a prefeito mais comentados (i.e. Serra, Russomanno e Haddad). As notícias e comentários foram extraídos da Folha de São Paulo, e o período analisado corresponde ao mês que antecede o primeiro turno da eleição. O objetivo do estudo foi propor uma abordagem que permitisse detalhar a opinião dos leitores em relação a aspectos específicos destes candidatos (e.g. a percepção de X sobre saúde é mais positiva que a dos candidatos Y e Z no mesmo aspecto), e aplicá-la sobre o corpus escolhido. Consideramos os mesmos aspectos já explorados em [Sapiras and Becker 2014]: saúde e educação Abordagem proposta A abordagem proposta para o estudo de caso é apresentada na Figura 1. As caixas com fundo cinza correspondem às técnicas discutidas em trabalhos prévios dos autores e as com fundo verde correspondem às etapas desenvolvidas no presente artigo. Uma vez extraídos os comentários dos jornais relevantes ao estudo de caso [Tumitan and Becker 2013], dois procedimentos são realizados: a) a identificação dos comentários envolvendo os aspectos alvo de acordo [Sapiras and Becker 2014]; e b) a mineração de opiniões em nível de sentença, para sentenças mencionando os candidatos observados [Tumitan and Becker 2014]. O nível de sentença foi adotado para a polarização da opinião porque cada comentário pode envolver opiniões sobre mais de um candidato. Então, a relação entre as sentenças polarizadas e os respectivos comentários é analisada para verificar se se referem a algum aspecto específico. Finalmente, a opinião dos leitores é sumarizada por candidato e por seus aspectos. Na discussão que segue, sejam A = {a i } um conjunto de aspectos, E = {e j } um conjunto de candidatos monitorados e C = {c k } um conjunto de comentários. Figura 1. Abordagem de mineração de opiniões em nível de aspecto. Extração de comentários: extração de comentários sobre notícias eleitorais, identificadas usando rótulos pré-definidos em um indexador de notícias (Google Reader). O pré-processamento elimina comentários duplicados (similaridade superior a 85% usando cosseno), ou muito curtos (até 3 palavras). Os detalhes da extração e limpeza de comentários são relatados em [Tumitan and Becker 2013]. Identificação de comentários que mencionam aspectos: identificação dos comentários C a C que contêm termos representativos de cada aspecto a A, de acordo o método detalhado na Seção 3.4. Divisão de comentários em sentenças: utilizando o módulo punkt do NLTK 2, treinado para português, os comentários são divididos em sentenças. A relação entre 2 Natural Language Toolkit

5 sentença e comentário de origem é armazenada, criando o conjunto de sentenças S = {< s i, c k >: c k C}. Identificação de sentenças que mencionam entidades eleitorais: filtragem de todas sentenças de S que fazem menções explícitas aos candidatos e E, criando um conjunto SM = {< s i, e j, c k >: e j E < s i, c k > S}. As menções são identificadas usando os nomes dos candidatos (e.g. Serra, Russomano) e suas variações (e.g. vampissera, tarussomano), encontradas a partir de expressões regulares. Polarização de sentenças: as sentenças com menções SM são polarizadas em três classes, gerando o conjunto SP = {< s i, e j, pol, c k >: pol {pos, neut, neg} < s i, e j, c k > SM}. Os detalhes relacionados à classificação das opiniões são discutidos na Seção 3.5. Associação das sentenças polarizadas aos aspectos: as sentenças com opiniões sobre aspectos específicos são separadas, usando o seu relacionamento com os respectivos comentários. Para cada aspecto a A, buscamos as sentenças SP a = {< s i, e j, pol, c a >: c a C a }, SP a SP, considerando estas como opiniões sobre o aspecto a do candidato e j. Sumarização da opinião sobre as entidades e seus aspectos: sumarização das opiniões sobre os candidatos em geral, e sobre seus aspectos, de acordo com os mecanismos apresentados na Seção 3.6. Agregamos as sentenças por comentário e candidato, para representar o número de pessoas emitindo opiniões sobre cada candidato Corpus e Gold Standard O corpus utilizado consiste de comentários de notícias sobre as eleições municipais de São Paulo relativos aos meses de setembro e outubro de Após pré-processamento, o corpus foi reduzido a comentários, divididos em sentenças. Deste corpus, foram extraídos dois subconjuntos de dados a serem usados como Gold Standard. Todos os dados foram anotados por três anotadores, em que somente anotações com no mínimo duas concordâncias foram consideradas. Os anotadores foram orientados a basear sua avaliação apenas no conteúdo explicitamente escrito, sem usar julgamento próprio ou conhecimento do domínio político para inferir entendimento. A concordância dos anotadores para polaridade foi 91,81%, e para aspectos, 85,75%. Os datasets 1 e 2 são subconjunto dos comentários sobre eleições municipais de 2012, enquanto que o Dataset3 foi criado para as pesquisas relatas em [Tumitan and Becker 2014], e envolve eleições de A identificação de aspectos foi validada usando o Dataset1. Os datasets 2 e 3 foram utilizadas para treinar e testar os classificadores de opinião. Dataset1: aleatoriamente, foram selecionadas 407 notícias eleitorais do corpus, as quais foram anotadas em relação aos tópicos que evocavam (i.e. saúde ou educação). Dos respectivos comentários, foram selecionadas também aleatoriamente 2072 sentenças, em que cada anotador deveria avaliar se a sentença evocava um dos tópicos, quais candidatos eram explicitamente mencionados, se expressava uma opinião e a respectiva polaridade. Assumiu-se que todo comentário que contivesse pelo menos uma sentença anotada como evocando um dado tópico, por transitividade, também mencionava aquele tópico. 121

6 Dataset2: aleatoriamente foram selecionadas 1071 sentenças de comentários do mesmo corpus, as quais foram anotadas no tocante à polaridade, possuindo 732 sentenças negativas, 180 neutras e 159 positivas. Dataset3: considerando as eleições presidenciais e governamentais de São Paulo de 2010, foram selecionadas aleatoriamente 990 sentenças de comentários extraídos segundo o mesmo processo, que, após anotação quanto à polaridade, resultaram em 356 sentenças negativas, 480 neutras e 154 positivas Identificação de Aspectos A Figura 2 detalha a abordagem utilizada para encontrar os aspectos [Sapiras and Becker 2014], a qual visa identificar os comentários que mencionam determinado aspecto com base em um conjunto de termos representativos do mesmo. Dado um conjunto de notícias sobre um dado aspecto (documentos de domínio), os termos representativos são encontrados com base na co-ocorrência entre termos encontrados nestes documentos (palavras candidatas), e um conjunto de palavras-semente. Figura 2. Processo de identificação de aspectos. No estudo de caso, as palavras-semente foram definidas pelos próprios autores a partir do conhecimento do domínio. Exemplos de palavras-semente para Saúde são hospital, médico e vacinação, e para o aspecto Educação, aula e escola. O processo de identificação dos termos representativos tem início com a extração de documentos específicos do domínio de cada aspecto. Nosso estudo de caso utiliza um corpora de notícias classificadas pelo Jornal Folha de São Paulo para os aspectos saúde e educação. O processo de extração desse corpora resultou em 1000 notícias com o rótulo Educação, e 1000 notícias com o rótulo Saúde. De cada um desses corpora, foram extraídas, usando NLTK, todas as palavras existentes, junto com suas respectivas frequências e classes gramaticais (part-of-speech tags). Stopwords foram eliminadas. Foram consideradas como palavras candidatas apenas os substantivos que apareciam no respectivo corpus (e.g. notícias sobre saúde) e que não apareciam no outro (e.g. notícias sobre educação). Dentre as técnicas de co-ocorrência examinadas, os melhores resultados foram obtidos com EMIM (Expected Mutual Information Measure), detalhada na Equação

7 Dado que x representa uma palavra candidata e y representa uma palavra-semente, a é número de vezes que as palavras x e y co-ocorrem em um documento; b é o número de vezes que x ocorre em um documento e y não ocorre; c é o número de vezes que y ocorre e x não ocorre, e d é o número de vezes que nem x nem y ocorrem um documento. EMIM (x,y) = log 2 a(a + b + c + d) (a + b)(a + c) (1) Um termo x é considerado como representativo quando: a) EMIM(x, y) > 0, e b) x e y co-ocorrem em, no mínimo, 10 documentos do domínio, em que estes limites foram fixados empiricamente. Em nossos experimentos, melhor detalhados em [Sapiras and Becker 2014], obtivemos 73,83% de precisão, 79,8% de revocação e 76,7% de F-score para o aspecto Saúde. Já para o aspecto Educação, obtivemos 70,54% de precisão, 80,53% de revocação e 75,21% de F-score. Também experimentamos as técnicas LSI e Phi-squared, mas essas apresentaram resultados inferiores Polarização de Opinião Usamos a experiência desenvolvida em [Tumitan and Becker 2014] para polarizar as sentenças, com a diferença de que consideramos três classes: positivo, neutro e negativo. Optamos por utilizar apenas técnicas de aprendizagem de máquina, testando diferentes classificadores no WEKA [Hall et al. 2009]. Os melhores resultados foram obtidos usando o algoritmo SMO para treinar um classificador Support Vector Machine (SVM). Para preparação de features, utilizamos unigramas, representação de pesos usando TF-IDF e seleção de atributos utilizando a técnica BestFirst. Testamos várias outras preparações (e.g. n-gramas, stopwords, representação binária e frequência, outras funções de seleção), mas os resultados foram inferiores e não são descritos aqui. A Tabela 1 apresenta os resultados usando Precisão, Revocação, Medida-F e a respectiva média ponderada. Foram feitos dois experimentos: com validação cruzada, e com conjuntos de treino e teste distintos. Na abordagem SVM (Cross-validation), mesclamos os datasets 2 e 3, e verificamos o desempenho do classificador utilizando validação cruzada com 10 folds. Já na segunda abordagem, utilizamos o Dataset3 como conjunto de treinamento e o Dataset2 como conjunto de teste. Os resultados são animadores quanto à precisão, mas com baixa revocação para algumas classes, em particular a neutra. O pior desempenho da segunda abordagem é devido a overfiting, já que termos distintos foram usados em cada eleição. Por exemplo, nas eleições de 2010 existiam várias referências às primeiras candidatas à presidência (e.g. guerreira, presidenta ), enquanto que, em 2012, foram evocados feitos passados dos candidatos e os escândalos de seus partidos. Tabela 1. Resultados da polarização das sentenças com Precisão (P), Revocação (R), F-score (F), respectivas médias ponderadas (WP, WR, WF) e Acurácia (A). Abordagem Polaridade P(%) R(%) F(%) WP(%) WR(%) WF(%) A(%) Positivo 86,6 51,9 64,9 SVM (Cross-validation) Neutro 93,7 26,8 41,7 83,9 82,5 79,5 82,46 Negativo 81,6 98,5 89,3 Positivo 76,2 48,4 59,2 SVM (Com conjunto de teste) Neutro 92,5 20,6 33,6 79,3 77,3 73,2 77,31 Negativo 76,8 97,5 85,9 123

8 Os melhores resultados foram obtidos para a classe negativa, já que há um número muito maior de sentenças negativas, quando comparado às demais classes. No futuro, reavaliaremos os resultados com classes mais equilibradas. A sumarização dos resultados descrita na próxima seção utiliza SVM com validação cruzada, pois foi a que apresentou o melhor desempenho Sumarização O modelo visual de sumarização adotado, exemplificado nas Figuras 3 e 4, é semelhante ao apresentado em [Castellanos et al. 2011]. Através dele, é possível visualizar a percepção da população sobre cada candidato em geral, os aspectos analisados em particular, bem como os termos mais comentados em cada tópico. Figura 3. Modelo visual de sumarização de opiniões. A opinião sobre cada candidato é sumarizada usando o número absoluto e percentual de comentários positivos, negativos ou neutros. O mesmo é feito especificamente para cada aspecto. Os resultados mostrados na Figura 3 correspondem à aplicação da abordagem proposta no corpus completo (i.e comentários). Agregamos as opiniões por comentários para representar pessoas emitindo opiniões. O uso de sentenças, como em [Tumitan and Becker 2014], provocaria distorções nos resultados, e.g. um comentário com diversas sentenças negativas teria mais peso que um comentário com uma única sentença positiva. Classificamos um comentário c k C como positivo em relação a uma entidade e j, se contiver mais sentenças positivas sp i P relacionadas a c k que mencionem e j, do que negativas. Caso o número de sentenças negativas seja superior, o comentário é classificado como negativo, se não, ele é neutro. Note-se que o mesmo comentário pode ser contabilizado para mais de um candidato, caso expresse opiniões sobre múltiplos candidatos. Neste caso, são contabilizadas as sentenças referentes a cada candidato. A mesma lógica foi aplicada na sumarização dos comentários por aspecto. Com base na sumarização apresentada na Figura 3, concluímos que os leitores expressam um número substancialmente maior de opiniões negativas, tanto para os candidatos em geral, quanto para seus aspectos. Observamos também que, apesar de existir 124

9 uma grande quantidade de comentários com opinião sobre os candidatos, a proporção em relação ao total de comentários foi relativamente baixa (51%). Além disso, a quantidade de opinião da população sobre os aspectos analisados (saúde e educação) também foi baixa. Isso está relacionado ao fato de que o conteúdo dos comentários apresenta opiniões sobre outros aspectos (e.g. corrupção) ou opiniões diretas aos candidatos. Considerando que dois candidatos haviam sido ex-ministros de educação e saúde, é interessante interpretar os comentários por aspecto. Os leitores têm uma percepção mais positiva sobre educação do ex-ministro da saúde do que o ex-ministro da educação sobre educação. A nuvem de palavras (Figura 4) mostra os termos representativos para cada aspecto, em que o tamanho das palavras está relacionado à frequência de ocorrência de tais termos nos comentários. (a) Saúde (b) Educação Figura 4. Nuvem de palavras para termos representativos de cada aspecto. 4. Conclusões Este artigo apresentou uma proposta de mineração de opinião pública em nível de aspecto para entidades eleitorais, considerando uma fonte de opinião fracamente estruturada. Desenvolvemos um estudo de caso completo, no qual, identificamos, classificamos e sumarizamos a percepção dos leitores de um jornal sobre os aspectos saúde e educação de candidatos, baseado em seus comentários. Em nosso conhecimento, trata-se de um trabalho pioneiro de mineração de opiniões em nível de aspecto fora do contexto de revisões de produtos. No estudo de caso, foi possível observar que apesar de existir uma grande quantidade de opiniões em relação aos candidatos, a quantidade em relação aos aspectos analisados é pequena. Isso se deve ao fato da população apresentar opiniões sobre outras dimensões destes candidatos. Este trabalho apresenta limitações, que serão tratadas em trabalhos futuros, tais como a extensão do estudo de caso para outros aspectos, o uso de corpus balanceado para classificação de opiniões, o tratamento de opiniões irregulares e implícitas e a identificação automática das entidades eleitorais nos comentários. Também é importante a identificação automática de aspectos. Para resolver o problema de uma sentença expressar opiniões sobre vários candidatos (e.g. X é horrível, votarei em Y ), a solução seria polarizar a opinião em nível de cláusulas. Pretendemos também aplicar nossa abordagem para as eleições presidenciais de 2014 e utilizar outros meios além de comentários de notícias, tais como posts em redes sociais. Referências Balahur, A., Steinberger, R., Kabadjov, M., Zavarella, V., Van Der Goot, E., Halkia, M., Pouliquen, B., and Belyaeva, J. (2010). Sentiment analysis in the news. In Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC), volume 10, page

10 Castellanos, M., Dayal, U., Hsu, M., Ghosh, R., Dekhil, M., Lu, Y., Zhang, L., and Schreiman, M. (2011). Lci: a social channel analysis platform for live customer intelligence. In Proceedings of the 2011 ACM SIGMOD International Conference on Management of data, SIGMOD 11, pages , New York, NY, USA. ACM. Guo, H., Zhu, H., Guo, Z., Zhang, X., and Su, Z. (2009). Product feature categorization with multilevel latent semantic association. In Proceedings of the 18th ACM Conference on Information and Knowledge Management, CIKM 09, pages , New York, NY, USA. ACM. Hall, M., Frank, E., Holmes, G., Pfahringer, B., Reutemann, P., and Witten, I. H. (2009). The weka data mining software: an update. ACM SIGKDD Explorations Newsletter, 11(1): Hu, M. and Liu, B. (2004). Mining and summarizing customer reviews. In Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining, KDD 04, pages , New York, NY, USA. ACM. Liu, B. (2012). Sentiment Analysis and Opinion Mining. Synthesis Lectures on Human Language Technologies. Morgan & Claypool Publishers. Liu, Q., Gao, Z., Liu, B., and Zhang, Y. (2013). A logic programming approach to aspect extraction in opinion mining. In Proceedings of the 2013 IEEE/WIC/ACM International Conferences on Web Intelligence, pages O Connor, B., Balasubramanyan, R., Routledge, B. R., and Smith, N. A. (2010). From tweets to polls: Linking text sentiment to public opinion time series. ICWSM, 11: Pang, B. and Lee, L. (2008). Opinion mining and sentiment analysis. Found. Trends Inf. Retr., 2(1-2): Qiu, G., Liu, B., Bu, J., and Chen, C. (2011). Opinion word expansion and target extraction through double propagation. Computational Linguistics, 37(1):9 27. Sapiras, L. and Becker, K. (2014). Identificação de aspectos de candidatos eleitorais em comentários de notícias. In Anais do III Brazilian Workshop on Social Network Analysis and Mining - BraSNAM Tsytsarau, M. and Palpanas, T. (2012). Survey on mining subjective data on the web. Data Min. Knowl. Discov., 24(3): Tumasjan, A., Sprenger, T. O., Sandner, P. G., and Welpe, I. M. (2010). Predicting elections with twitter: What 140 characters reveal about political sentiment. In ICWSM 10. Tumitan, D. and Becker, K. (2013). Tracking Sentiment Evolution on User-Generated Content: A Case Study on the Brazilian Political Scene. In Anais do XXVIII Simpósion Brasileiro de Banco de Dados, pages Tumitan, D. and Becker, K. (2014). Sentiment-based features for predicting election polls: a case study on the brazilian scenario. In Proceedings of the 2014 IEEE/WIC/ACM International Conferences on Web Intelligence, page 8p. IEEE Computer Society. 126

Mineração de Opinião / Análise de Sentimentos

Mineração de Opinião / Análise de Sentimentos Mineração de Opinião / Análise de Sentimentos Carlos Augusto S. Rodrigues Leonardo Lino Vieira Leonardo Malagoli Níkolas Timmermann Introdução É evidente o crescimento da quantidade de informação disponível

Leia mais

Laboratório de Mídias Sociais

Laboratório de Mídias Sociais Laboratório de Mídias Sociais Aula 02 Análise Textual de Mídias Sociais parte I Prof. Dalton Martins dmartins@gmail.com Gestão da Informação Universidade Federal de Goiás O que é Análise Textual? Análise

Leia mais

Como monitorar seus concorrentes e fazer pesquisa de mercado nas redes sociais. Por Gustavo Valvasori

Como monitorar seus concorrentes e fazer pesquisa de mercado nas redes sociais. Por Gustavo Valvasori Como monitorar seus concorrentes e fazer pesquisa de mercado nas redes sociais Por Gustavo Valvasori Índice 1. Introdução 2. Por que monitorar? 3. O que monitorar? 4. Como dialogar 5. Fluxo de comunicação

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Mineração de emoções em textos multilíngues usando um corpus paralelo

Mineração de emoções em textos multilíngues usando um corpus paralelo paper:79 Mineração de emoções em textos multilíngues usando um corpus paralelo Aline Graciela Lermen dos Santos, Karin Becker, Viviane Moreira Instituto de Informática Universidade Federal do Rio Grande

Leia mais

5 Extraindo listas de produtos em sites de comércio eletrônico

5 Extraindo listas de produtos em sites de comércio eletrônico 5 Extraindo listas de produtos em sites de comércio eletrônico Existem diversos trabalhos direcionadas à detecção de listas e tabelas na literatura como (Liu et. al., 2003, Tengli et. al., 2004, Krüpl

Leia mais

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperação de Informação GSI521 Prof. Rodrigo Sanches Miani FACOM/UFU Introdução Organização e Recuperação de Informação(GSI521) Tópicos Recuperação de informação (RI); Breve histórico; O

Leia mais

Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags

Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags Universidade Federal de Pernambuco Graduação em Ciência da Computação 2012.2 Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags Proposta de Trabalho de Graduação Aluno:

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Monitoramento de Redes Sociais

Monitoramento de Redes Sociais Monitoramento de Redes Sociais O QlikBrand é uma ferramenta profissional para monitoramento de mídias sociais e o primeiro "Social Mídia Discovery" com Qlikview. Localiza menções nas mídias sociais, interage

Leia mais

GARANTIA DA QUALIDADE DE SOFTWARE

GARANTIA DA QUALIDADE DE SOFTWARE GARANTIA DA QUALIDADE DE SOFTWARE Fonte: http://www.testexpert.com.br/?q=node/669 1 GARANTIA DA QUALIDADE DE SOFTWARE Segundo a NBR ISO 9000:2005, qualidade é o grau no qual um conjunto de características

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

OBSERVATÓRIO DE GESTÃO DA INFORMAÇÃO. Palavras-chave: Gestão da Informação. Gestão do conhecimento. OGI. Google alertas. Biblioteconomia.

OBSERVATÓRIO DE GESTÃO DA INFORMAÇÃO. Palavras-chave: Gestão da Informação. Gestão do conhecimento. OGI. Google alertas. Biblioteconomia. XIV Encontro Regional dos Estudantes de Biblioteconomia, Documentação, Ciência da Informação e Gestão da Informação - Região Sul - Florianópolis - 28 de abril a 01 de maio de 2012 RESUMO OBSERVATÓRIO DE

Leia mais

Descoberta de Domínio Conceitual de Páginas Web

Descoberta de Domínio Conceitual de Páginas Web paper:25 Descoberta de Domínio Conceitual de Páginas Web Aluno: Gleidson Antônio Cardoso da Silva gleidson.silva@posgrad.ufsc.br Orientadora: Carina Friedrich Dorneles dorneles@inf.ufsc.br Nível: Mestrado

Leia mais

Identificação de aspectos de candidatos eleitorais em comentários de notícias

Identificação de aspectos de candidatos eleitorais em comentários de notícias Identificação de aspectos de candidatos eleitorais em comentários de notícias Leonardo Augusto Sápiras, Karin Becker Instituto de Informática Universidade Federal do Rio Grande do Sul (UFRGS) Caixa Postal

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

Uma Análise de Comentários Sobre Produtos e Empresas, Usando o Corpus do Reclame Aqui

Uma Análise de Comentários Sobre Produtos e Empresas, Usando o Corpus do Reclame Aqui Uma Análise de Comentários Sobre Produtos e Empresas, Usando o Corpus do Reclame Aqui Roney L. de S. Santos 1, João P. A. Vieira 1, Jardeson L. N. Barbosa 1, Carlos A. de Sá 1, Raimundo S. Moura 1 1 Departamento

Leia mais

PROCESSAMENTO TEXTUAL EM PÁGINAS DA WEB

PROCESSAMENTO TEXTUAL EM PÁGINAS DA WEB PROCESSAMENTO TEXTUAL EM PÁGINAS DA WEB Aluno: Pedro Lazéra Cardoso Orientador: Eduardo Sany Laber Antecedentes Na primeira fase da Iniciação Científica, o aluno deu continuidade ao projeto que estava

Leia mais

BANCO DE DADOS I AULA 3. Willamys Araújo

BANCO DE DADOS I AULA 3. Willamys Araújo BANCO DE DADOS I AULA 3 Willamys Araújo Modelo Conceitual Descreve quais dados serão armazenados no banco de dados as relações que existem entre eles. Independe do SGBD e da abordagem do banco de dados

Leia mais

Extração de Requisitos

Extração de Requisitos Extração de Requisitos Extração de requisitos é o processo de transformação das idéias que estão na mente dos usuários (a entrada) em um documento formal (saída). Pode se entender também como o processo

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação SOFT DISCIPLINA: Engenharia de software AULA NÚMERO: 08 DATA: / / PROFESSOR: Andrey APRESENTAÇÃO O objetivo desta aula é apresentar e discutir conceitos relacionados a modelos e especificações. Nesta aula

Leia mais

TOTVS BA Guia de Customização Linha Logix

TOTVS BA Guia de Customização Linha Logix TOTVS BA Guia de Customização Linha Logix Guia de Customização Sumário Título do documento 1. Objetivo... 3 2. Introdução... 3 3. Customização... 3 2 TOTVS BA Linha Logix Guia de Customização Projeto/Versão:

Leia mais

QFD: Quality Function Deployment QFD: CASA DA QUALIDADE - PASSO A PASSO

QFD: Quality Function Deployment QFD: CASA DA QUALIDADE - PASSO A PASSO QFD: CASA DA QUALIDADE - PASSO A PASSO 1 - INTRODUÇÃO Segundo Akao (1990), QFD é a conversão dos requisitos do consumidor em características de qualidade do produto e o desenvolvimento da qualidade de

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD RESUMO Thereza P. P. Padilha Fabiano Fagundes Conceição Previero Laboratório de Solos

Leia mais

DP6: Gerando novos negócios a partir do monitoramento de redes sociais

DP6: Gerando novos negócios a partir do monitoramento de redes sociais DP6: Gerando novos negócios a partir do monitoramento de redes sociais O núcleo de inteligência em redes sociais Há cinco anos, a DP6, consultoria de marketing digital com foco em inteligência e performance

Leia mais

Orientação a Objetos

Orientação a Objetos 1. Domínio e Aplicação Orientação a Objetos Um domínio é composto pelas entidades, informações e processos relacionados a um determinado contexto. Uma aplicação pode ser desenvolvida para automatizar ou

Leia mais

USO DE REDES SOCIAIS EM AMBIENTES CORPORATIVOS. www.gentispanel.com.br

USO DE REDES SOCIAIS EM AMBIENTES CORPORATIVOS. www.gentispanel.com.br USO DE REDES SOCIAIS EM AMBIENTES CORPORATIVOS www.gentispanel.com.br Só quem tem uma base de 6,5 milhões de pessoas pode resolver suas pesquisas de mercado em poucos dias. Pesquisas ad-hoc Consumidores

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Estudos Comparativos Recentes - Behavior Scoring Roteiro Objetivo Critérios de Avaliação

Leia mais

Data, Text and Web Mining

Data, Text and Web Mining Data, Text and Web Mining Fabrício J. Barth TerraForum Consultores Junho de 2010 Objetivo Apresentar a importância do tema, os conceitos relacionados e alguns exemplos de aplicações. Data, Text and Web

Leia mais

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Aula anterior Organização e Recuperação de Informação(GSI521) Modelo vetorial- Definição Para o modelo vetorial, o

Leia mais

Avaliação e Monitoramento de Redes Sociais

Avaliação e Monitoramento de Redes Sociais Avaliação e Monitoramento de Redes Sociais Aula 03 Ferramentas de monitoramento Prof. Dalton Martins dmartins@gmail.com www.l3p.fic.ufg.br Pós-graduação em Gestão e Avaliação da Informação Apresentação

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

E3Suite. Estudo da Evolução de Eventos Científicos

E3Suite. Estudo da Evolução de Eventos Científicos E3Suite Estudo da Evolução de Eventos Científicos Manual do usuário Projeto: Redes Sociais de Pesquisa em Sistemas de Informação UNIRIO Conteúdo 1. Instalação... 3 2. Visão Geral... 4 Equivalência de Instituições...

Leia mais

11 de maio de 2011. Análise do uso dos Resultados _ Proposta Técnica

11 de maio de 2011. Análise do uso dos Resultados _ Proposta Técnica 11 de maio de 2011 Análise do uso dos Resultados _ Proposta Técnica 1 ANÁLISE DOS RESULTADOS DO SPAECE-ALFA E DAS AVALIAÇÕES DO PRÊMIO ESCOLA NOTA DEZ _ 2ª Etapa 1. INTRODUÇÃO Em 1990, o Sistema de Avaliação

Leia mais

4 Segmentação. 4.1. Algoritmo proposto

4 Segmentação. 4.1. Algoritmo proposto 4 Segmentação Este capítulo apresenta primeiramente o algoritmo proposto para a segmentação do áudio em detalhes. Em seguida, são analisadas as inovações apresentadas. É importante mencionar que as mudanças

Leia mais

Revisando o Método de Análise da Semântica Latente para Propósitos de Mineração de Opiniões sobre Produtos

Revisando o Método de Análise da Semântica Latente para Propósitos de Mineração de Opiniões sobre Produtos Revisando o Método de Análise da Semântica Latente para Propósitos de Mineração de Opiniões sobre Produtos Wilson Pires Gavião Neto 1, Sidnei Renato Silveira 1 1 Sistemas de Informação: Ciência e Tecnologia

Leia mais

4 Implementação e Resultados Experimentais

4 Implementação e Resultados Experimentais 4 Implementação e Resultados Experimentais Com o objetivo de fazer a criação automática de visões materializadas, ou seja, prover uma solução on-the-fly para o problema de seleção de visões materializadas,

Leia mais

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:

Leia mais

Classes Funcionais 21

Classes Funcionais 21 Classes Funcionais 21 3 Classes Funcionais Em todo trabalho de classificação funcional é necessário determinar quais serão as classes funcionais utilizadas. Esta divisão não se propõe a ser extensiva,

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

Perfil de Produção Bibliográfica dos Programas Brasileiros de Pós-Graduação em Ciência da Computação

Perfil de Produção Bibliográfica dos Programas Brasileiros de Pós-Graduação em Ciência da Computação Perfil de Produção Bibliográfica dos Programas Brasileiros de Pós-Graduação em Ciência da Computação Jesús P. Mena-Chalco 1, Luciano A. Digiampietri 2, Leonardo B. Oliveira 3 1 Centro de Matemática, Computação

Leia mais

Módulo 4. Construindo uma solução OLAP

Módulo 4. Construindo uma solução OLAP Módulo 4. Construindo uma solução OLAP Objetivos Diferenciar as diversas formas de armazenamento Compreender o que é e como definir a porcentagem de agregação Conhecer a possibilidade da utilização de

Leia mais

Avaliação das campanhas antitabagismo na mídia de massa

Avaliação das campanhas antitabagismo na mídia de massa Avaliação das campanhas antitabagismo na mídia de massa Marc Boulay, PhD Center for Communication Programs Johns Hopkins Bloomberg School of Public Health 2008 Johns Hopkins Bloomberg School of Public

Leia mais

ANEXO 2 - INDICADORES EDUCACIONAIS 1

ANEXO 2 - INDICADORES EDUCACIONAIS 1 ES R O D A C I D N I 2 O X E N A EDUCACIONAIS 1 ANEXO 2 1 APRESENTAÇÃO A utilização de indicadores, nas últimas décadas, na área da educação, tem sido importante instrumento de gestão, pois possibilita

Leia mais

Resultados Experimentais

Resultados Experimentais Capítulo 6 Resultados Experimentais Este capítulo é dedicado às avaliações experimentais do sistema CBIR. Os experimentos aqui realizados têm três objetivos principais: comparar os nossos resultados com

Leia mais

Sugestão de Roteiro para Elaboração de Monografia de TCC

Sugestão de Roteiro para Elaboração de Monografia de TCC Sugestão de Roteiro para Elaboração de Monografia de TCC Sugerimos, para elaborar a monografia de TCC (Trabalho de Conclusão de Curso), que o aluno leia atentamente essas instruções. Fundamentalmente,

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE Mariane Alves Gomes da Silva Eliana Zandonade 1. INTRODUÇÃO Um aspecto fundamental de um levantamento

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS

SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS André Zuconelli 1 ; Manassés Ribeiro 2 1. Aluno do Curso Técnico em Informática, turma 2010, Instituto Federal Catarinense, Câmpus Videira, andre_zuconelli@hotmail.com

Leia mais

Utilização de Análise de Características Dinâmicas em analises estáticas.

Utilização de Análise de Características Dinâmicas em analises estáticas. Utilização de Análise de Características Dinâmicas em analises estáticas. Felipe A. Miziara 1, Marcelo A. Maia 1 1 Departamento de pós-graduação em Ciências da Computação Universidade Federal de Uberlândia

Leia mais

APLICACAÇÃO DE METRICAS E INDICADORES NO MODELO DE REFERENCIA CMMI-Dev NIVEL 2

APLICACAÇÃO DE METRICAS E INDICADORES NO MODELO DE REFERENCIA CMMI-Dev NIVEL 2 APLICACAÇÃO DE METRICAS E INDICADORES NO MODELO DE REFERENCIA CMMI-Dev NIVEL 2 Renan J. Borges 1, Késsia R. C. Marchi 1 1 Universidade Paranaense (UNIPAR) Paranavaí, PR Brasil renanjborges@gmail.com, kessia@unipar.br

Leia mais

PESQUISA SOBRE O PERFIL DE ALUNOS NA UTILIZAÇÃO DE UM SITE DOCENTE DO ENSINO SUPERIOR

PESQUISA SOBRE O PERFIL DE ALUNOS NA UTILIZAÇÃO DE UM SITE DOCENTE DO ENSINO SUPERIOR PESQUISA SOBRE O PERFIL DE ALUNOS NA UTILIZAÇÃO DE UM SITE DOCENTE DO ENSINO SUPERIOR Wesley Humberto da Silva (Fundação Araucária), André Luis Andrade Menolli (Orientador) e-mail: wesleyhumberto11@mail.com

Leia mais

6 Construção de Cenários

6 Construção de Cenários 6 Construção de Cenários Neste capítulo será mostrada a metodologia utilizada para mensuração dos parâmetros estocásticos (ou incertos) e construção dos cenários com respectivas probabilidades de ocorrência.

Leia mais

DEMONSTRAÇÕES FINANCEIRAS COMBINADAS

DEMONSTRAÇÕES FINANCEIRAS COMBINADAS 24 DEMONSTRAÇÕES FINANCEIRAS COMBINADAS Os mercados de capitais na Europa e no mundo exigem informações financeiras significativas, confiáveis, relevantes e comparáveis sobre os emitentes de valores mobiliários.

Leia mais

Aula 02: Conceitos Fundamentais

Aula 02: Conceitos Fundamentais Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que

Leia mais

COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS

COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS Leonardo Meneguzzi 1 ; Marcelo Massoco Cendron 2 ; Manassés Ribeiro 3 INTRODUÇÃO

Leia mais

Engenharia de Software Sistemas Distribuídos

Engenharia de Software Sistemas Distribuídos Engenharia de Software Sistemas Distribuídos 2 o Semestre de 2009/2010 FEARSe Requisitos para a 1 a entrega 18 de Março de 2010 1 Introdução O projecto conjunto das disciplinas de Engenharia de Software

Leia mais

Hierarquia de modelos e Aprendizagem de Máquina

Hierarquia de modelos e Aprendizagem de Máquina Hierarquia de modelos e Aprendizagem de Máquina Fabrício Jailson Barth BandTec Maio de 2015 Sumário Introdução: hierarquia de modelos e aprendizagem de máquina. O que é Aprendizagem de Máquina? Hierarquia

Leia mais

Disciplina: Unidade III: Prof.: E-mail: Período:

Disciplina: Unidade III: Prof.: E-mail: Período: Encontro 08 Disciplina: Sistemas de Banco de Dados Unidade III: Modelagem Lógico de Dados Prof.: Mario Filho E-mail: pro@mariofilho.com.br Período: 5º. SIG - ADM Relembrando... Necessidade de Dados Projeto

Leia mais

YouTube Insights: o que considerar na hora de criar o vídeo da sua campanha

YouTube Insights: o que considerar na hora de criar o vídeo da sua campanha YouTube Insights: o que considerar na hora de criar o vídeo da sua campanha Nesses dez anos de vida do YouTube, o vídeo online passou por transformações significativas, moldou a relação das pessoas Publicado

Leia mais

NBC TSP 10 - Contabilidade e Evidenciação em Economia Altamente Inflacionária

NBC TSP 10 - Contabilidade e Evidenciação em Economia Altamente Inflacionária NBC TSP 10 - Contabilidade e Evidenciação em Economia Altamente Inflacionária Alcance 1. Uma entidade que prepara e apresenta Demonstrações Contábeis sob o regime de competência deve aplicar esta Norma

Leia mais

Criminalidade. Luciano Nakabashi Juliano Condi

Criminalidade. Luciano Nakabashi Juliano Condi A Associação Comercial de (ACIRP) em parceria com a FUNDACE realiza uma pesquisa de qualidade de vida na cidade de desde 2009. Essa é uma pesquisa muito importante para se que se tenha uma base confiável

Leia mais

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I! A utilização de escores na avaliação de crédito! Como montar um plano de amostragem para o credit scoring?! Como escolher as variáveis no modelo de credit

Leia mais

Referências internas são os artefatos usados para ajudar na elaboração do PT tais como:

Referências internas são os artefatos usados para ajudar na elaboração do PT tais como: Plano de Teste (resumo do documento) I Introdução Identificador do Plano de Teste Esse campo deve especificar um identificador único para reconhecimento do Plano de Teste. Pode ser inclusive um código

Leia mais

Web Data mining com R: aprendizagem de máquina

Web Data mining com R: aprendizagem de máquina Web Data mining com R: aprendizagem de máquina Fabrício Jailson Barth Faculdade BandTec e VAGAS Tecnologia Junho de 2013 Sumário O que é Aprendizagem de Máquina? Hierarquia de aprendizado. Exemplos de

Leia mais

Análise de Web Reviews Sobre Produtos ou Serviços Usando um Léxico de Sentimentos

Análise de Web Reviews Sobre Produtos ou Serviços Usando um Léxico de Sentimentos Análise de Web Reviews Sobre Produtos ou Serviços Usando um Léxico de Sentimentos João Paulo A. Vieira 1, Jardeson L. N. Barbosa¹, Roney L. de S. Santos¹, Carlos A. de Sá¹, Raimundo S. Moura 1 1 Departamento

Leia mais

Se observarmos nos diferentes livros. Planejamento de Testes a partir de Casos de Uso

Se observarmos nos diferentes livros. Planejamento de Testes a partir de Casos de Uso Planejamento de Testes a partir de Casos de Uso Arilo Cláudio Dias Neto ariloclaudio@gmail.com É Bacharel em Ciência da Computação formado na Universidade Federal do Amazonas, Mestre em Engenharia de Sistemas

Leia mais

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o DATABASE MARKETING No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o empresário obter sucesso em seu negócio é

Leia mais

REFORMULAÇÃO SITE ARCA BRASIL

REFORMULAÇÃO SITE ARCA BRASIL REFORMULAÇÃO SITE ARCA BRASIL Equipe A³ Elton Sacramento Eveline Almeida Gabriela Yu 1 1. Introdução O site escolhido foi o ARCA Brasil (http://www.arcabrasil.org.br/), uma ONG que promove o bem-estar

Leia mais

2 Conceitos Gerais de Classificação de Documentos na Web

2 Conceitos Gerais de Classificação de Documentos na Web Conceitos Gerais de Classificação de Documentos na Web 13 2 Conceitos Gerais de Classificação de Documentos na Web 2.1. Páginas, Sites e Outras Terminologias É importante distinguir uma página de um site.

Leia mais

CONCURSO PÚBLICO ANALISTA DE SISTEMA ÊNFASE GOVERNANÇA DE TI ANALISTA DE GESTÃO RESPOSTAS ESPERADAS PRELIMINARES

CONCURSO PÚBLICO ANALISTA DE SISTEMA ÊNFASE GOVERNANÇA DE TI ANALISTA DE GESTÃO RESPOSTAS ESPERADAS PRELIMINARES CELG DISTRIBUIÇÃO S.A EDITAL N. 1/2014 CONCURSO PÚBLICO ANALISTA DE GESTÃO ANALISTA DE SISTEMA ÊNFASE GOVERNANÇA DE TI RESPOSTAS ESPERADAS PRELIMINARES O Centro de Seleção da Universidade Federal de Goiás

Leia mais

Engenharia de Software III

Engenharia de Software III Engenharia de Software III Casos de uso http://dl.dropbox.com/u/3025380/es3/aula6.pdf (flavio.ceci@unisul.br) 09/09/2010 O que são casos de uso? Um caso de uso procura documentar as ações necessárias,

Leia mais

Dadas a base e a altura de um triangulo, determinar sua área.

Dadas a base e a altura de um triangulo, determinar sua área. Disciplina Lógica de Programação Visual Ana Rita Dutra dos Santos Especialista em Novas Tecnologias aplicadas a Educação Mestranda em Informática aplicada a Educação ana.santos@qi.edu.br Conceitos Preliminares

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios FATEC Cruzeiro José da Silva Ferramenta CRM como estratégia de negócios Cruzeiro SP 2008 FATEC Cruzeiro José da Silva Ferramenta CRM como estratégia de negócios Projeto de trabalho de formatura como requisito

Leia mais

Recuperação de Imagens na Web Baseada em Informações Textuais

Recuperação de Imagens na Web Baseada em Informações Textuais Recuperação de Imagens na Web Baseada em Informações Textuais André Ribeiro da Silva Mário Celso Candian Lobato Universidade Federal de Minas Gerais Departamento de Ciência da Computação {arsilva,mlobato}@dcc.ufmg.br

Leia mais

Avaliando o que foi Aprendido

Avaliando o que foi Aprendido Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função

Leia mais

Fundamentos de Teste de Software

Fundamentos de Teste de Software Núcleo de Excelência em Testes de Sistemas Fundamentos de Teste de Software Módulo 3 Planejamento e Aula 8 do Projeto Aula 08 do Projeto SUMÁRIO INTRODUÇÃO... 3 ACOMPANHAMENTO DO PROJETO... 3 1. do Progresso...

Leia mais

Programação Estruturada e Orientada a Objetos. Fundamentos Orientação a Objetos

Programação Estruturada e Orientada a Objetos. Fundamentos Orientação a Objetos Programação Estruturada e Orientada a Objetos Fundamentos Orientação a Objetos 2013 O que veremos hoje? Introdução aos fundamentos de Orientação a Objetos Transparências baseadas no material do Prof. Jailton

Leia mais

Microsoft Access XP Módulo Um

Microsoft Access XP Módulo Um Microsoft Access XP Módulo Um Neste primeiro módulo de aula do curso completo de Access XP vamos nos dedicar ao estudo de alguns termos relacionados com banco de dados e as principais novidades do novo

Leia mais

Microsoft Access: Criar consultas para um novo banco de dados. Vitor Valerio de Souza Campos

Microsoft Access: Criar consultas para um novo banco de dados. Vitor Valerio de Souza Campos Microsoft Access: Criar consultas para um novo banco de Vitor Valerio de Souza Campos Conteúdo do curso Visão geral: consultas são essenciais Lição: inclui sete seções Tarefas práticas sugeridas Teste.

Leia mais

Big Data. Como utilizar melhor e mais rápido seus dados e informações utilizando metodologias e tecnologias GED/ECM

Big Data. Como utilizar melhor e mais rápido seus dados e informações utilizando metodologias e tecnologias GED/ECM Big Data Como utilizar melhor e mais rápido seus dados e informações utilizando metodologias e tecnologias GED/ECM Irineu Granato, CDIA+ CBPP, AIIM (ECMp, ECMs, IOAp, BPMs, ERMs) AIIM Professional Member

Leia mais

Capítulo 7 Medidas de dispersão

Capítulo 7 Medidas de dispersão Capítulo 7 Medidas de dispersão Introdução Para a compreensão deste capítulo, é necessário que você tenha entendido os conceitos apresentados nos capítulos 4 (ponto médio, classes e frequência) e 6 (média).

Leia mais

Módulo 4: Gerenciamento de Dados

Módulo 4: Gerenciamento de Dados Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

Grupo Seres Adota CA Nimsoft Service Desk para Automatizar e Gerenciar Chamados de Service Desk

Grupo Seres Adota CA Nimsoft Service Desk para Automatizar e Gerenciar Chamados de Service Desk CUSTOMER SUCCESS STORY Abril 2014 Grupo Seres Adota CA Nimsoft Service Desk para Automatizar e Gerenciar Chamados de Service Desk PERFIL DO CLIENTE Indústria: Consultoria Empresa: Grupo Seres Colaboradores:

Leia mais

CRIAÇÃO DO SITE DA DISCIPLINA DE EXPERIMENTAÇÃO E DA CENTRAL DE ANÁLISES ESTATÍSTICAS NA UTFPR-DV

CRIAÇÃO DO SITE DA DISCIPLINA DE EXPERIMENTAÇÃO E DA CENTRAL DE ANÁLISES ESTATÍSTICAS NA UTFPR-DV CRIAÇÃO DO SITE DA DISCIPLINA DE EXPERIMENTAÇÃO E DA CENTRAL DE ANÁLISES ESTATÍSTICAS NA UTFPR-DV 1. Identificação do proponente Nome: Moeses Andrigo Danner Vínculo com a instituição: Docente permanente

Leia mais

Modelo Entidade-Relacionamento

Modelo Entidade-Relacionamento Modelo Entidade-Relacionamento Banco de Dados I Fases do Projeto jt de BD Enunciado de requisitos entrevista com o usuário do banco de dados para entender e documentar seus requerimentos de dados. Projeto

Leia mais

RELATÓRIO DE MONITORAMENTO. Danilo Pestana & Rafael Grilo Orientador: Prof. Dr. Sérgio Sobreira

RELATÓRIO DE MONITORAMENTO. Danilo Pestana & Rafael Grilo Orientador: Prof. Dr. Sérgio Sobreira RELATÓRIO DE MONITORAMENTO Danilo Pestana & Rafael Grilo Orientador: Prof. Dr. Sérgio Sobreira 1 1. Volume total de menções Mostrar a evolução dia-a-dia das menções com o sentimento correspondente e identificar

Leia mais

35 Reports úteis. para Monitoramento de. Redes Sociais

35 Reports úteis. para Monitoramento de. Redes Sociais 35 Reports úteis para Monitoramento de Redes Sociais Fevereiro/2014 1 35 Reports Úteis O principal desafio da E.Life ao lançar o Buzzmonitor era criar uma solução de Business Intelligence e não apenas

Leia mais

O que é a estatística?

O que é a estatística? Elementos de Estatística Prof. Dr. Clécio da Silva Ferreira Departamento de Estatística - UFJF O que é a estatística? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os

Leia mais

Como o Scup pode ajudar consultores políticos durante o período eleitoral

Como o Scup pode ajudar consultores políticos durante o período eleitoral Como o Scup pode ajudar consultores políticos durante o período eleitoral Primeiros passos no mundo da política Em 1992, o paulista Gilberto Musto iniciou a sua consultoria política na cidade de Fernandópolis.

Leia mais