Desenvolvimento de um Sistema de Pergunta e Resposta baseado em Corpus

Tamanho: px
Começar a partir da página:

Download "Desenvolvimento de um Sistema de Pergunta e Resposta baseado em Corpus"

Transcrição

1 Desenvolvimento de um Sistema de Pergunta e Resposta baseado em Corpus Adriano Jorge Soares Arrigo, Elvio Gilberto Silva, Henrique Pachioni Martins, Patrick Pedreira Silva Curso de Ciência da Computação Universidade Sagrado Coração (USC) Bauru SP Bauru arrigo.adriano@gmail.com, elvio.silva@usc.br, henrique.martins@usc.br, patrick.silva@usc.br Abstract. As the amount of textual information grows dramatically, it is important to research methods and develop tools in order to process and organize such data automatically. This project aims at exploring the potential of the text surface pattern to develop a Question Answering System. Therefore, this work proposes the adjustment and use of a method which allows learning the patterns automatically. A tagged corpus will be built based on the web, providing the samples required for both learning process and system building. After deploying, the system will be tested to verify its performance and validate the proposed method. Resumo. Com o crescimento exponencial da quantidade de informações textuais geradas, torna se relevante pesquisar métodos e desenvolver ferramentas que possam processar e organizar tais informações de modo automático. Este projeto propõe explorar o potencial dos padrões de superfície do texto para o desenvolvimento de um Sistema de Pergunta e Resposta. Para isso, é proposta a adaptação e utilização de um método que permite a aprendizagem de padrões automaticamente. Um corpus etiquetado será construído a partir da internet, provendo os exemplos necessários para o processo de aprendizagem e construção do sistema. Após a implementação o sistema será testado para verificação do seu desempenho e validação do método proposto.. Introdução As ferramentas de busca online que estão disponíveis atualmente (Google, Bing, Yahoo, etc.) emitem resultados que são correlatos à questão (query) que se deseja a resposta, mas não exatamente a resposta que se procura. Assim, não são raras as situações em que a busca de uma informação conduz a diversos assuntos, divergindo do objetivo inicial. A maior parte dessas ferramentas faz uso de técnica de busca por palavraschave, sendo incapazes de interpretar para além da correspondência de palavras em documentos (técnica conhecida como bag of words). Em tal técnica, o usuário apresenta um conjunto de termos (as palavras chave) e o sistema devolve uma lista

2 de documentos com base na presença ou relevância dos termos buscados. Finalizada a parte automática, cabe ao usuário a análise dos documentos obtidos, o que envolve a leitura e o descarte daqueles que não lhe são relevantes e, eventualmente, a detecção da informação pontual procurada no corpo de um daqueles documentos [Melo et. al 202]. Hoje, devido aos avanços significativos dos buscadores em questões de desempenho, estrutura e armazenamento, esses possuem resultados excelentes se for tomada como métrica o desempenho para conhecimentos relevantes como, por exemplo, qual é a capital de um determinado país, quem foi determinada pessoa, etc; [Lewandowski 205]. Não obstante, com o desenvolvimento de novas tecnologias de interação do usuário com a máquina, esses buscadores, a exemplo do Google, proporcionam atualmente não só um alto desempenho em suas respostas, mas uma experiência completa nessas buscas, como visto a partir de 204 com o Grafo de Conhecimento. Entretanto, a ausência de um corpo principal 2 pode causar dificuldades na construção, gestão e aplicação em uma base de conhecimento [Shengtao et. al 2002], ou seja, uma base de dados (nesse caso, o corpus) que possua informações relacionadas a um conjunto de conhecimentos específicos. Assim, esse trabalho visa propor alternativas aos tradicionais métodos de busca de respostas em bases de documentos através do uso de extração de padrões de superfícies textuais. Essa proposta tem como base o trabalho de [Ravichandran and Rovy 2002] que aborda o tema através do uso de expressões regulares, etiquetagem de corpus e, posteriormente, o cálculo de precisão das respostas encontradas. 2. Trabalhos Correlatos Um sistema de Pergunta e Resposta (Q&A, do inglês Question Answering) pode partir de domínios abertos ou domínios fechados. Os de domínios abertos são os que abrangem várias áreas do conhecimento, cruzando informações para chegar a uma resposta específica. Os sistemas fechados são treinados para responder perguntas em uma especialidade, como biologia, geografia, etc. Independente de um sistema de Q&A ser especializado ou não, ele passa por quatro fases principais [PRESTES 20] conforme mostra a Figura. Figura. Esquema das principais fases de um sistema de Q&A Grafos de Conhecimento são ligações que o buscador faz para atrelar diferentes conhecimentos sobre um mesmo assunto a partir da busca que o usuário faz. 2 Entende se por corpo principal a parte de um corpus ou de um banco de dados que será usada para um propósito específico.

3 Para melhor desempenho do sistema e para facilitar a compreensão da pergunta, alguns sistemas, como o MULDER [KWOK; ETZIONI; WELD, 200 apud PRESTES 200], o AnswerBus [ZHENG 2002 apud PRESTES 200] e o Qualim [KAISSER 2005 apud PRESTES 200] utilizam largamente: Ontologias para classificar o corpus ou os documentos 3. O sistema WordNet 4, uma ontologia largamente utilizada em sistemas de domínio aberto para a língua inglesa. Ferramentas de análise sintática para determinar a estrutura gramatical (Parsers); Reconhecedores de entidades nomeadas para identificar o tipo de resposta esperada, sendo uma etapa essencial para perguntas que visam respostas sobre fatos (Qual a maior montanha do mundo / Quem foi Ayrton Senna). O processo de steemining, que é o processo de voltar (se houver e se for possível) o verbo da pergunta para sua forma no infinitivo (ex.: descobrimento e nasceu tornam se descobrir e nascer, respectivamente). Como fica claro na maioria dos sistemas de Q&A, as metodologias abordadas são orientadas a complexos métodos, porém isso não garante que os resultados sejam satisfatórios quando testados na língua portuguesa ou mesmo em sua língua vernácula. [PRESTES 2002] considera fraco o desempenho de tais métodos quando adaptados à língua portuguesa devido a diversos fatores ligados às abordagens orientadas à linguística computacional. Já [Ravinchandran and Rovy 2002] ressaltam que no evento TREC 5 0 o sistema de QA vencedor usou apenas um único recurso computacional: uma lista extensa de padrões de superfície de texto. Assim, através da análise da metodologia usada no sistema vencedor, o trabalho de [Ravichandran and Rovy 2002] investiga a acurácia de padrões encontrados sob a ótica da análise de superfícies textuais e, no caso do presente artigo, os esforços concentram se em adaptar esse método para a língua portuguesa e realizar uma análise das dificuldades encontradas e as possíveis potencialidades dessa abordagem oferecendo, assim, uma alternativa para os principais métodos linguísticos usados até então no desenvolvimento de sistemas de Q&A. 3 Uma Ontologia é um modelo de dados que descreve um conjunto de conceitos dentro de um domínio e os relacionamentos entre esses conceitos [PRESTES CITAÇAÕ DIRETA]; 4 WordNet disponível em 5 O TREC é uma das principais conferencias na área de Q&A e tem por finalidade apoiar pesquisa na área de Recuperação de Informação e avaliar metodologias correlatas[ PRESTES 2002],

4 3. Materiais e Métodos Para o processo da recuperação dos padrões de respostas foi necessária a construção de um corpus específico para esta investigação dividido em seis domínios de conhecimento, a saber: DESCOBRIDOR, FAMOSO POR, ANO NASCIMENTO, LOCAL, DEFINIÇÃO e INVENTOR. Cabe destacar que tais domínios correspondem a uma adaptação para o português do trabalho de [Ravichandran and Hovy 2002]. Foram feitas, pelo menos, duas perguntas (queries) distintas relacionadas a cada domínio. Por exemplo, para o domínio DEFINIÇÃO, foram feitas perguntas que indicassem a busca pelo significado de algo, como O que é uma Timbila?. Para essa questão o corpus foi construído, considerando todos os resultados da query Timbila+ instrumento musical (correspondendo ao objeto e sua definição), retornados pelo buscador Google e que são as palavras chave para a pergunta e a resposta, etiquetadas no corpus como <PERGUNTA> e 6, respectivamente. O método de procura por padrões em superfícies foi usado em conjunto com essas etiquetas, já que esse método somente busca as palavras chave, sem analisar, em um primeiro momento, elementos característicos de cada palavra como seu emprego sintático ou semântico. Foram utilizados comandos de linguagens típicas para recuperação de padrões textuais, como sed e awk. Essas linguagens, somadas ao utilitário de texto grep permitem a criação de simples expressões regulares [Ravichandran and Rovy 2002] que são muito úteis para buscar padrões textuais avançados através de complexos critérios de seleção [Robbins 200]. Assim, para o presente trabalho, essas linguagens são muito úteis para recuperarem sentenças específicas no corpus além de ser possível, posteriormente, ranquear os melhores padrões de respostas. Foram construídos dois algoritmos: um para a aprendizagem de padrões de respostas (algoritmo ) e o outro para calcular a precisão desses padrões (algoritmo 2). O algoritmo é responsável por copiar os 00 primeiros resultados da query formulada a partir da pergunta inserida no buscador web, considerando apenas o conteúdo textual das páginas Web formando, assim, o corpus específico. Neste processo são desconsideradas, portanto, informações como imagens, tabelas, código HTML, etc; objetos esses que não são úteis para o procedimento aqui adotado. Além da eliminação destes elementos, foram retirados símbolos textuais (@, #,!, etc.), links e aspas. Adicionalmente, o corpus é colocado inteiramente em letras minúsculas (case folding). Posteriormente, são substituídas as palavras chave por suas etiquetas correspondentes, assim, todas as sentenças recuperadas podem ser analisadas automaticamente para que seja possível manter somente sentenças que possuam ambas as etiquetas, de pergunta e resposta. 6 Previamente as respostas do domínio DEFINIÇÃO foram dadas como certas a partir da definição encontrada no Dicionário Priberam da Língua Portuguesa (disponível em embora seja muito vasto as possíveis respostas para se definir determinadas entidades como, por exemplo, o que é o movimento artístico Concretismo.

5 Ao final, as sentenças que se mantiveram durante todo esse processo são ranqueadas através da contagem automática da sua frequência no corpus. Assim, ao final do algoritmo, serão selecionadas para o Algoritmo 2 somente as sentenças que tiverem o melhor posicionamento. O algoritmo 2 analisa a precisão de cada padrão de resposta selecionado. Para isso, os padrões selecionados são submetidos a um mecanismo de busca para que seja verificada a sua capacidade de recuperação de informação (precisão). No exemplo da pergunta O que é uma Timbila?, o melhor padrão de resposta, de acordo com os resultados do algoritmo, foi <PERGUNTA> é o nome de um. Assim, esse padrão é inserido no buscador com a query timbila é o nome de um, omitindo a resposta (instrumento musical) para justamente ser possível descobrir quais palavras são recuperadas por esse padrão. Dessa forma, são possíveis os seguintes resultados: Timbila é o nome de um instrumento musical. 2 Timbila é o nome de um <QUALQUER_PALAVRA>; Apesar de ser bastante genérica a opção <QUALQUER_PALAVRA> para a busca "O que é uma Timbila?", optou se por não não fazer restrições do tipo "Timbila é um <SUBSTANTIVO>", por exemplo. Tal decisão partiu da hipótese de que mais resultados interessantes podem aparecer sem essa restrição, apesar de o generalismo permitir também a recuperação de respostas indesejáveis. A precisão de cada padrão de resposta (P) é calculada pela frequência absoluta acumulada, uma adaptação para o método descrito no trabalho de [Ravichandran and Rovy 2002], que consiste em P = Ca/Co, onde: Ca = total de sentenças recuperadas que contenha a resposta correta; Co = total de sentenças recuperadas. 4. Resultados A precisão foi calculada através de um experimento usando o mecanismo de busca Google com um conjunto de 2 perguntas relacionadas a um domínio específico (DESCOBRIMENTO, ANO NASCIMENTO, FAMOSO POR, DEFINIÇÃO, INVENTOR, LOCALIZAÇÃO). A Tabela mostra alguns dos principais resultados por domínio.

6 Tabela. Resumo dos padrões encontrados e suas respectivas precisões Domínio Pergunta Melhores Padrões Encontrados Precisão DESCOBRIDOR Quem descobriu Netuno? Quem descobriu o Nióbio? <PERGUNTA> foi descoberto por <PERGUNTA> descoberto pelo 0.58 ANO NASCIMENTO Em que ano B. Pitt nasceu? <PERGUNTA> nasceu em 0.4 FAMOSO POR Daniel Radcliffe é/ficou famoso pelo quê? <PERGUNTA> famoso por <PERGUNTA> famoso por interpretar 0.42 DEFINIÇÃO O que é timbila? O que é concretismo? <PERGUNTA> é o nome de um <PERGUNTA> corresponde a um 0.83 INVENTOR Quem inventou o Pantógrafo? <PERGUNTA> foi construído por <PERGUNTA> foi inventado pelo Quem inventou a lâmpada? inventa a <PERGUNTA> LOCALIZAÇÃO Onde fica a C. da Diamantina? <PERGUNTA> na 0

7 Um gráfico foi elaborado para melhor visualização dos resultados levando em consideração o desempenho geral para a precisão de cada domínio, conforme mostrado na Figura 2. Figura 2. Resultado gráfico da precisão dos domínios testados. Conforme pode ser observado na Figura 2, o domínio que apresentou os melhores resultados foi o de DESCOBRIMENTO com uma precisão de 0,76 embora houvesse certa dificuldade para formular perguntas concisas sobre esse domínio, já que a maioria das perguntas formuladas relacionavam se melhor ao domínio INVENTOR. Perguntas que se relacionam a esse domínio foram restritas a descobrimentos científicos, que foram exatamente o tipo de pergunta feita nessa investigação. Perguntas do tipo Quem descobriu o Brasil? foram evitadas nesse experimento devido às divergências que há nas respostas, prejudicando os cálculos de precisão. O domínio DEFINIÇÃO obteve muitas respostas, dificultando a recuperação de um padrão que apareça no corpus duas ou mais vezes. Sendo assim, o padrão está atrelado ao tipo da palavra chave buscada. Para o domínio FAMOSO POR, o método proposto (inserção da query com as palavras chave no buscador Google), não foi capaz de encontrar nenhum padrão que fosse recuperado duas ou mais vezes. Alternativamente, foram escolhidos manualmente os padrões encontrados. Para o padrão famoso por interpretar <PERGUNTA> um script auxiliar foi aplicado ao corpus para retirar os adjetivos encontrados nesse caso. O domínio INVENTOR obteve bons resultados devido ao grande número de páginas web em português que possuem informações relevantes sobre os temas. Uma

8 das perguntas do experimento consistiu em buscar a resposta sobre um objeto pouco conhecido (Pantógrafo) e, em contraste, foi feita uma pergunta de conhecimento comum (quem inventou a lâmpada?). Embora mais satisfatório que os resultados do domínio ANO NASCIMENTO, essa última pergunta encontra muitos textos de traduções automáticas ou duplicadas. Por um lado isso é bom, pois a quantidade de padrões encontrados foi alta e muito precisa. Porém, por outro lado, textos repetitivos fazem com o que o sistema desenvolvido lide com um mesmo tipo de padrão, impossibilitando testar o método para padrões diversificados, como é o caso da pergunta sobre o Pantógrafo. Para o domínio LOCALIZAÇÃO, o método de encontrar os padrões de resposta (algoritmo ) não recuperou nenhum padrão de resposta válido. Há uma grande variedade de respostas para uma pergunta do tipo Onde fica Bauru?/ Onde se localiza Bauru?. Como exemplo, algumas respostas poderiam ser: Bauru fica no Centro Oeste paulista, Bauru fica no interior de São Paulo ou Bauru fica perto de Marília. Assim, é muito difícil escolher a melhor resposta para usar como palavrachave. Quando as palavras chave são encontradas, elas estão dentro de contexto de anúncios, notícias ou informações comerciais. Isso também pode ser verificado em informações sobre regiões mais conhecidas como Onde fica o deserto de Gobi?. Isso demonstra a complexidade de trabalhar com esse domínio e o seu baixo desempenho, como pode ser visto no resultado da pergunta Onde fica a Chapada Diamantina?. Para o domínio ANO NASCIMENTO, que teve o pior desempenho, o buscador Google não reconheceu padrões que possuem caracteres especiais (tais como parênteses e traços simples), assim poucos (ou nenhum) textos recuperados se encaixaram no padrão de resposta. Também é importante notar que devido as palavras chave serem nomes próprios seguidas de números (por exemplo, Mozart 746) o buscador não consegue fazer distinção entre idiomas ocasionando a recuperação de padrões que, nesse caso, foram descartados devido o foco do trabalho ser a língua portuguesa. 5. Conclusões Apesar de incipientes, os resultados foram satisfatórios pois, de um modo geral, permitiram recuperar respostas pontuais para questionamentos realizados juntos ao motor de busca; o que pode indicar potencialidades na abordagem sugerida nesta investigação. Entretanto, ajustes com relação a alguns padrões devem ser feitos já que nem todos permitem recuperar uma resposta de modo tão preciso. Fatores como a própria complexidade da língua portuguesa dificultam essa tarefa. A grafia das palavras é um caso típico (por exemplo, pantógrafo e pantografo ) dessa situação. Na investigação aqui relatada foram necessários que scripts adicionais fossem desenvolvidos para padronizar as palavras ou remover palavras extras. A partir disso, deve se levar em consideração que a web é muito extensa e há, assim, uma

9 pluralidade muito grande nas formas de escrever as palavras, embora, algumas vezes, a ortografia das palavras esteja incorreta, além de páginas que ainda fazem uso de ortografias antigas ou de Português de Portugal. A questão da variação de ortografia foi ignorada nesta investigação. A hipótese adotada é de que as respostas mais confiáveis serão encontradas nas páginas ou nos trechos de texto que utilizam a grafia correta. Textos que usam a grafia errada têm maiores chances de terem a resposta errada ou de terem outros erros de português, inclusive erros gramaticais, que dificultarão a obtenção de um padrão de resposta. Por outro lado, esse aspecto poderá ser explorado em trabalhos futuros para mostrar se está correto ou não essa percepção, sendo realizada a análise da qualidade das respostas com a grafia correta e com a incorreta. Assim, apesar das limitações do método proposto, o foco particular do trabalho é o processamento da língua portuguesa, pois há poucos recursos para esta língua, uma vez que a maior parte das pesquisas envolve o idioma inglês. Devido à diversidade de padrões encontrada, o foco dos futuros trabalhos será em cima do domínio DESCOBRIMENTO, pois este obteve uma precisão maior se forem analisadas as complexas formações de frases possíveis em todas as respostas encontradas. Referências Robbins, A. (2009), Effective awk Programming, 3 nd edition. Ravichandran, D. and Hovy, E. (2002) Learning Surface Text Patterns for a Question Answering System, Proceedings 40th Annual Meeting of the Association for Computational Linguistics (ACL). Shengtao, S., Dingsheng, L and Guoqing, L. (202) The Application of a Hierarchical Tree Method to Ontology Knowledge, International Journal of Software Engineering, Vol. 22, No. 4. Dora M., Irene R., and Vitor N. (202) Um sistema de pergunta resposta para ontologias owl. In INForum 202 Simpósio de Informática. Faculdade de Ciências e Tecnologia, Universidade Nova de Lisboa, Lisboa. Lewandowski, D. (205) Evaluating the retrieval effectiveness of Web search engines using a representative query sample, Journal of the American Society for Information Science and Technology, vol. 66, Issue 9, p Prestes, K. (20) Avaliação de métodos de Seleção da Resposta em um sistema de Perguntas e Respostas. Projeto de Diplomação. Universidade Federal Do Rio Grande Do Sul, Porto Alegre, 20, 98 p.

TÍTULO: DESENVOLVIMENTO DE UM SISTEMA DE PERGUNTA E RESPOSTA BASEADO EM CORPUS

TÍTULO: DESENVOLVIMENTO DE UM SISTEMA DE PERGUNTA E RESPOSTA BASEADO EM CORPUS TÍTULO: DESENVOLVIMENTO DE UM SISTEMA DE PERGUNTA E RESPOSTA BASEADO EM CORPUS CATEGORIA: CONCLUÍDO ÁREA: CIÊNCIAS EXATAS E DA TERRA SUBÁREA: COMPUTAÇÃO E INFORMÁTICA INSTITUIÇÃO: UNIVERSIDADE DO SAGRADO

Leia mais

Desenvolvimento de um sistema de pergunta e resposta baseado em corpus

Desenvolvimento de um sistema de pergunta e resposta baseado em corpus Desenvolvimento de um sistema de pergunta e resposta baseado em corpus Adriano Jorge Soares Arrigo e-mail: arrigo.adriano@gmail.com Elvio Gilberto Silva e-mail: elvio.silva@usc.br Henrique Pachioni Martins

Leia mais

Mineração de Textos na Web

Mineração de Textos na Web Mineração de Textos na Web Luciano Antonio Digiampietri Escola de Artes Ciências e Humanidades da Universidade de São Paulo digiampietri@usp.br Resumo: Com o crescimento das informações disponíveis na

Leia mais

TÍTULO: DESENVOLVIMENTO DE UM SOFTWARE PARA DETECÇÃO AUTOMÁTICA DE TÓPICOS EM DOCUMENTOS TEXTUAIS BASEADA EM ONTOLOGIA

TÍTULO: DESENVOLVIMENTO DE UM SOFTWARE PARA DETECÇÃO AUTOMÁTICA DE TÓPICOS EM DOCUMENTOS TEXTUAIS BASEADA EM ONTOLOGIA Anais do Conic-Semesp. Volume 1, 2013 - Faculdade Anhanguera de Campinas - Unidade 3. ISSN 2357-8904 TÍTULO: DESENVOLVIMENTO DE UM SOFTWARE PARA DETECÇÃO AUTOMÁTICA DE TÓPICOS EM DOCUMENTOS TEXTUAIS BASEADA

Leia mais

Descoberta de conhecimento em textos - Análise semântica. Diogo Cardoso Eduardo Camilo Inácio Eduardo Monteiro Dellandréa Guilherme Gomes

Descoberta de conhecimento em textos - Análise semântica. Diogo Cardoso Eduardo Camilo Inácio Eduardo Monteiro Dellandréa Guilherme Gomes Descoberta de conhecimento em textos - Análise semântica Diogo Cardoso Eduardo Camilo Inácio Eduardo Monteiro Dellandréa Guilherme Gomes Introdução Diversidade de textos não padronizados; Emails, artigos,

Leia mais

Identificação em Documentos

Identificação em Documentos Identificação de Contexto Geográfico em Documentos Marcos Henrique Fonseca Ribeiro Bancos de Dados Geográficos Marcos Henrique Fonseca Ribeiro Slide 1 Roteiro Motivação e contexto Cenários a serem explorados

Leia mais

Índice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed

Índice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed Classificação de textos para o ensino de português como segunda língua Pedro Santos Curto Conclusões, Contribuições e Trabalho futuro 1 2 Motivação Aplicações e escala da classificação de textos Motivação

Leia mais

RECONHECIMENTO DE CARACTERES MANUSCRITOS JAPONESES

RECONHECIMENTO DE CARACTERES MANUSCRITOS JAPONESES UNIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA Holanda RECONHECIMENTO DE CARACTERES MANUSCRITOS JAPONESES PROPOSTA DE TRABALHO DE GRADUAÇÃO Aluno: Marconi Emanuel

Leia mais

6 Atributos. A dívida da empresa subiu.

6 Atributos. A dívida da empresa subiu. 6 Atributos Para buscar o sentimento de um texto automaticamente precisamos encontrar boas pistas ao longo do discurso. Uma grande variedade de palavras e expressões possui conotação positiva ou negativa,

Leia mais

2. Criação de Algoritmos

2. Criação de Algoritmos 2. Criação de Algoritmos Neste capítulo, será visto o desenvolvimento de um algoritmo, regras, etapas e simbologias. 2.1 O que é Pseudocódigo? Fig.1: Ilustração de algoritmo Fonte: Internet Os algoritmos

Leia mais

Tratamento dos Erros de Sintaxe. Adriano Maranhão

Tratamento dos Erros de Sintaxe. Adriano Maranhão Tratamento dos Erros de Sintaxe Adriano Maranhão Introdução Se um compilador tivesse que processar somente programas corretos, seu projeto e sua implementação seriam grandemente simplificados. Mas os programadores

Leia mais

Revisão/Mapeamento Sistemático

Revisão/Mapeamento Sistemático Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação SSC0572 - Computadores, Sociedade e Ética Profissional Revisão/Mapeamento Sistemático Prof. Dr. José Carlos Maldonado PAE: Pedro

Leia mais

Sistemas de Recomendação Uma abordagem geral

Sistemas de Recomendação Uma abordagem geral Sistemas de Recomendação Uma abordagem geral Universidade Estadual de Maringá Departamento de Informática Programa de Pós-Graduação Mestrado em Ciência da Computação Disciplina: Seminários II Aluna: Késsia

Leia mais

Verificação automática de substantivos compostos através de reconhecimento de padrões sintáticos

Verificação automática de substantivos compostos através de reconhecimento de padrões sintáticos Universidade Federal do Rio Grande do Sul Grupo de Processamento de Linguagens Naturais Projeto Expressões Multipalavras Verificação automática de substantivos compostos através de reconhecimento de padrões

Leia mais

Recuperação de Informação

Recuperação de Informação Recuperação de Informação Avaliação de Desempenho de Sistemas de Recuperação de Informação Renato Fernandes Corrêa 1 Para que avaliar? Existem muitos modelos de RI, mas qual é o melhor? Qual a melhor escolha

Leia mais

Problemas de Escrita. Graça Nunes Thiago Pardo

Problemas de Escrita. Graça Nunes Thiago Pardo Problemas de Escrita Graça Nunes Thiago Pardo Qual é o problema? A transformada de Hough é um algoritmo muito conhecido em visão computacional, mas a sua aplicação em alguns sistemas de tempo real é proibitiva,

Leia mais

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Pré-processamento de documentos Organização e Recuperação de Informação(GSI521) Introdução O pré-processamento de

Leia mais

UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO

UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO Sistema de Sumarização Automática de Textos Baseado em Classes de Documentos PROPOSTA DE TRABALHO DE GRADUAÇÃO

Leia mais

Tutorial sobre o MineraFórum I. Introdução

Tutorial sobre o MineraFórum I. Introdução Tutorial sobre o MineraFórum I. Introdução O MineraFórum é um minerador de textos para fóruns de discussão. A ferramenta realiza um mapeamento dos principais conceitos relacionados ao tema em debate, calculando

Leia mais

1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a

1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a 1 Introdução 1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a partir de dados. Existem diversas aplicações

Leia mais

Classificação Automática de Gêneros Musicais

Classificação Automática de Gêneros Musicais Introdução Método Experimentos Conclusões Utilizando Métodos de Bagging e Boosting Carlos N. Silla Jr. Celso Kaestner Alessandro Koerich Pontifícia Universidade Católica do Paraná Programa de Pós-Graduação

Leia mais

Ontologias Linguísticas e Processamento de Linguagem Natural. Ygor Sousa CIn/UFPE

Ontologias Linguísticas e Processamento de Linguagem Natural. Ygor Sousa CIn/UFPE Ontologias Linguísticas e Processamento de Linguagem Natural Ygor Sousa CIn/UFPE ycns@cin.ufpe.br 2015 Roteiro Processamento de Linguagem Natural Ontologias Linguísticas WordNet FrameNet Desambiguação

Leia mais

Organização e Recuperação da Informação

Organização e Recuperação da Informação Organização e Recuperação da Informação Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Adaptado do Material da Prof Vanessa Braganholo - IC/UFF Recuperação

Leia mais

Introdução a Teste de Software

Introdução a Teste de Software Universidade Católica de Pelotas Tecnólogo em Análise e Desenvolvimento de Sistemas Disciplina de Qualidade de Software Introdução a Teste de Software Prof. Luthiano Venecian 1 Conceitos Teste de software

Leia mais

MODELO DE CLASSIFICAÇÃO AUTOMÁTICA DE QUESTÕES NA LÍNGUA PORTUGUESA Henrique Maia Braum 1, Sandro José Rigo 1, Jorge L. V.

MODELO DE CLASSIFICAÇÃO AUTOMÁTICA DE QUESTÕES NA LÍNGUA PORTUGUESA Henrique Maia Braum 1, Sandro José Rigo 1, Jorge L. V. CINTED- Novas Tecnologias na Educação 1 MODELO DE CLASSIFICAÇÃO AUTOMÁTICA DE QUESTÕES NA LÍNGUA PORTUGUESA Henrique Maia Braum 1, Sandro José Rigo 1, Jorge L. V. Barbosa 1 1 UNISINOS Universidade do Vale

Leia mais

Biblioteca Escolar. Como pesquisar na internet

Biblioteca Escolar. Como pesquisar na internet Biblioteca Escolar Como pesquisar na internet Antes de haver Internet, as grandes concentrações de informação encontravam-se quase em exclusivo nos livros, revistas e publicações em geral, que, por razões

Leia mais

Identificação e Tratamento de Expressões Multipalavras aplicado à Recuperação de Informação

Identificação e Tratamento de Expressões Multipalavras aplicado à Recuperação de Informação Universidade Federal do Rio Grande do Sul Instituto de Informática Programa de Pós-Graduação em Computação Identificação e Tratamento de Expressões Multipalavras aplicado à Recuperação de Informação Otávio

Leia mais

DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias

DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING Aluno José Lino Uber Orientador Paulo Roberto Dias Dezembro/2004 Roteiro Introdução Objetivo Conceitos Motivação / Tipos

Leia mais

A/ART casa/n caiu/v./. Figura 3.1: Frase com anotação morfossintática.

A/ART casa/n caiu/v./. Figura 3.1: Frase com anotação morfossintática. 3 Tarefa Esse capítulo começa dissertando sobre as vantagens de se agrupar as palavras em classes, como elas são agrupadas em part-of-speechs e suas aplicações. Em seguida é apresentado o Anotador Morfossintático

Leia mais

Sumário. Trabalho que foi desenvolvido. Introdução

Sumário. Trabalho que foi desenvolvido. Introdução Proposta de um sistema de Classificação de Notícias utilizando técnicas de Aprendizagem de Máquina integrado com o ClippingBr Bruno Campagnolo de Paula PROJETO FINAL DA DISCIPLINA DE MACHINE LEARNING Mestrado

Leia mais

Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes

Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes Luciana Kayo e Paulo Mei Prof. Dr. Marco Dimas Gubitoso Introdução Inspiração na competição When Bag of Words

Leia mais

AMBIENTE DIDÁTICO GRÁFICO PARA A COMPREENSÃO DE LÓGICA DE PROGRAMAÇÃO. Rodrigo Ferreira da Silva

AMBIENTE DIDÁTICO GRÁFICO PARA A COMPREENSÃO DE LÓGICA DE PROGRAMAÇÃO. Rodrigo Ferreira da Silva AMBIENTE DIDÁTICO GRÁFICO PARA A COMPREENSÃO DE LÓGICA DE PROGRAMAÇÃO Rodrigo Ferreira da Silva rodrigoferreira2002@hotmail.com Klaus Schlünzen Junior klaus@prudente.unesp.br Universidade Estadual Paulista

Leia mais

Aplicação de uma Técnica Tradicional de Expansão de Consulta ao Modelo TR+

Aplicação de uma Técnica Tradicional de Expansão de Consulta ao Modelo TR+ Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Informática Programa de Pós-Graduação em Ciência da Computação Aplicação de uma Técnica Tradicional de Expansão de Consulta ao Modelo

Leia mais

PROTÓTIPO PARA SUMARIZAÇÃO AUTOMÁTICA DE TEXTOS ESCRITOS EM LÍNGUA PORTUGUESA ALEXANDRE BUSARELLO JOYCE MARTINS

PROTÓTIPO PARA SUMARIZAÇÃO AUTOMÁTICA DE TEXTOS ESCRITOS EM LÍNGUA PORTUGUESA ALEXANDRE BUSARELLO JOYCE MARTINS PROTÓTIPO PARA SUMARIZAÇÃO AUTOMÁTICA DE TEXTOS ESCRITOS EM LÍNGUA PORTUGUESA ALEXANDRE BUSARELLO JOYCE MARTINS Roteiro Introdução Objetivos Fundamentação Teórica Especificação Implementação Operacionalidade

Leia mais

Comparação dos algoritmos sequencial e paralelo para contagem de palavras e contexto

Comparação dos algoritmos sequencial e paralelo para contagem de palavras e contexto Comparação dos algoritmos sequencial e paralelo para contagem de palavras e contexto Eduardo Delazeri Ferreira, Francieli Zanon Boito, Aline Villavicencio 1. Introdução 1 Instituto de Informática - Universidade

Leia mais

Um Sistema de Informação Criativo baseado na técnica de criatividade whiteboard

Um Sistema de Informação Criativo baseado na técnica de criatividade whiteboard Um Sistema de Informação Criativo baseado na técnica de criatividade whiteboard Vitor Santos Microsoft, Lisboa, Portugal vitors@microsoftcom Henrique S Mamede Universidade Aberta, Lisboa, Portugal hsmamede@univ-abpt

Leia mais

Introdução à Programação

Introdução à Programação Introdução à Programação Aula 02 Algoritmos e Ciclo de Desenvolvimento Edirlei Soares de Lima Modelo de um Computador Linguagem de Máquina Um processador executa instruções de máquina.

Leia mais

Ferramenta de auxílio acadêmico utilizando chatterbot. Aluna: Camila Viviani Martins Orientadora: Joyce Martins

Ferramenta de auxílio acadêmico utilizando chatterbot. Aluna: Camila Viviani Martins Orientadora: Joyce Martins Ferramenta de auxílio acadêmico utilizando chatterbot Aluna: Camila Viviani Martins Orientadora: Joyce Martins Roteiro Introdução Objetivos Fundamentação teórica Trabalhos correlatos Requisitos funcionais

Leia mais

Aula 2: Planejamento da RS

Aula 2: Planejamento da RS Universidade de São Paulo Instituto de Ciências Matemática e de Computação SSC 5905 - Revisão Sistemática Aula 2: da RS Profa. Dra. Elisa Yumi Nakagawa 1. Semestre de 2013 Processo de Revisão Sistemática

Leia mais

Proposição de um conjunto de relações espaciais representativo dos vocábulos usados na tarefa de descrição espacial C U R I T I B A J U N H O

Proposição de um conjunto de relações espaciais representativo dos vocábulos usados na tarefa de descrição espacial C U R I T I B A J U N H O Proposição de um conjunto de relações espaciais representativo dos vocábulos usados na tarefa de descrição espacial MARIA ENGRACINDA DOS SANTOS FERREIRA LUCIENE STAMATO DELAZARI C U R I T I B A J U N H

Leia mais

MANUAL DE PESQUISA E RESERVA NO SISTEMA PERGAMUM CATÁLOGO DAS BIBLIOTECAS DO SISTEMA DE BIBLIOTECAS DA UFS - SIBIUFS

MANUAL DE PESQUISA E RESERVA NO SISTEMA PERGAMUM CATÁLOGO DAS BIBLIOTECAS DO SISTEMA DE BIBLIOTECAS DA UFS - SIBIUFS MANUAL DE PESQUISA E RESERVA NO SISTEMA PERGAMUM CATÁLOGO DAS BIBLIOTECAS DO SISTEMA DE BIBLIOTECAS DA UFS - SIBIUFS PESQUISA GERAL Módulo de pesquisa simplificado que permite a busca direta por palavra(s)

Leia mais

Pré-processamento textual para a extração de informação em bases de patentes

Pré-processamento textual para a extração de informação em bases de patentes Pré-processamento textual para a extração de informação em bases de patentes Bruno Silva Sette, Claudia Aparecida Martins Instituto de Computação Universidade Federal de Mato Grosso (UFMT) Av. Fernando

Leia mais

Tutorial sobre o MineraFórum

Tutorial sobre o MineraFórum Tutorial sobre o MineraFórum I Conceito O MineraFórum é um minerador de textos para fóruns de discussão. A ferramenta extrai os principais conceitos abordados no debate e oferece a opção de calcular a

Leia mais

Marketing de. Conteúdo. Plano de Estudo

Marketing de. Conteúdo. Plano de Estudo Marketing de Conteúdo Plano de Estudo Descrição do programa O programa está construído tecnicamente, desde uma perspectiva educativa e com os mais recentes desenvolvimentos e padrões do mercado digital.

Leia mais

Este capítulo aborda os fundamentos principais aplicados neste trabalho.

Este capítulo aborda os fundamentos principais aplicados neste trabalho. 2 Fundamentos Este capítulo aborda os fundamentos principais aplicados neste trabalho. 2.1 Linked Data Linked Data é um padrão de práticas a serem seguidas para a publicação e interligação de dados estruturados

Leia mais

Gazetteers - Aplicação em RI Geográfica. Ivre Marjorie R. Machado

Gazetteers - Aplicação em RI Geográfica. Ivre Marjorie R. Machado Gazetteers - Aplicação em RI Geográfica Ivre Marjorie R. Machado Julho de 2009 Sumário Introdução Gazetteer Exemplos Locus Limitações Conclusão Referências 2 Introdução Quem nunca usou uma máquina de busca

Leia mais

Hashing: conceitos. Hashing

Hashing: conceitos. Hashing Hashing: conceitos hashing é uma técnica conhecida como espalhamento, mapeamento ou randomização que tenta distribuir dados em posições aleatórias de uma tabela (array) associa cada objeto (de um determinado

Leia mais

Medidas de Avaliação

Medidas de Avaliação Medidas de Avaliação Medidas de Avaliação Para a maioria dos sistemas computacionais é necessário criar medidas para aferir sua eficácia e eficiência; A medida mais comum é o tempo e o espaço. Quanto menor

Leia mais

1 Introdução Motivação

1 Introdução Motivação 1 Introdução 1.1. Motivação Informações podem ser armazenadas das mais variadas maneiras. O modo mais clássico de armazenamento de informação é através da palavra escrita, impressa. O acesso à informação

Leia mais

Comparação de softwares científicos utilizando perfis de desempenho: automatização dos cálculos pela planilha perfis.xls

Comparação de softwares científicos utilizando perfis de desempenho: automatização dos cálculos pela planilha perfis.xls Comparação de softwares científicos utilizando perfis de desempenho: automatização dos cálculos pela planilha perfis.xls Pedro Augusto Munari Jr Instituto de Ciências Matemáticas e de Computação Universidade

Leia mais

Computação e Programação

Computação e Programação Computação e Programação MEMec, LEAN - 1º Semestre 2015-2016 Aula Teórica 10 Exemplo de desenvolvimento de Programa Modular: Máquina de venda de bilhetes D.E.M. Área Científica de Controlo Automação e

Leia mais

Semântica no Reconhecedor Gramatical Linguístico

Semântica no Reconhecedor Gramatical Linguístico Workshop de Tecnologias Adaptativas WTA 2015 Semântica no Reconhecedor Gramatical Linguístico Ana Contier, Djalma Padovani, João José Neto Linguagem Natural - Desafios Crescente quantidade de documentos

Leia mais

Ontology-Based Data Access. Diogo Espinhara Oliveira Banco de Dados

Ontology-Based Data Access. Diogo Espinhara Oliveira Banco de Dados Ontology-Based Data Access Diogo Espinhara Oliveira Banco de Dados - 2017.1 Sumário 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. Motivação e Objetivo Ontology Based Data Access (OBDA) Ontologia e Lógica de Descrição

Leia mais

Revisão Sistemática de Validação de Ontologias

Revisão Sistemática de Validação de Ontologias Revisão Sistemática de Validação de Ontologias Alex Mateus Porn e Cristiane Huve Professor: Alexandre Ibrahim Direne Metodologia Científica 2015 Sumário 1. Introdução; 2. Revisão Sistemática; 3. Resultados;

Leia mais

Descoberta de conhecimento em redes sociais e bases de dados públicas

Descoberta de conhecimento em redes sociais e bases de dados públicas Descoberta de conhecimento em redes sociais e bases de dados públicas Trabalho de Formatura Supervisionado Bacharelado em Ciência da Computação - IME USP Aluna: Fernanda de Camargo Magano Orientadora:

Leia mais

Linguagens Documentárias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília

Linguagens Documentárias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília Linguagens Documentárias Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília Contexto Organização da Informação...... procura criar métodos e instrumentos para elaborar

Leia mais

Universidade Federal do Rio de Janeiro. Flávio Henrique Schuindt da Silva. Estimativa de Fluxo Ótico com o método de Lukas-Kanade

Universidade Federal do Rio de Janeiro. Flávio Henrique Schuindt da Silva. Estimativa de Fluxo Ótico com o método de Lukas-Kanade Universidade Federal do Rio de Janeiro Programa de Engenharia de Sistemas e Computação Introdução ao Processamento de Imagens Flávio Henrique Schuindt da Silva Estimativa de Fluxo Ótico com o método de

Leia mais

8 Conclusão 8.1 Contribuição

8 Conclusão 8.1 Contribuição 8 Conclusão 8.1 Contribuição O crescente volume e a distribuição de dados e processos em Bioinformática torna cada vez mais fácil as descobertas de novas informações biológicas. Entretanto, como são inúmeras

Leia mais

Um Método para Melhoria de Dados Estruturados de Imóveis

Um Método para Melhoria de Dados Estruturados de Imóveis Universidade Federal de Pernambuco Centro de Informática Graduação em Ciência da Computação Um Método para Melhoria de Dados Estruturados de Imóveis Lucas Nunes de Souza Proposta de Trabalho de Graduação

Leia mais

Integração de Ontologia com Modelagem de Processo: Um Método para Facilitar a Elicitação de Requisitos

Integração de Ontologia com Modelagem de Processo: Um Método para Facilitar a Elicitação de Requisitos Ana Luiza Ávila Cerqueira Integração de Ontologia com Modelagem de Processo: Um Método para Facilitar a Elicitação de Requisitos Dissertação de Mestrado Dissertação apresentada como requisito parcial para

Leia mais

Raciocínio Baseado em Casos

Raciocínio Baseado em Casos Raciocínio Baseado em Casos Augusto Cesar Castoldi, Marcos de Oliveira dos Santos. Bacharéis em Ciências da Computação 2º Semestre, 2002. Departamento de Informática e Estatística (INE) Universidade Federal

Leia mais

Profª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni

Profª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni Profª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni Motivação e Objetivos Etapas do Desenvolvimento de um Sistema de Recuperação de Informações (SRI): Pré-processamento; Representação; Extração

Leia mais

3 Arquitetura do Sistema

3 Arquitetura do Sistema Arquitetura do Sistema 22 3 Arquitetura do Sistema 3.1. Visão geral O sistema desenvolvido permite a criação de aplicações que possibilitam efetuar consultas em um banco de dados relacional utilizando

Leia mais

Unidade 1 Introdução à Análise de Sistemas. Objectivos

Unidade 1 Introdução à Análise de Sistemas. Objectivos Unidade 1 Introdução à Análise de Sistemas Objectivos 1 2 Objectivos Definir a análise de sistemas Reconhecer as funções do analista de sistemas Definir conceitos de sistema Reconhecer a finalidade do

Leia mais

CONTEÚDOS. 1 O que é a Web of Science? 2 Registo 3 Pesquisa 4 Resultados de pesquisa 5 Personalizar

CONTEÚDOS. 1 O que é a Web of Science? 2 Registo 3 Pesquisa 4 Resultados de pesquisa 5 Personalizar FORMAÇÃO DE UTILIZADORES 2018 CONTEÚDOS 1 O que é a Web of Science? 2 Registo 3 Pesquisa 4 Resultados de pesquisa 5 Personalizar 1 O que é a Web of Science? > É uma plataforma de bases de dados de referência

Leia mais

Ferramenta de apoio a identificação de eventos utilizando Linguagem Natural. Aluno: Ricardo Tomelin Orientador: Everaldo Artur Grahl

Ferramenta de apoio a identificação de eventos utilizando Linguagem Natural. Aluno: Ricardo Tomelin Orientador: Everaldo Artur Grahl Ferramenta de apoio a identificação de eventos utilizando Linguagem Natural Aluno: Ricardo Tomelin Orientador: Everaldo Artur Grahl Roteiro 1. Introdução 2. Objetivos 3. Análise Essencial de Sistemas 4.

Leia mais

Figura 13: Etapas do método de pesquisa

Figura 13: Etapas do método de pesquisa 3 O Método O presente capítulo apresenta o método de pesquisa utilizado para criação de uma metodologia para elaboração de matrizes de portfólios, permitindo-se assim que os produtos e serviços comprados

Leia mais

Sistema de recomendação de segundo nível para suporte à produção de matérias jornalísticas

Sistema de recomendação de segundo nível para suporte à produção de matérias jornalísticas Demetrius Costa Rapello Sistema de recomendação de segundo nível para suporte à produção de matérias jornalísticas Dissertação de mestrado Dissertação apresentada como requisito parcial para a obtenção

Leia mais

ASSISTENTE DIGITAL PARA BUSCA INTELIGENTE DE INFORMAÇÕES

ASSISTENTE DIGITAL PARA BUSCA INTELIGENTE DE INFORMAÇÕES ASSISTENTE DIGITAL PARA BUSCA INTELIGENTE DE INFORMAÇÕES Inspiração inicial : Ter um dispositivo que pudéssemos perguntar : Quantos consumidores estão sem luz? Quais agências de atendimento estão sobrecarregadas?

Leia mais

4 Algoritmos de Aprendizado

4 Algoritmos de Aprendizado 4 Algoritmos de Aprendizado Este capítulo apresenta os algoritmos utilizados ao longo da dissertação e alguns utilizados como base por eles. Os algoritmos adotados são todos de aprendizado supervisionado.

Leia mais

A SEMÂNTICA DOS ADJETIVOS: COMO E POR QUE INCLUÍ-LA EM UMA ONTOLOGIA DE DOMÍNIO JURÍDICO

A SEMÂNTICA DOS ADJETIVOS: COMO E POR QUE INCLUÍ-LA EM UMA ONTOLOGIA DE DOMÍNIO JURÍDICO A SEMÂNTICA DOS ADJETIVOS: COMO E POR QUE INCLUÍ-LA EM UMA ONTOLOGIA DE DOMÍNIO JURÍDICO Anderson Bertoldi Rove Chishman UNISINOS 1 Recuperação de Informação Jurídica Área investigativa interdisciplinar:

Leia mais

Medidas de Avaliação. Após a execução de uma busca, pode-se dividir os documentos do corpus nos seguintes conjuntos: Recuperados não recuperados

Medidas de Avaliação. Após a execução de uma busca, pode-se dividir os documentos do corpus nos seguintes conjuntos: Recuperados não recuperados Medidas de Avaliação Após a execução de uma busca, pode-se dividir os documentos do corpus nos seguintes conjuntos: Relevantes não-relevantes Recuperados não recuperados 1 Documentos úteis para atender

Leia mais

ICET CURSO: Ciência da Computação e Sistemas de Informação (Engenharia de Software) Campus: Data: / / Nome:

ICET CURSO: Ciência da Computação e Sistemas de Informação (Engenharia de Software) Campus: Data: / / Nome: ICET CURSO: Ciência da Computação e Sistemas de Informação (Engenharia de Software) Estudos Disciplinares Campus: Data: / / Nome: RA: Turma: Questão 1: Assinale a função correta de engenharia de requisitos:

Leia mais

Realimentação de Relevância

Realimentação de Relevância Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Ciclo de realimentação onde uma consulta q recebida do usuário é transformada em uma consulta modificada

Leia mais

SBC - Sistemas Baseados em Conhecimento

SBC - Sistemas Baseados em Conhecimento Siglas, Símbolos, Abreviaturas DW - Data Warehouse KDD Knowledge Discovery in Database MD Mineração de Dados OLAP - On-line analytical processing SBC - Sistemas Baseados em Conhecimento 1. INTRODUÇÃO O

Leia mais

INTRODUÇÃO. Prof. Msc. Luis Filipe Alves Pereira 2015

INTRODUÇÃO. Prof. Msc. Luis Filipe Alves Pereira 2015 INTRODUÇÃO Prof. Msc. Luis Filipe Alves Pereira 2015 INTRODUÇÃO 02/21 QUAIS AS OPERAÇÕES BÁSICAS REALIZADAS EM UM COMPUTADOR DIGITAL? INTRODUÇÃO 03/21 QUAIS AS OPERAÇÕES BÁSICAS REALIZADAS EM UM COMPUTADOR

Leia mais

Castro (2008, p.7) define a palavra ontologia de forma mais simplificada:

Castro (2008, p.7) define a palavra ontologia de forma mais simplificada: Recuperação de Informação baseada em Castro (2008, p.7) define a palavra ontologia de forma mais simplificada: Ela é o resultado da junção de dois termos gregos onta (entes) e logos (teoria, discurso,

Leia mais

FATORES E MÉTRICAS DE QUALIDADE

FATORES E MÉTRICAS DE QUALIDADE FATORES E MÉTRICAS DE QUALIDADE 1 2 FATORES DE QUALIDADE OPERAÇÃO DO PRODUTO CORRETITUDE (FAZ O QUE EU QUERO?) CONFIABILIDADE (SE COMPORTA COM PRECISÃO?) EFICIÊNCIA (RODARÁ TÃO BEM QUANTO POSSÍVEL?) INTEGRIDADE

Leia mais

AS ETAPAS DA PESQUISA AS ETAPAS DA PESQUISA

AS ETAPAS DA PESQUISA AS ETAPAS DA PESQUISA AS ETAPAS DA PESQUISA Prof. MSc: Anael Krelling 1 O planejamento e a execução de uma pesquisa fazem parte de um processo sistematizado que compreende etapas que podem ser detalhadas da seguinte forma:

Leia mais

Introdução à Programação. João Manuel R. S. Tavares

Introdução à Programação. João Manuel R. S. Tavares Introdução à Programação João Manuel R. S. Tavares Sumário 1. Ciclo de desenvolvimento de um programa; 2. Descrição de algoritmos; 3. Desenvolvimento modular de programas; 4. Estruturas de controlo de

Leia mais

Realidade Aumentada aplicada ao ensino da simetria molecular

Realidade Aumentada aplicada ao ensino da simetria molecular Realidade Aumentada aplicada ao ensino da simetria molecular Matheus Gaspar Reis 1, Alan Salvany Felinto 1 1 Departamento de Computação Universidade Estadual de Londrina (UEL) Caixa Postal 10.011 86057-680

Leia mais

Introdução à Programação

Introdução à Programação Introdução à Program João Manuel R. S. Tavares Sumário 1. Ciclo de desenvolvimento de um programa; 2. Descrição de algoritmos; 3. Desenvolvimento modular de programas; 4. Estruturas de controlo de um programa.

Leia mais

TeO: UM CHATTERBOT PARA TELESSAÚDE

TeO: UM CHATTERBOT PARA TELESSAÚDE TeO: UM CHATTERBOT PARA TELESSAÚDE Helcio da Silva 1 ; Elvio Gilberto da Silva 1 ; Patrick Pedreira Silva 1 ; Lyana Carvalho e Souza 1 1 Universidade Sagrado Coração, Bauru/SP helciodasilva@gmail.com;

Leia mais

MODELO DE FORMATAÇÃO A SER UTILIZADO PELO IBEROAMERICAN JOURNAL OF INDUSTRIAL ENGINEERING

MODELO DE FORMATAÇÃO A SER UTILIZADO PELO IBEROAMERICAN JOURNAL OF INDUSTRIAL ENGINEERING MODELO DE FORMATAÇÃO A SER UTILIZADO PELO IBEROAMERICAN JOURNAL OF INDUSTRIAL ENGINEERING Nome completo do Autor 1 Nome completo do Autor 2 Nome completo do Autor 3 Nome completo do Autor 4 Nome completo

Leia mais

TÉCNICO EM MANUTENÇÃO E SUPORTE EM INFORMÁTICA FORMA SUBSEQUENTE. Professora: Isabela C. Damke

TÉCNICO EM MANUTENÇÃO E SUPORTE EM INFORMÁTICA FORMA SUBSEQUENTE. Professora: Isabela C. Damke TÉCNICO EM MANUTENÇÃO E SUPORTE EM INFORMÁTICA FORMA SUBSEQUENTE Professora: Isabela C. Damke isabeladamke@hotmail.com Linguagem de Programação Uma linguagem de programação é um conjunto de símbolos (

Leia mais

Uma ferramenta para Definição de Mapeamentos entre Vocabulários usados na publicação de Dados Linkados

Uma ferramenta para Definição de Mapeamentos entre Vocabulários usados na publicação de Dados Linkados U NIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 201 2. 1 Uma ferramenta para Definição de Mapeamentos entre Vocabulários usados na publicação de Dados Linkados

Leia mais

Inteligência Artificial. Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional

Inteligência Artificial. Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional Inteligência Artificial Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional OBJETIVOS : Introduzir o estudo Processamento de Linguagem Natural. Histórico O processamento de linguagem natural, nasceu

Leia mais

ORGANIZAÇÃO E APRESENTAÇÃO DE TRABALHOS ACADÊMICOS

ORGANIZAÇÃO E APRESENTAÇÃO DE TRABALHOS ACADÊMICOS Disciplina HSM 121- Informação Bibliográfica em Saúde Pública Angela Maria Belloni Cuenca abcuenca@usp.br ETAPAS DE PLANEJAMENTO Delimitação do tema Seleção das fontes de busca da informação Identificação

Leia mais

6.1. Teste Baseado em Gramática e Outras Abordagens de Teste

6.1. Teste Baseado em Gramática e Outras Abordagens de Teste 6 Discussão Além das técnicas de teste usando modelos gramaticais, existem outras abordagens de teste funcional de sistemas que estão sendo estudadas pela comunidade científica. Algumas delas se dedicam

Leia mais

Geração semi-automática de massas de testes funcionais a partir da composição de casos de uso e tabelas de decisão

Geração semi-automática de massas de testes funcionais a partir da composição de casos de uso e tabelas de decisão Luiz Rodolfo Neves Caldeira Geração semi-automática de massas de testes funcionais a partir da composição de casos de uso e tabelas de decisão Dissertação de Mestrado Dissertação apresentada como requisito

Leia mais

UNIVERSIDADE FEDERAL DA BAHIA

UNIVERSIDADE FEDERAL DA BAHIA UNIVERSIDADE FEDERAL DA BAHIA INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO RECUPERAÇÃO DE ARQUITETURA DE SOFTWARE UTILIZANDO ALGORITMOS DE AGRUPAMENTO ALUNO: DENNIS LESSA

Leia mais

Tabelas Dinâmicas Excel

Tabelas Dinâmicas Excel 1º Trim 2º Trim Jan Fev Mar Abr Mai Jun Marca A Família Marca B 1 Marca C Família Marca D 2 Marca E Viseu Aveiro Porto Centro-I Braga Norte-A Guimarães Excel 1 O que são? São tabelas interactivas que resumem

Leia mais

Informática. Mecanismos de Busca. Professor Márcio Hunecke.

Informática. Mecanismos de Busca. Professor Márcio Hunecke. Informática Mecanismos de Busca Professor Márcio Hunecke www.acasadoconcurseiro.com.br Informática MECANISMOS DE BUSCA Os principais sites utilizados como mecanismos de buscas atualmente são Google, Yahoo

Leia mais

1. Introdução O que é um relatório Organização de um relatório Identificação As 4 questões...

1. Introdução O que é um relatório Organização de um relatório Identificação As 4 questões... Cabeçalho da secção 1 Índice 1. Introdução...1 1.1. O que é um relatório...1 2. Organização de um relatório...2 2.1. Identificação...2 2.2. As 4 questões...2 2.3. Informação adicional...2 2.4. Estrutura...2

Leia mais

A Computação e as Classificações da Ciência

A Computação e as Classificações da Ciência A Computação e as Classificações da Ciência Ricardo de Almeida Falbo Metodologia de Pesquisa Departamento de Informática Universidade Federal do Espírito Santo Agenda Classificações da Ciência A Computação

Leia mais

Informática. Buscadores. Professor Sérgio Spolador.

Informática. Buscadores. Professor Sérgio Spolador. Informática Buscadores Professor Sérgio Spolador www.acasadoconcurseiro.com.br Informática Matéria Aula XX MECANISMOS DE BUSCA Esse material é uma coletânea de informações sobre os mecanismos de busca,

Leia mais

Classificação e Pesquisa. Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional

Classificação e Pesquisa. Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional Classificação e Pesquisa Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional Plano de Ensino e Aprendizagem ( PEA) Pesquisa ( ou Busca) de Dados A Pesquisa ( ou Busca ) de Dados é a parte da ciência

Leia mais

Informática I. Aula 7. Aula 7-17/09/2007 1

Informática I. Aula 7.   Aula 7-17/09/2007 1 Informática I Aula 7 http://www.ic.uff.br/~bianca/informatica1/ Aula 7-17/09/2007 1 Ementa Noções Básicas de Computação (Hardware, Software e Internet) HTML e Páginas Web Internet e a Web Javascript e

Leia mais