Gestão e Recuperação de Informação. Avaliação em Sistemas de Recuperação de Informação. José Borbinha DEI/IST

Tamanho: px
Começar a partir da página:

Download "Gestão e Recuperação de Informação. Avaliação em Sistemas de Recuperação de Informação. José Borbinha DEI/IST"

Transcrição

1 Gestão e Recuperação de Informação Avaliação em Sistemas de Recuperação de Informação José Borbinha DEI/IST

2 Problema: Como avaliar um sistema de RI? 2

3 Comecemos, analisando um exemplo... 3

4 Exemplo... 4

5 Exemplo... 5

6 Exemplo... Os 3 primeiros resultados são os mesmo nas duas pesquisas, mas o resultado que aparece agora na posição 4 aparecia só na posição 31 na pesquisa anterior...!!!... Pergunta: Isso será bom ou mau? 6

7 Voltando ao problema... 7

8 Voltando ao problema: Como avaliar um sistema/solução de RI? Como comparar duas soluções para um problema de RI? Será possível ter processos de avaliação genéricos para qualquer tipo de sistema e para qualquer tipo de problema? Como se decide quando é que cada técnica melhor (ou pior) responde a um problema específico? Term selection (stopword removal, stemming )? Ranking function (dot-product, cosine, )? Term weighting (TF, TF-IDF, )?...???? Interface 8

9 Information Retrieval Chapter 7: Evaluation 9

10 Conceito Fundamental: Relevância A eficácia de um sistema depende da RELEVÂNCIA dos documentos retornados! Não é fácil no entanto definir OBJECTIVAMENTE relevância... Pode não ser sempre um conceito binário (relevante / não relevante), mas algo que pode ser: Subjectivo (depende logo à partida de cada utilizador individualmente) Situacional (pode depender do momento em que o utilizador efectua a pesquisa) Cognitivo (depende claramente da percepção do problema e do comportamento de cada utilizador perante o sistema) Dinâmico (pode mudar ao longo do tempo...) 10

11 Medidas: Precision e Recall Precision: A capacidade do sistema em retornar ao utilizador os documentos mais relevantes Recall: A capacidade do sistema em encontrar na colecção os documentos mais relevantes Precision = Precisão?... Recall = Abrangência?... Cobertura?... 11

12 Conceitos: Precision e Recall Toda a Colecção Documentos Relevantes Documentos Recuperados relevant irrelevant Retrieved but irrelevant Retrieved and relevant Not retrieved, irrelevant Not retrieved but relevant retrieved not retrieved Recall = Number of relevant documents retrieved Total number of relevant documents Precision = Number of relevant documents retrieved Total number of documents retrieved 12

13 Medidas: Precision e Recall Colecção Total Documentos Relevantes Documentos Recuperados A relevant irrelevant A B A B A B A B retrieved B not retrieved Precision = A B B Recall = A B A 13

14 Gráfico Precision-Recall Experimentalmente calculam-se pares de valores (Precision, Recall) Um cenário ideal seria ter sempre Precision = Recall = 1 Infelizmente, num sistema real tentar melhorar uma das medidas implica normalmente deteriorar sempre a outra... (Porquê?) 14

15 Como avaliar os resultados de uma avaliação???... 15

16 Qual a melhor curva Precision-Recall? Qual a melhor curva?... Geralmente a decisão depende do negócio (objectivos concretos do sistema) 16

17 Voltando ao Exemplo... Relembrando, os 3 primeiros resultados são os mesmo nas duas pesquisas, mas o resultado que aparece agora na posição 4 aparecia só na posição 31 na pesquisa anterior...!!!... 17

18 Precision, Recall e Relevance Ranking As medidas de Precision e Recall são sempre tomadas relativamente a uma data lista de resultados. Teoricamente um sistema de RI pode retornar TODA uma colecção se o problema for definido como qual a prioridade com que a mesma deve ser ordenada relativamente a uma dada interrogação... Definir o tamanho da lista de resultados e a ordem (relevance ranking) dos mesmos é portanto importante! Por exemplo, se um sistema retornar 20 resultados em que apenas os 10 primeiros são relevantes, teremos Precision=0,5 se considerarmos toda a lista, mas já teremos Precision=1 se considerarmos apenas a primeira metade da mesma... 18

19 Revendo Precision: R-Precision n x x x x x doc # relevant Precision = 5/14 = 0.36 R = # documentos relevantes = 6 R-Precision = 4/6 = 0.67 Nota: R-Precision aparece na literatura por vezes também como N-Precision 19

20 Precision inicial e final Initial Precision: É o valor de Precision quando Recall=0. Permite dar uma indicação sobre o Relevance Ranking dos primeiros resultado. Final Precision: É o valor de Precision quando Recall=1. Indica a profundidade a que se tem de ir na lista de resultados para se poder recuperar todos os documentos relevantes. 20

21 Precision média Mesmo num cenário de R-Precision pode não ser fácil perceber a qualidade do sistema na rapidez com que retorna primeiro os documentos mais relevantes. Average Precision é uma medida que privilegia um bom Relevance Ranking, pois calcula uma Precision média de forma ponderada segundo a posição de cada caso relevante na lista de resultados: N = tamanho da lista de resultados r = posição na lista de resultados rel() = função binária da relevância para uma dada posição na lista de resultados P() = Precision para uma da lista de resultados (P(r) significa na prática truncar a lista de resultados para caso de documento relevante...) 21

22 Problemas com Precision e Recall: Número de documentos irrelevantes na colecção não é considerado! Como será o sistema afectado se adicionarmos ou removermos documentos irrelevantes? Recall é indefinido quando não há documentos relevantes na colecção. Precision é indefinido quando o número de documentos devolvido é nulo. Fallout mede a velocidade com que Precision cai quando Recall é aumentada: Fallout = total no.of no.of nonrelevant items retrieved nonrelevant items in the collection 22

23 Conceito: Fallout Colecção Total Documentos Recuperados A irrelevant A B A B Documentos Relevantes A relevant A B A B Precision = Recall = A B B A B A Fallout = retrieved B A B A not retrieved 23

24 Resumindo Recall = an estimate of the conditional probability that an item will be retrieved given that it is relevant [P(B/A)] Precision = an estimate of the conditional probability that an item will be relevant given that it is retrieved [P(A/B)] Fallout = an estimate of the conditional probability that an item will be retrieved given that it is non-relevant [P(B/`A]. 24

25 Outras medidas: F-Measure Média harmónica: Medida que considera ao mesmo tempo Recall e Precision = 2PR F 1 1 P + R + R P Em alternativa a uma média simples, neste caso ambos os valores necessitam ser altos para que o valor final seja alto... = 2 Cálculo de uma média harmónica em termos gerais: 25

26 E-Measure (parameterized F-Measure) Variante da F-Measure que permite ponderar a Precision em relação à Recall: E = 2 (1 + β ) PR β 2 P + R = (1 + 2 β R β 1 + P 2 ) O valor de β permite expressar preferências: β = 1: Peso igual a Precision e Recall (E=F). β > 1: Precision com maior peso β < 1: Recall com maior peso 26

27 Iniciativas de Avaliação... 27

28 Iniciativas de Avaliação Conjuntas Iniciativas que tentam comparar sistemas recorrendo a colecções e interrogações comuns: TREC Text Retrieval Conference INEX Initiative for the Evaluation ox XM Retrieval CLEF Cross Language Evaluation Forum NTCIR NII Test Collection for IR (Asia...) CWIRF Chinese Web Test Collection Linguateca Centro de Recursos para o Processamento Computacional da Língua Portuguesa 28

29 29

30 30

31 31

32 32

33 33

34 Colecções dos jornais Público e Folha de S. Paulo, etc. 34

35 Perguntas? 35

Recuperação de Informação

Recuperação de Informação Recuperação de Informação Avaliação de Desempenho de Sistemas de Recuperação de Informação Renato Fernandes Corrêa 1 Para que avaliar? Existem muitos modelos de RI, mas qual é o melhor? Qual a melhor escolha

Leia mais

Medidas de Avaliação. Após a execução de uma busca, pode-se dividir os documentos do corpus nos seguintes conjuntos: Recuperados não recuperados

Medidas de Avaliação. Após a execução de uma busca, pode-se dividir os documentos do corpus nos seguintes conjuntos: Recuperados não recuperados Medidas de Avaliação Após a execução de uma busca, pode-se dividir os documentos do corpus nos seguintes conjuntos: Relevantes não-relevantes Recuperados não recuperados 1 Documentos úteis para atender

Leia mais

Medidas de Avaliação

Medidas de Avaliação Medidas de Avaliação Medidas de Avaliação Para a maioria dos sistemas computacionais é necessário criar medidas para aferir sua eficácia e eficiência; A medida mais comum é o tempo e o espaço. Quanto menor

Leia mais

Avaliação de Desempenho de SRI

Avaliação de Desempenho de SRI Avaliação de Desempenho de SRI Desempenho espaço x tempo é usual em computação quão preciso é o conjunto resposta (ranking) é usual em SRI Avaliação baseada em coleção de referência = documentos + consultas

Leia mais

Profª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni

Profª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni Profª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni Motivação e Objetivos Etapas do Desenvolvimento de um Sistema de Recuperação de Informações (SRI): Pré-processamento; Representação; Extração

Leia mais

GSI024 - Organização e Recuperação da

GSI024 - Organização e Recuperação da GSI024 - Organização e Recuperação da Informação Ilmério Reis da Silva ilmerio@facom.ufu.br Arquivo 7 - Avaliação GSI024-ORI Pg:7. 1 Sumário de resultados Tornando os resultado úteis ao usuário Como avaliar

Leia mais

Avaliação da Recuperação

Avaliação da Recuperação Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Adaptado do Material da Profª Vanessa Braganholo - IC/UFF Avaliação de sistemas de busca Podemos avaliar

Leia mais

Um estudo sobre diferentes modelos de Recuperação de Informação em documentos semi-estruturados (XML) -

Um estudo sobre diferentes modelos de Recuperação de Informação em documentos semi-estruturados (XML) - Um estudo sobre diferentes modelos de Recuperação de Informação em documentos semi-estruturados (XML) - Implementação, Análise, Avaliação e Comparação Autor: Mirella Silva Junqueira 1, Orientador: Prof.

Leia mais

Avaliação Sistemas de Recuperação da Informação

Avaliação Sistemas de Recuperação da Informação Avaliação Sistemas de Recuperação da Informação Prof. Rodrigo Tripodi Calumby DEXA / UEFS rtcalumby@ecomp.uefs.br Por que? Ex.: Projeto de Aviões Teste em simuladores e experimentos Construção e teste

Leia mais

LÍNGUA NATURAL RECUPERAÇÃO DE INFORMAÇÃO (INFORMATION RETRIEVAL) Nuno Mamede N E C E S S I D A D E

LÍNGUA NATURAL RECUPERAÇÃO DE INFORMAÇÃO (INFORMATION RETRIEVAL) Nuno Mamede N E C E S S I D A D E LÍNGUA NATURAL N E C E S S I D A D E Internet mais de 3 biliões de documentos indexados pelo Google RECUPERAÇÃO DE INFORMAÇÃO (INFORMATION RETRIEVAL) Nuno Mamede Que quantidade de informação é gerada todos

Leia mais

Modelo Espaço Vetorial. Mariella Berger

Modelo Espaço Vetorial. Mariella Berger Modelo Espaço Vetorial Mariella Berger Agenda Introdução Atribuição de Pesos Frequência TF-IDF Similaridade Exemplo Vantagens e Desvantagens Modelo Espaço Vetorial Introdução Modelo Espaço Vetorial O modelo

Leia mais

Ponderação de termos

Ponderação de termos Ponderação de termos Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Adaptado do Material da Profª Vanessa Braganholo - IC/UFF Parte da ideia de que, dentro

Leia mais

Recuperação de Dado X Informação. Gerenciamento de Dados e Informação. Histórico. Recuperação de Informação. Histórico. Histórico

Recuperação de Dado X Informação. Gerenciamento de Dados e Informação. Histórico. Recuperação de Informação. Histórico. Histórico Recuperação de Dado X Informação Gerenciamento de Dados e Informação Recuperação de Informação Fernando Fonseca Ana Carolina Robson Fidalgo Comparação (matching) Recuperação de Dados Exata Recuperação

Leia mais

Recuperação de Informações

Recuperação de Informações Recuperação de Informações Ana Carolina Salgado & Fernando Fonseca Comparação (matching) Dados Inferência Modelo Ling Consulta Esp da Consulta Recuperação de Dado X Informação Recuperação de Recuperação

Leia mais

Avaliação de Descritores de Imagem

Avaliação de Descritores de Imagem Avaliação de Descritores de Imagem André Tavares da Silva andre.silva@udesc.br Descritor O par descritor de imagem e função de distância descreve como as imagens de uma coleção estão distribuídas no espaço

Leia mais

4 Recuperação de Informação

4 Recuperação de Informação 4 Recuperação de Informação No presente capítulo são apresentados os fundamentos da área de Recuperação de Informação utilizados em Mineração de Textos, como por exemplo, os modelos de representação de

Leia mais

Realimentação de Relevância

Realimentação de Relevância Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Ciclo de realimentação onde uma consulta q recebida do usuário é transformada em uma consulta modificada

Leia mais

Melhorando a Recuperação de Informação

Melhorando a Recuperação de Informação Recuperação de Informação e Web Mining 1 Melhorando a Recuperação de Informação O modelo de espaço vetorial Utiliza pesos para termos Permite o ranqueamento dos resultados Pode reduzir a dimensão do espaço

Leia mais

Recuperação de Informação em Bases de Texto

Recuperação de Informação em Bases de Texto Recuperação de Informação em Bases de Texto Mestrado em Engenharia Informática Universidade de Évora 2010/2011 Paulo Quaresma pq@di.uevora.pt http://www.moodle.uevora.pt 1 Objectivos Programa Avaliação

Leia mais

Modelo Probabilístico

Modelo Probabilístico Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Adaptado do Material da Profª Vanessa Braganholo - IC/UFF Proposto em 1976 por Roberstson e Sparck Jones;

Leia mais

Revisão. Meio ambiente da Recuperação de Informação. Linguagem Analógico x Digital

Revisão. Meio ambiente da Recuperação de Informação. Linguagem Analógico x Digital Revisão Meio ambiente da Recuperação de Informação Linguagem Analógico x Digital 1 Recuperação de Informação Recuperação de informação é o nome dado ao processo ou método pelo qual um potencial usuário

Leia mais

PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E PROCESSOS INDUSTRIAIS MESTRADO. Antonio Carlos Alves GIRS GENETIC INFORMATION RETRIEVAL SYSTEM

PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E PROCESSOS INDUSTRIAIS MESTRADO. Antonio Carlos Alves GIRS GENETIC INFORMATION RETRIEVAL SYSTEM 0 PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E PROCESSOS INDUSTRIAIS MESTRADO Antonio Carlos Alves GIRS GENETIC INFORMATION RETRIEVAL SYSTEM Santa Cruz do Sul, outubro de 2009. Livros Grátis http://www.livrosgratis.com.br

Leia mais

Mineração de Opinião Aplicada ao Cenário Político

Mineração de Opinião Aplicada ao Cenário Político Mineração de Opinião Aplicada ao Cenário Político Leandro Massetti Ribeiro Oliveira 1, Vandecia Rejane Monteiro Fernandes 1 1 Engenharia da Computação - Universidade Federal do Maranhão (UFMA) São Luis

Leia mais

Organização e Recuperação da Informação

Organização e Recuperação da Informação Organização e Recuperação da Informação Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Adaptado do Material da Prof Vanessa Braganholo - IC/UFF Recuperação

Leia mais

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Realimentaçãode relevânciae expansão de consultas Organização e Recuperação de Informação(GSI521) Realimentação de

Leia mais

SISTEMA BASEADO EM CONHECIMENTO PARA RECUPERAÇÃO DE INFORMAÇÃO EM REPOSITÓRIOS DE DOCUMENTOS DE PROJETOS DA INDÚSTRIA DA CONSTRUÇÃO CIVIL

SISTEMA BASEADO EM CONHECIMENTO PARA RECUPERAÇÃO DE INFORMAÇÃO EM REPOSITÓRIOS DE DOCUMENTOS DE PROJETOS DA INDÚSTRIA DA CONSTRUÇÃO CIVIL SISTEMA BASEADO EM CONHECIMENTO PARA RECUPERAÇÃO DE INFORMAÇÃO EM REPOSITÓRIOS DE DOCUMENTOS DE PROJETOS DA INDÚSTRIA DA CONSTRUÇÃO CIVIL Luiz Antonio do NASCIMENTO Mestrando pela Escola Politécnica da

Leia mais

Desenvolvimento de um Web Crawler para indexação de documentos científicos

Desenvolvimento de um Web Crawler para indexação de documentos científicos Desenvolvimento de um Web Crawler para indexação de documentos científicos Heitor de Sousa Miranda¹, Rafael Gonçalves Barreira², Edeilson Milhomem da Silva³ Curso de Sistemas de Informação - CEULP/ULBRA

Leia mais

Lista de exercícios 2 Recuperação de Informação Textual

Lista de exercícios 2 Recuperação de Informação Textual Lista de exercícios 2 Recuperação de Informação Textual 2 de dezembro de 2015 0.1 O que é o modelo bag-of-words? Porque ele é uma simplificação? Dê um exemplo em que ele estaria incorreto. 0.2 O que é

Leia mais

Outline. 2 Abordagem probabiĺıstica para ORI. 3 Teoria de probabilidades. 4 Princípio de ranking probabiĺıstico

Outline. 2 Abordagem probabiĺıstica para ORI. 3 Teoria de probabilidades. 4 Princípio de ranking probabiĺıstico Outline 1 Recapitulação 2 Abordagem probabiĺıstica para ORI 3 Teoria de probabilidades 4 Princípio de ranking probabiĺıstico 5 Apreciação&Extensões Modelo probabiĺıstico 1 / 47 Retorno de relevância: ideia

Leia mais

ABD Arquivos e Bibliotecas Digitais

ABD Arquivos e Bibliotecas Digitais ABD Arquivos e Bibliotecas Digitais FEUP, Março de 2010 Parte III A interface dos Arquivos e Bibliotecas Digitais Documentos em ĺınguas diversas Tipos de interrogação Redução de maiúsculas e radicalização

Leia mais

03/07/2017. Modelo de Recuperação de Informação

03/07/2017. Modelo de Recuperação de Informação Modelo de Recuperação de Informação Modelo de Recuperação de Informação Um modelo de recuperação de informação é a especificação formal de três elementos: a representação dos documentos; a representação

Leia mais

Pesquisa: operação elementar

Pesquisa: operação elementar Pesquisa: operação elementar uma das operações mais usadas em programação pesquisas em: vectores, matrizes, tabelas de registos, ficheiros, tipos de dados estruturados (hierarquicos),... necessidade de

Leia mais

Campus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini /

Campus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini   / Campus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini E-mail: prof.andre.luis.belini@gmail.com / andre.belini@ifsp.edu.br MATÉRIA: SIG Aula N : 08 Tema: Como melhorar a tomada

Leia mais

Universidade do Sul de Santa Catarina Ciência da Computação Aula 09 Introdução a Análise de Textos Prof. Max Pereira

Universidade do Sul de Santa Catarina Ciência da Computação Aula 09 Introdução a Análise de Textos Prof. Max Pereira Universidade do Sul de Santa Catarina Ciência da Computação Técnicasde InteligênciaArtificial Aula 09 Introdução a Análise de Textos Prof. Max Pereira Processamento de Linguagem Natural Conjunto de técnicas

Leia mais

Fabrício Jailson Barth. Recuperação de documentos e pessoas em ambientes empresariais através de árvores de decisão

Fabrício Jailson Barth. Recuperação de documentos e pessoas em ambientes empresariais através de árvores de decisão Fabrício Jailson Barth Recuperação de documentos e pessoas em ambientes empresariais através de árvores de decisão São Paulo 2009 Fabrício Jailson Barth Recuperação de documentos e pessoas em ambientes

Leia mais

Arquivos invertidos 39

Arquivos invertidos 39 Arquivos invertidos 39 Arquivos invertidos É um mecanismo que utiliza palavras para indexar uma coleção de documentos a fim de facilitar a busca e a recuperação Estruturas de um arquivo invertido Vocabulário

Leia mais

4. Algoritmos de Busca em Vetores

4. Algoritmos de Busca em Vetores Introdução à Computação II 5952011 4. Algoritmos de Busca em Vetores Prof. Renato Tinós Local: Depto. de Computação e Matemática (FFCLRP/USP) 1 Principais Tópicos 4.1. Introdução 4.2. Busca Linear 4.2.1.

Leia mais

Mineração de Textos. Mineração de Textos

Mineração de Textos. Mineração de Textos Mineração de Textos Os estudos em Aprendizado de Máquina normalmente trabalham com dados estruturados Entretanto, uma grande quantidade de informação é armazenada em textos, que são dados semi-estruturados

Leia mais

AVALIAÇÃO DA QUALIDADE DO USO DE WAVELETS PARA RECUPERAÇÃO, CLASSIFICAÇÃO E AGRUPAMENTO DA INFORMAÇÃO TEXTUAL. Fabrício Raphael Silva Ferreira

AVALIAÇÃO DA QUALIDADE DO USO DE WAVELETS PARA RECUPERAÇÃO, CLASSIFICAÇÃO E AGRUPAMENTO DA INFORMAÇÃO TEXTUAL. Fabrício Raphael Silva Ferreira AVALIAÇÃO DA QUALIDADE DO USO DE WAVELETS PARA RECUPERAÇÃO, CLASSIFICAÇÃO E AGRUPAMENTO DA INFORMAÇÃO TEXTUAL Fabrício Raphael Silva Ferreira Dissertação de Mestrado apresentada ao Programa de Pós-graduação

Leia mais

Experiências em Armazenamento e Recuperação de Informação

Experiências em Armazenamento e Recuperação de Informação Experiências em Armazenamento e Recuperação de Informação Ana Sofia Queimado ci05006 Filipa Ramalho ci05020 Jennifer Gonçalves ci05032 Faculdade de Engenharia da Universidade do Porto Licenciatura em Ciência

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular André C.. L. F. de Carvalho Monitor: Valéria Carvalho lanejamento e Análise de Experimentos rincipais tópicos Estimativa do erro artição dos dados Reamostragem

Leia mais

Luciana Farina Almansa

Luciana Farina Almansa Uma Arquitetura de Question-Answering Instanciada no Domínio de Doenças Crônicas Luciana Farina Almansa Dissertação apresentada ao Departamento de Computação e Matemática da Faculdade de Filosofia, Ciência

Leia mais

Recuperação de informação em documentos XML

Recuperação de informação em documentos XML Recuperação de informação em documentos XML Desde 2000, quando aconteceu o primeiro workshop sobre XML e Recuperação de Informação, este tema tem estado presente nas conferências ACM SIGIR, mostrando o

Leia mais

Técnicas de recuperação de informação: filtragem, agrupamento

Técnicas de recuperação de informação: filtragem, agrupamento Técnicas de recuperação de informação: filtragem, agrupamento 1 Nome usado para descrever uma variedade de processos envolvendo a entrega de informação para pessoas que precisam dela; Compreende um método

Leia mais

EASy EvaluationAutomatic GenerationSystem for Web based on Hyper-Automaton. Renata Zanella Graciela Lima Bruna Antunes Paulo Blauth Menezes

EASy EvaluationAutomatic GenerationSystem for Web based on Hyper-Automaton. Renata Zanella Graciela Lima Bruna Antunes Paulo Blauth Menezes EASy EvaluationAutomatic GenerationSystem for Web based on Hyper-Automaton Renata Zanella Graciela Lima Bruna Antunes Paulo Blauth Menezes 1 Roteiro Introdução Avaliação XHA EASy Conclusões Avaliação Experimental

Leia mais

Bases de Dados 2013/2014 Recuperação de Informação

Bases de Dados 2013/2014 Recuperação de Informação Bases de Dados 2013/2014 Recuperação de Informação Pável Calado (baseado nos slides de Mário Gaspar da Silva) DMIR group@inesc-id Mário Silva Helena Galhardas H. Sofia Pinto Pável Calado Paulo Carreira

Leia mais

BUSCA EM ARRAYS. Prof. André Backes. Ato de procurar por um elemento em um conjunto de dados

BUSCA EM ARRAYS. Prof. André Backes. Ato de procurar por um elemento em um conjunto de dados BUSCA EM ARRAYS Prof. André Backes Definição 2 Ato de procurar por um elemento em um conjunto de dados Recuperação de dados armazenados em um repositório ou base de dados A operação de busca visa responder

Leia mais

Universidade Federal do Espírito Santo

Universidade Federal do Espírito Santo Universidade Federal do Espírito Santo ELIEZER DE SOUZA DA SILVA Recuperação de conteúdo usando LSI e VSM SÃO MATEUS/ES 2010 Universidade Federal do Espírito Santo ELIEZER DE SOUZA DA SILVA Recuperação

Leia mais

Diego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo

Diego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo Estudo de comparação do descritor de imagens coloridas BIC empregando diferentes abordagens de classificação de detecção de bordas: Canny e Operador Laplaciano Diego Martin Mancini Orientador: Prof. Paulo

Leia mais

SISTEMA DE INDEXAÇÃO E RECUPERAÇÃO DE INFORMAÇÃO EM CONSTRUÇÃO BASEADO EM ONTOLOGIA

SISTEMA DE INDEXAÇÃO E RECUPERAÇÃO DE INFORMAÇÃO EM CONSTRUÇÃO BASEADO EM ONTOLOGIA SISTEMA DE INDEXAÇÃO E RECUPERAÇÃO DE INFORMAÇÃO EM CONSTRUÇÃO BASEADO EM ONTOLOGIA AMORIM, Sergio R. Leusin (1); CHERIAF, Malik (2) (1) UFF - Universidade Federal Fluminense, Rua Passo da Pátria, 156,

Leia mais

Boas Maneiras em Aprendizado de Máquinas

Boas Maneiras em Aprendizado de Máquinas Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Boas Maneiras em Aprendizado de Máquinas David Menotti www.inf.ufpr.br/menotti/ci171-182 Boas Maneiras Agenda Introdução Métricas

Leia mais

Estudo de percepção do uso de dispositivos móveis no Ensino Superior

Estudo de percepção do uso de dispositivos móveis no Ensino Superior Estudo de percepção do uso de dispositivos móveis no Ensino Superior Relatório interno 1/2009 CEREM UFP Steven Abrantes Instituto Politécnico de Viseu steven@di.estv.ipv.pt Luis Borges Gouveia Universidade

Leia mais

25/04/2017. Modelo de Recuperação de Informação

25/04/2017. Modelo de Recuperação de Informação Modelo de Recuperação de Informação Modelo de Recuperação de Informação Um modelo de recuperação de informação é a especificação formal de três elementos: a representação dos documentos; a representação

Leia mais

GIRS - GENETIC INFORMATION RETRIEVAL SYSTEM - UMA PROPOSTA EVOLUTIVA PARA SISTEMAS DE RECUPERAÇÃO DE INFORMAÇÕES

GIRS - GENETIC INFORMATION RETRIEVAL SYSTEM - UMA PROPOSTA EVOLUTIVA PARA SISTEMAS DE RECUPERAÇÃO DE INFORMAÇÕES GIRS - GENETIC INFORMATION RETRIEVAL SYSTEM - UMA PROPOSTA EVOLUTIVA PARA SISTEMAS DE RECUPERAÇÃO DE INFORMAÇÕES - (-) - A recuperação de informação é uma subárea da ciência da computação que estuda o

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia Roteiro PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br

Leia mais

Ferramentas para Recuperação e Mineração de Informações

Ferramentas para Recuperação e Mineração de Informações Ferramentas Java para Recuperação e Mineração de Informações Fabrício J. Barth 1,2 1 Fundação Atech Tecnologias Críticas (fbarth@atech.br) 2 Centro Universitário SENAC (fabricio.jbarth@sp.senac.br) 9 de

Leia mais

Indexação e Modelos Clássicos

Indexação e Modelos Clássicos Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Adaptado do Material da Profª Vanessa Braganholo - IC/UFF Construção de um Sistema de Busca 1ª Etapa: Definir

Leia mais

EVOLUÇÃO DO MECANISMO DE BUSCA DO AINFO-CONSULTA COM USO DE THESAURUS AGROPECUÁRIO

EVOLUÇÃO DO MECANISMO DE BUSCA DO AINFO-CONSULTA COM USO DE THESAURUS AGROPECUÁRIO 13 a 15 de agosto de Jaguariúna, SP EVOLUÇÃO DO MECANISMO DE BUSCA DO AINFO-CONSULTA COM USO DE THESAURUS AGROPECUÁRIO IGOR J. P. MARINHO 1 ; HENRIQUE T. M. CARDONE 2 ; GLAUBER J. VAZ 3 Nº 12610 RESUMO

Leia mais

Estudo da utilização de Ferramentas Colaborativas Computacionais pelos estudantes da Universidade do Porto

Estudo da utilização de Ferramentas Colaborativas Computacionais pelos estudantes da Universidade do Porto Estudo da utilização de Ferramentas Colaborativas Computacionais pelos estudantes da Universidade do Porto Projecto FEUP, 2010/2011 Faculdade de Engenharia da Universidade do Porto Grupo G_I418 André Barbosa

Leia mais

Diz que é uma espécie de survey sobre Query Expansion

Diz que é uma espécie de survey sobre Query Expansion Diz que é uma espécie de survey sobre Query Expansion Nuno Cardoso Orientadores: Diana Santos e Mário J. Silva Simpósio Doutoral da Linguateca 30 de Março de 2007 FCUL O que é Query Expansion (QE)? Adição

Leia mais

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) 2016/ PPGCA PPGCA/UTFPR -- CAIA003

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) 2016/ PPGCA PPGCA/UTFPR -- CAIA003 UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) Mineração de Dados 2016/3 Professores Celso e Heitor Jean Avila Rangel 1801317 - PPGCA PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados --

Leia mais

Extração de Informações na Web

Extração de Informações na Web Mário Henrique A. C. Adaniya 1, Mario Lemes Proença Jr 1 Resumo: É observado um crescimento exponencial nas informações contidas na Web, e com todo este crescimento, por muitas razões deixamos de agregar

Leia mais

OPIS: Um Método para Identificação e Busca de Páginas-Objeto

OPIS: Um Método para Identificação e Busca de Páginas-Objeto UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE INFORMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO MIRIAM PIZZATTO COLPO OPIS: Um Método para Identificação e Busca de Páginas-Objeto Dissertação

Leia mais

GistSumm GIST SUMMarizer: Extensões e Novas Funcionalidades

GistSumm GIST SUMMarizer: Extensões e Novas Funcionalidades Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP GistSumm GIST SUMMarizer: Extensões e Novas Funcionalidades Thiago Alexandre Salgueiro

Leia mais

1º Exame IPM 2013 / 2014

1º Exame IPM 2013 / 2014 1º Exame IPM 2013 / 2014 Proposta de Solução ATENÇÃO: As respostas não estão 100% completas (Não usar como ÚNICO elemento de estudo para os exames) Licenciatura em Engenharia Informática e de Computadores

Leia mais

Uma Abordagem ao PÁGICO baseada no Processamento e Análise de Sintagmas dos Tópicos

Uma Abordagem ao PÁGICO baseada no Processamento e Análise de Sintagmas dos Tópicos Uma Abordagem ao PÁGICO baseada no Processamento e Análise de Sintagmas dos Tópicos Ricardo Rodrigues Hugo Gonçalo Oliveira Paulo Gomes CISUC, Universidade de Coimbra CISUC, Universidade de Coimbra CISUC,

Leia mais

IMPLEMENTAÇÃO E ANÁLISE EXPERIMENTAL DE UMA MÁQUINA DE BUSCA A DOCUMENTOS PDF

IMPLEMENTAÇÃO E ANÁLISE EXPERIMENTAL DE UMA MÁQUINA DE BUSCA A DOCUMENTOS PDF MEC-SETEC INSTITUTO FEDERAL MINAS GERAIS - Câmpus Formiga Curso de Ciência da Computação IMPLEMENTAÇÃO E ANÁLISE EXPERIMENTAL DE UMA MÁQUINA DE BUSCA A DOCUMENTOS PDF Roger Santos Ferreira Orientador:

Leia mais

INQUÉRITO REALIZADO A DOCENTES E INVESTIGADORES LABORATÓRIO DE CÁLCULO. Trabalho realizado por Lucília Rodrigues Macedo

INQUÉRITO REALIZADO A DOCENTES E INVESTIGADORES LABORATÓRIO DE CÁLCULO. Trabalho realizado por Lucília Rodrigues Macedo INQUÉRITO REALIZADO A DOCENTES E INVESTIGADORES LABORATÓRIO DE CÁLCULO 2010 Trabalho realizado por Lucília Rodrigues Macedo ÍNDICE 1. INTRODUÇÃO... 3 2. METODOLOGIA... 3 3. APRESENTAÇÃO DOS RESULTADOS...

Leia mais

, (1) onde v é o módulo de v e b 1 e b 2 são constantes positivas.

, (1) onde v é o módulo de v e b 1 e b 2 são constantes positivas. Oscilações Amortecidas O modelo do sistema massa-mola visto nas aulas passadas, que resultou nas equações do MHS, é apenas uma idealização das situações mais realistas existentes na prática. Sempre que

Leia mais

Agrupamento Automático de Páginas Web utilizando Técnicas de Web Content Mining

Agrupamento Automático de Páginas Web utilizando Técnicas de Web Content Mining Universidade da Beira Interior Departamento de Informática Mestrado em Eng.ª Informática Agrupamento Automático de Páginas Web utilizando Técnicas de Web Content Mining Ricardo Campos Orientador: Professor

Leia mais

Auto-Fusão na Recuperação de Imagens Baseadas em Conteúdo.

Auto-Fusão na Recuperação de Imagens Baseadas em Conteúdo. Auto-Fusão na Recuperação de Imagens Baseadas em Conteúdo. Severino Jr, Osvaldo IMES - FAFICA osvaldo@fafica.br Gonzaga, Adilson Escola de Engenharia de São Carlos - USP adilson@sc.usp.br Resumo Neste

Leia mais

Classificadores de Texto Reduzido Basedados em SVM

Classificadores de Texto Reduzido Basedados em SVM Classificadores de Texto Reduzido Basedados em SVM Eduardo Akira Kinto Emílio Del Moral Hernandez eakinto@yahoo.com emilio_del_moral@ieee.org Laboratório de Sistemas Integrado Departmento de Engenharia

Leia mais

Avaliação Heurística, segundo Nielsen, Jakob e Molich, Rolf

Avaliação Heurística, segundo Nielsen, Jakob e Molich, Rolf Avaliação Heurística, segundo Nielsen, Jakob e Molich, Rolf É um método de avaliação de usabilidade onde um avaliador procura identificar problemas de usabilidade numa interface com o usuário, através

Leia mais

A Escolha Racional relações binárias número de relações binárias 2m.p domínio imagem

A Escolha Racional relações binárias número de relações binárias 2m.p domínio imagem A Escolha Racional A racionalidade na teoria dos jogos procura perceber como os jogadores (sejam eles indivíduos, empresas, organizações, países etc.) tomam suas decisões em situações de interação estratégica.

Leia mais

Visualização de Texto e Documento

Visualização de Texto e Documento Visualização de Texto e Documento SCC5836 Visualização Computacional Prof. Fernando V. Paulovich http://www.icmc.usp.br/~paulovic paulovic@icmc.usp.br Instituto de Ciências Matemáticas e de Computação

Leia mais

Dados Internacionais de Catalogação na Publicação (CIP)

Dados Internacionais de Catalogação na Publicação (CIP) Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Informática Programa de Pós-Graduação em Ciência da Computação Expansão de Consultas com Realimentação e Pseudo Realimentação de Relevantes

Leia mais

Seleção Não-Supervisionada de Métodos de Binarização para Documentos Históricos

Seleção Não-Supervisionada de Métodos de Binarização para Documentos Históricos Seleção Não-Supervisionada de Métodos de Binarização para Documentos Históricos MAC0499 Trabalho de Formatura Supervisionado Aluno: Denis T. Ikeda Orientador: Ronaldo Fumio Hashimoto O que é binarização?

Leia mais

A Interação Humano-Computador

A Interação Humano-Computador Interfaces de busca A Interação Humano-Computador Bem concebidos, os sistemas eficazes geram sentimentos positivos em seus usuários. Quando um sistema é bem projetado, a interface quase desaparece, permitindo

Leia mais

Identificação e Tratamento de Expressões Multipalavras aplicado à Recuperação de Informação

Identificação e Tratamento de Expressões Multipalavras aplicado à Recuperação de Informação Universidade Federal do Rio Grande do Sul Instituto de Informática Programa de Pós-Graduação em Computação Identificação e Tratamento de Expressões Multipalavras aplicado à Recuperação de Informação Otávio

Leia mais

Combinando Fatores de Ponderação para Melhorar a

Combinando Fatores de Ponderação para Melhorar a Computer on the Beach 2014 - Artigos Completos 32 Combinando Fatores de Ponderação para Melhorar a Classificação de Textos Frederico P. de Souza 1, Patrick M. Ciarelli 2, Elias de Oliveira 1 1 Departamento

Leia mais

Aplicação de uma Técnica Tradicional de Expansão de Consulta ao Modelo TR+

Aplicação de uma Técnica Tradicional de Expansão de Consulta ao Modelo TR+ Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Informática Programa de Pós-Graduação em Ciência da Computação Aplicação de uma Técnica Tradicional de Expansão de Consulta ao Modelo

Leia mais

3 Recuperação de Informações Textuais

3 Recuperação de Informações Textuais 3 Recuperação de Informações Textuais Tudo deveria se tornar o mais simples possível, mas não simplificado. Albert Einstein Sistemas tradicionais de indexação costumam utilizar-se de termos-índice, que

Leia mais

Assessing Relevance Using Automatically. Information Retrieval

Assessing Relevance Using Automatically. Information Retrieval Assessing Relevance Using Automatically Translated Documents for Cross-Language Information Retrieval A thesis submitted to Middlesex University in partial fulfilment of the requirements for the degree

Leia mais

Modelo Booleano Wendel Melo

Modelo Booleano Wendel Melo Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Adaptado do Material da Profª Vanessa Braganholo - IC/UFF Modelo simples; Baseado em teoria dos conjuntos

Leia mais

Mecânica 1.1 Tempo, posição e velocidade

Mecânica 1.1 Tempo, posição e velocidade Mecânica 1.1 Tempo, posição e velocidade REFERENCIAL E POSIÇÃO Estudar o movimento de um sistema mecânico pode ser muito complicado se implicar o estudo do movimento de todas as partículas que o constituem.

Leia mais

Uma Abordagem de Componentes Combinados. para a Geração de Funções de Ordenação. usando Programação Genética. Humberto Mossri de Almeida

Uma Abordagem de Componentes Combinados. para a Geração de Funções de Ordenação. usando Programação Genética. Humberto Mossri de Almeida Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Ciência da Computação Uma Abordagem de Componentes Combinados para a Geração de Funções de Ordenação usando Programação

Leia mais

Design de Multimédia e Interacção

Design de Multimédia e Interacção índice 1. Interacção 1.1 Definições 2.1 Definições 2.2 Definições - diagrama 1 2.3 Definições - sumário 2.4 Princípios - diagrama 2 2.5 So, What is Interaction Design? Bibliografia 1. Interacção 1.1 Definições

Leia mais

Projeto e Análise de Algoritmos

Projeto e Análise de Algoritmos Projeto e Análise de Algoritmos Apresentação da Disciplina Edirlei Soares de Lima Por que Estudar Algoritmos? Razões Práticas e Teóricas: Devemos conhecer um conjunto de algoritmos

Leia mais

Linguagens Documentárias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília

Linguagens Documentárias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília Linguagens Documentárias Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília Contexto Organização da Informação...... procura criar métodos e instrumentos para elaborar

Leia mais

Classificação Hierárquica de Documentos Textuais Digitais usando o Algoritmo knn

Classificação Hierárquica de Documentos Textuais Digitais usando o Algoritmo knn Classificação Hierárquica de Documentos Textuais Digitais usando o Algoritmo knn Leonardo Cavalheiro Langie, Vera Lúcia Strube de Lima Programa de Pós-Graduação em Ciência da Computação Faculdade de Informática

Leia mais

Automatização de um Método de Avaliação de Estruturas Retóricas

Automatização de um Método de Avaliação de Estruturas Retóricas Automatização de um Método de Avaliação de Estruturas Retóricas Erick Galani Maziero (erickgm@grad.icmc.usp.br) Thiago Alexandre Salgueiro Pardo (taspardo@icmc.usp.br) Núcleo Interinstitucional de Lingüística

Leia mais

Stemming para a língua portuguesa: estudo, análise e melhoria do algoritmo RSLP

Stemming para a língua portuguesa: estudo, análise e melhoria do algoritmo RSLP UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE INFORMÁTICA CURSO DE CIÊNCIA DA COMPUTAÇÃO ALEXANDRE RAMOS COELHO Stemming para a língua portuguesa: estudo, análise e melhoria do algoritmo RSLP

Leia mais

Recuperação de imagens por conteúdo utilizando Lógica Fuzzy - um estudo de caso sobre imagens faciais

Recuperação de imagens por conteúdo utilizando Lógica Fuzzy - um estudo de caso sobre imagens faciais Recuperação de imagens por conteúdo utilizando Lógica Fuzzy - um estudo de caso sobre imagens faciais Leila Cristina Carneiro Bergamasco; Fátima L.S. Nunes Universidade de São Paulo Escola de Artes, Ciências

Leia mais

Seleção e geração de características utilizando regras de associação para o problema de ordenação de resultados de máquinas de buscas

Seleção e geração de características utilizando regras de associação para o problema de ordenação de resultados de máquinas de buscas UNIVERSIDADE FEDERAL DE GOIÁS INSTITUTO DE INFORMÁTICA CARINA CALIXTO RIBEIRO DE ARAUJO Seleção e geração de características utilizando regras de associação para o problema de ordenação de resultados de

Leia mais

Matriz de Decisão ou Priorização. Matriz de Decisão - Etapas. Matriz de Decisão - Etapas. Utilizada quando:

Matriz de Decisão ou Priorização. Matriz de Decisão - Etapas. Matriz de Decisão - Etapas. Utilizada quando: Utilizada quando: Matriz de Decisão ou Priorização Uma alternativa dev e ser selecionada entre pequeno número de outras, um ótimo pr ocesso é o de ponderar diferentes critérios de avaliação. Formamos,

Leia mais

JORGE CASTELO EXERCÍCIOS PARA TREINAR A MANUTENÇÃO DA POSSE DA BOLA. Fórum dos Treinadores Portugueses de Futebol 2013

JORGE CASTELO EXERCÍCIOS PARA TREINAR A MANUTENÇÃO DA POSSE DA BOLA. Fórum dos Treinadores Portugueses de Futebol 2013 JORGE CASTELO! EXERCÍCIOS PARA TREINAR A MANUTENÇÃO DA POSSE DA BOLA Fórum dos Treinadores Portugueses de Futebol 2013 Jorge Castelo Data de Nascimento: 26-01-1957; Nacionalidade: Portuguesa; Profissões:

Leia mais

Vendors Enquiries for RFP 003/2015

Vendors Enquiries for RFP 003/2015 Date: 22/10/2015 Vendors Enquiries for RFP 003/2015 1) Question I am afraid the terms of the RFP cannot be complied by none of the companies we work with, the terms have limited the underwriters ability

Leia mais

A todas as pessoas anónimas que contribuem para melhorar o dia-a-dia da nossa sociedade

A todas as pessoas anónimas que contribuem para melhorar o dia-a-dia da nossa sociedade VIVER SEM DOR Dossier de Imprensa da Fundação Grünenthal A todas as pessoas anónimas que contribuem para melhorar o dia-a-dia da nossa sociedade OBRIGADO A Fundação Grünenthal dedica-se há mais de dez

Leia mais