05/05/2015. Recuperação de Informação



Documentos relacionados
04/04/2017. Período 2: Recuperação de Informação. Recuperação de Informação

Processos de Desenvolvimento de Software

01/08/2018. Recuperação de Informação

HABILITAÇÃO COMPONENTE TITULAÇÃO

EMENTAS DAS DISCIPLINAS

Representação da Informação Automação de Unidades de Informação

Dadas a base e a altura de um triangulo, determinar sua área.

UNOCHAPECÓ - ÁREA DE CIÊNCIAS EXATAS E AMBIENTAIS ENGENHARIA MECÂNICA - P.I. PROF. EDERSON MOREIRA PAZ

Extração de Requisitos

Gestão da Qualidade por Processos

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU

Sistemas de Informações Gerenciais

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1.

Engenharia de Requisitos Estudo de Caso

Introdução a Informática. Prof.: Roberto Franciscatto

Tecnologia e Sistemas de Informações Tipos de SI

Wilson Moraes Góes. Novatec

INFORMÁTICA BÁSICA. Prof. Rafael Zimmermann

Testes de Usabilidade

TI Aplicada. Aula 02 Áreas e Profissionais de TI. Prof. MSc. Edilberto Silva prof.edilberto.silva@gmail.com

Análise do Conteúdo e a Análise Documental

EMENTAS DAS DISCIPLINAS

Interface Homem-Computador

Interação Homem-Computador: As Interfaces

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Renata Alves Campos (CoInfo) Sandra Maria Peron de Lima (DP) Março/2012

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

III Semana de Ciência e Tecnologia IFMG - campus Bambuí III Jornada Científica 19 a 23 de Outubro de 2010

MÓDULO 7 Modelo OSI. 7.1 Serviços Versus Protocolos

BPMN Business Process Modeling Notation

RESENHA CRÍTICA A LEITURA DE IMAGENS FOTOGRÁFICAS: PRELIMINARES DA ANÁLISE DOCUMENTÁRIA DE FOTOGRAFIAS.

Requisitos de Software

Introdução a Computação

LINGUAGENS E PARADIGMAS DE PROGRAMAÇÃO. Ciência da Computação IFSC Lages. Prof. Wilson Castello Branco Neto

A GESTÃO DE DOCUMENTOS COMO UM DOS FUNDAMENTOS PARA A INTELIGÊNCIA COMPETITIVA

Introdução à Engenharia de Software

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

Análise de Sistemas. Visão Geral: Orientação a Objetos. Prof. José Honorato Ferreira Nunes honorato.nunes@bonfim.ifbaiano.edu.br

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

Classificação / Indexação

ADM041 / EPR806 Sistemas de Informação

UNOESTE - Universidade do Oeste Paulista F I P P - Faculdade de Informática de Presidente Prudente

EMENTÁRIO DE COMPONENTES CURRICULARES

ONTOLOGIA E SUAS APLICAÇÕES EM MODELAGEM CONCEITUAL PARA BANCO DE DADOS PROPOSTA DE TRABALHO DE GRADUAÇÃO

IMPLANTAÇÃO DE UM SISTEMA DE AVALIAÇÃO DE DESEMPENHO NA UFG

Prof. Daniel Gondim. Sistemas de Informações

IDENTIFICAÇÃO DE CATEGORIAS INFORMACIONAIS PARA REPRESENTAÇÃO DE IMAGENS FOTOGRÁFICAS FIXAS EM BANCOS DE IMAGENS COMERCIAIS

Engenharia de Software I: Análise e Projeto de Software Usando UML

Sistemas de Informação I

MINISTÉRIO DA CIÊNCIA E TECNOLOGIA MCT MUSEU PARAENSE EMÍLIO GOELDI MPEG

Um modelo é uma simplificação da realidade. Construímos modelos para compreender melhor o sistema que estamos desenvolvendo.

IMPLEMENTAÇÃO DAS CAMADAS Inference Machine e Message Service Element PARA UM SERVIDOR DE SISTEMA DE GERENCIAMENTO DE Workflow HOSPITALAR

UML - Unified Modeling Language

Qualidade de Software

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios

Guia Básico de Utilização da Biblioteca Virtual da FAPESP. Thais Fernandes de Morais Fabiana Andrade Pereira

Informática. Prof. Macêdo Firmino. Macêdo Firmino (IFRN) Informática Setembro de / 25

UNIVERSIDADE DO ESTADO DE SANTA CATARINA - UDESC DCC Departamento de Ciência da Computação Joinville-SC

Engenharia de Software: conceitos e aplicações. Prof. Tiago Eugenio de Melo, MSc tiagodemelo@gmail.com

Algoritmos: Lógica para desenvolvimento de programação de computadores. Autor: José Augusto Manzano. Capítulo 1 Abordagem Contextual

ü Curso - Bacharelado em Sistemas de Informação

Engenharia de Software. Artigo revista Engenharia de Software, edição 30 (novembro 2010)

Universidade Estadual Paulista Faculdade de Filosofia e Ciências Campus de Marília Grupo de Estudos sobre Organização e Representação do Conhecimento

GESTÃO DAS INFORMAÇÕES DAS ORGANIZAÇÕES MÓDULO 11

CIÊNCIA DA INFORMAÇÃO: O QUE É ISTO? RESUMO

Logística e Administração de Estoque. Definição - Logística. Definição. Profª. Patricia Brecht

Prof. JUBRAN. Aula 1 - Conceitos Básicos de Sistemas de Informação

rosefib.webnode.com.br

EMENTAS DAS DISCIPLINAS

DATA WAREHOUSE. Introdução

Documento Arquivístico Eletrônico. Produção de Documentos Eletrônicos

Questionamento 3. Ano. Série. Nome do Aluno. Escola

Sistemas de Informação para Apoio à Decisão Gerencial

Empreendedorismo de Negócios com Informática

Introdução Visão Geral Processos de gerenciamento de qualidade. Entradas Ferramentas e Técnicas Saídas

ANÁLISE E DESENVOLVIMENTO DE SISTEMAS TURMA º PERÍODO - 7º MÓDULO AVALIAÇÃO A4 DATA 22/10/2009 ENGENHARIA DE USABILIDADE

APLICATIVO PARA GERENCIAMENTO DE FORÇA DE TRABALHO EM EMPRESAS DE TELEFONIA MÓVEL

BIBLIOTECA ANACOM MANUAL DO UTILIZADOR

TRABALHO DE DIPLOMAÇÃO Regime Modular ORIENTAÇÕES SOBRE O ROTEIRO DO PROJETO FINAL DE SISTEMAS DE INFORMAÇÕES

Gestão de Processos de Negócios

UML Aula III Diagramas de Estado, Atividades, Componentes e Instalação

Um Framework para definição de processos de testes de software que atenda ao nível 3 do TMM-e

Engenharia de Software

Arquitetura dos Sistemas de Informação Distribuídos

Modelos de Qualidade de Produto de Software

ICORLI INSTALAÇÃO, CONFIGURAÇÃO E OPERAÇÃO EM REDES LOCAIS E INTERNET

Faculdade de Ciência da Informação Profa. Lillian Alvares

Universidade de Brasília Faculdade de Ciência da Informação Disciplina: Projeto de Implementação de Sistemas Arquivísticos Profa.

BPMN - Business Process Modeling and Notation

Universidade de Brasília Departamento de Ciência da Informação e Documentação Programa de Pós Graduação em Ciência da Informação Prof a.

Gestão Estratégica de Recursos Humanos

Desenvolvendo uma Arquitetura de Componentes Orientada a Serviço SCA

Ensino técnico Integrado ao médio.

UNOESTE - Universidade do Oeste Paulista F I P P - Faculdade de Informática de Presidente Prudente

Projeto Disciplinar de Infra-Estrutura de Software FARMAINFOR - GERENCIAMENTO DA FARMACIA

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

Engenharia de Software: Introdução. Mestrado em Ciência da Computação 2008 Profa. Itana Gimenes

Concepção e Elaboração

PMO DE SUCESSO PRECISA TER FOCO! Uma proposta de modelo para Escritórios de Projetos

A Linguagem de Modelagem Unificada (UML)

Transcrição:

Recuperação de Informação Recuperação de Informação Recuperar consiste em identificar, em um conjunto de documentos (corpus), quais atendem à necessidade de do usuário. O usuário de um sistema de recuperação de está interessado em recuperar sobre um determinado assunto e não em recuperar registros de dados que satisfazem sua expressão de busca, nem tampouco documentos, embora seja nestes que a estará registrada. Essa característica é o que diferencia os sistemas de recuperação de dos sistemas gerenciadores de bancos de dados, estudados e implementados no âmbito da Ciência da Computação. 1

Recuperação de Informação A recuperação de envolve: um acervo documental; pessoas que buscam por documentos relevantes para satisfazer suas necessidades de. Recuperar implica em operar seletivamente um estoque de envolve processos cognitivos difíceis de serem formalizados. A utilização de recursos computacionais nessa tarefa parte de inevitáveis simplificações teóricas e de adequações de conceitos subjetivos relevância necessidade de Recuperação de Informação Recuperação de é um processo de comunicação. Em certo sentido é um meio pelo qual autores e criadores de registros se comunicam com os leitores, mas indiretamente e possivelmente com um longo intervalo de tempo entre a criação de uma mensagem ou texto e a sua entrega para o usuário de um sistema de recuperação de. Às vezes o sistema de recuperação de ou bibliotecário conduzindo uma pesquisa pode passar informações sobre a provável relevância ou valor do que é recuperado, aumentando a para o conjunto de itens recuperados. Os registros de uma base de dados são criados e montados sem conhecimento exatamente de quem irá lê-los, ou sob quais circunstâncias. As linguagens e os canais de tal sistema de comunicação são bastante diferentes de outros modelos bem conhecidos, tais como a radiodifusão ou a comunicação ponto-a-ponto (MEADOW et al, 2007, p.3) 2

Recuperação de Informação Um sistema de recuperação de é um ambiente linguístico mediador da comunicação entre um estoque de e os seus requisitantes. Sua eficiência depende de um controle adequado da linguagem de representação dos itens de e das buscas dos usuários. Por meio de uma expressão de busca (consulta) o usuário comunica a sua necessidade de e obtém como resultado um conjunto de documentos que possivelmente irão satisfazer tal necessidade. O processo de recuperação de 3

Documento Documentos Segundo Buckland (1991),: o termo é utilizado na maioria das vezes vinculado a um objeto que contém : um documento. Assim, o termo poderia também designar algo atribuído a um objeto, tal como dado e documento que se referem à, porque deles se espera que sejam informativos. Para Le Coadic (2004, p.5): documento é o termo genérico que designa os objetos portadores de. Um documento é todo artefato que representa ou expressa um objeto, uma ideia ou uma por meio de signos gráficos e icônicos (palavras, imagens, diagramas, mapas, figuras, símbolos), sonoros e visuais (gravados em suporte de papel ou eletrônicos). 4

Documento Animal na natureza Não é documento Suzanne Briet, 2006, p.10 Animal no zoológico É documento 5

Representação dos documentos Análise de assunto de um documento e a colocação do resultado desta análise numa expressão linguística; Pressupõe uma linguagem documentária, instrumento de padronização da indexação, a qual visa garantir que indexadores de um mesmo sistema usem os mesmos conceitos para representar documentos semelhantes. É também um instrumento de comunicação ao permitir que indexadores e usuários partilhem um mesmo vocabulário. Indexação Automática Por extração Por atribuição Representação dos documentos Desmatamento Mata Atlântica Madeireiras Reflorestamento Desmatamento 0.7 Mata Atlântica 0.6 Madeireiras 0.3 Reflorestamento 0.0 6

Usuário Segundo Riecken (2006): O usuário e os conteúdos estão no centro das preocupações da CI [Ciência da Informação] e não as tecnologias. Entretanto, a CI pode valer-se de práticas de modelagem e notação oriundas da engenharia de software e da computação visando a facilitar a operacionalização em sistemas computacionais, suas bases de dados e redes, a partir dos modelos e representações conceituais. Segundo Le Coadic (2004, p.38-40), existem dois tipos de necessidades de : a necessidade de em função do conhecimento, originária do desejo de saber, e a necessidade de em função da ação, derivada de necessidades materiais determinadas pela realização de atividades humanas, profissionais e individuais. Ambas serão representadas pelo usuário quando entram em contato com o ambiente que escolheram para satisfazer a sua necessidade informacional. 7

Expressão de Busca Meio que o usuário emprega para comunicar a sua necessidade informacional para o sistema de. Podem ser especificada em linguagem natural ou por meio de uma linguagem artificial, dependendo dos recursos oferecidos pelo sistema. Os usuários necessitam ter um mínimo de conhecimento do tema de interesse e do seu vocabulário do domínio. Principal dificuldade: predizer quais os termos que foram usadas para representar os documentos que satisfarão sua necessidade. 8

Representação da Expressão de Busca É necessário que a expressão de busca seja representada de forma similar à utilizada na representação dos documentos. Essa homogeneidade permitirá a comparação entre a busca e todos os documentos do corpus do sistema por meio da função de busca. 9

Representação da Expressão de Busca Mata Atlântica 0.5 Desmatamento 0.8 Causas 0.7 Mata Atlântica Desmatamento Causas Quais as principais causas do desmatamento da Mata Atlântica? Usuário e sua necessidade de 10

Função de Busca compara as representações dos documentos com a representação da expressão de busca e recupera os itens que supostamente fornecerão a que o usuário procura. calcula o grau de similaridade entre a expressão de busca e cada um dos documentos do corpus. O grau de similaridade, na maioria das vezes definido por um valor numérico, pretensamente define o quão relevante é um determinado documento para satisfazer a necessidade de do usuário; O grau de similaridade é utilizado para ordenar os documentos resultantes da busca. Função de Busca Representação dos documentos Função de busca Representação da Busca ( x y) Cálculos matemáticos 1 2 Lista ordenada de documentos 11

Resultado da Busca Geralmente é composto por um conjunto de documentos que supostamente serão úteis para o usuário. É apresentado na forma de uma lista ordenada pelo grau de similaridade calculada pela função de busca. Uma busca deve resultar na recuperação de uma quantidade de documentos que possibilite ao usuário a verificação de cada um deles a fim de selecionar os que lhe serão úteis. O fato de um termo utilizado na expressão de busca aparecer na representação de um documento não significa que este documento seja relevante para a necessidade do usuário. 12

Modelo de Recuperação de Informação É a especificação formal de três elementos: a representação dos documentos; a representação da necessidade de por meio de uma expressão de busca; como estes dois elementos serão comparados: a função de busca. A eficiência de um sistema de recuperação de está diretamente ligada ao modelo que ele utiliza, influenciando diretamente em seu modo de operação. 13

Leituras: O processo de recuperação de Leituras KHAPRE, SHAILESH; BASHA, SALEEM. A Theoretical Paradigm of Information Retrieval in Information Science and Computer Science. International Journal of Computer Science Issues, v.9, n.2, 2012. 14

Referências bibliográficas Referências bibliográficas BRIET, Suzanne. What is Documentation?: English Translation of the Classic French Text. Oxford, UK:Scarecrow Press, 2006. BUCKLAND, M.K. Information as thing. Journal of the American Society of Information Science, v.42, n.5, 1991. p.351-360. LE COADIC, Y-F. A Ciência da Informação. 2.ed. Brasília: Briquet de Lemos, 2004. MEADOW, C.T.; BOYCE, B.R.; KRAFT, D.H.; BARRY, C. Text Information Retrieval System. 3 rd ed. London UK: Elsevie, 2007 RIECKEN, R. F. Frame de temas potenciais de pesquisa em Ciência da Informação. Revista Digital de Biblioteconomia e Ciência da Informação, Campinas, v. 3, n. 2, jan./jun. 2006. p.43-63. 15