O TRATAMENTO DA INFORMAÇÃO:



Documentos relacionados
O propósito deste trabalho foi o de apresentar os programas de. catalogação cooperativa, centralizada e catalogação-na-publicação, os quais,

MINISTÉRIO PÚBLICO DO ESTADO DE SÃO PAULO ÁREA DE DOCUMENTAÇÃO E DIVULGAÇÃO SETOR DE PROCESSAMENTO TÉCNICO DA BIBLIOTECA CÉSAR SALGADO PROJETO

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

Critérios para certificação de Sites SciELO: critérios, política e procedimentos para a classificação e certificação dos sites da Rede SciELO

DESCRIÇÃO DAS ATIVIDADES DOS CARGOS

IV. Intercâmbio Eletrônico de Dados (EDI)

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU

Importância do GED. Implantação de um Sistema de GED

Engª de Produção Prof.: Jesiel Brito. Sistemas Integrados de Produção ERP. Enterprise Resources Planning

ADMINISTRAÇÃO DE ATIVOS DE TI GERENCIAMENTO DE LIBERAÇÃO

Carta para a Preservação do Patrimônio Arquivístico Digital Preservar para garantir o acesso

Curso de Educação Profissional Técnica de Nível Médio Subseqüente ao Ensino Médio, na modalidade a distância, para:

Sistemas de Informações Gerenciais

SOCIEDADE CULTURAL E EDUCACIONAL DE ITAPEVA FACULDADE DE CIÊNCIAS SOCIAIS E AGRÁRIAS DE ITAPEVA

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

Análise e Projeto de Sistemas. Engenharia de Software. Análise e Projeto de Sistemas. Contextualização. Perspectiva Histórica. A Evolução do Software

Plano de Trabalho Docente Ensino Técnico

Sistema de Informação

ü Curso - Bacharelado em Sistemas de Informação

POLÍTICA DE EXPANSÃO E ATUALIZAÇÃO DO ACERVO DA BIBLIOTECA DA FAIP

Planificação anual de 3º ciclo de Educação Tecnológica 7º e 8º ano

Introdução à Computação

FACULDADE INTEGRADAS DE PARANAÍBA ADMINISTRAÇÃO DE EMPRESAS. Bancos de Dados Conceitos Fundamentais

QUALIDADE E EXCELÊNCIA NA SOCIEDADE DA INFORMAÇÃO Faculdade de Letras Universidade do Porto

Processos de Desenvolvimento de Software

Bancos de Dados. Conceitos F undamentais em S is temas de B ancos de Dados e s uas Aplicações

Projeto BVS-SP-1.9 Publicação eletrônica de textos completos em Saúde Pública (15 de outubro de 1999)

A LIBERDADE DO LINUX COM A QUALIDADE ITAUTEC

Plano de Trabalho Docente Ensino Técnico. Habilitação Profissional: habilitação Profissional técnica de nível médio de técnico em administração

Exame de Fundamentos da ITIL

Engenharia de Requisitos Estudo de Caso

TERMO DE REFERÊNCIA PARA CONTRATAÇÃO DE PESSOA FÍSICA

PROJETO DE IMPLANTAÇÃO DE BIBLIOTECAS ESCOLARES NA CIDADE DE GOIÂNIA

PROGRAMA DE CAPACITAÇÃO E APERFEIÇOAMENTO PARA TUTORES - PCAT

Desenvolvimento de Interfaces Prototipação

Centros de documentação e informação para área de ENGENHARIA: como implantar e resultados esperados. Iza Saldanha

UNIVERSIDADE IGUAÇU CAMPUS ITAPERUNA CURSO DE DIREITO LABORATÓRIOS

ADMINISTRAÇÃO DE ATIVOS DE TI GERENCIAMENTO DE CONFIGURAÇÃO

SISTEMA DE GESTÃO DE PESSOAS SEBRAE/TO UNIDADE: GESTÃO ESTRATÉGICA PROCESSO: TECNOLOGIA DA INFORMAÇÃO

FUNDAÇÃO OSWALDO CRUZ BIREME - OPAS - OMS CENTRO DE INFORMAÇÃO CIENTÍFICA E TECNOLÓGICA CICT PROJETO BVS DOENÇAS INFECCIOSAS E PARASITÁRIAS BRASIL

Plano de Trabalho Docente Ensino Técnico

Modelagem e Simulação

Instrumentais Técnicos da Gestão de Documentos: o Código de Classificação e a Tabela de Temporalidade e Destinação de Documentos de Arquivo

Uso de taxonomias na gestão de conteúdo de portais corporativos.

Glossário Apresenta a definição dos termos, siglas e abreviações utilizadas no contexto do projeto Citsmart.

Segurança Computacional. Rodrigo Fujioka

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR

Administração Central Unidade de Ensino Médio e Técnico - CETEC. Ensino Técnico

AULA 04 - TABELA DE TEMPORALIDADE

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd.

OBSERVATÓRIO DE GESTÃO DA INFORMAÇÃO. Palavras-chave: Gestão da Informação. Gestão do conhecimento. OGI. Google alertas. Biblioteconomia.

Gerenciamento de Incidentes

FACULDADE PITÁGORAS DISCIPLINA: ARQUITETURA DE COMPUTADORES

ITIL - Por que surgiu? Dependências de TI; A qualidade, quantidade e disponibilidade de infra-estrutura de TI afetam diretamente;

INFLUÊNCIA DA TECNOLOGIA DA INFORMAÇÃO NA GESTÃO DA ÁGUA E ESGOTO

Análise Estruturada de Sistemas

DESENVOLVIMENTO DE INTERFACE WEB MULTIUSUÁRIO PARA SISTEMA DE GERAÇÃO AUTOMÁTICA DE QUADROS DE HORÁRIOS ESCOLARES. Trabalho de Graduação

Intranets. FERNANDO ALBUQUERQUE Departamento de Ciência da Computação Universidade de Brasília 1.INTRODUÇÃO

Introdução sobre Implantação de Sistema ERP em Pequenas Empresas. Prof Valderi R. Q. Leithardt

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1.

Portaria Inep nº 190 de 12 de julho de 2011 Publicada no Diário Oficial de 13 de julho de 2011, Seção 1, pág. 13

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios

05/05/2015. Recuperação de Informação

Prof. Daniel Gondim. Sistemas de Informações

PLANIFICAÇÃO MODULAR ANO LECTIVO 2015 / 2016

BIREME/OPAS/OMS BVS Saúde Pública. Projeto BVS-SP-7 Atualização da terminologia e áreas temáticas em saúde pública (01 de julho de 2002) 1.

GOVERNO DO ESTADO DO PARÁ MINISTÉRIO PÚBLICO DE CONTAS DOS MUNICÍPIOS DO ESTADO DO PARÁ MPCM CONCURSO PÚBLICO N.º 01/2015

Gerenciamento de Níveis de Serviço

TI Aplicada. Aula 02 Áreas e Profissionais de TI. Prof. MSc. Edilberto Silva prof.edilberto.silva@gmail.com

CENTRO DE INFORMAÇÃO EUROPE DIRECT DE SANTARÉM

Material de Apoio. Sistema de Informação Gerencial (SIG)

Sistema de Automação do NDC (SAND): Controle da Terminologia de Indexação e Sistema de Informações Legislativas

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

Sistemas Integrados de Gestão Empresarial

ATIVIDADES PARA A INCORPORAÇÃO DE EQUIPAMENTOS MÉDICO- HOSPITALARES Ênfase em software/firmware

UNIDADE 4. Introdução à Metodologia de Desenvolvimento de Sistemas

Organização dos Estados Ibero-americanos. Para a Educação, a Ciência e a Cultura

Centros para a Qualificação e o Ensino Profissional (CQEP) Estrutura, competências e objetivos

Tecnologia da Informação. Prof. Esp. Lucas Cruz

Conceitos ADMINISTRAÇÃO DE SISTEMAS DE INFORMAÇÃO. Comunicação; Formas de escritas; Processo de contagem primitivo;

A IMPORTÂNCIA DE PROGRAMAS DE GESTÃO DE DOCUMENTOS NO ÓRGÃOS E ENTIDADES INTEGRANTES DO SIGA

BANCO DE DADOS AULA 02 INTRODUÇÃO AOS BANCOS DE DADOS PROF. FELIPE TÚLIO DE CASTRO 2015

15 Computador, projeto e manufatura

EMENTAS DAS DISCIPLINAS

Programação com acesso a BD. Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br

Requisitos de Software. Teresa Maciel DEINFO/UFRPE

A Parceria UNIVIR / UNIGLOBO- Um Case Focado no Capital Intelectual da Maior Rede de TV da América Latina

Administração de Sistemas de Informação. Plano Diretor de Informática

Introdução Ciclo de vida tradicional de desenvolvimento Prototipagem Pacotes de software Desenvolvimento de 4ª geração Terceirização

DESENVOLVIMENTO WEB DENTRO DOS PARADIGMAS DO HTML5 E CSS3

TRABALHO DE DIPLOMAÇÃO Regime Modular ORIENTAÇÕES SOBRE O ROTEIRO DO PROJETO FINAL DE SISTEMAS DE INFORMAÇÕES

2 INOVAÇÃO NA PROVISÃO DE SERVIÇOS

PERFIL DA VAGA: GERENTE DE CONTEÚDOS E METODOLOGIAS

Sistemas de Informações Gerenciais Prof. Esp. André Luís Belini Bacharel em Sistemas de Informações MBA em Gestão Estratégica de Negócios

MINISTÉRIO DA EDUCAÇÃO FUNDO NACIONAL DE DESENVOLVIMENTO DA EDUCAÇÃO DIRETORIA DE GESTÃO, ARTICULAÇAO E PROJETOS EDUCACIONAIS

MARCELO CHAVES ARAGÃO A AVALIAÇÃO DE CONTROLES INTERNOS PELAS AUDITORIAS DO TCU

TERMO DE REFERÊNCIA Nº 1671 PARA CONTRATAÇÃO DE PESSOA FÍSICA/JURÍDICA CONSULTOR POR PRODUTO

A ESCOLHA DE SISTEMA PARA AUTOMAÇÃO DE BIBLIOTECAS. A decisão de automatizar

Organização dos Estados Ibero-americanos. Para a Educação, a Ciência e a Cultura TERMO DE REFERÊNCIA PARA CONTRATAÇÃO DE PESSOA FÍSICA

Transcrição:

O TRATAMENTO DA INFORMAÇÃO: FACE AOS SISTEMAS AUTOMATIZADOS DE RECUPERAÇÃO

ESQUEMA GERAL Importância do acesso à informação, O crescimento e diversificação dos sistemas de informação Explosão bibliográfica Necessidade do controle de vocabulário Linguagem de indexação Evolução histórica dos sistemas Novas ferramentas de apoio a construção das linguagens de indexação Novos desafios

INFORMAÇÃO Fenômeno humano, que funciona como instrumento social de comunicação do conhecimento produzido. Tem caráter ágil e provisório, na medida em que sistematiza e transcodifica o estado da arte, na produção do conhecimento.

SISTEMA DE INFORMAÇÃO Instituições intermediárias entre o produtor e o consumidor de informação.

PRINCIPAIS PROBLEMAS ENCONTRADOS NO ACESSO À INFORMAÇÃO Rapidez com que as informações sofrem obsolescência, Escassez de tempo nas buscas retrospectivas, Falta de entendimento sobre o funcionamento das rotinas dos sistemas de informação (falta padrão comum), Incompatibilidade entre o vocabulário de abordagem (usuário) vocabulário utilizado no sistema de informação. Morosidade no processo de tratamento de novos documentos

IMPORTÂNCIA DO VOCABULÁRIO A designação de objetos e processos é fundamental para o homem organizar seu pensamento e comunicá-lo. É um modo de conquistar o mundo, entendê-lo e transformá-lo. Em face de um vocabulário, o ser humano dele se apropria, transformando-o segundo as circunstâncias da vida. Quando nos defrontamos com novos processos ou objetos, resgatamo-os, reconhecendo-os pela sua designação. Na ausência desta, necessitamos construí-la, para que a experiência não perca no momento em que é vivida. A designação é portanto, forma de fixação e de comunicação. PASQUARELLI, Maria Luiza R. A informação bibliográfica automatizada na USP: uma política de implantação. Ciência Informação, Brasília, v. 18, n.1, p. 58-61, jan./jun. 1989.

SOLUÇÕES MANUAIS DESENVOLVIDAS COM POUCO OU NENHUM CONTROLE DE VOCABULÁRIO Déc. 50 - Linguagem natural + sistema UNITERM truncamento de palavras truncamento com infixos (especificando o começo e o fim da palavra mas não o meio)

AVALIAÇÃO DO SISTEMA DE RECUPERAÇÃO MANUAL VANTAGENS DESVANTAGENS agilidade na incorporação de novos termos, alto grau de especificidade incorpora termos usuais, pouca dependência do profissional da informação, Diversidade de pontos de acesso Em caso de pesquisa exaustiva, grande revocação ( possibilitando seleção) custo por busca elevado altos índices de revocação, baixos índices de precisão, relações espúrias (falsa associações, relações incorretas entre termos, etc.) Linguagem redundante por falta de controle do vocabulário Necessidade de usuário especializado

NEGOCIANDO SOLUÇÕES POSSÍVEIS Sistemas híbridos (linguagem natural + vocabulário controlado), Vocabulário pós- controlado, Tesauro em crescimento.

Funções das linguagens de indexação a) recuperar documentos com conteúdo semelhante, b) recuperar documentos relevantes sobre um assunto específico, c) recuperar documentos por grandes áreas de assunto, d) possibilitar a conversão dos termos de indexação entre diferentes linguagens e) auxiliar na escolha do termo adequado para a estratégia de busca, f) representar o assunto de maneira consistente, g) permitir a compatibilidade e diálogo entre a linguagem do indexador e a do pesquisador.

Histórico da automação no tratamento da informação Década de 50 Estados Unidos: é marcada pela utilização de sistemas automatizados. Década de 50 Surge a indexação automatizada: idéia desenvolvida por LUHN ( KWIC = Key Word in Context) elaborado a partir de rotação automática de palavras significativas dos títulos. Anos 60 Computadores tornaram-se largamente disponíveis na sociedade industrializadas, marcando o advento da era de sistemas automatizados. 1961 Inicia nos Estados Unidos dois projetos: - Projeto MEDLARS pela Biblioteca Nacional de Medicina - Projeto de Publicações Seriadas pela Universidade de California/San Diego

Histórico da automação no tratamento da informação Década de 60 Surge o sistema MARC (Machine Readable Cataloging = Catalogação legível por computador), visava a conversão de dados catalográficos em forma legível por máquinas, propiciando o formato padrão para intercâmbio de dados catalográficos. 1968 1a experiência de indexação automatizada no Brasil: elaboração de índices bibliográficos publicados pelo Instituto Brasileiro de Bibliografia e Documentação (atual IBICT): edição da Bibliografia Brasileira de Física. 1968 Surge o sistema MARC II: após estudos sobre a experiência do projeto piloto (MARC). É adotado como formato padrão pela American Library Association.

Histórico da automação no tratamento da informação 1972 Projeto CALCO: surge no Brasil tendo o MARC II como base para o desenvolvimento do seu projeto. Foi proposto pelo IBBD (Instituto Brasileiro de Bibliografia e Docuemtação, atual IBICT). 1974 Sistema Precis : É uma linguagem de indexação em cadeia desenvolvido por Derek Austin. 1976 O Formato CALCO passou a ser utilizado, contribuindo para a padronização e unificação do controle bibliográfico e documental. Experiência pioneira da catalogação automatizada no Brasil. 1977 A Biblioteca Nacional publica um manual descritivo intitulado Instruções de preenchimento da folha para a catalogação CALCO e CALCO Autoridades, seguindo de perto a linha da Biblioteca do Congresso Americano

Histórico da automação no tratamento da informação Rede Bibliodata Calco A partir dessas publicações a Biblioteca Central e o Centro de Processamento de Dados da Fundação Getúlio Vargas iniciaram a implementação do Sistema Bibliodata-CALCO. 1980 Foi dado o ínicio à implementação efetiva do módulo de Catalagoção pela Biblioteca Central da Fundação Getúlio Vargas. 1980 Foi dado o ínicio à implementação efetiva do módulo de Catalagoção pela Biblioteca Central da Fundação Getúlio Vargas. 1984 Integração das Bibliotecas da UNI-RIO na Rede Bibliodata. 1988 Integração da Fundação Universidade Regional de Blumenau à Rede Biliodata-CALCO

Histórico da automação no tratamento da informação Década de 90 UFMG: integração das bibliotecas setoriais, exceto Medicina, Música e Educação Física. 1993 A Rede Bibliodata possui mais de 60 membros de diferentes partes do Brasil, de acordo com artigo Cooperative cataloging outside northamerica: status report 1993 de Robert Holley, publicado no periódico Cataloging & Classification Quarterly. O sistema CALCO foi adotado pela Biblioteca Nacional, Fundação Getúlio Vargas e Centro de Informática do Ministério da Educação (CIMEC), atual Secretária da Informática. 1996 Sistema Integrado de Biblioteca da USP, com 38 bibliotecas em 70 cidades tornou-se o primeiro membro da rede OCLC Online Computer Library Center.

Histórico da automação no tratamento da informação ROBREDO descreve em seu livro Documentação de Hoje e de Amanhã outros sistemas independentes: Formato utilizado pela Biblioteca Central da Universidade de Brasília Ministério do Interior (MINTER) Sistema SICON (Sistema de Informação do Congresso Nacional) Projeto TAUPI (Total Automação de Bibliotecas Públicas, São Bernardo do Campo, SP) Formato IBICT Formatos internacionais: Formato padronizado do Manual de Referência do UNISIST

INDEXAÇÃO AUTOMÁTICA Teve início no final da década de 50, por LUHN. Ele desenvolveu a idéia de que o vocabulário existente no documento deveria constituir-se na base para análise de seu conteúdo, sendo a melhor forma de recuperá-lo.

INDEXAÇÃO AUTOMÁTICA A indexação automática se baseia na comparação de cada palavra do texto com uma relação de palavras vazias de significado (stop list), previamente estabelecidas, que conduz, por eliminação, a considerar as palavras restantes do texto com significativas. Este sistema objetiva a eliminação da subjetividade constante aos processos de indexação manual.

INDEXAÇÃO AUTOMÁTICA Na indexação automática a indexação a estratégia de busca é realizada pelos mesmos programas assegurando compatibilidade entre a linguagem de indexação utilizada na indexação e a utilizada na formulação da pergunta. A indexação automática é uma operação que identifica, através de programas de computador, palavras ou expressões significativas dos documentos para descrever de forma condensada o seu conteúdo.

INDEXAÇÃO AUTOMÁTICA As palavras significativas dos documentos selecionadas automaticamente, através de metodologias específicas, adotadas de acordo com as políticas de indexação e recuperação da informação, desenvolvimento de software e capacidade de hardware dos sistemas de informação.

NÍVEIS DE INDEXAÇÃO Categorização - representa o assunto que predomina, superficial - representa os conceitos principais de forma geral, profunda - representa todos os conceitos fundamentais.

METODOLOGIAS EMPREGADAS Método de freqüência ou análise estatística Método de atribuição de peso Método probabilistico Análise de Cluster Método de associação de palavras

SISTEMAS CRIADOS Década de 50/ frequência e análise estatistica KWIC - keyword in context KWOC - Keyword out context Década de 60/70 - Baseada nos princípios da classificação facetada PRECIS- PREserved Context sistem Década de 70 / uso de sinais delimitadores NEPHIS - ( Nested PHrase indexing sistem)

PONTOS CRÍTICOS DA INDEXAÇÃO AUTOMATIZADA Qualidade da indexação, Qualidade da recuperação da informação (sobretudo na área de ciências sociais, onde os termos têm significação subjetiva) Por outro lado a partir desta metodologia cresceram as preocupações com o enriquecimento dos títulos dos documentos tendo em vista a sua recuperação mais ágil.

O QUE SIGNIFICA NESTE CONTEXTO O CONTROLE DE VOCABULÁRIO É a elaboração de instrumentos artificiais (linguagem de indexação) que visam privilegiar o vocabulário de abordagem do usuário e o vocabulário dos autores dos documentos tendo em vista a rápida recuperação e utilização da informação

MAS A MÁQUINA NÃO FAZ TUDO???!! A atividade de controle e criação de linguagens de indexação é uma atividade essencialmente intelectual e enquanto tal necessita da mediação humana no processo. Deste modo Lixo dentro, é igual a lixo fora

MAS O QUE A MÁQUINA PODE FAZER??? A máquina pode ser um instrumento auxiliar na criação de linguagens de indexação e FACILITADOR NA INTERFACE USUÁRIO/SISTEMA no momento da recuperação da informação.

NOVAS FERRAMENTAS : CONSTRUÇÃO DE LINGUAGEM TCS TECER ADMINISTRAÇÃO DE BASES DE DADOS Micro ISIS Bibliodata Calco

NOVOS DESAFIOS COMPATIBILIZAÇÃO DAS POLÍTICAS DE CONTROLE DE VOCABULÁRIO APLICADOS AOS NOVOS FORMATOS: O hipertexto Os arquivos localizados na INTERNET Os materiais não bibliográficos, CD s, vídeo lasers, filmes, vídeos, Controle de textos integrais automatizados