UNIVERSIDADE ESTADUAL PAULISTA

Tamanho: px
Começar a partir da página:

Download "UNIVERSIDADE ESTADUAL PAULISTA"

Transcrição

1 1 unesp UNIVERSIDADE ESTADUAL PAULISTA JÚLIO DE MESQUITA FILHO Faculdade de Filosofia e Ciências, Campus de Marília SP Programa de Pós-Graduação em Ciência da Informação FABIANO FERREIRA DE CASTRO Padrões de representação e descrição de recursos informacionais em bibliotecas digitais na perspectiva da Ciência da Informação: uma abordagem do MarcOnt Initiative na era da Web Semântica Marília 2008

2 2 FABIANO FERREIRA DE CASTRO Padrões de representação e descrição de recursos informacionais em bibliotecas digitais na perspectiva da Ciência da Informação: uma abordagem do MarcOnt Initiative na era da Web Semântica Dissertação apresentada ao Programa de Pós- Graduação em Ciência da Informação, como parte das exigências para a obtenção do título de mestre em Ciência da Informação, da Faculdade de Filosofia e Ciências Universidade Estadual Paulista - UNESP, Campus de Marília. Área: Informação, Tecnologia e Conhecimento. Linha: Informação e Tecnologia Orientador: Dra. Plácida Leopoldina Ventura Amorim da Costa Santos Pesquisa financiada pela CAPES Marília 2008

3 3 C353p Castro, Fabiano Ferreira de. Padrões de representação e descrição de recursos informacionais em bibliotecas digitais na perspectiva da ciência da informação : uma abordagem do MarcOnt initiative na era da web semântica / Fabiano Ferreira de Castro. - - Marília, f. : il. ; 30 cm Dissertação (Mestrado em Ciência da Informação) Faculdade de Filosofia e Ciências Universidade Estadual Paulista, Bibliografia: f Orientadora: Dra. Plácida Leopoldina Ventura Amorim da Costa Santos 1. MarcOnt Initiative. 2. MARC Web Semântica. 4. Bibliotecas digitais. I. Autor. II. Título. CDD

4 4 FABIANO FERREIRA DE CASTRO Padrões de representação e descrição de recursos informacionais em bibliotecas digitais na perspectiva da Ciência da Informação: uma abordagem do MarcOnt Initiative na era da Web Semântica BANCA EXAMINADORA: Nome: Dra. Plácida Leopoldina Ventura Amorim da Costa Santos. Titulação: Profa. do Programa de Pós-Graduação em Ciência da Informação Faculdade de Filosofia e Ciências Universidade Estadual Paulista UNESP, Campus de Marília. (Orientadora). Nome: Dra. Silvana Aparecida B. Gregorio Vidotti. Titulação: Profa. do Programa de Pós-Graduação em Ciência da Informação Faculdade de Filosofia e Ciências Universidade Estadual Paulista UNESP, Campus de Marília. Nome: Profa. Dra. Lídia Alvarenga. Titulação: Profa. do Programa de Pós-Graduação em Ciência da Informação Escola de Ciência da Informação Universidade Federal de Minas Gerais UFMG, Campus de Belo Horizonte. Data da defesa: 29/02/2008 Local: Faculdade de Filosofia e Ciências UNESP/Marília.

5 5 Dedicatória... À Deus, por me conceder esse presente. Aos meus pais Alaor e Ana, com muito amor e carinho.

6 6 AGRADECIMENTOS Essa é uma das partes mais fáceis e prazerosas que perpassam o trabalho, mas ao mesmo tempo difícil, pois são tantas as pessoas que passaram em nossas vidas e que direta ou indiretamente contribuíram para a concretização de mais uma etapa alcançada. Sendo assim, vamos tentar... Quero agradecer primeiramente e de maneira especial àquele que me ensina a cada dia a aprender a viver melhor, o Mestre dos Mestres, o qual não estaria agora aqui, firme, de pé, é só por Ele... Deus. Assim como diz o grande livro: Tudo posso naquele que me fortalece. Sinto-me feliz, por ser tão agraciado com a dádiva da vida e ter tido a oportunidade de realizar algo que mais do que eu quisera Deus já o sonhara para mim. Assim como diz a canção: [...] vou perseguir tudo aquilo que Deus já escolheu pra mim [...] realizar o sonho mais lindo que Deus sonhou.... Agradeço também à minha família que mesmo distantes, me apoiaram, oraram e me deram condições, no sentido lato do termo, de concretizar mais esta etapa da minha vida: meu pai Alaor, minha mãe Ana Maria, minha irmã Tatiane e meu irmão Júnior. Amo muito todos vocês, obrigado por fazerem parte da minha vida, da minha história. Aos meus pais, por me ensinarem, educarem e, sobretudo, a ser gente proporcionando-me condições de chegar até aqui. Essas pessoas que falarei um pouco agora entraram na minha vida de mansinho, mas fizeram uma revolução que ninguém faz idéia, nem mesmo eu. Estou falando do casal Carlão e Teresa (mais conhecida como Mi), posso considerá-los a segunda família. Posso dizer que foram peças principais nesta etapa, pois me acolheram em sua casa, como se fosse um filho mesmo. O Carlão, o que falar dele: pai, amigo, psicólogo, companheiro, com um grande coração, esse cara é ouro. Desde o tempo do GOU (Grupo de Oração Universitário) pudemos conviver como família. Obrigado pelas preciosas conversas, especialmente por me ajudar no campo da Psicologia. Não tenho nem palavras para expressar a minha gratidão, meu carinho, simplesmente muito obrigado por tudo...

7 7 Agora vamos falar dessa figura a Mi, essa grande japonesa é como minha mãe mesmo, carinhosa, meiga, amiga, companheira, ótima pessoa, sem falar das comidas que ela faz, que tempero maravilhoso. Obrigado por tudo, pela paciência. Vocês moram no meu coração e que o Senhor possa a cada dia abençoá-los abundantemente. A pessoa que eu falarei agora é uma pessoa que eu tenho muita admiração, que eu a conheço desde 1999, período o qual ingressei no curso de Biblioteconomia dessa mesma universidade; lembra Dra. Plácida Leopoldina Ventura Amorim da Costa Santos, do primeiro dia de aula: o que é informação?, falta de informação mata? o que é catalogação? Perguntas e questionamentos que nortearam a minha vida profissional e acadêmica até o presente momento. Não é por nada não, ela é simplesmente a minha orientadora sempre ética e muito zelosa com o que faz, um exemplo de profissional e pessoa. Muito obrigado por tudo, pela dedicação, amizade, orientação, carinho, pela confiança depositada, em especial por ter tido o privilégio de ser seu orientando em mais este trabalho, desfrutando do seu conhecimento e competência. Muito obrigado por me ajudar a descobrir os maiores diamantes espalhados pelos campos. Será que encontrarei mais algum (s)? À Profa. Silvana Vidotti, por sua participação na banca de qualificação e agora na defesa deste trabalho, pelos apontamentos e contribuições. O que dizer sobre ela: uma pessoa amiga, competente e que vem acompanhando meu crescimento acadêmico desde minha graduação. Muito obrigado por fazer parte da minha vida. À Profa. Lídia Alvarenga, por sua participação na banca de qualificação, por suas valiosas contribuições que me fizeram refletir e a concretizar essa pesquisa. Muito obrigado por tudo, por permitir-me partilhar um pouco do seu conhecimento e, sobretudo, da sua simplicidade embutida na sua competência profissional. Gostaria de agradecer aos funcionários da Pós-Graduação em Ciência da Informação que prontamente sempre me atenderam com muito profissionalismo, de maneira especial Carol, Aline, Andréia, Márcia e Douglas. Aos funcionários da Universidade Estadual Paulista Campus de Marília pela dedicação, pelos serviços prestados, sempre atenciosos em suas atribuições. De maneira

8 8 especial à Luzinete, bibliotecária e companheira do mestrado, muito obrigado por tudo, pela amizade, carinho e boas conversas. Obrigado por compartilhar um pouco de sua experiência. Aos meus colegas da Pós-Graduação em Ciência da Informação os quais passamos bons e agradáveis momentos juntos e trocas de conhecimentos constantes. Em particular: Ângela, Rachel, Juliane, Deise, Roberta, Aldinar, Liriane, Maria Carolina, Carlos, Luana, Silvia, Milena, Rogério, Elvis e Maria José. Aos professores do Programa de Pós-Graduação em Ciência da Informação, por toda minha formação acadêmica e profissional. mestrado. Agradeço a CAPES pelo suporte financeiro desta pesquisa durante o período do Aos meus amigos que sempre me apoiaram nesta etapa da minha vida, por compreenderem os momentos de ausência: Hellen, Roberta, Marcinho, Lucilene, Kamila, Denise, Milena, Viviane, Danielle, Marcos, Elza, Adriana Eugênio, Cassiane, Cláudia, Nina, Kléber, Christiane, Estela, Comunidade El Shaddai e Vanessa. A todas as pessoas, que com seu modo de ser, contribuíram e me apoiaram. Simplesmente muito obrigado, vocês moram no meu coração.

9 9 FOLHA EM BRANCO A vida segue seu rumo Vou escrevendo minha história A cada dia eu recebo Uma folha em branco do Criador! Vou escrever o HOJE Sem me preocupar com o AMANHÃ Sim, já passou o ONTEM Só quero ficar com o que é bom! Eu não tenho medo de tentar! Parar! Pensar! Mudar! (Diego Fernandes)

10 10 No bonde, antigamente No trem, no navio, em movimento um não-lugar concreto. E na Internet, atualmente. O bonde trilhando O avião voando O navio... Existe um lugar em movimento? (Um-lugar-de-momento). (MIRANDA; SIMEÃO, 2005)

11 "Renda-se, como eu me rendi. Mergulhe no que você não conhece como eu mergulhei. Não se preocupe em entender, viver ultrapassa qualquer entendimento". (Clarice Lispector) 11

12 12 RESUMO A relevância tanto da Web quanto das bibliotecas digitais para os diversos ramos da ciência, tem impulsionado pesquisadores e comunidades científicas a buscar soluções de integração, intercâmbio e entendimento semântico sobre os conteúdos que nelas circulam. Verifica-se, no cenário atual, uma forte tendência para a disponibilização de conteúdos digitais e a falta de uso de padrões adequados para a representação e a descrição desses recursos em ambientes digitais, o que é apontado pela literatura como uma grande preocupação para a comunidade científica e focado neste trabalho enquanto problema da pesquisa. Nesse contexto, a proposição desta pesquisa é verificar na literatura científica a aplicabilidade e a funcionalidade das tecnologias e instrumentos disponíveis como padrões de representação e descrição de conteúdo e forma, no âmbito das bibliotecas digitais, com o objetivo de identificar e de caracterizar o uso e a aplicação do MarcOnt enquanto ferramenta para a construção de formas de representação da informação para bibliotecas digitais na atualidade, destacando-o como instrumento para descrição dos aspectos semânticos dos conteúdos digitais nestas ambiências. Como metodologia, o presente trabalho caracteriza-se por ser uma pesquisa de análise exploratória e descritiva do tema, com o qual é possível obter subsídios para um maior entendimento e compreensão mais detalhados do MarcOnt e as tecnologias que estão abarcadas no âmbito das bibliotecas digitais para a construção Web Semântica. Como resultado, procurou-se demonstrar a aplicação da ferramenta MarcOnt em um ambiente informacional específico, a Biblioteca Digital Semântica JeromeDL, para analisar nos fundamentos da Catalogação as formas de representação dos recursos informacionais. O que nos levou a definir categorias para análise futura do sistema em comparação com o padrão de metadados MARC21. Além disso, foi possível demonstrar a existência de um ambiente colaborativo, o Portal MarcOnt, o qual se apresenta como um espaço para a construção de descrições bibliográficas semânticas. Assim, o padrão de descrição bibliográfica semântica MarcOnt, oferece a possibilidade de garantir uma melhora na performance de interoperabilidade, não somente entre padrões de metadados, mas também entre sistemas e ambientes informacionais digitais. Palavras-chave: MarcOnt. MARC21. Web Semântica. Bibliotecas digitais. Representação da informação. Catalogação automatizada. Padrões de metadados. Informação e Tecnologia.

13 13 ABSTRACT The relevancy of not only the Web but also the digital libraries for the diverse branches of Science has stimulated researchers and scientific communities to search for integration solutions, interchange and semantic understanding about the contents that circulate in them. In the present scenary, a strong tendency is verified for the availability of digital contents and the lack of use of adequate patterns for the representation and description of those resources in digital environments, what is pointed by literature as a great concern for the scientific community and focused on this work as a problem of the research. In this context, the proposal of this research is to verify, in the scientific literature, the applicability and functionality of the technologies and instruments available as patterns of representation and description of content and form, in the ambit of digital libraries, with the objective of identifying and characterizing the use and the application of MarcOnt as a tool for the construction of forms of information representation for digital libraries at the present time, highlighting it as an instrument for describing the semantic aspects of the digital contents in these environments. As a methodology, the present work is characterized by being an exploratory and descriptive analysis of the subject, with which it is possible to obtain subsidies for a better and more detailed understanding and comprehension of MarcOnt and the technologies that are included in the ambit of digital libraries for the Semantic Web construction. As a result, it was attempted to demonstrate the application of the MarcOnt tool in a specific informational environment, the JeromeDL Semantic Digital Library, to analyze the fundamentals of Cataloguing the forms of representation of informational resources. That made us define the categories for the future analysis of the system comparing to the MARC21 metadata pattern. Besides, it was possible to demonstrate the existence of a cooperative environment, the MarcOnt Gateway, which presents itself as a space for the construction of semantic bibliographic descriptions. Therefore, the MarcOnt semantic bibliographic description pattern offers the possibility of assuring an improvement in the interoperability performance, not only among metadata patterns, but also among digital informational systems and environments. Keywords: MarcOnt. MARC21. Semantic Web. Digital libraries. Representation of information. Automatized cataloguing. Metadata patterns. Information and Technology.

14 14 LISTA DE ILUSTRAÇÕES FIGURA 1: Memex (Memory Extension)...33 FIGURA 2: Evolução das bibliotecas com a presença das TICs...45 FIGURA 3: Elementos básicos do acervo digital...60 FIGURA 4: Tipos de informação segundo o Modelo de referência Open Archival Information System (OAIS)...62 FIGURA 5: Entidades do Grupo 1 e Relações Bibliográficas Primárias...83 FIGURA 6: Estrutura do código RDA...86 FIGURA 7: Exemplo de registro bibliográfico em formato MARC21 comentado pelo autor FIGURA 8: Estrutura de um registro em formato MARCXML...93 FIGURA 9: Elementos contemplados no padrão de metadados Dublin Core...96 FIGURA 10: Estrutura de registro em formato Dublin Core...97 FIGURA 11: Estrutura de um registro no padrão de metadados BibTeX FIGURA 12: Exemplo de documento livro em XML FIGURA 13: Arquitetura RDF simples FIGURA 14: Declaração RDF utilizando a sintaxe XML FIGURA 15: Estrutura da arquitetura RDF Schema FIGURA 16: Arquitetura da Web Semântica proposta em 2005 comentada pelo autor FIGURA 17: Arquitetura de serviços de mediação MarcOnt FIGURA 18: Estrutura de representação em MarcOnt FIGURA 19: Regras para construção de descrição semântica de MARC21 para MarcOnt FIGURA 20: Estrutura básica do MarcOnt FIGURA 21: Arquitetura da Biblioteca Digital Semântica JeromeDL FIGURA 22: Interface de apresentação da Biblioteca Digital Semântica JeromeDL FIGURA 23: Formas de busca e tipos documentais FIGURA 24: Interface de busca avançada FIGURA 25: Interface de Busca semântica FIGURA 26: Recurso informacional Livro FIGURA 27: Formas de apresentação dos recursos informacionais FIGURA 28: Representação de um recurso informacional em MarcOnt FIGURA 29: Interface de entrada no Portal MarcOnt...150

15 15 FIGURA 30: Principais ferramentas para a construção de descrições semânticas FIGURA 31: Ambiente das regras gerais de transformação FIGURA 32: Criação de múltiplas descrições FIGURA 33: Apresentação do recurso em forma de tripla FIGURA 34: Submissão da criação da descrição do recurso ao comitê de avaliação FIGURA 35: Verificação das normas exigidas para construção da descrição FIGURA 36: Acesso aos recursos informacionais...155

16 16 LISTA DE SIGLAS AACR - Anglo-American cataloging rules AACR AACR3 - Anglo-American Cataloging Rules 3. ed ACL - Access Control List ALA - American Library Association ARPA - Advanced Research Projects Agency CALCO CAtalogação Legível por COmputador CBU - Controle Bibliográfico Universal CCSDS - Consultive Committee for Space Data Systems CDD - Classificação Decimal de Dewey CDNL - Conferência de Diretores das Bibliotecas Nacionais CDU - Classificação Decimal Universal COLIS - International Conference on Conceptions of Library and Information Science DC - Dublin Core DERI - Entreprise Research Institute DTD - Document Type Definition ELP - Extensible Library Protocol FID - Federação Internacional de Documentação FRBR - Functional Requirements of Bibliographic Records GUT - Gdańsk University of Technology HTML - Hypertext Markup Language HTTP - Hypertext Transfer Protocol IBBD - Instituto Brasileiro de Bibliografia e Documentação IBICT - Instituto Brasileiro de Informação Científica e Tecnológica IFLA - International Federation of Library Association and Institutions IIB - Instituto Internacional de Bibliografia IID Instituto Internacional de Documentação ISBD - International Standard Bibliographic Description LC - Library of Congress MARC - Machine Readable Cataloging MEMEX - Memory Extension METS - Metadata Encoding and Transmission Standard MIT - Massachussets Institute of Technology

17 17 OAI-PMH - Open Archives Initiative Protocol for Metadata Harvesting OAIS - Open Archival Information System OCLC - OnLine Computer Library Center OWL - Web Ontology Language RBU - Repertório Bibliográfico Universal RDA - Resource Description and Access RDF - Resource Description Framework RDFS - Resource Description Framework Schema RI - Repositórios Institucionais RIEC - Reunião Internacional de Especialistas em Catalogação RMI - Remote Method Invocation SGML - Standard Generalized Markup Language TICs - Tecnologias da Informação e Comunicação UFRJ Universidade Federal do Rio de Janeiro UNESP - Universidade Estadual Paulista Júlio de Mesquita Filho URI - Uniform Resource Identifier W3C - World Wide Web Consortium XHTML - extensible Hypertext Markup Language XML - Extensible Markup Language XSL - Extensible Stylesheet Language

18 18 SUMÁRIO 1 INTRODUÇÃO Definição do problema Proposição Objetivos Objetivo geral Objetivos específicos Metodologia Forma de análise dos resultados Justificativa UMA ABORDAGEM REVISITADA DAS TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO NO ÂMBITO DA CIÊNCIA DA INFORMAÇÃO BIBLIOTECAS DIGITAIS: GÊNESE E CONTEMPORANEIDADE Dimensão contextual acerca das Bibliotecas Digitais Pontuações sobre os Websites Paradigma da Preservação digital na perspectiva das Bibliotecas Digitais Modelo de Referência Open Archival Information System (OAIS) O papel dos metadados na preservação digital Elementos éticos no contexto das Bibliotecas Digitais FORMAS DE REPRESENTAÇÃO DA INFORMAÇÃO: UM DIÁLOGO INTERSUBJETIVO Representação da informação Breves considerações sobre os catálogos, as regras e os códigos de catalogação: marcos de formas de representação na perspectiva da Biblioteconomia e da Ciência da Informação Catalogação ou metadados... eis a questão : paradigmas e transformações no cenário atual Padrão de metadados MARC Padrão de metadados MARCXML Padrão de metadados Dublin Core...95

19 Padrão de metadados BibTeX XML (Extensible Markup Language) Arquitetura de metadados RDF RDF Schema Apontamentos sobre as formas de representação da informação MARCONT INITIATIVE: UMA PROPOSTA PARA A REPRESENTAÇÃO E A DESCRIÇÃO DE RECURSOS INFORMACIONAIS NA WEB Web Semântica: novos olhares para a representação e a descrição de recursos informacionais Descrição bibliográfica na era da Web Semântica Arquitetura MarcOnt Biblioteca Digital Semântica JeromeDL Formas de representação dos recursos informacionais na Biblioteca Digital Semântica JeromeDL Portal Colaborativo MarcOnt: um modelo de aplicação para recursos informacionais À guisa de resultados CONSIDERAÇÕES FINAIS REFERÊNCIAS BIBLIOGRAFIA CONSULTADA ANEXOS ANEXO A Regras de transformação entre os padrões de metadados...185

20 18 Capítulo 1 INTRODUÇÃO

21 19 1 INTRODUÇÃO Conhecimento é a capacidade de atuar num contexto (Karl-Erik Sveiby) Esta pesquisa insere-se na linha de pesquisa Informação e Tecnologia do Programa de Pós-Graduação em Ciência da Informação da Universidade Estadual Paulista Júlio de Mesquita Filho UNESP - campus de Marília. Tem como tema MarcOnt Initiative 1 no âmbito das bibliotecas digitais na era da Web Semântica, ferramenta tecnológica considerada um padrão de representação e de descrição da informação que contempla forma e conteúdo do recurso informacional, no âmbito das bibliotecas digitais. A pesquisa é integrante do projeto financiado pelo CNPq intitulado Da Catalogação ao uso de recursos informacionais digitais: questões sobre a interoperabilidade em ambientes informacionais, sob a coordenação da Dra. Plácida Leopoldina Ventura Amorim da Costa Santos, junto ao Grupo de Pesquisa Novas Tecnologias em Informação da UNESP/Marília e conta com o apoio financeiro da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES). Vivenciamos atualmente constantes mudanças nos mais variados segmentos de nossa sociedade, uma delas de cunho tecnológico, no contexto que conhecemos hoje por Sociedade da Informação. Percebe-se que nos últimos tempos houve um aumento desordenado e caótico na quantidade de informações produzidas e disponibilizadas em meio digital, requerendo uma mudança e um repensar nas formas de armazenamento, de representação, de descrição e de preservação dos recursos informacionais digitais. 1 As informações concernentes ao projeto MarcOnt Initiative 2005 MARCONT.org estão disponibilizadas no Portal MarcOnt. Disponível em: < Acesso em: 04 jan Vale destacar que os estudos referentes ao projeto MarcOnt Initiative contam com a parceria da National University of Ireland- Galway, Leopold Franzens University-Innsbruck, Gdansk University of Technology e Digital Enterprise Research Institute (DERI).

22 20 A Web atual, caracterizada como um espaço aberto e de fácil socialização do conhecimento vem enfrentando mudanças significativas em sua estrutura e na sua forma de representar e apresentar os recursos informacionais digitais, o que exige e pressupõe um novo olhar de diversos profissionais, especialmente os da área de Ciência da Informação e de Biblioteconomia que têm um papel sine qua non, enquanto agentes transformadores no século XXI. Nesse contexto, temos o papel das bibliotecas que atuam como segmentos na Internet e que passam a ser totalmente dependentes de tecnologias e precisam se adaptar às novas perspectivas tecnológicas na constituição de ambientes informacionais digitais e novos formatos de armazenamento, descrição e representação das informações. A relevância tanto da Web quanto das bibliotecas digitais para os diversos ramos da ciência tem impulsionado pesquisadores e comunidades científicas a buscar soluções de integração, intercâmbio e entendimento semântico sobre os conteúdos que nelas circulam, a fim de proporcionar uma recuperação mais precisa, relevante e significativa para o usuário final. 1.1 Definição do problema As bibliotecas digitais se caracterizam como ambientes facilitadores de acesso às informações, sem a limitação de espaço e tempo, uma vez que nessas o tratamento dado ao recurso informacional requer uma descrição de forma e de conteúdo legível por máquinas com resultados compreensíveis aos humanos. Desse modo, destaca-se a necessidade de um tratamento de forma e conteúdo adequado para a representação e para a apresentação de informações, visando uma recuperação mais eficiente. Verifica-se, no cenário atual, uma forte tendência para a disponibilização de conteúdos digitais e a falta de uso de padrões adequados para a representação e a descrição destes recursos em ambientes digitais, e que garanta a sua apresentação para o uso, a preservação e o reuso das informações para os usuários.

23 Proposição Na tentativa de encontrar caminhos para a solução do problema, Kruk, Decker e Zieborak (2005), apontam o MarcOnt Initiative, que apresenta instrumentos subjacentes à Web Semântica, tais como as ontologias e o uso de padrões de metadados, contemplando parâmetros que vão ao encontro dos objetivos das bibliotecas digitais e propiciam meios mais adequados de representar e organizar os recursos informacionais digitais, atrelados aos aspectos semânticos de seus conteúdos. Nesse contexto, a proposição desta pesquisa é verificar na literatura científica a aplicabilidade e a funcionalidade de tais tecnologias e instrumentos como padrões de representação e descrição de conteúdo e forma, no âmbito das bibliotecas digitais e no ambiente Web de um modo geral. 1.3 Objetivos A Ciência da Informação como uma área que tem como objeto de estudo a informação, desde a sua geração até o seu uso, pautada nos processos de representação, descrição, organização, acesso e recuperação de recursos informacionais, busca identificar algumas ferramentas para a construção de formas de representação de recursos em bibliotecas digitais. Nesse sentido, a presente pesquisa tem como objetivos: Objetivo geral De acordo com os novos cenários, tais como, Web Semântica, Web 2.0 etc. e caracterizados por novas perspectivas tecnológicas, a pesquisa tem como objetivos a identificação e o estudo de métodos e ferramentas tecnológicas disponíveis para a representação e a descrição de recursos informacionais bem como de seu conteúdo, no contexto das bibliotecas digitais e da Web, na tentativa de identificar o embasamento conceitual subjacente às ferramentas para a padronização da descrição dos aspectos de forma

24 22 e do conteúdo dos recursos informacionais nestas ambiências, na abordagem da Ciência da Informação Objetivos específicos Nesse sentido, os objetivos específicos elencados para uma abordagem mais aprofundada da pesquisa, são os seguintes: Identificar e caracterizar o MarcOnt Initiative, como um padrão de representação da informação (forma e conteúdo) em bibliotecas digitais e na Web na atualidade; Justificar a adoção da ferramenta MarcOnt como possibilidade de proporcionar a interoperabilidade semântica entre bibliotecas digitais e outros sistemas de informação. 1.4 Metodologia Na busca de um conhecimento teórico sobre as ferramentas tecnológicas disponíveis para a construção de formas de representação de recursos informacionais, no âmbito das bibliotecas digitais, o presente trabalho caracteriza-se por ser uma pesquisa de análise exploratória e descritiva do tema (CERVO; BERVIAN, 2003). Os estudos exploratórios, segundo Dencker e Viá (2001, p. 41), São investigações de pesquisa empírica que tem por finalidade formular ou esclarecer questões para desenvolver hipóteses. O estudo exploratório aumenta a familiaridade do pesquisador com o fenômeno ou com o ambiente que pretende investigar, servindo de base para uma pesquisa futura mais precisa. São também utilizados para esclarecer ou modificar conceitos. As descrições, nesse caso, tanto podem ser qualitativas quanto quantitativas. Os métodos de coleta de dados também podem variar da pesquisa bibliográfica e documental ao uso de questionário, entrevista ou observação.

25 23 Assim, no referencial teórico publicado sobre o tema, foi possível identificar elementos para responder aos principais objetivos estabelecidos neste trabalho. A adoção dessa metodologia permitiu abordar os aspectos envolvidos nos objetivos específicos definidos anteriormente e a proporcionar a compreensão e a concretização do objetivo geral proposto. O método de coleta de dados escolhido é a pesquisa bibliográfica e documental. Os procedimentos metodológicos podem ser assim delineados: Levantamento bibliográfico em níveis nacional e internacional, em fontes bibliográficas primárias (livros, periódicos, anais de congressos, teses e documentos eletrônicos da Internet, entre outros documentos congêneres), secundárias (Bases de dados textuais e referenciais como: Lisa, Scielo, Current Contents, Web Spirs, Periódicos Capes, Web of Science, entre outras) e terciárias (bibliografias, índices, catálogos coletivos, diretórios e outros) da área de Ciência da Informação. Seleção dos documentos, constantes nas referências e bibliografia consultada deste trabalho, a partir dos critérios de pertinência com relação aos assuntos principais desta pesquisa, com os termos: MarcOnt, MARC21, Web Semântica, Bibliotecas digitais, Representação da informação, Catalogação automatizada, Informação e Tecnologia nos idiomas português, inglês e espanhol, com período de publicação limitado aos últimos dez anos, apenas como abordagem inicial, não havendo limitação cronológica para referências citadas nos documentos selecionados. Leituras e documentação dos textos selecionados, que possibilitaram a criação de um referencial teórico com o qual será possível obter subsídios para um maior entendimento e compreensão mais detalhados do MarcOnt e as metodologias para a descrição de recursos informacionais, no âmbito das bibliotecas digitais na abordagem da Ciência da Informação.

26 Forma de análise dos resultados Para que os objetivos propostos pela pesquisa fossem alcançados, os resultados obtidos foram sistematizados sob os focos: 1. Identificação de categorias de análise para avaliação sistemática do MarcOnt. 2. Identificação e caracterização do MarcOnt Initiative no âmbito da Ciência da Informação, a fim de contextualizar o objeto de estudo da pesquisa e sua relevância e contribuição científica para a área; 3. Possibilidade de aplicação do MarcOnt Initiative, enquanto padrão de representação e de descrição (forma e conteúdo) na perspectiva das bibliotecas digitais e da Web. 1.5 Justificativa Um dos aspectos que motivaram o desenvolvimento da pesquisa foi a familiaridade do autor desde a pesquisa na graduação em Biblioteconomia no ano de 2002 no tema Catalogação Automatizada e formato de intercâmbio MARC21, o que impulsionou um estudo mais aprofundado sobre a temática aqui tratada. Em 2005, no curso de especialização Uso Estratégico das Tecnologias em Informação oferecido pela Universidade Estadual Paulista Júlio de Mesquita Filho UNESP/Marília, o autor se deparou com questões relacionadas às novas abordagens da representação e da descrição de recursos informacionais em ambientes informacionais digitais, tais como a Web Semântica e as Bibliotecas Digitais e os novos rumos da Catalogação aplicada a essas ambiências, culminando assim, na presente pesquisa. Partindo do princípio que cada vez mais informações são produzidas, principalmente no meio digital, tais ambientes passam requerer métodos mais adequados que possibilitem a representação e a organização de seus conteúdos de modo mais eficiente e preciso.

27 25 Há na comunidade científica várias pesquisas neste sentido, principalmente no âmbito das bibliotecas digitais, na tentativa de estabelecer formas mais eficazes de recuperação e comunicação entre estes ambientes. Tal cenário requer uma preocupação com a identificação e o desenvolvimento de normas e padrões para a representação das informações que facilitem a sua descrição e localização, e ainda que proporcionem a interoperabilidade entre os sistemas informacionais. Uma dessas iniciativas é o desenvolvimento do padrão MarcOnt que possui uma arquitetura baseada no modelo RDF (Resource Description Framework), proposta por Berners-Lee para a Web Semântica e com algumas aplicações preliminares em bibliotecas digitais semânticas específicas, tais como a JeromeDL, que será abordada posteriormente no capítulo 5. Ainda que amplamente discutido em nível internacional, como por exemplo, na Biblioteca Digital Semântica JeromeDL, na Polônia, no Brasil não existem relatos de discussão a respeito do MarcOnt Initiative, no processo de recuperação da informação e identificação do recurso informacional em ambientes digitais. Pensando nisso, acredita-se que esta seja uma pesquisa de relevância por contribuir para o desenvolvimento de referencial teórico e metodológico na disciplina de Catalogação da área de Biblioteconomia. A atualidade do assunto e sua repercussão na comunidade científica, atrelado ao desejo e a necessidade de uma investigação científica de forma mais aprofundada no tema MARC e formas de representação no âmbito das bibliotecas digitais na era da Web Semântica, também é levado em consideração. Verifica-se, preliminarmente, a falta de publicações do assunto em língua portuguesa, destacando dessa forma, a relevância da pesquisa por contribuir como uma fonte de informação bibliográfica; além disso, a relevância social na realização desta pesquisa está em fornecer subsídios teóricos para que profissionais da área de Ciência da Informação possam desenvolver métodos e técnicas mais eficazes de representação para a localização e a recuperação da informação em ambientes informacionais digitais.

28 26 Justifica-se seu desenvolvimento no que tange em acompanhar os avanços da área de Ciência da Informação sobre a temática abordada e a questão da padronização da representação e da descrição dos recursos informacionais e seus conteúdos em bibliotecas digitais e no ambiente Web. O presente capítulo compreende a Introdução e aborda questões iniciais, bem como o contexto que esta se insere, tais como o problema da pesquisa, a hipótese, a proposição, os objetivos (geral e específico), a metodologia, a justificativa, a relevância social, a relevância para a área de Ciência da Informação. As demais partes desta dissertação são: CAPÍTULO 2 - UMA ABORDAGEM REVISITADA DAS TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO NO ÂMBITO DA CIÊNCIA DA INFORMAÇÃO Nesse capítulo procura-se mostrar como as Tecnologias da Informação e Comunicação TICs vêem permeando os ambientes informacionais, desde o pensamento de alguns renomados autores da área da Ciência da Informação, dentre os quais, Paul Otlet e Vannevar Bush, e a preocupação da comunidade em criar ferramentas e metodologias para a padronização dos processos informacionais e o percurso do campo científico da Ciência da Informação, assim como as novas perspectivas tecnológicas apontadas pela literatura, tais como, Web Semântica, Web 2.0 etc. CAPÍTULO 3 BIBLIOTECAS DIGITAIS: GÊNESE E CONTEMPORANEIDADE Esse capítulo trata do surgimento das bibliotecas digitais até como estas se apresentam hodiernamente, apontando que estas se encontram como ambiências específicas e padronizadas e que podem auxiliar, com suas metodologias e tecnologias advindas da Biblioteconomia e da Ciência da Informação a construção e a efetivação da Web Semântica, no que diz respeito à descrição e à representação dos recursos informacionais, promovendo uma sinergia e a possibilidade de um trabalho colaborativo entre ambientes informacionais digitais.

29 27 CAPÍTULO 4 FORMAS DE REPRESENTAÇÃO DA INFORMAÇÃO: UM DIÁLOGO INTERSUBJETIVO Nesse capítulo destacou-se a necessidade de se criar e ter estruturas padronizadas para a construção de formas de representação da informação registrada, destacando que as metodologias da Biblioteconomia e da Ciência da Informação proporcionam e dão respaldo para qualquer tipo de representação do recurso informacional. Além disso, propõe-se a construção da forma de representação de um recurso informacional, destacando as novas perspectivas tecnológicas e as aspirações do cenário atual, tais como: Bibliotecas Digitais e Web Semântica, a fim de promover e possibilitar a interoperabilidade semântica entre ambientes informacionais digitais. CAPÍTULO 5 - MARCONT INITIATIVE: UMA PROPOSTA PARA A REPRESENTAÇÃO E A DESCRIÇÃO DE RECURSOS INFORMACIONAIS NA WEB Com o intuito de analisar e verificar as formas de representação e de descrição de recursos informacionais na Web, procurou-se destacar as tendências e os novos olhares para os ambientes informacionais digitais com os cenários conhecidos hoje, como Web Semântica, Web 2.0 etc. Nesse contexto, apontamos como umas das possíveis soluções para as questões de padronização dos recursos informacionais na rede, o desenvolvimento de um novo padrão de descrição semântica indicado pela literatura científica como MarcOnt Initiative. Além disso, mostramos os ambientes e o aparecimento das primeiras bibliotecas digitais semânticas, com destaque para a Biblioteca Digital Semântica JeromeDL, ambiência na qual procurou-se testar as potencialidades e as funcionalidades do padrão MarcOnt, no que diz respeito às questões de busca e de recuperação dos recursos informacionis no âmbito digital. CAPÍTULO 6 - CONSIDERAÇÕES FINAIS Esse capítulo apresenta os resultados, observações e reflexões acerca do padrão de descrição bibliográfica semântica MarcOnt, bem como os novos rumos da Catalogação e o impacto na evolução de ambientes informacionais digitais na perspectiva da Ciência da Informação. REFERÊNCIAS São apresentadas as referências que constituem e formam o corpus teórico dessa pesquisa.

30 28 Capítulo 2 Uma abordagem revisitada das Tecnologias da Informação e Comunicação no âmbito da Ciência da Informação

31 29 2 UMA ABORDAGEM REVISITADA DAS TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO NO ÂMBITO DA CIÊNCIA DA INFORMAÇÃO Nenhuma ciência goza do privilégio de uma imaculada concepção. Paul Ricouer Para se contextualizar a questão de pesquisa, torna-se importante afirmar que esta insere-se na linha de pesquisa Informação e Tecnologia do Programa de Pós-Graduação em Ciência da Informação da Universidade Estadual Paulista Júlio de Mesquita Filho UNESP - do campus de Marília. Neste sentido, por estar contemplada em tal linha, tornou-se relevante traçar um panorama sobre como as Tecnologias da Informação e Comunicação (TICs 2 ) foram se desenvolvendo ao longo dos tempos, atuando significamente no campo da Ciência da Informação enquanto instrumentos na facilitação dos processos informacionais. Serão revisitados os pensamentos de autores e conceitos que contribuíram com a emergência da Ciência da Informação. A Ciência da Informação tem como dos um dos seus principais precursores Paul Otlet, que contribuiu de forma marcante na evolução das práticas bibliotecárias e documentais. Ele desenvolveu uma nova classificação que foi considerada como o ponto de partida para o lançamento do Repertório Bibliográfico Universal (RBU), durante a Conferência Bibliográfica Internacional celebrada em Bruxelas em Em 1907, o termo documentação foi formulado por Otlet para expressar uma abordagem mais ampla à organização de fontes de conhecimento do que tradicionalmente associada ao termo bibliografia, ou seja, era considerada uma atividade complementar à educação e à pesquisa. Nesse sentido, Otlet destaca o que no seu entendimento, seriam as fontes da documentação: documentos escritos (livros, periódicos, jornais e manuscritos), as ilustrações (gravuras, desenhos, fotografias etc.), os ideogramas (mapas, plantas, quadros 2 Para este estudo adotaremos a sigla (TICs) para nos referirmos às Tecnologias da Informação e Comunicação.

32 30 sinópticos, diagramas etc.) e a música. (RAYWARD, 1997). Pode-se dizer que o entendimento de Otlet sobre documentação, bem como sua organização, como sendo um campo de estudo e pesquisa, pode ser traduzido em nosso termo de Ciência da Informação. Durante o período compreendido entre as duas grandes guerras mundiais, exatamente em 1924, foi reorganizado o Instituto Internacional de Bibliografia (IIB) que se constituiu na Federação de Organizações de Documentação. O IIB em suas finalidades foi criado com o intuito de criar ferramentas para registrar, de forma sistemática e padronizada, as referências dos documentos. As primeiras preocupações do IIB era a de desenvolver um sistema de classificação único, com o propósito de ser adotado por todos, na indexação dos documentos. Em 1925, Otlet desenvolve uma biblioteca portátil de microfichas, o que pode ser considerado como uma iniciativa da preocupação de armazenar o conhecimento em algum suporte informacional para posterior acesso e uso. Nesse contexto, surge a Classificação Decimal Universal (CDU) que possibilitava o tratamento temático de outros tipos de documentos além do livro e de outros produtos impressos. A CDU era um sistema de gerenciamento de banco de dados (entendidos nesse contexto, como arquivos impressos, classificados por título, autor e assunto) extremamente complexo, descrita no contexto de um sistema de armazenamento e recuperação de informação de hipertexto: um mecanismo de recuperação para acesso e gerenciamento efetivos de banco de dados. (RAYWARD, 1997). Segundo Otlet (1934) a criação e a organização de sistemas de acesso a banco de dados, precisava de uma tecnologia da informação especial, que foi denominada de tecnologia de ficha e arquivo, cujo padrão era de 3 X 5 para fins de uso bibliográfico. Ao separar o conteúdo de um livro de seu autor e de sua intenção autoral, Otlet imaginava que seria capaz de extrair sistematicamente dos livros tudo o que representasse uma nova contribuição para o conhecimento. Essas informações poderiam ser armazenadas em fichas, de modo que elas refletissem as afinidades envolvidas em cada assunto. Dessa forma, as fichas foram consideradas como instrumentos fundamentais para o sistema tecnológico idealizado por Otlet. (RAYWARD, 1997). Já em 1931 o antigo instituto passa a ser o IID Instituto Internacional de Documentação. O fato mais marcante desse período é a publicação do monumental Traité de Documentation de autoria de Otlet (1934), que expõe as noções relativas ao livro e ao documento, ao emprego separado dos elementos que constituem a documentação, além de

33 31 destacar o valor de vínculo necessário entre os homens e lembrar o fenômeno da explosão dos documentos. (ROBREDO, 2003). A necessidade de tornar acessível o enorme acúmulo de documentação gerada dia a dia foi sempre expressada por Otlet. Em 1935 a realização em Copenhague do 3º Congresso Internacional promovido pelo Instituto Internacional de Documentação foi muito significativa, principalmente pelas discussões sobre a tecnologia da informação, ou seja, a preocupação no desenvolvimento de instrumentos para representar de forma padronizada os documentos, na garantia do acesso mais efetivo às informações. Paul Otlet era um homem com imensa curiosidade em relação às inovações tecnológicas que pudessem ser úteis no processo documentário. Ele realizou diversas experimentações com a microfilmagem e previu um futuro promissor para uma invenção surgida na época: a televisão, além de antevir o desenvolvimento de diferentes equipamentos tecnológicos como o fax, os microcomputadores, o hipertexto. Otlet, de certa forma, sempre procurou meios para estabelecer o armazenamento e a padronização de informações, principalmente com o avanço do conhecimento tecnológico e o uso de dispositivos mecânicos que possibilitariam o acesso remoto às informações previamente armazenadas. Outra contribuição importante trata-se de Mooers (1951), que cunha o termo recuperação da informação numa perspectiva em que ela engloba os aspectos intelectuais da descrição de informações e suas especificidades para a busca, além de quaisquer sistemas, técnicas ou máquinas empregadas para o desempenho da operação. A recuperação da informação assumiu um papel decisivo no surgimento da Ciência da Informação, trazendo em seu bojo suas associações com a tecnologia da informação. (OLIVEIRA, 2005). A prática profissional é indissociável dos processos tecnológicos. Os anos de 1950 foram considerados um período significativo devido ao crescimento da informação científica, em diferentes formatos, sobretudo sob a forma de relatórios técnicos, e por um rápido desenvolvimento dos sistemas automáticos de armazenamento e de recuperação da informação, com especial destaque para recuperação por assunto. (ROBREDO, 2003). De meados ao final da década de 1960, a UNESCO em consonância com outros órgãos internacionais voltados para informação científica, discutem as bases da informação

34 32 científica voltadas para o desenvolvimento científico, tecnológico, econômico, social e cultural, como bem da humanidade, atrelada aos princípios da Federação Internacional de Documentação - FID. (GOMES; ZAHER, 1972). A documentação da FID era considerada, em seu sentido mais cooperativo, uma forma de garantir o intercâmbio bibliográfico internacional, ligado à concepção do conhecimento como bem da humanidade. O surgimento da documentação é confirmado, despertando um grande interesse pelas atividades de ciência e tecnologia, ocasionando o fenômeno da explosão da informação, caracterizado por um crescimento exponencial de registros de conhecimento. Estudos sobre a evolução da Ciência da Informação e sobre a diversidade considerável de profissionais da informação, bem como a atividade técnico-profissional são realizados. A necessidade de encontrar uma forma de organizar a gama de informações geradas durante a Segunda Guerra, foi expressa por Vannevar Bush em Após a Segunda Guerra, define-se o problema do gerenciamento da informação e é proposta uma máquina, denominada Memex (Memory Extension), que agregava as mais modernas tecnologias da informação existentes na época. O Memex pode ser comparado ao princípio de funcionamento de um computador conectado a Internet com a finalidade de contribuir para a criação e a distribuição do conhecimento adquirido em pesquisas, facilitando o compartilhamento e a busca de informações. Pode-se de acordo com a figura 1, visualizar o que seria o Memex.

35 33 FIGURA 1: Memex (Memory Extension) Fonte: Disponível em: < Acesso em: 23 mar O funcionamento do Memex pode ser assim representado: Estoque: multimídia de documentos, abrangendo ao mesmo tempo imagens, sons e textos; Dispositivos periféricos: facilitariam a integração rápida de novas informações, outros permitiriam transformar automaticamente a palavra em texto escrito; Miniaturização desta massa de documentos: microfilme e fita magnética, que acabavam de ser descobertos naquela época. Tudo isso deveria caber em um ou dois metros cúbicos, o equivalente ao volume de um móvel de escritório; Acesso às informações seria feito através de uma tela de televisão munida de altofalantes. Além dos acessos clássicos por indexação, um comando simples permitiria criar ligações independentes de qualquer classificação hierárquica entre uma dada informação e outra; Manipulação: estabelecida a conexão, cada vez que determinado item fosse visualizado, todos os outros que tivessem sido ligados a ele poderiam ser instantaneamente recuperados, através de um simples toque em botões e alavancas. (TÁLAMO, 2006).

36 34 O Memex pode ser considerado em suas funções como um dispositivo mecânico de classificação e seleção por associação, paralelo ao princípio da indexação clássica, ou seja, uma máquina considerada visionária para auxiliar a memória e guardar conhecimentos. O Memex nunca foi construído, mas as idéias que inspiraram sua idealização ainda fazem parte das aspirações de pesquisadores e cientistas da atualidade. (TÁLAMO, 2006). Vale destacar que enfrentamos hoje, talvez em maior escala, os mesmos problemas apontados por Otlet e Bush, buscando-se nas tecnologias da informação e comunicação a solução de tais problemas. A criação de novas tecnologias para tratamento e recuperação da informação, tais como os cartões perfurados para a recuperação da informação por assunto, foi largamente acelerada em agências de inteligência governamentais, sendo transpostos para os serviços de documentação científica e tecnológica no pós-guerra. (SHERA; CLEVELAND, 1977). Em 1960, foi utilizado o termo hipertexto cunhando por Theodore Nelson considerado discípulo de Bush, na tentativa de exprimir a idéia de leitura/escrita não linear em um sistema de informática. Nelson vislumbrava uma imensa rede de informações que pudessem ser acessíveis em tempo real pelos usuários num processo interativo utilizando-se de todos os recursos disponíveis em diferentes mídias (texto, imagem, som etc.). O que diferencia o conceito de hipertexto das outras formas de armazenamento eletrônico da informação é a estrutura associativa que reproduz, muito de perto, a estrutura da memória humana e pode tornar-se seu complemento íntimo e ampliado. Permite substituir as estruturas clássicas arborescentes da informação por estruturas mais ricas e mais complexas, organizadas em redes, mostrando um número infinito de caminhos, abertos a todas as navegações e interligando múltiplos objetos. (LE-COADIC, 2004, p ). A partir da década de 1960 começa a surgir o que conhecemos hoje como Internet, uma tecnologia que causou impactos sociais, pois trouxe assuntos relativos, que alteraram o modo de vida dos indivíduos e da sociedade, como: democratização da informação, globalização, sociedade da informação, velocidade de disseminação da informação, novo papel do bibliotecário e do profissional da informação, entre outros. A Internet nasce com iniciativa do Departamento de Defesa dos Estados Unidos ARPA (Advanced Research Projects Agency) - como estratégia militar. Seu grande objetivo era

37 35 [...] projetar um sistema de comunicação invulnerável a ataque nuclear. Com base na tecnologia de comunicação por comutação de pacotes, o sistema tornou a rede independente de centros de comando e controle, de modo que as unidades de mensagens encontrariam suas rotas ao longo da rede, sendo remontadas com sentido coerente em qualquer ponto dela. (CASTELLS, 2000, p. 375). A Internet é uma rede que, em uma visão simples, pode ser vista como sistemas que se apresentam como um conjunto de partes interagentes e interdependentes que formam um todo unitário, com determinado objetivo e efetuam determinada função. Possui como elementos principais a conectividade e a coerência. Suas principais características são: transmissão de informações na forma eletrônica com velocidade e confiabilidade; dependência aos seus usuários; crescimento dos servidores; popularização das homepages pessoais; interesses econômicos; e atividades de lazer. (ROBREDO, 2003). A Internet tem contribuído na construção da maneira de ver e de processar a informação, visto que a informação em tempo real tem ganhado espaço não só na rede, mas também em outros meios de informação e comunicação. A moderna tecnologia da informação baseada em computador e nas telecomunicações reduziu o impacto dos problemas nos serviços atuais de banco de dados bibliográficos e textuais. Notadamente caracterizada como a era da difusão do computador, transformando o processamento e armazenamento de dados centralizados em um sistema compartilhado e interativo de computadores em rede, tal fato ocasionou mudanças nas interações sociais e organizacionais onde tempo e espaço são regidos pela velocidade, ou seja, do imediatismo das informações estabelecidas nos processos de comunicação. A idéia elementar de rede é bem simples e antecede a utilização efetiva das tecnologias de informática. Trata-se de uma articulação entre diversas unidades que, através de certas ligações, trocam elementos entre si, fortalecendo-se reciprocamente, e podem se multiplicar em novas unidades, as quais, por sua vez, fortalecem todo o conjunto à medida que são fortalecidas por ele, permitindo-lhe expandir-se em novas unidades ou manter o equilíbrio sustentável. Cada nó na rede representa uma unidade, e cada fio um canal por onde essas unidades se articulam através de diversos fluxos. (SANTOS, 2002, p. 104). Além da grande quantidade de informação, a morosidade em um processo de recuperação de informação se torna preocupante; em meados da década de 1960 foi gerado um modelo, ou seja, um dispositivo que pudesse representar as informações armazenadas pelo computador e interpretadas por sistemas inteligentes. Este princípio se baseia na organização

38 36 prévia das informações, criando meios de acesso para agilizar o fornecimento ou indicação de respostas. Esse modelo, tradicionalmente utilizado por bibliotecas e centros de documentação, tem como princípio fundamental a geração de respostas antes de receber os estímulos. Esse processo consiste na geração de meios de respostas (classificação da informação e geração de catálogos ou índices) com base na previsão das perguntas mais freqüentes a que o sistema estará sujeito. (ROBREDO, 2003). A comprovada capacidade do computador na simulação dos mecanismos mentais de processamento de informações foram fatores que levaram a um novo modelo de sistema. Para a alimentação desse novo sistema, não se requer o processamento prévio das informações. As rotinas de comparação, associação, classificação, ordenação e geração de meios, obrigatórias na fase de alimentação do sistema tradicional deixam de existir como rotinas de alimentação do sistema artificial, dando lugar à rotina de descrição da informação a ser referenciada ou armazenada (metadados 3 ). Essa rotina consiste no fornecimento de dados que representem fielmente a informação, permitindo ao computador interpretá-los, processá-los e fornecê-los de acordo com os parâmetros impostos na pergunta pelo usuário. (ROBREDO, 2003). Fundamentados no modelo tradicional de processamento de informação e com os novos recursos tecnológicos advindos com o computador, surgiram técnicas até então inaplicáveis sem os recursos da informática. O computador, com suas qualidades comprovadas na simulação de processos, gradativamente foi sendo alvo de atenção daqueles encarregados dos serviços de tratamento de informações. Sua grande capacidade em executar tarefas repetitivas, exigidas pelos sistemas tradicionais de processamento, desviou a atenção de alguns quanto a sua capacidade no processamento de informações. A elaboração de catálogos classificados, índices numéricos ou alfabéticos, controles estatísticos e controles burocráticos foi o grande alvo de aplicação da máquina. (OLIVEIRA, 1998). Já em 1961 e 1962 surge a primeira formulação do que seria a Ciência da Informação nas conferências do Geórgia Institute of Technology. Uma das definições clássicas, de acordo com a literatura científica é a de Borko (1968), que define Ciência da Informação: ciência interdisciplinar que estuda as propriedades e o comportamento da informação, as forças que 3 Os metadados serão tratados de forma específica no capítulo 4.

39 37 dirigem o fluxo e o uso da informação e as técnicas, tanto manuais quanto mecânicas de processar a informação visando sua armazenagem, recuperação e disseminação. Ampliando tal definição e aplicando-se nos dias atuais, e com base nos autores Shera e Cleveland (1977), Robredo (2003, p. 55) apresenta a Ciência da Informação nos seguintes termos: Ciência da Informação é a que investiga as propriedades e comportamento da informação, as forças que regem o fluxo da informação e os meios de processamento da informação para um máximo de acessibilidade e uso. O processo inclui a origem, disseminação, coleta, organização, armazenamento, recuperação, interpretação e uso da informação. O campo deriva ou relaciona-se com a matemática, a lógica, a lingüística, a psicologia, a tecnologia computacional, as operações de pesquisa, as artes gráficas, as comunicações, a biblioteconomia, a gestão e alguns outros campos. Capurro (2003), no que tange às origens históricas da Ciência da Informação, descreve-a como um campo que possui duas raízes: a primeira está relacionada à Biblioteconomia clássica, mais especificamente ao estudo dos problemas referentes com a transmissão de mensagens, enquanto a segunda está atrelada à computação digital. Em 1966, discutem-se os aspectos profissionais da ciência e tecnologia da informação e no mesmo ano Ingwersen (1992) publica um artigo intitulado Perspectivas cognitivas da interação na recuperação da informação: elementos de uma teoria cognitiva da recuperação da informação, no qual enfatiza a importância do estudo do comportamento humano no processo de recuperação da informação. Nesse momento é pertinente destacar a preocupação da comunidade científica nos tempos hodiernos em estudos voltados principalmente para a usabilidade e a acessibilidade de recursos informacionais, notadamente em ambientes informacionais digitais, retomando as perspectivas cognitivas de Ingwersen (1992), Popper (1974), Borlund (2000), Buckland (1991), Brookes (1977), Maturana e Varela (1980), Saracevic (1995), Hjørland (2002), Capurro e Hjørland (2007), destacando não somente o uso de tecnologias, mas também o usuário (sujeitos cognoscentes) enquanto protagonista na participação efetiva dos sistemas de recuperação da informação.

40 38 As novas tecnologias da informação difundiram-se de maneira global em menos de duas décadas, entre meados dos anos de 1970 e 1990, por meio de uma lógica que é caracterizada pela aplicação imediata no próprio desenvolvimento da tecnologia gerada, conectando o mundo através da tecnologia da informação. [...] esse período de transformações tecnológicas em aceleração marca uma descontinuidade histórica irreversível na base material da espécie humana. O repentino aumento de aplicações tecnológicas transformou os processos de produção e distribuição, criou uma grande quantidade de novos produtos e mudou de maneira decisiva a localização das riquezas e do poder no mundo, que ficou ao alcance dos países e elites capazes de comandar esse sistema tecnológico. (CASTELLS, 2000, p. 53) elucida que, Le Coadic (2004, p. 84, grifo nosso) ao se reportar às tecnologias da informação, Se as técnicas de informação são conjuntos de processos metódicos, baseados ou não em conhecimentos científicos, empregados na produção, tratamento, comunicação, uso e armazenamento de informações, a tecnologia da informação é, se nela reconhecemos uma dignidade científica, o estudo científico dessas técnicas. Mais prosaicamente, ela tem por objetivo a concepção de produtos, sistemas e serviços que permitem a construção, comunicação, armazenamento e uso da informação. Na década de 1970 as novas tecnologias da informação difundiram-se amplamente, acelerando seu desenvolvimento sinérgico e convergindo em um novo paradigma. A microeletrônica mudou tudo isso, causando uma revolução dentro da revolução, principalmente com o microprocessador e uso de chips. (CASTELLS, 2000). Em suma, o paradigma da tecnologia da informação não evolui para seu fechamento como um sistema, mas rumo à abertura como uma rede de acessos múltiplos. De acordo com Le Coadic (2004, p. 20) [...] o surgimento das tecnologias eletrônicas (analógicas ou digitais) e fotônicas da informação (microcomputadores, telas de monitor sensíveis ao toque, discos laser, fibras ópticas, dispositivos de multimídia, videodiscos, programas de gerenciamento de acervos etc.) ocasionaram transformações nas unidades de informação 4 deixando de ser depósitos para se tornarem centros de informação. Nessa perspectiva é possível evidenciar o impacto das tecnologias, em especial as TICs na transformação das unidades de informação e no surgimento da Ciência da Informação 4 Para este estudo a terminologia Unidades de Informação refere-se à biblioteca.

41 39 alicerçada nas tecnologias de processamento de dados e nas técnicas de controle da informação. Na década de 1990, Hawkins (2001) sugere a conservação do termo information retrieval e observa a tendência para associar library a information science, retratando os serviços bibliográficos, departamentos das universidades e também de alguns títulos de publicações. Numa abordagem mais contemporânea e outro marco para a Ciência da Informação é Saracevic (1995), ao afirmar que a Ciência da Informação é interdisciplinar por natureza, estando relacionada com a tecnologia da informação, possuindo forte dimensão social e humana. O autor ainda afirma que a Ciência da Informação tem se desenvolvido a partir de três idéias principais: recuperação da informação, relevância e interação. Ele ainda recomenda três áreas emergentes para serem incluídas no atual conceito de Ciência da Informação: estudos de interação, recuperação da informação multimídia e multilíngua, bibliotecas virtuais e buscas na Internet. Wersing (1993) destaca que a Ciência da Informação não pode ser vista como uma disciplina clássica, mas como um protótipo de um novo tipo de ciência, que nesse contexto, rompe com as percepções tradicionais sobre o conhecimento, sobre o prisma de que tal disciplina visa apenas o estudo da constituição de sistemas de informação. Em 1991, foi realizada a Primeira International Conference on Conceptions of Library and Information Science CoLIS 1 e buscaram-se reflexões sobre o conceito de Ciência da Informação. Saracevic (1995) estabeleceu a diferença entre a Biblioteconomia ao dizer que esta possui atribuições mais culturais e tecnicistas nos ambientes de bibliotecas, enquanto a Ciência da Informação possui uma natureza tecnológica. No Brasil, a partir da década de 1970 inicia-se um processo de transformações no âmbito do Instituto Brasileiro de Bibliografia e Documentação (IBBD) que em 1976 se transforma em Instituto Brasileiro de Informação Científica e Tecnológica (IBICT). Em 1970 nascia o Curso de Mestrado em Ciência da Informação, em convênio do IBBD com a UFRJ Universidade Federal do Rio de Janeiro, com uma forte orientação para a formação dos

42 40 profissionais da informação, privilegiando as atividades de informação e documentação científica e o uso das emergentes tecnologias da informação. (ROBREDO, 2003). A Ciência da Informação em sua gênese assume um papel importante na resolução de problemas que podem ser elencados como: reunir, organizar e tornar acessível o conhecimento cultural, científico e tecnológico produzido em todo o mundo, que podem também ser contemplados na Documentação e na Recuperação da Informação. Numa visão mais sucinta, desde a época de Otlet (1934) havia uma preocupação na recuperação da informação com o apoio de tecnologias, principalmente com relação ao armazenamento e tratamento informacional; em seguida houve a preocupação de tecnologias para apoiar as práticas profissionais que estavam sendo desenvolvidas. Posteriormente, com a iniciativa de Bush (1945), surge a idéia de desenvolver uma máquina, o Memex, para auxiliar no processamento da informação. Na década de 1960 é cunhando o termo hipertexto por Nelson e também o surgimento da Internet, que impactou decisivamente a forma de tratamento da informação. Nessa mesma década, o conceito do que pode ser Ciência da Informação é definido, e nesse conceito está claramente identificada a relação da tecnologia com a área. Em 1966, Ingwersen (1992) constrói um artigo falando sobre os sujeitos cognoscentes e formas de interação com os sistemas informacionais numa perspectiva sobre a recuperação das informações. Mais recentemente, Saracevic (1995), destaca a tecnologia da informação como fator fundamental na área e apresenta três áreas emergentes, ao mencionar que a Ciência da Informação é interdisciplinar por natureza, estando relacionadas com estudos de interação, recuperação da informação de diversos tipos de conteúdos e estratégias e ferramentas de buscas em ambientes de informação digital. A partir desse contexto, pode-se constatar que desde os instrumentos e ferramentas vislumbradas por Otlet (1934), há uma presença marcante da tecnologia da informação e comunicação durante a evolução da Ciência da Informação, bem como o investimento no desenvolvimento e estudo das mesmas, visando aos benefícios que as tecnologias podem proporcionar à sociedade de um modo geral e em especial aos profissionais da informação.

43 41 Santos (2002, p. 107; 114) afirma que As tecnologias são instrumentos de infinitas possibilidades, que precisam ser explorados na formação do profissional da informação de maneira a gerar condições de uso estratégico, especialmente na prática não-discursiva de atuação desse profissional [...]. Todavia, as tecnologias não são nada além de um recurso instrumental à disposição dos sujeitos institucionais, e para utilizar estrategicamente a plenitude de sua capacidade devem-se conhecer suas potencialidades e seus limites. Atualmente, é possível notar com os avanços tecnológicos, mudanças significativas nos modelos de tratamento documentário e o desenvolvimento de ferramentas que possibilitam formas mais eficazes de interação e colaboração dos sujeitos/usuários com os novos ambientes informacionais digitais. Podemos destacar dentre esses avanços, o que a literatura aponta como Web Semântica, proposta por Berners-Lee (2001), que tem em seus objetivos, embutir um maior nível semântico nos conteúdos informacionais, de modo a permitir que as informações possam ser interpretadas de forma inteligente, pelos agentes de software e que será tratada detalhadamente, no capítulo 5. Além disso, destaca-se também, o paradigma da Web 2.0, criada por Tim O Reilly (2005), considerada como a próxima geração da World Wide Web. Trata-se, portanto, da construção de ambientes colaborativos, interativos e de compartilhamento de recursos informacionais, com a participação mais efetiva da comunidade (usuários). É preciso um olhar da Ciência da Informação, bem como dos profissionais envolvidos nos processos informacionais, da transposição para o novo, ou seja, têm-se novas ambiências e recursos disponíveis que precisam ser analisados e revisitados constantemente, a fim de propiciar o uso e o reuso estratégico das informações e suas potencialidades. Podemos encontrar na Ciência da Informação, respaldo indispensável, no que tange à representação (forma e conteúdo) e à descrição dos recursos informacionais na potencialização dos ambientes informacionais. Ao nos reportarmos às abordagens epistemológicas da área, a literatura disponível aponta que a Ciência da Informação, enquanto campo específico e disciplina do campo das Ciências Sociais Aplicadas carece de construção conceitual, ou seja, não tem uma base epistemológica bem delineada, constituindo-se, portanto, de um campo ou disciplina em

44 42 desenvolvimento/constituição, que utiliza aportes teóricos e metodológicos de outros campos científicos em busca de cientificidade. Pinheiro (1997, p. 6) reforça que Mesmo os teóricos da área reconhecem a ausência de um sólido terreno teórico, essência do estágio científico de qualquer área, na visão tradicionalista. Este parece ser um problema não exclusivo da Ciência da Informação, mas de campos do conhecimento mais recentes, surgidos no limiar dos anos 50 e 60 e que marcam a era da sociedade da informação. Podemos dizer, nessa perspectiva, que a Ciência da Informação atua como adjuvante da Sociedade da Informação, enquanto um campo disciplinar constituído de interfaces que trabalha com problemas informacionais usando a interdisciplinaridade para resolvê-los. Assim, uma disciplina científica que pretenda alcançar o status de ciência, como é o caso da Ciência da Informação, classificada na área de ciências sociais aplicadas, necessita tanto de teorias quanto de práticas. (ANDRADE; OLIVEIRA, 2005, p. 45). O desenvolvimento tecnológico, principalmente com o impacto dos computadores e das telecomunicações no gerenciamento da informação, deu-se de tal forma, que podemos apontar hoje, que a Ciência da Informação atrelada às tecnologias da informação e comunicação é tema de estudos, pesquisas e discussões acerca do percurso do campo científico, o que vem sendo discutido em âmbito mundial. Nesse sentido, faz-se necessário o entendimento das tecnologias da informação e comunicação para saber como usá-las estrategicamente como instrumentos pautados em processos, metodologias que atuam e norteiam o fazer profissional de qualquer área, em especial, dos profissionais da Ciência da Informação, levando em consideração o contexto sócio-cultural, que determinará o uso efetivo das tecnologias em diferentes ambiências informacionais na potencialização dos processos relacionados à geração, à transferência, à utilização e à preservação da informação e de documentos. O campo da Biblioteconomia e da Ciência da Informação já detém um corpo de conhecimento e ferramentas para se trabalhar com o conteúdo dos documentos visando sua recuperação. Verificou-se que as tecnologias usadas de Otlet (1934), passando por Bush (1945) e Nelson (1960) sempre buscaram gerenciar conceitos, assuntos dispersos nos

45 43 documentos, de forma a possibilitar a recuperação de partes de documentos dos mais variados tipos e suportes. Portanto, pode-se considerar que as tecnologias da informação e comunicação, vêm permeando e potencializando o âmbito informacional. Assim, pode-se dizer que as TICs possibilitam os ensaios idealizados por Otlet (1934) e por Bush (1945) de forma mais efetiva, principalmente no que tange à construção de formas de representação da informação para sua identificação, localização e uso, e sua aplicação em ambiências específicas, tais como as bibliotecas digitais, que serão objeto de análise do próximo capítulo.

46 44 Capítulo 3 Bibliotecas digitais: gênese e contemporaneidade

47 45 3 BIBLIOTECAS DIGITAIS: GÊNESE E CONTEMPORANEIDADE Às bibliotecas está reservado o papel de repensar suas atividades e funções, adaptando-se aos novos modelos organizacionais e extraindo das tecnologias disponíveis o substrato para a melhoria na prestação de serviços e na utilização eficaz de informações. Luiz Atílio Vicentini Dando continuidade aos assuntos tratados no capítulo anterior, antes de embarcarmos ao universo da pesquisa propriamente dito, procura-se contextualizar a evolução das bibliotecas com os avanços tecnológicos, caracterizado principalmente pela presença marcante das Tecnologias da Informação e Comunicação nos variados estágios desse processo evolutivo. Vale frisar que esta pesquisa tem como ponto focal as bibliotecas digitais, que estão sendo apontadas de acordo com a figura 2, a seguir. FIGURA 2: Evolução das bibliotecas com a presença das TICs. Fonte: Cunha (2000, p. 75)

48 46 De acordo com Cunha (2000), tal como apresenta a figura 2, podemos verificar que a biblioteca passou e continua passando por uma série de transformações à medida que são desenvolvidas novas tecnologias visando a agilização dos processos informacionais em cada momento. Era I - compreendida como Biblioteca Tradicional moderna - têm-se as bibliotecas caracterizadas por seu espaço físico bem delimitado, cujo acervo é constituído por documentos em papel. Era II compreendida como Biblioteca Automatizada caracterizada pela utilização dos computadores nos processos e serviços da biblioteca, por exemplo, organização do acervo, catalogação, indexação etc. Era III compreendida como Biblioteca Eletrônica caracterizada pela formação de bancos de dados eletrônicos, cujo acesso era realizado via rede de computadores de forma on-line. Era IV compreendida como Biblioteca Digital e Virtual o Biblioteca Digital formada por documentos em formato digital, com acesso via rede de computadores. o Biblioteca Virtual formada por um conjunto de bibliotecas digitais. Destacase ainda, nesse caso, a Biblioteca Virtual com realidade virtual. Nosso interesse de pesquisa está voltado principalmente para as questões de representação e de descrição dos recursos informacionais no âmbito das bibliotecas digitais, o que tem se tornado alvo de investigação e estudos pela comunidade científica atualmente. Para melhor compreendermos o desenvolvimento das bibliotecas digitais, vejamos sua dimensão contextual a fim de subsidiar uma discussão de forma mais aprofundada sobre a forma em que elas são apresentadas contemporaneamente. 3.1 Dimensão contextual acerca das Bibliotecas Digitais Bem antes do desenvolvimento da imprensa de Gutenberg, o homem procura de alguma forma armazenar o conhecimento registrado em algum suporte informacional a fim de

49 47 assegurar a guarda e a memória de sua história. Pode-se verificar essa evolução, desde as bibliotecas da Antiguidade, com os tabletes de argila, o papiro, o pergaminho, até o papel, destacando que cada período é marcado por características próprias determinadas pelas tecnologias vigentes em cada época. Como ponto de partida, temos num primeiro momento o estabelecimento das bibliotecas convencionais ou tradicionais caracterizadas por seus espaços físicos bem delimitados, com suas coleções, bem como seus catálogos em suporte papel para registro das informações. O objetivo principal, a razão de ser das bibliotecas, consiste no atendimento às demandas do público quanto aos registros do conhecimento, ou seja, quanto ao conteúdo dos itens, suportes físicos do conhecimento. (MEY, 1995, p. 1). As bibliotecas tradicionais têm em suas funções o tratamento, o armazenamento, a disseminação e a disponibilização dos seus documentos de forma convencional, independendo de seu suporte físico que é apresentado, caracterizadas como espaços de preservação do conhecimento acumulados pela humanidade. Segundo Houaiss, Villar e Franco (2001, p. 58) a biblioteca seria uma coleção de livros; um lugar [espaço] que guarda, cataloga e empresta livros e outros impressos ao público. A biblioteca, inicialmente considerada como um depósito de livros com o objetivo apenas de preservação dos documentos (MATOS, 2003), com o passar do tempo teve sua função transformada de simples guardiã do conhecimento para assumir um papel social e cultural mais amplo como ponto de acesso à socialização do conhecimento da humanidade. Para Almeida Júnior (2004, p. 2), [...] a biblioteca também foi e continua sendo vista como dissociada dos interesses da maioria da sociedade; como um equipamento cultural que contribui para a perpetuação de uma estrutura em que o saber é ferramenta para ampliação das desigualdades; como uma instituição cujas ações reforçam e ampliam o fosso entre os que possuem e os que não possuem informação. É possível verificar que desde a época de Otlet (1934), conforme apontado no capítulo 2, o homem tem em suas preocupações a necessidade de armazenar e padronizar as informações em um espaço para sua socialização e efetivo uso. No caso das bibliotecas tradicionais, estas concentravam as informações em um espaço físico para servir a uma

50 48 diversidade de usuários que restringiam-se apenas às comunidades que conseguiam acessá-la localmente. Uma característica marcante na evolução das bibliotecas é a utilização de catálogos em fichas, abandonando os catálogos que eram em forma de livros, ponto este centrado no início do processo de automação em bibliotecas. Com o surgimento da tecnologia do computador, os serviços das bibliotecas (catalogação, classificação, indexação) e a própria organização do acervo, começam ser realizados de forma automatizada, proporcionando o acesso on-line aos bancos de dados através de redes de telecomunicações e a dinamização dos processos de disseminação e recuperação das informações. Para alavancar ainda mais os processos informacionais, com a chegada da Internet, tem-se um novo espaço além do físico o ciberespaço, onde neste tipo de ambiência, encontram-se textos na íntegra, disponíveis de forma on-line, ampliando as possibilidades de acesso aos conteúdos informacionais na facilitação ao usuário final. Para Lévy (1999, p. 92, 107) o ciberespaço pode ser definido como, [...] o espaço de comunicação aberto pela interconexão mundial de computadores e das memórias de computadores. [...] Esse novo meio tem a vocação de colocar em sinergia e interfacear todos os dispositivos de criação de informação [...] pesquisas sobre as interfaces de navegação são orientadas, direta ou indiretamente, pela perspectiva última de transformar o ciberespaço em um único mundo virtual, imenso, infinitamente variado e perpetuamente mutante. O uso efetivo das tecnologias da informação e a associação dos computadores às tecnologias da comunicação culminaram no aumento exponencial das facilidades com relação ao fluxo e ao acesso aos recursos informacionais potencializando a conectividade entre os sujeitos e viabilizando a amplitude da disseminação das informações. Como apresentado no capítulo anterior, as bibliotecas, em diferentes épocas, sempre foram dependentes das TICs acompanhando dessa forma, o desenvolvimento de paradigmas tecnológicos. Desde a iniciativa de Bush em 1945 com a criação do Memex, é possível

51 49 observar o trabalho árduo de diferenciados profissionais no estabelecimento de mecanismos que pudessem agilizar as tradicionais rotinas de tratamento das informações a fim de garantir a integridade e recuperação das mesmas. A evolução das bibliotecas tem merecido grande destaque ao longo destes anos, no que se refere ao desenvolvimento e uso de tecnologias, principalmente as da informação e comunicação (TICs) que se potencializam por meio dos novos recursos de acesso e formatos de intercâmbio advindos principalmente da área de Biblioteconomia no tratamento de informações bibliográficas e catalográficas. A história das bibliotecas digitais está intimamente ligada à realidade dos últimos anos do século XX: o uso corrente das tecnologias da informação e comunicação, permitiram a ampliação da produção de informações em formato digital e o êxito social das redes de comunicação, impulsionaram o intercâmbio de informações em diferentes formatos. Pode-se considerar que a diferença entre a biblioteca tradicional e a biblioteca digital está na potencialização do suporte eletrônico que, por meio dos avanços tecnológicos amplia as possibilidades de tratamento, acesso e recuperação dos recursos informacionais. Vale ressaltar, que a temática bibliotecas digitais têm sido alvo de estudo e pesquisa de muitas comunidades científicas, principalmente por profissionais da Ciência da Informação onde muitos, numa perspectiva futurista a denominam de Biblioteca Universal que vislumbra ser aquela que, por meio de redes de computadores, em diferentes suportes, garantirá o acesso livre aos conteúdos informacionais permitindo a recuperação. Para tanto são oferecidos vários congressos, simpósios e seminários em níveis nacional e internacional onde os profissionais da área procuram discutir e sanar problemas relativos ao tema, na tentativa de identificar conceitos, teorias, instrumentos tecnológicos e metodologias que permitam ser aplicados a esta ambiência digital, na melhoria dos processos informacionais abarcados pelas bibliotecas digitais. Uma variedade de estudos para a definição de bibliotecas digitais está disponível, alguns centrados nos objetivos que as bibliotecas digitais devem contemplar, outros voltados para o conteúdo informacional, no sentido de que tipo de informação deve ser armazenado e disponível e outros direcionados ao público que estas devem servir. Nesse sentido, procura-se mostrar alguns conceitos relativos às bibliotecas digitais, abarcados pela literatura científica, a

52 50 fim de subsidiar uma discussão mais acurada do universo da pesquisa. Para tanto, estabelecese um recorte dos últimos dez anos, resgatando através dos tempos e propondo a ampliação do conceito de biblioteca digital no cenário atual. Segundo Borgman (1996, p. 6, tradução nossa), Bibliotecas digitais são um conjunto de fontes eletrônicas e serviços técnicos associados para a criação, pesquisa e uso da informação, que possibilitam uma extensão e um aumento do armazenamento da informação e dos sistemas de recuperação de informação, manipulando dados digitais em qualquer meio (texto, imagens, sons, imagens dinâmicas e estáticas) em redes distribuídas de trabalho. O conteúdo das bibliotecas digitais inclui dados e metadados que descrevem vários aspectos do dado (representação, criador, dono, direitos de reprodução) e metadados que consistem em ligações ou relacionamentos com outros dados ou metadados, sejam esses externos ou internos à biblioteca digital. É pertinente destacar neste momento, de acordo com a citação anterior que a presente pesquisa tem como objetivos, a identificação de padrões de representação e descrição de recursos informacionais no âmbito das bibliotecas digitais, que se dão por meio dos metadados, instrumentos fundamentais nos ambientes de manipulação de dados bibliográficos e que potencializam os resultados das buscas. Sem a utilização dos metadados não conseguimos ter uma ambiência padronizada o que acarretará a dificuldade nos processos de recuperação dos recursos informacionais. As bibliotecas digitais incorporam o uso de rede de computadores e dispositivos de armazenamento, tais como discos magnéticos, memórias e CD-ROM, facilitando o armazenamento e distribuição de conteúdos digitais. Para Marchiori (1997, p. 117), A biblioteca digital difere das demais, porque a informação que ela contém existe apenas na forma digital, podendo residir em meios diferentes de armazenagem. [...] a biblioteca digital não contém livros na forma convencional e a informação pode ser acessada em locais específicos e remotamente, por meio de redes de computadores.

53 51 A concepção de representação, descrição, organização e do acesso às informações juntamente com as tecnologias da informação e comunicação tem proporcionado um desenvolvimento mais intensivo nos serviços de informação de forma global. Pereira e Rutina (1999, p. 7), consideram que [...] a biblioteca digital seria aquela que teria, além de seu catálogo, os textos dos documentos de seu acervo armazenado de forma digital, permitindo sua leitura na tela do monitor ou sua importação (download) para o disco rígido do computador. Para melhor entendermos a estrutura das bibliotecas digitais, bem como seu funcionamento, Cunha (1999, p. 258) aponta algumas características, tais como: a) acesso remoto pelo usuário, por meio de um computador conectado a uma rede; b) utilização simultânea do mesmo documento por duas ou mais pessoas; c) inclusão de produtos e serviços de uma biblioteca ou centro de informação; d) existência de coleções de documentos correntes onde se pode acessar não somente a referência bibliográfica, mas também o seu texto completo. O percentual de documentos retrospectivos tenderá a aumentar à medida que novos textos forem sendo digitalizados pelos diversos projetos em andamento; e) provisão de acesso em linha a outras fontes externas de informação (bibliotecas, museus, bancos de dados, instituições públicas e privadas); f) utilização de maneira que a biblioteca local não necessite ser proprietária do documento solicitado pelo usuário; g) utilização de diversos suportes de registros da informação, tais como: texto, som, imagem e números; h) existência de unidade de gerenciamento do conhecimento, que inclui sistema inteligente ou especialista para ajudar na recuperação de informação mais relevante. Com relação à estrutura tecnológica que a biblioteca digital deve possuir, vale destacar que o planejamento e o desenvolvimento devem estar pautados de acordo com o modelo estipulado em uma biblioteca tradicional, ou seja, todo o tratamento informacional (representação descritiva e temática), formas de aquisição, recuperação, disseminação, serviço de referência até mesmo a preservação, devem estar contemplados de acordo com uma política institucional que norteará a funcionalidade da biblioteca digital. nossa), Nesta perspectiva, conforme pode ser observado por Wainwright (1996, p. 2, tradução

54 52 [...] as bibliotecas digitais, ainda permanecem sendo bibliotecas, [sustentadas] com os mesmos propósitos, funções e metas das bibliotecas tradicionais [convencionais]. A parte digital do termo indica meramente que os materiais estão armazenados e acessados digitalmente. Podemos dizer que a Internet propicia às bibliotecas formas mais efetivas de atuação no ciberespaço. Nesse contexto, é necessário um olhar para os estudos voltados para o desenvolvimento de websites que possibilitem melhores formas de acesso, uso e reuso dos recursos informacionais para os usuários. 3.2 Pontuações sobre os Websites Vale destacar nesse momento, que não é nosso objetivo neste trabalho, estudar com profundidade as tecnologias e as metodologias para a construção de websites, mas apontarmos a necessidade de estudos para a construção de ambientes padronizados, na facilitação da interação dos sujeitos com os recursos disponíveis. Num primeiro momento, pode-se pensar no website de uma biblioteca digital, como uma mimetização de um modelo de biblioteca convencional, ou seja, com sua estrutura física transportada para um ambiente tecnológico. Se a Internet propicia às bibliotecas estarem presentes na Web para continuarem a desempenhar suas funções, o website da biblioteca passa a ser sua forma de atuar no ciberespaço. Nesta lógica de raciocínio, o website da biblioteca deve ser capaz de desempenhar todas as funções da biblioteca, de modo a aproveitar todo o potencial de acessibilidade, disponibilidade, interconectividade e interatividade à informação e ao conhecimento que a Web pode oferecer. (AMARAL, 2005, p. 22). Complementando tal idéia, outro ponto que deve ser repensado é a arquitetura da informação de websites, que podem ser potencialmente aplicados ao contexto das bibliotecas digitais, com a facilitação de interfaces mais amigáveis para os usuários. Para tanto, Rosenfeld e Morville (1998), Vidotti e Sant Ana (2006, p. 80-2) apresentam alguns elementos que devem estar descritos no delineamento de um sistema informacional, tais como:

55 53 Sistema de organização: formas de agrupamento dos conteúdos informacionais responsável pela estruturação dos conteúdos, nele são definidos os critérios de disposição dos itens informacionais, observando os esquemas e /ou estruturas que melhor satisfaçam a necessidade do usuário, sem comprometer a navegabilidade do website. Os esquemas podem ser dos tipos exatos, ambíguos ou híbridos. As estruturas podem ser hierárquicas, de base relacional ou hipertextuais; Sistema de rotulagem: denominação do conteúdo do grupo informacional forma de representar um conjunto de informações utilizando uma palavra ou um ícone, de modo a facilitar a recuperação da informação e a navegabilidade do website. Possibilita ao usuário decidir qual caminho seguir, permitindo que o mesmo possa identificar-se com a linguagem e com a estruturação do site, culminando em um tempo de navegação mais otimizado; Sistema de navegação: forma de interação do usuário com o ambiente e com o conteúdo informacional disponível, permitindo ao usuário ir de um ponto ao outro pelo caminho desejado, possibilitando melhor aproveitamento do tempo de uso ou de acesso. Mantém o equilíbrio entre a movimentação e o oferecimento de opções de links para o usuário. As estruturas de navegação baseiam-se geralmente nas formas hierárquicas, globais e locais; Sistema de busca: possibilita ao usuário a formulação das expressões de busca para a recuperação dos documentos que correspondem à informação desejada. Para a recuperação das informações, é necessária uma forma de representação descritiva e temática adequada aos conteúdos do metadados. Deve-se observar, antes da implementação, a forma como os usuários potenciais realizam essas buscas, e seus diferentes tipos de necessidades informacionais. Os tipos de buscas são os seguintes: busca por itens conhecidos, busca por idéias abstratas, buscas exploratórias e buscas compreensivas. Além dos elementos propostos por Rosenfeld e Morville (1998), Vidotti e Sant Ana (2006), a literatura científica aponta o estudo da usabilidade de websites ou das bibliotecas digitais, que visa o estudo de usuários na garantia de satisfação de suas necessidades informacionais num processo de interação homem (usuário) e sistema. Segundo Dias (2003, p. 28), Um sistema interativo é considerado eficaz quando possibilita que os usuários atinjam seus objetivos. A eficácia é a principal motivação que leva um usuário a utilizar um produto ou sistema. Se um sistema é fácil de usar, fácil de aprender e mesmo agradável ao usuário, mas não consegue atender a objetivos específicos de usuários específicos, ele não será usado, mesmo que seja oferecido gratuitamente. Com a utilização das redes de computadores, foi possível uma maior agilidade nos processos de recuperação e disseminação da informação. Nesse sentido, Machado, Novaes e

56 54 Santos (1999, p. 217), apontam que [...] com o surgimento da Internet a biblioteca ganha uma nova dimensão, deixa de ter somente um espaço físico e ganha um novo espaço - o Ciberespaço. Parece ser consensual entre muitos autores que uma das características principais das bibliotecas digitais é o fácil compartilhamento instantâneo dos recursos informacionais através de redes de computadores de forma que o acesso aconteça local ou remotamente, em qualquer lugar e a qualquer tempo, cujo custo é proporcionalmente baixo. dizem que Neste sentido, Machado, Novaes e Santos (1999, p. 216), para reforçarem tal assertiva [...] a biblioteca digital tem como característica uma coleção de documentos eminentemente digitais, independendo se forem criados na forma digital ou digitalizados a partir de documentos impressos, e permite, por meio do uso de redes de computadores, compartilhar a informação instantânea e facilmente. Numa visão mais contemporânea, outros autores, tais como Dias (2001, p. 4) na tentativa de conceituar as bibliotecas digitais, bem como seu desenvolvimento, diz que [...] a biblioteca digital parece estar se firmando como um conjunto de artefatos, conhecimento, práticas e uma comunidade que engendra compromissos realísticos assumidos por profissionais da informação, analistas de sistemas e usuários. [...] elementos estes que em conjunto constituiriam a instância dos conhecimentos/práticas tecno-científicas, com as práticas ativas e em evolução substitutas da considerada passiva e estática estrutura tradicional. O discurso de uma biblioteca digital onde todos possam acessar todo o conhecimento em tempo real, sem restrições, ainda parece utópico, uma vez que mesmo havendo iniciativas por parte do governo ao inserir todo e qualquer cidadão no mundo digital, fica visível que apenas uma parcela da população realmente tem acesso às tecnologias e são participantes ativos nesta sociedade. Dentre essas iniciativas, podemos destacar a chamada Sociedade da Informação 5, que visa incluir os cidadãos numa sociedade digital, 5 Sociedade da Informação é o termo concebido aos programas nacionais voltados às Tecnologias da Informação e Comunicação como forma de garantir sua utilização e distribuição para toda a população, a fim de que as TICs não sejam mais um fator de exclusão social, mas possibilite a troca de informação em formato digital, suportando a interação entre indivíduos e entre estes e instituições, recorrendo a práticas e métodos em construção permanente. No Brasil, o projeto é finalizado entre 1999 e (NAZARENO et al., 2007).

57 55 principalmente com o uso intensivo das tecnologias da informação e comunicação, que são consideradas a base material da sociedade. Para Hernández e Tosete Herranz (2004, p. 189, tradução nossa), [...] as bibliotecas digitais deveriam possibilitar a qualquer cidadão acessar a todo o conhecimento humano, em qualquer momento e lugar e de forma amigável, multi-modal, eficiente e efetiva, superando as barreiras da distância, da linguagem e da cultura - mediante o uso de múltiplos dispositivos de conexão a Internet. É possível identificar na literatura científica que biblioteca digital é a terminologia mais empregada para aplicar ao contexto de um cenário marcado pelos aparatos tecnológicos, em especial, as tecnologias da informação e da comunicação, o que implica uma mudança de paradigma, principalmente no que diz respeito ao fazer profissional dos bibliotecários e dos cientistas da informação, uma vez que nas bibliotecas digitais, as fontes não são catalogadas e classificadas como os bibliotecários entendem esses termos, tornando impossível um tratamento da informação nos moldes tradicionais. (ALVARENGA, 2001, p. 11). Deste modo, é preciso repensar formas diferenciadas para um tratamento de forma mais compatível com o potencial das novas tecnologias, na possibilidade da garantia de uma recuperação mais precisa e eficaz. Ao tentar-se construir um conceito de biblioteca digital que mais se adeque aos tempos hodiernos, verifica-se uma pluralidade discursiva na área de Ciência da Informação. Em uma das obras mais recentes no Brasil sobre a temática bibliotecas digitais, Toutain (2006, p. 16), as define como sendo Biblioteca que tem como base informacional conteúdos em texto completo em formatos digitais - livros, periódicos, teses, imagens, vídeos e outros -, que estão armazenados e disponíveis para acesso, segundo processos padronizados, em servidores próprios ou distribuídos e acessados via rede de computadores em outras bibliotecas ou redes de bibliotecas da mesma natureza. Nessa perspectiva, vale salientar que a pluralidade conceitual na área é demarcada pela consideração de que as bibliotecas digitais são formadas por documentos em formato digital. Entretanto, faz-se necessário acrescentar a importância da utilização de procedimentos e

58 56 metodologias pautadas em normas e padrões, para a representação e a descrição dos recursos informacionais para o tratamento, a divulgação, o acesso, o uso e o reuso dos conteúdos informacionais, de modo a garantir a preservação das informações digitais e a interoperabilidade entre os sistemas informacionais, por meio de redes de computadores, proporcionando a ampliação do acesso, otimização de recursos e a integração ambiências. Para reforçar tal definição, e de acordo com os conceitos apresentados no texto, podese neste momento, de acordo com Vicentini (2006, p. 242), estabelecer os principais componentes em uma biblioteca digital: Coleção/conteúdo Recursos humanos - Equipe multidisciplinar - Capacitação Padronização - Metadados - MARC - Formato do arquivo digital - Padrão de digitalização Tecnologia - Hardware - Software - Livre - Proprietário - Flexibilidade de desenvolvimento - Facilidade de gerenciamento da coleção digital - Linguagem de programação - Utilização de protocolos de comunicação para importação e exportação de dados Digitalização Garantia de direito autoral Preservação do documento digital

59 57 A coleção/conteúdo do acervo digital, compreendida aqui como o processo de aquisição (compra, digitalização etc.), pode ser composta por recursos multimídias (imagem, som, texto), interligados por informações referenciais. Os recursos humanos - devem ser formados por equipes multidisciplinares e com a atualização e a capacitação dos sujeitos constantemente, uma vez que tem-se um cenário com os mais variados recursos e serviços tecnológicos, disponíveis no atendimento digital ao usuário. A padronização dos recursos informacionais, entendida nesse contexto, como o processamento técnico do material informacional, é o elemento-chave na representação (forma e conteúdo) e na descrição dos recursos informacionais na confecção de metadados. A tecnologia possibilita a integração dos serviços, bem como dos conteúdos informacionais, de modo a permitir uma amplitude na interação dos sujeitos com a ambiência. As questões de direito autoral, também devem ser levadas em consideração, na garantia de preservar a integridade e a fidedignidade dos conteúdos informacionais para um posterior uso das informações digitais. Além disso, é necessário um olhar para o estabelecimento de políticas que contemplem à preservação dos conteúdos digitais, de forma a garantir a integridade lógica e física do ambiente informacional. As bibliotecas digitais apresentam-se hoje como importantes instrumentos que possibilitam a facilitação da disseminação da informação, em ambiências digitais de forma global, no que concerne à democratização da informação e dos conteúdos informacionais, além de garantir a confiabilidade e a integridade dos recursos informacionais, uma vez que o mesmo não ocorre, por exemplo, na Internet, cujas informações são caracterizadas pela efemeridade e não asseguram que tais informações possuam um determinado grau de veracidade em sua totalidade. Pode-se considerar, pelo estado da arte sobre bibliotecas digitais abordado no texto, que há um grande desafio e inúmeras possibilidades no desbravamento desta ambiência digital por parte de uma diversidade de profissionais, com destaque para os da área de Ciência da Informação, no tocante em questões de representação e descrição de conteúdo e forma dos recursos informacionais. O armazenamento e a preservação dos recursos informacionais e de seu conteúdo têm sido objetos de estudo de pesquisas atuais na área de Ciência da Informação, isto é, uma área de investigação que tem adquirido cada vez mais importância, uma vez que a massa de

60 58 informações em meio digital cresce exponencialmente, dificultando muitas vezes o controle, o acesso e a integridade das informações. Vale destacar também que a necessidade de estudos sobre a temática hoje, é uma realidade brasileira e está presente também nos cursos de Pós-Graduação em Ciência da Informação. Sendo assim, o que motivou a construção da seção seguinte, foi uma disciplina ministrada no curso de Pós-Graduação em Ciência da Informação da Universidade Estadual Paulista UNESP campus de Marília, pormenorizando um conjunto de iniciativas e desenvolvimento de políticas e ambientes informacionais digitais que contemplem os princípios da preservação digital. Nosso objetivo neste capítulo não é tratar com profundidade as técnicas, procedimentos e metodologias concernentes à preservação digital, mas alertarmos para a importância sobre o assunto para que seja estudado em consonância no estabelecimento e desenvolvimento de uma biblioteca digital, e as iniciativas que norteiam o cenário atual. 3.3 Paradigma da Preservação digital na perspectiva das Bibliotecas Digitais Com a grande quantidade de bibliotecas digitais desenvolvidas nos últimos tempos e o volume avassalador de informações no ambiente Web, cresce também paralela e vertiginosamente o número de documentos digitais permitindo uma ampla produção e disseminação de conteúdos informacionais no ambiente digital, causando assim, um repensar dos tradicionais modelos para preservação destes conteúdos no cenário atual. As informações geradas atualmente estão, cada vez mais, sendo armazenadas no formato digital. As vantagens desta forma de armazenamento de informações são muitas, destacando-se, entre elas, a flexibilidade oferecida para a sua recuperação e a possibilidade de armazenamento e veiculação em diferentes tipos de mídia. (CARVALHO, 2003, p. 76). Por preservação digital entende-se ser a capacidade de manter disponíveis informações e documentos digitais para que possam transcender a largo prazo com os avanços

61 59 tecnológicos nos ambientes digitais, sem riscos de que haja alteração ou perda de legibilidade destes documentos. O que pode ser constatado atualmente é que a grande parte das informações produzidas hoje nascem em formato digital e as que se encontram armazenadas em suportes convencionais, tais como, papel, disquetes, CD-ROMs, por exemplo, rapidamente são transformadas/convertidas ao suporte digital. Mas a grande preocupação da comunidade e alvo de discussão e estudos é como garantir o acesso de longo prazo aos recursos informacionais digitais, uma vez que não são determinadas políticas e estratégias consolidadas que contemplem a preservação para documentos digitais. Vale mais uma vez destacar que as bibliotecas, desde a Antiguidade, constituem-se como centros de preservação da memória e do conhecimento da humanidade. Neste sentido, com o uso cada vez mais intenso das tecnologias da informação e comunicação, temos as bibliotecas digitais que são consideradas por alguns especialistas o caminho mais adequado para a preservação dos recursos informacionais digitais. (HILDRETH, 1996; ARELLANO, 2004). As bibliotecas e os arquivos têm estabelecido programas de preservação para materiais tradicionais. A preservação digital possui uma natureza diferente, principalmente na diversidade de formatos de materiais existentes atualmente. Segundo Hedstrom ( ) a preservação digital abarca o material que começa sua vida no formato digital, bem como o material que é convertido do formato tradicional/convencional para o formato digital. Sendo assim, pode-se considerar que as bibliotecas digitais apresentam-se como espaços propícios para o armazenamento, a disseminação e a preservação das informações digitais, uma vez que elas podem ser manipuladas simultaneamente em vário locais, sem a limitação de espaço e tempo, com uma maior amplitude de acesso aos recursos informacionais. Ainda nessa perspectiva, Lesk (1997) e Arellano (2004, p. 17), afirmam que as bibliotecas digitais são meios mais dinâmicos para preservação digital do que as bibliotecas tradicionais, no sentido da sua adaptação às freqüentes mudanças tecnológicas.

62 60 De acordo com a figura 3, pode-se melhor compreender os elementos que devem estar contemplados numa estrutura tecnológica de um acervo digital. FIGURA 3: Elementos básicos do acervo digital Fonte: Innarelli (2005) De acordo com a figura 3, a responsabilidade de preservar documentos digitais por um longo prazo, em uma biblioteca digital, por exemplo, só se efetivará de acordo com uma infraestrutura tecnológica adequada por meio de hardware e software sofisticados (atualizados de acordo com determinada época). Ferreira (2006) elucida que além da parte física e lógica do acervo digital, necessita-se atentar para o tratamento das informações, entendidas nesse contexto, na transformação de bits, mediados pelo hardware e software, de forma a serem interpretados/processados pelas máquinas, proporcionando significado aos objetos digitais. A preservação de informação no domínio analógico manifesta-se, sobretudo, pela tentativa de conservar o suporte inalterado durante o máximo de tempo possível. No contexto digital, a preservação do suporte ou da seqüência de bits que constitui o objecto, não é condição suficiente para garantir que a informação permanece acessível, reutilizável e autêntica ao longo do tempo. Preservar informação digital consiste, por vezes, em modificar ou transformar deliberadamente o objecto físico ou lógico que transporta a mensagem. Para que essa transformação não produza uma mensagem exageradamente degradada, é fundamental definir quais as propriedades da mensagem que deverão ser asseguradas durante o processo de transformação. (FERREIRA, 2006, p. 51). O grande desafio da preservação de documentos em ambientes digitais é garantir a integridade e autenticidade dos recursos informacionais e o acesso contínuo a seus conteúdos, bem como suas funcionalidades, através dos recursos tecnológicos disponíveis em cada momento, a fim de proporcionar a facilidade no processamento, transmissão e armazenamento das informações de forma eficiente.

63 61 Em uma carta aprovada pela UNESCO em 2003 sobre a temática preservação digital que culminou em um texto apresentado pela Conferência de Diretores das Bibliotecas Nacionais CDNL destacaram a preservação digital como um dos pontos emergentes na constituição da sociedade da informação, no sentido dos países refletirem sobre o estabelecimento de políticas nacionais de preservação e que garanta o acesso aos recursos digitais. Para o delineamento da preservação digital que permita o armazenamento em repositórios de dados digitais, faz-se necessária a adoção de algumas estratégias, métodos e ferramentas tecnológicas que integrem determinado processo, tais como: Preservação física: A preservação física está centrada nos conteúdos armazenados em mídia magnética (fitas cassete de áudio e de rolo, fitas VHS e DAT etc.) e discos óticos (CD-ROMs, WORM, discos óticos regraváveis). Preservação lógica: A preservação lógica procura na tecnologia formatos atualizados para inserção dos dados (correio eletrônico, material de áudio e audiovisual, material em rede etc.), novos software e hardware que mantenham vigentes seus bits, para conservar sua capacidade de leitura. Preservação intelectual: No caso da preservação intelectual, o foco são os mecanismos que garantem a integridade e autenticidade da informação nos documentos eletrônicos. (ARELLANO, 2004, p. 17). Uma vez adotadas as estratégias anteriormente mencionadas, tem-se a possibilidade de potencializar o acesso aos recursos informacionais de forma mais efetiva, na melhoria e na integridade dos conteúdos digitais, para um posterior uso e reuso das informações. A seção seguinte, apresenta brevemente algumas iniciativas apontadas pela literatura científica, nas questões de preservação digital Modelo de Referência Open Archival Information System (OAIS) Uma das iniciativas da preservação digital, no âmbito das bibliotecas digitais e alvo de pesquisa de muitos profissionais da Ciência da Informação, que norteiam a manutenção do acesso aos recursos informacionais, é o modelo de referência Open Archival Information System (OAIS), mais conhecido como Sistema Aberto para Arquivamento de Informação,

64 62 publicado pelo Consultive Committee for Space Data Systems 6 (CCSDS), que consiste numa proposta de padronização de um sistema de arquivamento destinado à preservação e ao acesso dos recursos informacionais digitais em longo prazo. Um arquivo nos termos do OAIS significa considerar os arquivos como organizações de pessoas e sistemas, que aceitaram a responsabilidade de preservar a informação e torná-la disponível e melhorar a comunicação e produtividade entre diferentes comunidades. (CCSDS, 1998 apud ARELLANO, 2004, p. 19). Um aspecto importante a ser considerado no modelo OAIS é sua linguagem ou terminologia, no estabelecimento de um vocabulário compartilhado na forma de um glossário para a disseminação de conhecimento de formal mundial, proporcionando uma melhoria nos processos de comunicação científica. Quanto aos objetos de informação delineados para uma base de preservação digital dos documentos, podemos destacar 4 (quatro) categorias de informação, de acordo com a figura 4: FIGURA 4: Tipos de informação segundo o Modelo de referência Open Archival Information System (OAIS). Fonte: Arellano (2004, p. 20) 6 Maiores informações sobre a documentação do modelo OAIS podem ser encontradas no site do Consultive Committee for Space Data Systems. Disponível em: < Acesso em: 20 dez

65 63 As categorias de informação, apresentadas no modelo OAIS, podem ser interpretadas da seguinte maneira: informação de conteúdo: uma informação que é o objeto primário da preservação. Ela contém o objeto digital primário e informação representada necessária para transformar este objeto em informação com significado. informação de descrição de preservação: qualquer informação necessária para preservar adequadamente a informação de conteúdo com a qual está associada. Ela inclui: informação de referência: e.g. identificadores; informação de contexto: e.g. classificações por assunto; informação de proveniência: e.g. copyright, histórico; informação de integridade: documenta os mecanismos de autenticação. informação de pacote: informação que enlaça e relaciona os componentes de um pacote dentro de uma entidade identificável em uma mídia específica. informação descritiva: informação que permite localizar, analisar, recuperar ou ordenar a informação de pacote dentro de um OAIS. (ARELLANO, 2004, p. 20). Nesse sentido, pode-se observar, por exemplo, quando comparado a uma ambiência do tipo biblioteca, seja ela convencional ou digital, que as etapas acima citadas, podem ser compreendidas como processos padronizados, pautados em normas e padrões que estabelecem a garantia da representação (informação descritiva e informação de conteúdo, por exemplo) dos recursos informacionais, de modo que garanta a facilitação pelo usuário no acesso e o uso aos conteúdos informacionais. Na preservação digital, pode-se evidenciar a ocorrência de duas práticas distintas: na primeira, as bibliotecas escolhem gerar e guardar uma cópia de preservação e uma de acesso ao mesmo tempo ou gerar uma cópia de preservação e fazer cópias de acesso; na segunda, as matrizes de preservação têm o tratamento de preservação e não as demais cópias. Neste sentido, as bibliotecas digitais assumem uma responsabilidade vital no que concerne às práticas de preservação digital em sua totalidade, devendo estas estar inseridas e englobadas nos fluxos normais de trabalho. Os formatos digitais (mídia magnética e óptica) são qualitativamente diferentes, uma vez que são considerados meios reusáveis pondendo deteriorizar-se rapidamente, em vez de décadas, em apenas alguns anos começam um processo de deteriorização.

66 64 Um outro problema destacado é a obsolescência das tecnologias (hardware e software), aliado à ausência de padrões, protocolos e métodos para preservar a informação digital. Para garantir uma acessibilidade futura, faz-se necessário determinar fatores em relação à arquitetura, ao alocamento dos recursos informacionais e ao planejamento das bibliotecas digitais. Outros dois tópicos precisam ser discutidos quando falamos em preservação digital: a memória de massa, ou seja, a grande capacidade de armazenamento e a preservação a longo prazo. Há duas maneiras distintas para examinar as exigências da preservação digital: Da perspectiva dos usuários e a respeito da opinião das bibliotecas, arquivos e repositórios e; Dos administradores responsáveis pela manutenção, preservação e distribuição da informação. (HEDSTROM, , tradução nossa). O armazenamento digital não é apenas uma alternativa para armazenar formatos impressos, porque muitos tipos de objetos digitais não possuem equivalentes impressos e não podem ser preservados em formatos que não seja o digital. Na concepção de Hedstrom ( , tradução nossa) muita informação que começa sua vida no formulário eletrônico é impressa no papel ou no microfilme para ser armazenada de forma segura. O papel neutro ácido de alta qualidade pode durar um século ou mais, o microfilme pode durar 300 anos ou mais e mesmo assim, eles não requerem nenhum tipo de equipamento ou software especial para a recuperação ou visualização da informação. Uma outra estratégia para a preservação digital é preservar a informação digital nos diversos formatos possíveis. A informação digital pode ser transferida por meio de gerações sucessivas de tecnologias em um software-independente como o formato ASCII (arquivos em formato texto) ou como arquivos simples e uma estrutura uniforme, homogênea, que necessita ser migrada periodicamente. (HEDSTROM, , tradução nossa). Portanto, as ameaças comuns a todos os tipos de documentos, independentemente do seu suporte físico, requerem as mesmas estratégias de preservação. Já as ameaças atreladas

67 65 somente aos documentos digitais requerem o uso de estratégias diferenciadas e, na maioria das vezes, de forma associada. A importância de salvaguardar a integridade do objeto digital como parte da missão é um ponto importante para todas as bibliotecas digitais que estão envolvidas em preservação digital e neste contexto, podemos destacar o papel dos repositórios institucionais (RI) que atuam para assegurar e preservar a produção intelectual de comunidades acadêmicas específicas, além de tornar acessível o capital intelectual de uma determinada instituição e estabelecer melhores níveis de comunicação científica. De acordo com a definição de Café et al. (2003, p. 4), Um repositório institucional agrega um conjunto avançado de serviços relativos à organização, tratamento, acesso e disseminação do conteúdo digital produzido por uma instituição e sua comunidade acadêmica e de pesquisa. Dentre estes serviços, inclui-se principalmente o de preservação digital, uma vez que o gerenciamento da migração do conteúdo digital de uma tecnologia em vias de ser desativada para um sistema de ponta deve ocupar um espaço primordial nas preocupações das organizações que detêm os repositórios institucionais. Pode-se ainda nesta perspectiva enumerar algumas estratégias técnicas para a preservação em ambientes digitais tais como: Atualização: compreende a cópia do conteúdo de um meio de armazenamento para outro. Como tal, só se centra na obsolescência do meio, não é uma estratégia de preservação completa. Exemplo: copiar um grupo de arquivos de CD-ROMs a DVDs. Emulação: é a preservação do objeto digital junto com o software original, ou seja, é a recriação do ambiente técnico requerido para ver e utilizar a coleção digital. Migração/Conversão: é o processo de transferência de informação digital de uma configuração de hardware e software para outra, ou de uma geração de computadores a gerações subseqüentes. As melhorias em tecnologias da conversão podem suportar soluções híbridas à preservação e alcançar problemas permitindo repositórios armazenar determinados formatos do material digital em meios estáveis, tais como o

68 66 microfilme, com versão da demanda do formulário digital para a análise e reuso. (HEDSTROM, , tradução nossa). Ainda nessa perspectiva, deve-se considerar como um fator primordial no processo de preservação digital a utilização de metadados, que podem documentar a manutenção e usam a história do documento, tempo e descrição, e uma série de documentos que são essenciais para determinar a autenticidade e a compreensão da origem das fontes. O objetivo da presente pesquisa é analisar os metadados descritivos para informações bibliográficas no ambiente de bibliotecas digitais, advindos das áreas de Biblioteconomia e de Ciência da Informação que serão tratados de forma específica no capítulo 4. Assim, a intenção deste estudo não é analisar os metadados específicos para a preservação digital, mas pontuarmos a necessidade de usá-los para que se tenha uma representação completa e padronizada para o acesso e o uso efetivos das informações O papel dos metadados na preservação digital É pertinente destacar nesse momento, que a representação dos recursos informacionais por metadados, é uma condição-chave para as questões de preservação digital, ou seja, uma vez as informações bem descritas e representadas, melhores condições de uso, reuso e preservação dos conteúdos informacionais haverá. A criação e uso de metadados é uma parte essencial para a caracterização dos recursos informacionais em todas as estratégias operacionais de preservação digital, uma vez que elas estão baseadas na conservação de software e hardware, emulação ou migração, ou seja, um meio para garantir a autenticidade, registrar o gerenciamento de direitos e coleções de dados, a interação com os recursos de busca, bem como a identificação e a localização dos recursos informacionais. (ROTHENBERG, 1996, tradução nossa). A palavra-chave neste contexto de bibliotecas digitais, repositórios institucionais, comunicação científica, é interoperabilidade, ou seja, a capacidade entre sistemas

69 67 heterogêneos intercambiar recursos informacionais que somente ocorrerá com o uso efetivo dos metadados para a potencialização dos ambientes informacionais. Neste sentido, foi desenvolvido o Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH), que em português - Protocolo de Coleta de Dados da Iniciativa de Arquivos Abertos, o qual oferece um ambiente de interoperabilidade, baseado na coleta de metadados, que é independente das aplicações (computadores, seus programas e suas tecnologias). Os metadados nesta perspectiva de preservação digital, atuam como ferramentas indispensáveis no âmbito das bibliotecas digitais, podendo estar agrupados em quatro grandes categorias: Metadados descritivos: metadados usados para descrever e identificar informações sobre recursos; Metadados de acesso: metadados que definem os termos e condições para o acesso e a recuperação de um recurso; Metadados estruturais: metadados que respondem a uma estrutura previsível ou pré-determinada, tanto se essa estrutura é um padrão ou não; Metadados administrativos/preservação: metadados usados no gerenciamento e administração dos recursos informacionais. Além disso, pode-se apontar algumas iniciativas do desenvolvimento de metadados para preservação digital, tais como o METS (Metadata Encoding and Transmission Standard), criado pela Library of Congress, que consiste num esquema XML (Extensible Markup Language) Linguagem de Marcação Extensível, usado para codificar todo o conteúdo e o metadado de um objeto digital. Um documento METS pode ser um simples arquivo com conteúdo e metadado, um documento direcional que aponta para o conteúdo e para o metadado ou ainda, uma combinação dos elementos acima mencionados. A importância da utilização dos METS pode ser destacada em três momentos:

70 68 1. Interoperabilidade: partilhar objetos digitais entre sistemas de bibliotecas, permitindo que a biblioteca digital trabalhe no compartilhamento com objetos de outros repositórios; 2. Escalabilidade: a utilização de um único software podendo ser usado para indexar, navegar e mostrar diferentes tipos de conteúdos; 3. Preservação: auxilia as estratégias de processo de migração. Como pode ser apontado de acordo com a literatura, verifica-se que as bibliotecas digitais assumem um papel decisivo na constituição da sociedade da informação, uma vez que são produzidas gigantescas quantidades de informações no ambiente digital, precisando ser repensado constantemente formas diferenciadas para preservar os conteúdos informacionais para uma futura recuperação. Vale destacar neste contexto que a atuação dos profissionais da informação, em especial, os bibliotecários sujeitos protagonistas neste cenário - precisam mais ainda agir de forma ética, a fim de assegurar a integridade dos recursos informacionais e permitir o acesso e o uso das informações pelo usuário final. Neste sentido, serão levantados alguns pontos com relação aos elementos éticos para possíveis reflexões sobre o fazer do profissional do bibliotecário. 3.4 Elementos éticos no contexto das Bibliotecas Digitais Nosso objetivo neste estudo não é apresentarmos teorias, conceitos ou filosofias concernentes à ética, mas sim, fornecer subsídios para uma maior compreensão da existência de elementos éticos que norteiam a atuação e o fazer profissional dos profissionais da informação, em ambiências informacionais sejam estas convencionais ou digitais. De acordo com McGarry (1999) as bibliotecas existem há quase tanto tempo quanto os próprios registros escritos; as práticas realizadas nas bibliotecas geralmente estão relacionadas entre si, como, guardar para preservar e organizar para usar. Tanto os aspectos de armazenagem como organização apresentam uma evolução maior nos estudos e busca de soluções aos aspectos relativos ao acesso.

71 69 Vivencia-se uma mudança de paradigmas com os aportes e instrumentos tecnológicos desenvolvidos ultimamente, onde nossa sociedade, em especial a sociedade da informação é caracterizada pela interconectividade permeada por redes de computadores nos processos de interação. Neste sentido, pode-se mais uma vez considerar neste cenário marcado pela impactante presença das tecnologias da informação e comunicação (TICs) na potencialização de ambientes informacionais, tais como as bibliotecas digitais, que trouxeram consigo um novo repensar sobre questões éticas, principalmente no que diz respeito à preservação e ao acesso aos recursos informacionais. Entretanto, não se trata somente de uma mudança no ambiente tecnológico, mas, indo além, de uma mudança nas bases da ação profissional, visto que o componente ético passa a exigir uma constante reflexão em virtude da própria mutabilidade do ambiente. (CASTRO et al., 2006, p. 11). A grande oportunidade para as bibliotecas digitais, bem como para o profissional bibliotecário reside na mediação e criação de facilidades para o desenvolvimento no que concerne ao acesso e uso da informação com o propósito de gerar conhecimento. Como destaca Valentim (2004, p. 55), [...] o fazer intrínseco do profissional da informação, haja vista a natureza eminentemente mediadora do mesmo, desde a prospecção e filtragem de dados e informações, até a disseminação e transferência desses mesmos dados e informações ao público interessado, com especial destaque para o tratamento de conteúdos informacionais, no âmbito dos quais o uso das linguagens, como instrumentos de mediação, requer uma atitude - e reflexão - ética constante e vigilante. As novas tecnologias de produção, de processamento, de difusão e de exploração da informação digital modificam profundamente as práticas sociais e profissionais relativas ao uso da informação, causando dessa forma, questionamentos sobre os fundamentos ou justificativas das reivindicações dos direitos autorais, por exemplo.

72 70 Nesta perspectiva, Stuber e Franco (1999, p. 3) afirmam que, O fato das obras e informações transmitidas através da Internet estarem sob a forma digital não retira delas a característica de criação humana, passíveis de proteção jurídica, garantindo ao criador ou autor destas obras o direito exclusivo de reprodução, divulgação e utilização de seus trabalhos, e o direito à remuneração por sua utilização, seja através da aplicação das normas de direito do autor, seja através da aplicação de normas de proteção à propriedade industrial. Sem dúvida as bibliotecas digitais começam a se expandir exponencialmente. Sendo assim, necessitam ser analisadas e tratadas sob o enfoque dos aspectos legais. Questões sobre os direitos autorais (copyright) precisam ser esclarecidas, haja vista serem essenciais para a aquisição, o armazenamento e a disseminação dos conteúdos digitais à medida que se populariza o uso da informação digital por meio das redes eletrônicas abertas e das ferramentas e produtos da multimídia. Atualmente, os diferentes contextos que pautam discussões éticas compreendem questões como propriedade intelectual e direitos autorais, principalmente com o número de informações disponíveis na Internet, fomentadas pelas tecnologias da informação e comunicação que rompem com tradicionais formas de circulação e de produção de conhecimento e de informação. As bibliotecas digitais, ao possibilitar o acesso aos recursos informacionais, permitem ampliar a capacidade discursiva humana e, portanto, propiciam condições para a participação cidadã e produtiva dos indivíduos na sociedade. Mas a questão chave no atual cenário das bibliotecas digitais com relação aos aspectos éticos, apontados por Brey (1999) é a necessidade de um olhar sobre os aspectos representacionais (do ambiente e dos recursos informacionais) e aos aspectos interativos e de comportamento (do usuário) nos ambientes informacionais digitais. Nesse sentido, as questões éticas no contexto das bibliotecas digitais merecem ser amplamente debatidas pela comunidade científica, como desafio para proporcionar o acesso à informação neste ambiente.

73 71 Pode-se, dessa maneira conforme apontado por Castro et al. (2006, p. 12) elencar alguns problemas éticos específicos no âmbito das bibliotecas digitais, tais como: A. ACESSO Haveria controle de acesso aos recursos informacionais e como se daria o acesso a estes na biblioteca virtual [digital]? A interação com o bibliotecário virtual (agente inteligente) atenderia a todas as necessidades dos usuários? O custo do desenvolvimento e manutenção de uma Biblioteca virtual [digital] viabilizaria sua implementação? B. DIREITOS AUTORAIS Os usuários teriam acesso parcial (simples visualização) ou total (na íntegra) aos recursos informacionais? Como resolver a questão do direito autoral na hipótese de acesso total aos recursos informacionais? Como se resolve o conflito entre o respeito aos direitos de autor e os direitos de acesso à informação? C. REPRESENTAÇÃO DO VIRTUAL [digital] Entre a proposição e a representação da biblioteca virtual [digital] existe violação ética, quando não houver fidedignidade? O profissional estaria sendo tendencioso? O fato de alguns serviços (e não dos recursos informacionais) da biblioteca virtual [digital] ser disponibilizada em outras línguas violaria a fidedignidade da representação em realidade virtual, em detrimento da garantia cultural? D. REPRESENTAÇÃO DO RECURSO INFORMACIONAL Evitar desvios Evitar tendenciosidade Evitar insuficiência Evitar suprimir a informação (censura) Evitar a ausência de padronização Evitar a má-representação Conforme apontado pela literatura científica, as questões éticas sempre permearam os ambientes informacionais, tais como as bibliotecas e neste contexto, principalmente com o uso intensivo das tecnologias da informação e comunicação. Atualmente, tanto na Web quanto nas bibliotecas digitais verifica-se uma forte tendência para a disponibilização de conteúdos digitais o que sugere um novo repensar dos profissionais envolvidos no que tange num comportamento ético que vá ao encontro das necessidades informacionais dos usuários, considerados os sujeitos que atuam decisivamente nos sistemas informacionais no âmbito digital.

74 72 Nesse momento, retomam-se algumas questões no que tange ao contexto das bibliotecas digitais. As bibliotecas digitais, como ambientes propícios para a recuperação de informações, têm na utilização de metadados a padronização das formas de representação e a possibilidade de garantia de interoperabilidade entre sistemas, favorecendo a integridade e a acessibilidade dos recursos informacionais de forma eficiente pelo usuário final. Diante disso, pode-se dizer que, sem o uso de metadados, não haverá o estabelecimento de uma biblioteca digital de acordo com um conjunto de padrões e normas que garantam o acesso, a recuperação, o uso e a reutilização dos recursos informacionais e que atendam às necessidades dos usuários apresentadas nas solicitações de busca. (CASTRO; SANTOS, 2007). Nesse sentido, pode-se considerar que as bibliotecas digitais, que são consideradas ambientes específicos e padronizados, e distribuídas de acordo com áreas do conhecimento, já se constituem como segmentos na Internet e proporcionarão o estabelecimento da semântica aos recursos informacionais de forma mais precisa, uma vez que os metadados atribuídos nas bibliotecas digitais garantirão a representação dos recursos informacionais e contribuirão para aplicações mais efetivas na construção Web Semântica. Assim, o capítulo seguinte aponta a necessidade de estruturas padronizadas para as questões de representação e de descrição dos recursos informacionais e o surgimento de novas ferramentas e instrumentos tecnológicos, que atuam decisivamente nos ambientes informacionais digitais.

75 73 Capítulo 4 Formas de representação da informação: um diálogo intersubjetivo

76 74 4 FORMAS DE REPRESENTAÇÃO DA INFORMAÇÃO: UM DIÁLOGO INTERSUBJETIVO Representar algo significa conter a semelhança da coisa. (Tomás de Aquino) Esse capítulo destaca a necessidade de se ter e se criar estruturas e modelos padronizados para a construção de formas de representação da informação registrada, pautados principalmente nas metodologias cristalizadas da Biblioteconomia e da Ciência da Informação, na possibilidade do estabelecimento de ambientes informacionais digitais interoperáveis. 4.1 Representação da informação A tarefa de representação é uma atividade que os seres humanos, por se tratarem de sujeitos cognitivos, realizam-na de forma espontânea e a todo o momento, uma vez que a estrutura do cérebro permite uma analogia com o sistema hipertexto à medida que o pensamento (complexo simbólico) é processado e disponibilizado na teia neural a exemplo de uma verdadeira rede cíclica 7. A interação das mensagens constrói redes de significação transitórias na mente de um ouvinte, e Lévy (2001, p. 23) elucida que Quando ouço uma palavra, isto ativa imediatamente em minha mente uma rede de outras palavras, de conceitos, de modelos, mas também de imagens, sons, odores, sensações proprioceptivas, lembranças, afetos etc.. 7 Rede cíclica nesta pesquisa é entendida como um processo mental, construído exatamente na instabilidade e na não-linearidade da construção da forma de representação da informação.

77 75 A representação documentária acontece desde as primeiras tentativas de registro do conhecimento em suportes passíveis de armazenamento para posterior utilização. Nesse sentido, Castro (2002, p. 22) afirma que Desde que o homem começou a registrar suas descobertas e conquistas, desde os primitivos meios de comunicação quando foi possível registrar o pensamento em um suporte informacional, a necessidade e a preocupação em recuperar de alguma forma o que foi registrado e armazenado parece existir. A representação e a mediação do conhecimento são destacadas como os elementoschave para acesso rápido à informação, necessidade que originou várias formas de organização da informação. A representação deve ser suficientemente rica sob o aspecto cognitivo e, ao mesmo tempo sintética para economizar a energia do usuário de uma maneira significativa. (MARCONDES, 2001). Deve ser levado em consideração o papel ativo do usuário (sujeitos cognitivos), que é o principal personagem que se apropriará da representação e fará uso do conhecimento registrado. Algumas áreas do conhecimento, tais como a Ciência Cognitiva e a Psicologia, por exemplo, ressaltam que os sujeitos ao interagirem com um determinado ambiente, devem ter em mente algum tipo de representação de segmentos deste ambiente, ou seja, ter representações internas. Em contrapartida, temos as representações externas, ou seja, manipulações que operam as representações numa externalização do comportamento do sujeito que poderia conduzir a estabilidade entre o sujeito e o ambiente. Vale destacar que os humanos fazem uso de representações externas constantemente, tais como o alfabeto, a tecla do piano, notas musicais, computador etc. (PESCHL, 2002). A construção de uma forma de representação apropriada pode ser vantajosa e ainda facilitar a compreensão, a resolução de problema, o cálculo e especialmente, a ampliação de nossos conhecimentos. (SANTOS; VIDOTTI, 2007). A representação não tem que conter e mostrar toda a possível informação sobre uma certa realidade, mas tem que prover a informação que é pertinente a realização de uma tarefa. Não se tem acesso direto ao ambiente e o conhecimento sempre é um sistema relativo, no sentido de que é constituído para ser aplicado para a solução de um problema ou por gerar um comportamento que é específico para o usuário em uma determinada tarefa. A questão está

78 76 em estabelecer uma boa estabilidade dentro do sistema cognitivo e entre o ambiente, ou seja, prover a informação que é pertinente para a realização de uma tarefa. (PESCHL, 2002). Vale destacar também que a forma escolhida de representação tem que ser apropriada com respeito à tarefa que o usuário da representação (sujeitos que se apropriarão e farão uso das representações) tem que realizar. Diferentes formas de representação podem ainda ser usadas para apresentar um objeto ou conceito de diferentes pontos de vista. (CASA, 1997). O aspecto positivo está justamente na possibilidade de obter estruturas capazes de representar somente a informação relevante em um determinado momento. (CASA, 1997, p. 210). Podemos entender como estrutura neste contexto, algo que propicie e dê suporte informacional. Nesse sentido, McGarry (1999, p. 11) diz que a informação deve ser ordenada, estruturada ou contida de alguma forma, senão permanecerá amorfa e inutilizável, ou seja, a informação deve receber um tratamento que permita seu acesso para o uso, a preservação e a reutilização e se apresentar representada de alguma forma para que tenha sentido. Para tanto, faz-se necessário um veículo de comunicação para que a informação seja compreensível para o receptor. McGarry (1999) destaca três tipos de veículos para a transmissão de informações: sinais, símbolos e signos. Os sinais proporcionam ou determinam as relações com as ações a serem desenvolvidas pelo receptor. Por exemplo, um indivíduo ao dirigir um carro, no momento de estacionar ou deslocar-se para a direita ou para a esquerda, sinaliza que o momento e o local para determinada ação estão próximos. Nessa perspectiva, de uma forma genérica, percebe-se que o indivíduo (receptor) recebeu uma dada informação ao detectar os sinais. Os sinais podem ser considerados como uma forma de signo, enfatizando uma dada necessidade que será seguida por algum tipo de reação, requerendo também, algum tipo de reação do receptor. Em termos gerais um sinal é comunicado de uma pessoa a outra para indicar que o momento de agir está próximo. (McGARRY, 1999, p. 12).

79 77 Os símbolos constituem-se em representações culturalmente construídas e reconhecidas por uma comunidade específica. Um símbolo pode ter ou não semelhanças com o que representa. Um ícone de uma impressora pode ter uma boa semelhança com aquilo que pretende representar e pode ter sentido para indivíduos do mundo todo, desde que consigam identificar o objeto real. Entretanto, a palavra impressora terá sentido apenas para quem a conhece, ao mesmo tempo, o objeto real e a Língua Portuguesa. Neste contexto, podemos fazer uma distinção entre os símbolos icônicos, pois de acordo com McGarry (1999, p. 13) estes possuem uma semelhança sensorial com o que representam. Um símbolo icônico pode ser uma pintura, uma imagem esculpida, etc. Tais representações têm utilidade mais prática quando transmitem informações através das barreiras lingüísticas. Os signos indicam a presença física de determinada coisa ou algum evento relacionado a eles. Por exemplo, a fumaça representa ou indica fogo, o aumento da temperatura pode indicar febre e até mesmo um simples olhar entre duas pessoas pode ter um sentido ou significado conhecido. Há também numerosas linguagens de signos em que gestos convencionais são usados como substitutos da fala, como por exemplo, em nossa comunicação com os surdos ou entre eles próprios. (McGARRY, 1999, p. 13). A representação da informação passa por uma definição de conjuntos de elementos básicos e de regras para a conjunção desses elementos. Partindo desse pressuposto, podemos dizer que a tarefa de representar a informação registrada não é algo simples de realizar, porque a própria construção do processo de representação é redutora da informação, pois é realizada por um intermediário/mediador. No contexto atual das Tecnologias da Informação e Comunicação, tem-se a representação da informação por metadados, criados por humanos e o acesso aos recursos informacionais, realizados por sistemas/agentes especialistas das ferramentas de busca (intermediário/mediador), por exemplo, que realizam as buscas na Web, percorrendo bases de conhecimento pré-estabelecidas e/ou regras de inferências. Pode-se dizer que a representação da informação registrada é compreendida numa perspectiva de que é primeiramente mentalizada ou internalizada numa estrutura cerebral, onde os sujeitos cognoscentes (mediadores ou intermediários), precisam externalizar em um

80 78 formato ou em um suporte informacional, que garanta o registro (armazenamento) do conhecimento para uma posterior socialização, uso e reuso dos recursos informacionais. Reforçando tal assertiva, Alvarenga (2003, p. 4) diz que A representação compreende em ambos os casos, um processo cognitivo. Destaca-se como uma instância do processo cognitivo humano aquela que culmina com a representação primária do conhecimento, situando-se no âmbito do registro do pensamento em um suporte documental, incluindo as etapas de percepção, identificação, interpretação, reflexão e codificação, etapas que são envolvidas no ato de se conhecer um novo ser ou coisa, ou aprofundar-se no conhecimento de um ser ou uma coisa já conhecida, utilizando-se dos sentidos, da emoção, da razão e da linguagem. A principal função da representação é criar uma estrutura eficientemente rica com o objetivo de recuperação das informações. Entretanto, a transferência da informação por meio de sua representação é algo impreciso. Por exemplo, na descrição de conteúdo de uma determinada obra, são adotadas palavras-chave que resumem um assunto, no entanto, essas palavras são apenas representações parciais ou longínquas que contemplam a originalidade, a integridade e a perfeição do documento. Na perspectiva de Peterson (1996) formas de representação podem ser vistas como um tema interdisciplinar à ciência cognitiva, pois há uma grande multiplicidade de formas de representação (anotações, formalismos, interfaces, linguagens de programação etc.), e a admissão de uma nova forma de representação pode tornar um domínio mais acessível para um determinado propósito, comunidades de interesse específico ou tipo de usuário. Unidade informacional 8 é o que queremos representar de acordo com algum formalismo escolhido, pois é isso que efetivamente seremos capazes de manipular no ambiente de geração e uso de informações. No trabalho de informar, a representação é tão trivial que sua relevância é freqüentemente ignorada. E hoje, o aporte das Tecnologias da Informação e Comunicação TICs - disponíveis no auxílio da construção de formas de representação, para uma diversidade 8 Unidades informacionais nesta pesquisa são os recursos informacionais representados pelos seguintes tipos documentais: livros, periódicos, fotografias, filmes, músicas etc.

81 79 de recursos nos mais variados suportes, remete a tarefa de representar a patamares de grande necessidade e ao mesmo tempo de invisibilidade. Nesse momento, passaremos ao interesse específico de tratar da análise da construção de formas de representação para informações registradas a partir de um código textual e/ou imagético e sustentada em um suporte de informação caracterizando um tipo documental passível de armazenamento, recuperação, uso e reuso. Nesse sentido, a representação da informação pode ser caracterizada por um processo dúplice que é constituído pelo desenvolvimento de uma operação e que resulta em um produto, a partir das etapas de catalogação e classificação. Nosso interesse de pesquisa está voltado para a análise do processo de catalogação e a construção do registro bibliográfico como elemento que agrega a representação de forma e conteúdo do recurso informacional na construção de metadados que comporão o catálogo em ambientes informacionais ou quaisquer dimensões. Destaca-se, portanto, que o principal objetivo dos catálogos é representar os recursos informacionais para que se possa recuperar a informação contida nos recursos disponíveis. 4.2 Breves considerações sobre os catálogos, as regras e os códigos de catalogação: marcos de formas de representação na perspectiva da Biblioteconomia e da Ciência da Informação O catálogo é um dos instrumentos mais antigos na história da descrição e organização da informação registrada. A palavra vem do grego kata, que significa (de acordo com, sob, em baixo ou parte) e logos (ordem, razão). Muitas vezes define-se o catálogo como lista ordenada dos documentos existentes em um ou mais acervos. (CASTRO, 2002). No Renascimento, o Libri Graeci Impressi foi o primeiro catálogo impresso com objetivos comerciais de acordo com o desenvolvimento e o aperfeiçoamento da imprensa,

82 80 juntamente com a criação das chamadas feiras de livros, com destaque para as de Frankfurt e as de Leipizig. A necessidade de construção de um instrumento facilitador para a identificação e a localização das informações disponíveis impulsionou o desenvolvimento de padrões de representação que oferecessem o mínimo de uniformidade aos registros bibliográficos. No século XIX, mais exatamente em 1839, na Inglaterra, Antony Panizzi estabeleceu as 91 regras de catalogação, como forma de padronização das informações. Tais regras estabeleciam a valorização da página de rosto, a introdução do conceito de autoria coletiva e o cabeçalho de entrada de autor conforme determinada pela página de rosto. Em 1850, Charles Jewett, adapta e amplia as 91 regras de Panizzi e utiliza a tecnologia de esteriotipia em seu trabalho de catalogação centralizada, numa proposta precursora de implantação do catálogo coletivo nos Estados Unidos. Em 1876, Charles Ami Cutter define os objetivos e funções dos catálogos em Rules for a Dictionary Catalog e destaca a relevância de uma estrutura que contemple os interesses do usuário no catálogo de uma biblioteca, a partir de representações uniformes dos documentos. Em 1895, Otlet e La Fontaine criaram os primeiros passos para o Controle Bibliográfico Universal - CBU, iniciando o levantamento de registros das publicações editadas no mundo que se baseava numa estimativa de aproximadamente 16 milhões de registros, partindo do princípio de socialização do conhecimento. A padronização na representação das informações contidas nos catálogos passa a ser preocupação e, nesse sentido, diversos códigos de catalogação são desenvolvidos e aperfeiçoados. A preocupação com a uniformidade encontra eco nas discussões da Conferência Internacional sobre Princípios de Catalogação, realizada em 1961, em Paris, que culminou na publicação da Declaração de Princípios. O período compreendido entre 1992 até 1997 é marcado por estudos realizados pela IFLA - International Federation of Library Association and Institutions (Federação

83 81 Internacional de Associações e Instituições Bibliotecárias) a respeito da representação descritiva na reflexão pautada nos Princípios de Catalogação ou Princípios de Paris de 1961 para o estabelecimento de novas regras ou princípios que resultaram no documento publicado em 2003, denominado Declaración de Princípios Internacionales de Catalogación (2003, p. 1, tradução nossa), destacando que [...] novos princípios substituem e alargam os Princípios de Paris, consignando todos os tipos de materiais e não apenas as obras textuais e considerando a escolha e a forma de entrada para todos os aspectos dos registros bibliográficos e de autoridade utilizados em catálogos de bibliotecas. Ainda nesse sentido esses novos princípios cobrem ou abrangem de acordo com a DECLARACIÓN... (2003, p. 1-6, tradução nossa, grifo nosso): 1. Âmbito: Os princípios aqui enunciados destinam-se a orientar o desenvolvimento de códigos de catalogação. Aplicam-se a registros bibliográficos e de autoridade e a catálogos correntes de bibliotecas. Os princípios podem também ser aplicados a bibliografias e ficheiros de dados criados por bibliotecas, arquivos, museus e outras comunidades. 2. Entidades, Atributos e Relações: Para a criação de registros bibliográficos devem considerar-se as seguintes entidades, respeitantes a produtos de natureza intelectual ou artística: Obra, Expressão, Manifestação, Exemplar Os registros bibliográficos devem refletir tipicamente manifestações. Estas manifestações podem incorporar uma coleção de obras, uma obra individual ou uma parte componente de uma obra. As manifestações podem aparecer em uma ou mais unidades físicas. 3. Funções do Catálogo: As funções do Catálogo destinam-se a permitir ao utilizador: 3.1. Encontrar recursos bibliográficos numa coleção (real ou virtual) como resultado de uma pesquisa, utilizando atributos ou relações dos recursos: Para localizar um determinado recurso Para localizar conjuntos de recursos representados 4. Descrição Bibliográfica: A parte descritiva do registro bibliográfico deve ser baseada na Descrição Bibliográfica Internacional Normalizada e pode ser feita de acordo com vários níveis de exaustividade. 5. Pontos de Acesso: O registro bibliográfico deve incluir pontos de acesso controlados e formulados de acordo com um código de catalogação normalizado ou com princípios internacionais. Esses pontos de acesso controlados devem ser feitos utilizando as formas autorizadas dos nomes usados para a entidade, de acordo com o que constar em registros de autoridade.

84 82 6. Registros de Autoridade: 6.1. Os registros de autoridade devem ser construídos para controlar as formas autorizadas de nomes e referências que são usados como pontos de acesso para entidades como pessoas, coletividades, obras, expressões, manifestações, exemplares, conceitos, objetos, eventos e lugares Se uma pessoa, família ou coletividade usa nomes variados ou formas variantes dos nomes, deve escolher-se um nome ou uma forma do nome como cabeçalho autorizado. Se há títulos variados para uma obra, deve escolher-se um como título uniforme. 7. Fundamentos para permitir a Pesquisa: Os pontos de acesso são os elementos dos registros bibliográficos que providenciam 1) recuperação confiável de registros bibliográficos e de autoridade e respectivos recursos bibliográficos associados e 2) limitação dos resultados de pesquisa. Antecedendo a publicação da Declaración de Princípios Internacionales de Catalogación, a IFLA em 1998, verifica a necessidade de um reexame dos registros bibliográficos e lança os Functional Requirements of Bibliographic Records (FRBR) Requisitos Funcionais para Registros Bibliográficos, ou seja, com uma proposta de, [...] produzir um quadro que fornecesse um entendimento claro, precisamente determinado e compartilhado [por todos] do que seria aquilo sobre o que o registro bibliográfico proveria informação e o que se esperaria que o registro obtivesse, em termos de responder às necessidades dos usuários. (IFLA, 1998, p. 8). Os FRBR constituem em uma nova abordagem para a representação descritiva nos seus moldes convencionais, no sentido de propiciar uma recuperação mais efetiva e intuitiva dos itens documentários, agindo como um bibliotecário de referência, ou seja, relaciona todos os materiais atrelados ao termo da busca, trazendo-os de uma só vez em uma única interface. Por exemplo, se um determinado autor além de livros, possui outras manifestações, tais como discos, CDs, DVDs, o sistema permitirá através do modelo de relacionamento FRBR, no momento da busca realizada pelo usuário, relacionar todas essas manifestações e recuperá-las uma única vez. Os FRBR não são formatos para catalogação, mas sim, um referencial teórico atualizado para orientar a elaboração de formatos de descrição que sejam mais úteis para as diversas categorias de usuários dos catálogos. Utiliza uma abordagem baseada no usuário para analisar os requisitos da descrição bibliográfica e, a partir da análise, define de forma sistemática os elementos que o usuário espera encontrar no registro bibliográfico. (CAMPELLO, 2006, p. 61).

85 83 De acordo com Moreno (2006) os requisitos funcionais para registros bibliográficos constituem-se de um modelo conceitual que tem por objetivo reestruturar os registros bibliográficos a fim de reorganizar os elementos por meio da análise de entidades 9, atributos 10 e relacionamentos 11. No que se refere à entidade, por exemplo, vale dizer que compreende 3 (três) grupos: Grupo 1: entidades que são produto de trabalho intelectual ou artístico, Grupo 2: entidades que são responsáveis pelo conteúdo intelectual, guarda ou disseminação das entidades do primeiro grupo e, Grupo 3: entidades que são ou podem ser assunto das entidades. Pode-se visualizar de acordo com a figura 5, uma das manifestações no modelo de relacionamento propostos pelos FRBR no Grupo 1. FIGURA 5: Entidades do Grupo 1 e Relações Bibliográficas Primárias Fonte: Mey (1999) apud Moreno (2006, p. 57). 9 As entidades podem ser compreendidas, por exemplo, como uma obra, um texto, um livro etc. 10 Os atributos correspondem às características dos dados relacionados à entidade e servem para diferenciar o conteúdo intelectual ou artístico, por exemplo. (MORENO, 2006). 11 Os relacionamentos descrevem as ligações entre uma entidade e outra, na facilitação de manuseio do recurso informacional pelo usuário em um sistema.

86 84 Moreno (2006, p. 35, grifo do autor) de uma forma mais resumida apresenta que Obra é uma entidade abstrata, uma criação intelectual ou artística distinta. A entidade Expressão é a realização intelectual ou artística específica que assume uma obra ao ser realizada, excluindo-se aí aspectos de alteração da forma física. Uma Manifestação é a materialização de uma expressão de uma obra, ou seja, seu suporte físico, que podem ser livros, periódicos, kits multimídia, filmes, etc., que é representada pelo Item, um único exemplar de uma manifestação. As duas últimas entidades refletem a forma física, são entidades concretas, enquanto as duas primeiras refletem o conteúdo intelectual ou artístico. De acordo com a figura 5, pode-se fazer a seguinte interpretação para compreendermos a estrutura dos FRBR. Tomemos como exemplo, um romance literário (Obra), onde se tem o texto original e o mesmo fora traduzido ou tivera alguma modificação, tal como uma edição ilustrada (Expressão); as formas em que a obra está disponível podem ser encontradas/visualizadas em um formato impresso (manual) ou num formato eletrônico/digital (Manifestação); e no momento em que a obra está disponibilizada na estante de uma biblioteca, ou seja, os exemplares relativos àquela obra são denominados Itens. Os FRBR podem ser vistos como instrumentos que beneficiam e facilitam as tarefas dos usuários em um sistema de informação automatizado, reforçando as tarefas/objetivos tradicionais de um catálogo, por exemplo, enquanto um canal ou um meio como descrito por Cutter 12 em 1876, com a finalidade de habilitar os usuários a encontrar e sistematizar suas obras. Nesse sentido, seriam tarefas dos usuários no modelo de relacionamento FRBR: Encontrar: encontrar recursos que correspondam aos critérios de busca especificados pelo usuário, por meio de um atributo ou um relacionamento de uma entidade; Identificar: confirmar que o recurso descrito corresponde ao recurso buscado, ou distinguido entre dois ou mais recursos com características similares; Selecionar: selecionar um recurso que é apropriado às necessidades dos usuários, de acordo com suas especificidades, por exemplo, conteúdo, formato físico, etc. Obter: adquirir ou acessar o recurso descrito, por meio de compra, permuta ou acesso eletrônico remoto, por exemplo. (TILLET, 2004, tradução nossa). 12 CUTTER, C. A. Rules for a printed dictionary catalogue. Washington, D.C.: Government Printing Office, 1876, p. 10.

87 85 Considerando que os FRBR fornecem uma nova perspectiva da estrutura e nos relacionamentos dos registros bibliográficos, pois relacionam os metadados presentes em um registro bibliográfico com as necessidades dos usuários e recomendam um nível básico de funcionalidade para esses registros, os FRBR têm como objetivo padronizar e possibilitar um acesso mais efetivo aos recursos informacionais por meio do estabelecimento de representações mais adequadas e seus relacionamentos. Perspectiva essa que vai ao encontro da DECLARACIÓN... (2003, p. 1, tradução nossa), que retrata a intenção de que, [...] estes princípios potencializem a troca internacional de dados bibliográficos e de autoridade e orientem os que têm a missão de preparar regras de catalogação nos seus esforços para desenvolver um código internacional de catalogação. Criado em 1966, o Comitê de Direção para a Revisão do AACR - Joint Steering Committee for Revision of AACR, desde 2002 tem trabalhado e são os responsáveis pela atualização do código internacional de catalogação. Em 2004, iniciou-se uma revisão do AACR2 e em dezembro do mesmo ano foi lançado o que seria um primeiro esquema do novo código de catalogação - AACR3. Com o aumento dos recursos informacionais em meio digital em novos formatos e com novas tecnologias disponíveis e para atender às exigências atuais no que concerne aos impactos nas estruturas de descrição bibliográfica, o Comitê estabeleceu que tais regras eram inadequadas e adaptaram-nas desenvolvendo o Resource Description and Access (RDA 13 ) com lançamento de sua versão primeira prevista para De acordo com Tillett (2007, tradução nossa) o RDA será um novo padrão para a descrição e o acesso dos recursos informacionais, remodelado/projetado para o mundo digital, que proverá um conjunto compreensível de normas e instruções abarcando todos os tipos de conteúdos e mídias. 13 Detalhes mais específicos sobre o RDA estão disponíveis no site:

88 86 O RDA possibilitará aos usuários dos catálogos de bibliotecas e outros sistemas de organização da informação potencializar as tarefas de encontrar, de identificar, de selecionar e de obter recursos apropriados e melhor explicitados de acordo com suas necessidades informacionais. (TILLET, 2007; JOINT STEERING COMMITTEE FOR REVISION OF AACR, 2006, tradução nossa). Para Tseng (2005, p. 1) o novo código de catalogação deverá contemplar [...] modelos multinacionais de conteúdos a fim de fornecer descrições bibliográficas e acesso que abriguem todos os tipos de informação, incluindo meios emergentes, audiovisuais, objetos tridimensionais, etc. [...]. Será aplicado não apenas a bibliotecas, como a museus, arquivos, galerias e fontes de informação digitalizadas disponíveis na Web. O AACR3 irá englobar o conjunto de princípios e regras internacionais para catalogação denominado FRBR (Functional Requirements for Bibliographic Records) para controle das fontes autorizadas. O RDA de acordo com Bowen e Attig (2007) deverá ser constituído de duas partes, conforme pode ser visto, na figura 6: Parte A: Descrição e Relacionamentos Parte B: Controle de Pontos de Acesso FIGURA 6: Estrutura do código RDA. Fonte: Bowen e Atting (2007, p. 19).

89 87 Ao ser comparado com o código em exercício - AACR2, pode-se verificar notórias diferenças com relação à estrutura do RDA. O AACR2 contempla atualmente duas partes: Description (descrição) e Access (acesso). No RDA percebemos a inserção de alguns elementos, como por exemplo, na parte A (Descrição) onde estão agregados os Relationship (Relacionamentos) dados pelo modelo de relacionamento FRBR, ou seja, a parte A é agora descrição e relacionamento e abarca o conteúdo dos registros bibliográficos. Já a parte B Access Point Control (Controle de Pontos de Acesso) abarca o conteúdo de autoridade dos registros bibliográficos. Retomando a questão da preocupação da padronização, em especial da descrição bibliográfica, podemos dizer que foi a partir de Panizzi (1839) que houve uma efetivação de regras e normas no sentido de estabelecer uma padronização nas formas de representação, ou seja, regras que garantissem a uniformidade da descrição bibliográfica, o que pode ser visualizado nos tempos atuais e que vem influenciando decisivamente o trabalho da representação descritiva, mais comumente denominada catalogação. 4.3 Catalogação ou metadados... eis a questão : paradigmas e transformações no cenário atual O uso dos computadores contribuiu para o avanço da tecnologia e da ciência em geral, permitindo a automação de bibliotecas e o desenvolvimento de formas de representação que agilizassem o processamento dos dados bibliográficos e catalográficos para máquinas, contemplados nos catálogos convencionais. (CASTRO; SANTOS, 2005). À medida que as coleções aumentam uma das principais preocupações, principalmente das bibliotecas, e uma condição elementar é representar e descrever documentos de acordo com normas e técnicas padronizadas a fim de proporcionar a recuperação dos itens e posteriormente o seu uso. O surgimento da Web em meados dos anos de 1990 foi marcado pelo crescimento exponencial de informações em meio digital e nesse cenário há uma participação interdisciplinar entre bibliotecários, profissionais da Computação e da Lingüística, por

90 88 exemplo, na tentativa de se criar novas técnicas e instrumentos tecnológicos nos processos de produção, armazenagem representação, descrição e recuperação dos recursos informacionais digitais. Sobre esse aspecto, vale dizer que a Web caracterizada como um ambiente heterogêneo abarcando vários tipos de mídias tais como, som, imagem, texto etc. requer um olhar para novas formas diferenciadas do tratamento dos recursos informacionais digitais, a fim de que tais unidades possam ser representadas e descritas com o propósito de garantir o acesso, a recuperação, o uso e o reuso pelo usuário final. Nesse contexto, os formatos que possibilitam a descrição de documentos digitais, aparecem estruturados em formas denominadas metadados que etimologicamente refere-se a dados sobre dados, apontados pela literatura científica com o objetivo de descrever e localizar documentos eletrônicos na Web, de forma a permitir a sua recuperação de forma mais adequada e precisa. O catálogo de uma biblioteca é um exemplo típico de metadados, pois, nele existem várias informações que descrevem os recursos armazenados, auxiliando os usuários na recuperação. Muitas são as definições e conceitos sobre o termo metadados disponíveis hoje na literatura científica, o que vem causando uma pluralidade semântica acerca do seu uso, que interfere na sua compreensão por diferentes profissionais. Para este estudo recorremos a Alves (2005, p. 115), pois este é o conceito de metadados que mais se aplica aos propósitos dessa pesquisa. Segundo a autora, [...] os metadados são conjuntos de atributos, mais especificamente dados referenciais, que representam o conteúdo informacional de um recurso que pode estar em meio eletrônico ou não. A Internet ao ser considerada um ambiente com informações desestruturadas, tem nos metadados, a possibilidade de melhor estruturar os dados a fim de representar e proporcionar uma maior consistência na descrição dos recursos informacionais bem como sua recuperação. Os metadados podem ter diferentes níveis de especificidades e estruturas com o objetivo de descrever e identificar um recurso eletrônico mais exaustivamente, de forma a possibilitar sua integridade a fim de garantir o acesso, o uso, a preservação e a interoperabilidade entre ambientes informacionais digitais.

91 89 Para os profissionais da Ciência da Informação, o termo metadados está relacionado com o tratamento da informação, mais especificamente às formas de representação que caracterizam um recurso informacional para fins de identificação, de localização e de recuperação, ou seja, dados sobre catalogação e indexação que servem para organizar e tornar a informação mais acessível (GILLILAND-SWETLAND, 1999). Sobre essa ótica faz-se necessário retomar o ponto sugestivamente intitulado neste subcapítulo a fim de assoalhar o cenário atual. Surge a dúvida catalogação ou metadados? A questão-chave é a utilização ou a criação de terminologias novas para designar conceitos, atividades e funções há muito tempo sedimentadas por áreas específicas, tais como a Biblioteconomia e a Ciência da Informação num verdadeiro reinventar a roda. Tal práxis é realizada cotidianamente por profissionais de outras áreas sem o conhecimento das atribuições biblioteconômicas. Nesse sentido, é imprescindível um reexame dos aportes teóricos, conceituais e metodológicos da Biblioteconomia e da Ciência da Informação que propiciarão formas de representação mais efetivas. Os bibliotecários produzem e padronizam metadados há séculos, desde as primeiras tentativas de organização da informação a partir da descrição de documentos. O que vem acontecendo ultimamente é que profissionais de diversas áreas estão buscando criar instrumentos de descrição da informação, mas seu desconhecimento dos métodos, processos e peculiaridades característicos da documentação da Biblioteconomia, tem gerado uma variedade de padrões que muitas vezes não atende satisfatoriamente às exigências de uma lógica descritiva estabelecida na Biblioteconomia e que dê conta da complexidade da caracterização desse material. (MILSTEAD; FELDMAN, 1999; ALVES, 2005; CASTRO; SANTOS, 2007). Assim, podemos dizer que o objetivo e a função dos metadados estão fundamentados nos princípios da catalogação, ou seja, garantir a padronização dos recursos informacionais (forma e conteúdo), pautados em normas e regras internacionais na tentativa de facilitar e potencializar a identificação, a busca, a localização, a recuperação, a preservação, o uso e o reuso dos recursos informacionais. A diferença dessa forma de representação está na nova abordagem dada pelo ambiente tecnológico em que ela se insere. (ALVES, 2005, p. 117).

92 90 Nesse sentido, os metadados e padrões de metadados pormenorizados nessa pesquisa são MARC21, MARCXML, Dublin Core e BibTeX, pois estes são formatos vislumbrados pela iniciativa MarcOnt, no sentido de permitir a representação dos documentos e a interoperabilidade semântica entre formatos distintos Padrão de metadados MARC21 O padrão de metadados MARC21 é datado da década de 1960 e foi desenvolvido pela Library of Congress (LC), com o objetivo de padronizar a descrição bibliográfica em meio eletrônico com o início da utilização de computadores para gerenciar o processo de catalogação. O padrão de metadados MARC21 está inserido na era pré-internet e é considerado segundo as características dos metadados, um formato rico. O padrão de metadados MARC21 é considerado um formato completo e complexo, pois sua estrutura está baseada na semântica estrutural do AACR2 para a descrição e a identificação das características e especificidades do recurso informacional, por meio de uma representação padronizada, apresentando-se como o primeiro formato para a comunicação de registros bibliográficos. Quanto às suas funções, podemos dizer que o MARC21 é um formato destinado à criação, ao armazenamento, ao gerenciamento e ao intercâmbio de registros bibliográficos e catalográficos, de forma que diferentes computadores e programas possam reconhecer, processar e estabelecer pontos de acesso dos elementos que compõem a descrição bibliográfica. (ALVES; SOUZA, 2007). De acordo com Ferreira (2002), o formato MARC21 é um padrão amplamente utilizado na área biblioteconômica e é aceito internacionalmente para estabelecer a estrutura de representação, a importação e a exportação de dados bibliográficos e catalográficos. Outro fato que devemos destacar no padrão de metadados MARC21 é sua abrangência, ou seja, o formato contempla a descrição bibliográfica dos recursos informacionais em diferentes suportes de armazenamento, tais como: livros, periódicos,

93 91 mapas, música, materiais de arquivo e manuscritos, arquivos de computador e materiais visuais. O registro MARC é formado por campos 14, subcampos e indicadores; cada campo, etiqueta ou tag é constituído por três caracteres numéricos para sua identificação possuindo uma estrutura complexa e extensa (FURRIE, 2003), como pode ser vista na figura 7, a seguir. FIGURA 7: Exemplo de registro bibliográfico em formato MARC21 comentado pelo autor. Fonte: MARC21 Standards. Disponível em: < Acesso em: 24 jun Como pode-se perceber de acordo com a figura 7, o formato MARC21 apresenta um conjunto de campos em sua estrutura, com funções e objetivos para a representação e a sistematização de cada dado. Sendo assim, foi instituída a família MARC com a finalidade de dar um tratamento mais adequado e específico para diferentes tipos de dados, tais como: Formato MARC21 para dados bibliográficos (Bibliographic data): contêm especificações para a representação dos mais variados tipos de recursos informacionais, garantindo a descrição e a recuperação dos diferentes suportes; 14 Para este estudo adotaremos a termo campo para nos reportarmos à estrutura do formato MARC.

94 92 Formato MARC21 para controle de dados (Holding): contêm especificações para a codificação dos elementos referentes ao controle e a localização dos recursos informacionais, além de ser utilizado para o gerenciamento dos materiais; Formato MARC21 para dados de autoridade (Authority): possui especificações para a codificação de elementos que identificam autoridade (responsabilidade pela obra) de um registro bibliográfico e estabelecem o controle do conteúdo; Formato MARC21 para comunidade informacional (Community Information): contêm especificações para a codificação de registros que contenham informações sobre eventos, programas, serviços etc. Permite a inclusão e a disseminação de informações que podem ser integrados ao catálogo, tornando o recurso informacional acessível ao público; Formato MARC21 para dados de classificação (Classification): contêm especificações para a codificação e controle dos elementos de dados relacionados à classificação do conteúdo dos recursos informacionais. (LIBRARY OF CONGRESS, 2006). À medida que as tecnologias se desenvolvem, novos padrões de metadados surgem para atender à comunidade e para acompanhar os avanços tecnológicos. Sendo assim, o MARC21 para atender tal exigência, juntamente com a linguagem computacional XML estabelece a criação do padrão MARCXML, desenvolvido pela LC, abordado a seguir Padrão de metadados MARCXML Como mencionado anteriormente, o MARCXML foi desenvolvido pela LC com a finalidade de padronização e intercâmbio de dados em formato MARC para a linguagem computacional XML, além de permitir a navegabilidade na Web. Com o desenvolvimento tecnológico e para acompanhar os avanços da área de Ciência da Informação, a XML está sendo considerada cada vez mais a base de vários padrões da área de informação, principalmente no âmbito das bibliotecas digitais, ocorrendo, dessa forma, a migração do formato MARC21 para o MARCXML.

95 93 De acordo com Siqueira e Santos (2004, p. 106), [...] a estrutura do MARC21 em XML suporta todos os dados codificados na forma tradicional e sua arquitetura é baseada em componentes, e é extensível, ou seja, permite que os programadores de computador distribuam partes diferentes do software para construir soluções feitas sob encomenda. Vale destacar que o MARCXML possui exatamente a mesma estrutura do formato MARC21 (campos, subcampos, indicadores) apenas sua representação incorpora a XML redefinindo sua estrutura para potencializar a descrição dos recursos informacionais em meio digital. O MARCXML pode ser compreendido de acordo com a figura 8, a seguir. <?xml version="1.0" encoding="utf-8"?> - <collection xmlns=" - <record> <leader>01142cam a 4500</leader> <controlfield tag="001"> </controlfield> <controlfield tag="003">dlc</controlfield> <controlfield tag="005"> </controlfield> <controlfield tag="008">920219s1993 caua j eng</controlfield> - <datafield tag="010" ind1="" ind2=""> <subfield code="a"> </subfield> </datafield> - <datafield tag="020" ind1="" ind2=""> <subfield code="a"> :</subfield> <subfield code="c">$15.95</subfield> </datafield> - <datafield tag="040" ind1="" ind2=""> <subfield code="a">dlc</subfield> <subfield code="c">dlc</subfield> <subfield code="d">dlc</subfield> </datafield> - <datafield tag="042" ind1="" ind2=""> <subfield code="a">lcac</subfield> </datafield> - <datafield tag="050" ind1="0" ind2="0"> <subfield code="a">ps3537.a618</subfield> <subfield code="b">a </subfield> </datafield> - <datafield tag="082" ind1="0" ind2="0"> <subfield code="a">811/.52</subfield> <subfield code="2">20</subfield> </datafield> - <datafield tag="100" ind1="1" ind2=""> <subfield code="a">sandburg, Carl,</subfield> <subfield code="d"> </subfield> </datafield> - <datafield tag="245" ind1="1" ind2="0"> <subfield code="a">arithmetic /</subfield> <subfield code="c">carl Sandburg ; illustrated as an anamorphic adventure by Ted Rand.</subfield> </datafield> - <datafield tag="250" ind1="" ind2=""> <subfield code="a">1st ed.</subfield> </datafield>

96 94 - <datafield tag="260" ind1="" ind2=""> <subfield code="a">san Diego :</subfield> <subfield code="b">harcourt Brace Jovanovich,</subfield> <subfield code="c">c1993.</subfield> </datafield> - <datafield tag="300" ind1="" ind2=""> <subfield code="a">1 v. (unpaged) :</subfield> <subfield code="b">ill. (some col.) ;</subfield> <subfield code="c">26 cm.</subfield> </datafield> </datafield> - <datafield tag="500" ind1="" ind2=""> <subfield code="a">one Mylar sheet included in pocket.</subfield> </datafield> - <datafield tag="520" ind1="" ind2=""> <subfield code="a">a poem about numbers and their characteristics. Features anamorphic, or distorted, drawings which can be restored to normal by viewing from a particular angle or by viewing the image's reflection in the provided Mylar cone. </subfield> </datafield> - <datafield tag="650" ind1="" ind2="0"> <subfield code="a">arithmetic</subfield> <subfield code="x">juvenile poetry.</subfield> </datafield> - <datafield tag="650" ind1="" ind2="0"> <subfield code="a">children's poetry, American.</subfield> </datafield> - <datafield tag="650" ind1="" ind2="1"> <subfield code="a">arithmetic</subfield> <subfield code="x">poetry.</subfield> </datafield> - <datafield tag="650" ind1="" ind2="1"> <subfield code="a">american poetry.</subfield> </datafield> - <datafield tag="650" ind1="" ind2="1"> <subfield code="a">visual perception.</subfield> </datafield> - <datafield tag="700" ind1="1" ind2=""> <subfield code="a">rand, Ted,</subfield> <subfield code="e">ill.</subfield> </datafield> </record> </collection> FIGURA 8: Estrutura de um registro em formato MARCXML. Fonte: MARCXML. Disponível em: < Acesso em: 23 jul Pode-se destacar que o padrão de metadados MARCXML está sendo usado cada vez com mais intensidade nas questões de descrição, recuperação e preservação dos recursos informacionais na potencialização e padronização de ambientes informacionais digitais, o que implica e requer uma nova postura dos profissionais envolvidos na construção de formas de representação da informação.

97 Padrão de metadados Dublin Core O Dublin Core Metadata (DC), em seus objetivos, é destinado a organizar as informações disponíveis nas páginas da Web, na tentativa de estabelecer padrões de catalogação dos recursos informacionais em meio digital. É considerado como o primeiro a ser denominado padrão de metadados, cujo conceito é previsto nos fundamentos da Catalogação da área de Biblioteconomia e originário do MARC. Segundo Marcondes (2006, p. 108), Dublin Core é um padrão voltado principalmente para a descrição e a descoberta de documentos eletrônicos. Caso a biblioteca digital, além de referenciar recursos eletrônicos, seja uma publicadora ou editora, como o são várias bibliotecas digitais especializadas ou arquivos eletrônicos que têm a custódia dos documentos que compõem sua coleção, terá de se preocupar, além de referenciar seus documentos com metadados segundo padrões como o Dublin Core, com questões como copyright, administração e gestão destes documentos e a preservação digital dos mesmos. Para todas estas atividades, existem conjuntos de metadados específicos. O Dublin Core foi desenvolvido em 1995 por um consórcio de instituições produtoras de informação no setor de pesquisas da OnLine Computer Library Center (OCLC), cuja filosofia é que a descrição de um documento pode ser elaborada/representada pelo seu criador ou produtor devido a simplicidade do preenchimento dos campos, sem a obrigatoriedade de um profissional (bibliotecário/catalogador) especialista em catalogação. De acordo com Souza, Vendrusculo e Melo (2000, p. 93), [...] o Dublin Core, pode ser definido como sendo o conjunto de elementos de metadados planejado para facilitar a descrição de recursos eletrônicos. A expectativa é de que os autores e Websites, que não possuam conhecimentos em catalogação, possuam capacidade de usar o Dublin Core para descrição de recursos eletrônicos, tornando suas produções mais visíveis aos mecanismos de busca e sistemas de recuperação. Nesse momento é pertinente destacar que mesmo possuindo essa característica de simplicidade e flexibilidade apontadas pela literatura científica, vale dizer que há normas e princípios que norteiam a sua construção de forma a garantir uma representação efetiva e para que se estabeleça a interoperabilidade entre os sistemas informacionais digitais.

98 96 O Dublin Core é constituído por 15 elementos para facilitar a descrição e a recuperação dos recursos informacionais em meio digital. Barreto (1999, p. 74) destaca-os. Nome do elemento Subject Title Author Publisher OtherAgent Date ObjectType Form Identifier Relation Source Language Coverage Rights Description Tópico relacionado ao objeto descrito Nome do objeto Descrição do elemento Pessoas diretamente responsáveis pelo conteúdo intelectual do objeto Agente ou agência responsável por tornar o objeto disponível Pessoas, tais como editores e ilustradores, que contribuíram de forma significativa para o conteúdo intelectual do objeto. Data da publicação Gênero do objeto, tal como uma novela, um poema ou dicionário. Formato de dado do objeto, tal como postscript, HTML, etc. Números ou caracteres usados para identificar o recurso de forma única Categoria de relacionamento do objeto com outros objetos Objetos dos quais o objeto descrito é derivado Idioma relativo ao conteúdo intelectual do objeto Localização especial e duração temporal do objeto Contém ou referencia o direito de propriedade sobre o objeto Contém uma descrição textual do objeto ou uma referência para essa descrição FIGURA 9: Elementos contemplados no padrão de metadados Dublin Core. Fonte: Adaptado de DCMI (2006). Assim, para melhor compreender-se a estrutura de um documento no formato de metadados Dublin Core, segue de acordo com a figura 10, um modelo.

99 97 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" " <html xmlns=" lang="en-us" xml:lang="en-us"> <head> <title>dublin Core Metadata Initiative (DCMI)</title> <link rel="schema.dc" href=" /> <meta name="dc.title" content="dublin Core Metadata Initiative (DCMI) Home Page" /> <meta name="dc.description" content="the Dublin Core Metadata Initiative is an open forum engaged in the development of interoperable online metadata standards that support a broad range of purposes and business models. DCMI's activities include consensus-driven working groups, global conferences and workshops, standards liaison, and educational efforts to promote widespread acceptance of metadata standards and practices." /> <meta name="dc.date" content=" " /> <meta name="dc.format" content="text/html" /> <meta name="dc.contributor" content="dublin Core Metadata Initiative" /> <meta name="dc.language" content="en" /> <meta http-equiv="content-type" content="text/html; charset=iso " /> <link rel="meta" href="index.shtml.rdf" /> <link rel="alternate" type="application/rss+xml" title="rss" href=" /> <link rel="stylesheet" href="/css/default.css" type="text/css" /> <script src="/js/default.js" type="text/javascript"></script> </head> FIGURA 10: Estrutura de registro em formato Dublin Core. Fonte: Dublin Core Metadata Initiative. Disponível em: < Acesso em: 24 jul Vale destacar de acordo com a figura 10, que os mesmos elementos (campos) do DC correspondem a elementos (campos) do padrão de metadados MARC21, por exemplo, DC.title (DC) e 245 (MARC21), ver figuras 7 e 8: dizem respeito à indicação do título do recurso informacional. Isso significa que ambos os formatos provêm da mesma fonte e têm a possibilidade de intercambiar seus dados, ou seja, estabelecer a interoperabilidade entre formatos e padrões distintos. Uma das grandes discussões na comunidade científica é a polêmica de qual padrão de metadados utilizar (MARC21 ou DC), uma vez que devido a sua simplicidade grande parte dos ambientes informacionais, tais como repositórios digitais, bibliotecas digitais etc., adotam o DC. Mas o que precisa ficar evidente são quais princípios que norteiam sua criação. O DC foi criado com o objetivo de facilitar a descoberta do recurso informacional no ambiente Web, ou seja, abarca uma representação mínima que proporciona a sua identificação bem como a sua localização. Enquanto o MARC21 está relacionado à criação, ao armazenamento, ao gerenciamento e ao intercâmbio de registros bibliográficos e catalográficos e atende às peculiaridades exigidas nas grandes coleções.

100 98 Sendo assim, a adoção de um formato/padrão ou outro dependerá dos objetivos institucionais dos ambientes informacionais e de uma lógica descritiva que atenda e contemple suas necessidades informacionais e que permita o estabelecimento dos requisitos da interoperabilidade na satisfação dos usuários. Faz-se necessário destacar também que para acompanhar os avanços tecnológicos, o padrão de metadados Dublin Core já se encontra também disponível numa versão na linguagem computacional XML o que implica uma melhor estruturação e efetividade dos dados e dos metadados Padrão de metadados BibTeX O padrão de metadados BibTeX foi desenvolvido em 1985 por Oren Patashnik e Leslie Lamport enquanto um formato bibliográfico para a preparação de documentos no sistema LaTeX. LaTeX é um sistema de preparação para buscas abertas de documentos utilizado na comunidade acadêmica. (KRUK; SYNAK; ZIMMERMANN, 2005, tradução nossa). De acordo com os autores o BibTeX é considerado um formato bibliográfico simples para a descrição dos recursos informacionais na Internet e aplicado atualmente em bibliotecas digitais. Pode-se perceber que o BibTex é um padrão muito parecido com o Dublin Core no aspecto da simplicidade e autonomia dos autores na descrição e na criação do registro bibliográfico. Os autores provêm suas referências/citações de outras publicações, totalmente baseadas nas características originais do documento, para então, serem compartilhadas pela comunidade na Internet. (KRUK; SYNAK; ZIMMERMANN, 2005, tradução nossa). Os elementos contemplados pelo padrão podem ser assim elencados de acordo com Kruk, Synak e Zimmermann (2005): Abreviação Editor/autor Título Título (livro, revista, série)

101 99 Mês/dia/ano Issn/Isbn Volume/número/páginas Instituição/organização/escola Publicador/URL Endereço Notas O tipo de publicação (recurso informacional) pode ser classificado de acordo com 13 categorias diferentes. Cada arquivo de BibTeX contém um número de entrada. Uma entrada descreve uma única publicação, que pode ser uma entidade autônoma (como um livro, por exemplo) ou uma parte da publicação no todo (como um capítulo de um livro, por exemplo). Há entradas padrão em BibTeX tais como: Artigo - artigo de um periódico ou jornal Livro Conferência Inbook - parte de um livro, bem como um capítulo, seção Incollection - parte de um livro com o seu próprio título Inproceedings - um artigo nos anais do evento Manual documentação técnica Dissertação Miscelânea Tese (PHD) Anais/Resumos de uma conferência Relatórios técnicos um relatório publicado por uma instituição ou universidade Unpublished um documento nunca publicado, mas com um título e um autor. (KRUK; SYNAK; ZIMMERMANN, 2005, tradução nossa). O formato BibTeX apresenta quatro tipos diferentes de entradas, tais define abreviações na forma de apresentação do conteúdo do recurso informacional, como por { foo = "Mrs. Foo" }

102 define como o texto deve ser para comentários não feitos por BibTeX; Cada uma das entradas declarando uma referência única para um determinado tipo de publicação, @inproceedings, etc. (FEDER, 2006, tradução nossa). Para melhor compreender-se a estrutura de um registro BibTeX vejamos um modelo, de acordo com a figura 11, a seguir. FIGURA 11: Estrutura de um registro no padrão de metadados BibTeX Fonte: Synak (2005, p. 55) Como pode ser observado na figura 11, um registro BibTeX contempla alguns elementos descritivos tais como (author, title, address etc.) referente neste caso a um recurso informacional do tipo artigo publicado em anais de evento (inproceedings). Vale destacar também alguns sinais diacríticos, tais como { (chaves) que constituem a entrada do conteúdo do registro BibTeX, e finalizado também por } (chave); pode-se ainda verificar que cada campo do registro é separado por um sinal do tipo, (vírgula). Uma entrada de BibTeX consiste no tipo (uma palavra antecedida uma palavrachave e um número de metadados que definem várias características de uma entrada

103 101 específica de BibTeX. Entre esses metadados, pode-se destacar: autor, título, ano etc. Alguns campos são obrigatórios para determinados tipos de entradas em BibTeX, alguns são opcionais. Cada campo é especificado por seu nome seguido por um sinal de igual e pelo conteúdo contemplado no registro bibliográfico e por um sinal de marcação do tipo (aspas). Há um conjunto de metadados-padrão existentes, que podem ser interpretados por BibTeX ou ferramentas autorizadas por ele. Os campos que são desconhecidos pelo padrão são ignorados por ele e podem assim, ser usados para o armazenamento de informações adicionais sem interferir no resultado de uma busca de um documento original. (FEDER, 2006, tradução nossa). O padrão BibTeX tem em seus objetivos a possibilidade de facilitar a separação da bibliografia com a apresentação do texto, ou seja, utiliza-se do mesmo conceito da distinção do conteúdo com o estilo do texto utilizada no próprio LaTeX, por exemplo, ou da própria linguagem computacional XHTML 15 (extensible Hypertext Markup Language). Além disso, pode-se dizer que tal padrão está voltado principalmente para a comunidade científica (pesquisadores) e temas relacionados à educação. Em uma biblioteca digital que contenha publicações técnicas diferentes, publicar registros em BibTeX junto com essas pode ser muito mais útil para a comunidade de pesquisadores. (SYNAK, 2005, tradução nossa). Dessa forma, assim como os padrões de metadados MARC21 e Dublin Core que possuem versões na linguagem computacional XML, o formato BibTeX também possui em sua versão o padrão BibTeXML. Além disso uma das iniciativa atuais do Massachussets Institute of Technology (MIT) é a representação de BibTeXML na linguagem computacional OWL (Web Ontology Language), destinada a construção de ontologias cuja base está calcada na arquitetura de metados RDF (Resource Description Framework) que atua efetivamente na construção Web Semântica. Além dos padrões de metadados mencionados anteriormente, faz-se necessário o estudo e a atenção para outras ferramentas e instrumentos tecnológicos para o estabelecimento 15 Trata-se de uma evolução da linguagem HTML para a imposição de regras semânticas às páginas escritas em HTML bem como a sua integração com outras aplicações. (FEITOSA, 2006).

104 102 da interoperabilidade entre ambientes informacionais digitais. Para que haja um trabalho conjunto entre os sistemas, destaca-se a linguagem de marcação XML (Extensible Markup Language) e a arquitetura de metadados RDF (Resource Description Framework), pois são consideradas a base da infra-estrutura da Web Semântica e da iniciativa MarcOnt. 4.4 XML (Extensible Markup Language) Antes de adentrar-se no assunto propriamente dito, precisa-se destacar a importância da XML 16 para a construção Web Semântica e para o desenvolvimento da iniciativa MarcOnt. No primeiro caso, com a necessidade de embutir semântica para que os agentes de softwares possam entender o conteúdo dos dados, a XML atua como ferramenta que proporcionará, além da sintaxe, a semântica, na padronização e na estruturação dos dados. Já no segundo caso, vale dizer que para haver a interoperabilidade semântica entre os padrões de metadados vislumbrados pelo MarcOnt, é imprescindível uma linguagem comum, que poderá proporcionar melhores resultados na busca e na recuperação dos recursos informacionais e esta linguagem é a XML. A XML (Extensible Markup Language) foi desenvolvida em 1996 por um grupo de especialistas do W3C (World Wide Web Consortium), com o objetivo de tornar-se um padrão universalmente aceito para a descrição e a redefinição da estrutura de documentos eletrônicos e está sendo cada vez mais utilizada de forma generalizada na codificação de metadados. A linguagem computacional XML originou-se a partir da linguagem SGML (Standard Generalized Markup Language) e provê a estruturação de dados independente de plataforma, ou do modelo de dados em que as informações estão representadas sendo apontada na literatura como uma meta-linguagem, ou seja, uma linguagem genérica para definir a formatação de documentos. 16 É pertinente retratar que não é nosso objetivo nesta pesquisa abordar com profundidade a linguagem XML, mas sim apontar sua importância no desenvolvimento de ambientes informacionais específicos, como por exemplo, a Web Semântica e as Bibliotecas digitais. Informações mais detalhadas sobre XML podem ser encontradas em Furgeri (2006); Feitosa (2006); Flamino (2006); Alves (2005); Siqueira (2003); Siqueira e Santos (2004); Almeida (2002) e Bax (2001).

105 103 Um ponto que se faz necessário destacar é a diferença entre a HTML (HyperText Markup Language) e a XML; a primeira diz respeito à disposição de como o documento será apresentado, enquanto a segunda especifica o significado (semântica) das informações contempladas pelo documento na facilitação de proporcionar ao usuário uma busca mais significativa e dados melhor compreensíveis pelos agentes de softwares. relatam que Alguns autores como Esteves, Santos e Guimarães (2002) apud Siqueira (2003, p. 78) A XML aparece, no contexto da internet, para facilitar a difusão da informação documental. Como possui uma semântica própria, descreve a estrutura e conteúdo do documento, não a sua formatação, tornando-se, por isso, "revolucionário" em relação ao HTML que apenas possibilita a formatação dos dados no que respeita à sua apresentação gráfica, não fornecendo nenhum conteúdo semântico. A figura 12 apresenta uma forma de apresentação de um documento na estrutura XML, a seguir. <documento> <livro ano= 2006 > <autor> <nome> Bernadete</nome> <sobrenome> Campello</ sobrenome> </autor> <titulo> Introdução ao controle bibliográfico</titulo> <editora> <nome> Briquet de Lemos/Livros</nome> </editora> </documento> FIGURA 12: Exemplo de documento livro em XML. Fonte: do autor. Como pode ser observado pela figura 12, a estrutura de um documento XML é sempre constituído por marcações de início <documento> e marcações de fim </documento> onde a estrutura textual é denominada por elementos (atributos) e cada atributo é dado por um valor entre aspas ( 2006 ).

106 104 Ao nos reportarmos ao cenário da Biblioteconomia e da Ciência da Informação, vê-se que a XML é apontada na literatura, de acordo com vários autores (Furgeri, 2006; Feitosa, 2006; Flamino, 2006; Siqueira, 2003; Siqueira e Santos, 2004; Almeida, 2002; Bax, 2001) como uma ferramenta tecnológica que contribui significamente com os padrões de metadados no sentido de potencializar a preservação, o uso e o reuso dos recursos informacionais. Para este estudo adotam-se alguns conceitos de Siqueira (2003) e Siqueira e Santos (2004), pois de acordo com sua análise são os que mais se adaptam aos princípios do MarcOnt. A XML depende também da participação de outras tecnologias para a sua efetividade; dentre essas tecnologias destacam-se o DTD, XSL, XML Schema. DTD (Document Type Definition) estabelece um conjunto de regras (sintaxe) para a validação da estrutura de um documento XML. Umas das desvantagens da DTD é que ela permite apenas a verificação sintática de um documento sem nenhum tipo de controle semântico (conteúdo). [...] pode-se garantir que o título foi digitado, mas não se realmente era o título, ou ainda, pode-se verificar se o dado informado no campo data de publicação é realmente uma data, mas não se garante que seja a data correta. (SIQUEIRA, 2003, p. 75). XSL (Extensible Stylesheet Language) funciona como um instrumento na transformação de dados XML de forma a serem apresentados em HTML, cujo objetivo é permitir a correta visualização dos dados no navegador. Em relação ao MarcOnt, esta linguagem tem um papel importante principalmente no que diz respeito às formas de apresentação dos padrões de metadados contemplados no âmbito das bibliotecas digitais, por exemplo. A XSL juntamente com as linguagens XSLT (Linguagem de Transformação) e XSLFO (Linguagem de Formatação de Objetos) potencializa as estruturas de apresentação de um recurso informacional. (SIQUEIRA, 2003). XML Schema recomendada pelo W3C essa ferramenta está sendo empregada em substituição à DTD aplicada a diferentes contextos, com a finalidade de garantir a integridade sintática e semântica da estrutura de um documento XML. O papel de um XML Schema é similar ao dos esquemas de especificações de estruturas de dados [elementos, atributos e tipos de dados] como nomes de campos e seus respectivos

107 105 tipos em um banco de dados relacional. (FURGERI, 2006, p. 93). Vale destacar nesse momento, que a XML juntamente com a XML Schema localiza-se na camada base da Web Semântica e são, portanto, uma das linguagens que proporcionarão uma melhor estruturação dos dados (sintaxe e semântica) a fim de uma melhor recuperação dos recursos informacionais. A XML, no contexto das bibliotecas digitais, apresenta-se como uma das linguagens que mais se adapta às formas de representação da informação, permeado pelas TICs no que diz respeito à descrição bibliográfica dos recursos informacionais. Nessa perspectiva pode-se considerar que a linguagem XML visa à criação e o estabelecimento de padrões de comunicação entre os sistemas informacionais, tais como, por exemplo, as bibliotecas digitais na possibilidade de integração entre sistemas, plataformas e arquiteturas heterogêneos favorecendo a interoperabilidade semântica entre ambientes informacionais digitais. Além da linguagem computacional XML e para promover o estabelecimento da interoperabilidade, e de acordo com a diversidade de padrões de metadados, surgem as arquiteturas de metadados, que são apontadas pela literatura, como uma forma de representar e dar suporte à uma variedade de esquemas de metadados. Nesse sentido, a seção seguinte apresentará a arquitetura de metadados RDF, considerada uma estrutura computacional proposta por Berners-Lee para a Web Semântica. 4.5 Arquitetura de metadados RDF Assim como os padrões de metadados abordados anteriormente, esta seção apresenta a arquitetura de metadados RDF (Resource Description Framework), umas das recomendações do W3C que permeia a construção da Web Semântica, bem como apontada na literatura como o pilar para a iniciativa MarcOnt, além de possibilitar a interoperabilidade semântica entre bibliotecas digitais.

108 106 De acordo com o idealizador do MarcOnt, Kruk (2005, tradução nossa), a arquitetura de metadados RDF, constitui o centro ou coração da arquitetura deste novo padrão, na possibilidade de funcionar como uma ferramenta para o armazenamento de descrições bibliográficas semânticas e a comunicação entre recursos informacionais de ambientes heterogêneos, com diferentes arquiteturas e plataformas. Com a heterogeneidade de dados e metadados disponibilizados no ambiente Web, fazse necessário o desenvolvimento de um esquema ou estrutura que comporte esta diversidade de metadados, de modo que permita sistemas interoperáveis na rede. Esse esquema ou estrutura é denominado arquitetura de metadados, cujos objetivos são representar e proporcionar uma base de codificação de metadados por meio de estruturas flexíveis. Vale destacar que assim como há padrões de metadados diversificados, há também arquiteturas de metadados distintas. Para este estudo trataremos da arquitetura RDF, pelos motivos anteriormente explicitados. A arquitetura de metadados RDF possibilita o processamento e o gerenciamento automatizado de recursos informacionais, de acordo com áreas do conhecimento distintas, principalmente com relação: à descoberta de recursos informacionais, à descrição das relações entre os recursos informacionais representadas na rede, ao auxílio aos agentes de software, ao intercâmbio e ao compartilhamento de informações entre outros tipos de aplicações. (LASSILA; SWICK, 1999). A arquitetura RDF em seus objetivos visa [...] ter um modelo de dados simplificado; possuir semântica formal e provável inferência; utilizar um vocabulário extensível; utilizar sintaxe baseada em XML; dar suporte aos tipos de dados do XML Schema; permitir que qualquer pessoa possa fazer declarações acerca de qualquer recurso informacional. (FEITOSA, 2006, p ). De acordo com o World Wide Web Consortium (W3C), em termos semânticos, a estrutura de um documento RDF é baseada no conceito de tripla, ou seja, partes que contemplam a informação para sua compreensão tanto por homens, quanto por máquinas. Essas partes são denominadas como sujeito, predicado e objeto. Para Daconta (2003) apud Feitosa (2006, p , grifo do autor), as partes de RDF podem ser assim entendidas:

109 107 O sujeito, no contexto gramatical, corresponde a um nome ou frase nominal que representa aquele que pratica uma ação no campo da lógica, esse é o objeto sobre o qual se elabora alguma declaração. Em RDF, necessita-se de um URI para a identificação unívoca do conceito sobre o qual se elabora tal declaração; esse URI é também representativo de um recurso [unidade informacional]. O predicado, gramaticalmente, é a parte da sentença que modifica o sujeito e inclui uma frase verbal; em outras palavras, o predicado diz algo a respeito do sujeito no campo da lógica, um predicado é uma função de um indivíduo (um tipo particular de sujeito) para valores verdade, com base em certo número de argumentos. [ ] um predicado é uma relação entre o sujeito e o objeto. Gramaticalmente, um objeto é um nome que sofre a ação expressa por um verbo para a lógica um objeto é influenciado pelo predicado. [ ] o objeto pode ser também um recurso [unidade informacional], referenciado por um predicado ou por um valor literal. Pode-se visualizar uma estrutura RDF, bem como suas características explicitadas anteriormente, de acordo com a figura 13, a seguir: FIGURA 13: Arquitetura RDF simples. Fonte: Lassila e Swick (1999) Conforme pode ser observado na figura 13, apresenta-se uma estrutura RDF, onde se podem traçar os seguintes comentários: o assunto (recurso) é definido neste diagrama pelo arco cujo predicado (propriedade) é definido por um criador (creator), possuindo como objeto (Ora Lassila). Além disso, o recurso possui atributos e valor estruturado com identificador (85740), criado por (Ora Lassila) que possui o lassila@w3.org.

110 108 A arquitetura de metadados RDF pode ser representada e apresentada também na linguagem XML, conforme pode ser visto na figura 14. <rdf : RDF> < rdf: Description about= > <creator> Ora Lassila </ Creator > </ rdf: Description > </rdf : RDF> FIGURA 14: Declaração RDF utilizando a sintaxe XML. Fonte: Lassila e Swick (1999) Conforme pode ser observado pela figura 14, uma declaração RDF utilizando a linguagem XML pode ser representada de acordo com a etiqueta rdf : RDF cujo conteúdo dessa etiqueta é expressa por outra etiqueta do tipo rdf: Description, bem como a validação ou referência de um recurso já existente, representado pela etiqueta about. Para melhor potencializar a descrição e o relacionamento entre os recursos informacionais, surge o RDF Schema a fim de estabelecer uma amplitude semântica nas formas de representação, conforme pode ser visto, a seguir RDF Schema Além da arquitetura RDF pode-se destacar também uma outra ferramenta tecnológica que em outras palavras, pode ser considerada uma extensão de RDF, o denominado RDF Schema ou RDFS. O RDFS apresenta-se nesse contexto como uma linguagem de descrição de vocabulário, ou seja, descreve as propriedades de um recurso informacional bem como estabelece relações entre propriedades de outros recursos, podendo, além disso, descrever classes, propriedades e outros recursos informacionais condizentes aos pares atributo-valor contemplados em XML. (FEITOSA, 2006).

111 109 Assim como no XML Schema, o RDF Schema foi originado para fornecer a sintaxe e a semântica a um documento, com a finalidade de estabelecer uma estrutura/arquitetura para a descrição de classes e de propriedades específicas para atender a determinadas aplicações. Além disso, o RDF Schema fornece um modelo de dados para os recursos informacionais da Web e seus relacionamentos, propiciando uma semântica simples, com a possibilidade de representações do próprio modelo em XML. (FEITOSA, 2006). forma: De uma maneira mais sucinta, o RDF Schema pode ser compreendido da seguinte [...] os recursos podem ser divididos em grupos chamados classes. Os membros de uma classe são denominados instâncias. As classes em si, são também recursos e podem ser descritas por meio de propriedades. Ao conjunto de instâncias de uma classe denomina-se extensão da classe. Uma classe pode ser membro de sua própria extensão, isto é, pode ser uma instância de si própria. Todas as classes em RDF Schema são agrupadas em uma classe principal denominada rdfs:class. De tal maneira, se uma classe X é uma subclasse de Y, todas as instâncias de X serão também instâncias de Y e poderão ser declaradas com o uso da propriedade rdfs:subclassof. O termo superclasse é utilizado para designar uma classe superior em relação a suas subclasses. Coleções de recursos podem ser representadas em RDF pelo uso de contêineres, que podem ser de valores alternativos (rdf:alt), de valores não ordenados (rdf:bag) e de valores seqüenciais (rdf:seq). (FEITOSA, 2006, p. 109, grifo do autor). O RDF Schema, nesse sentido, pode ser compreendido como uma ferramenta que permite descrever vocabulários, bem como as classes e as propriedades para um recurso RDF, fornecendo assim, uma estrutura mais flexível e com uma maior amplitude semântica na descrição dos recursos informacionais. A estrutura do RDF Schema pode ser visualizada de acordo com a figura 15, a seguir. <?xml version="1.0"?> <!DOCTYPE rdf:rdf [<!ENTITY xsd " <rdf:rdf xmlns:rdf=" xmlns:rdfs=" xml:base=" <rdfs:class rdf:id="motorvehicle"/> <rdfs:class rdf:id="passengervehicle"> <rdfs:subclassof rdf:resource="#motorvehicle"/>

112 110 </rdfs:class> <rdfs:class rdf:id="truck"> <rdfs:subclassof rdf:resource="#motorvehicle"/> </rdfs:class> <rdfs:class rdf:id="van"> <rdfs:subclassof rdf:resource="#motorvehicle"/> </rdfs:class> <rdfs:class rdf:id="minivan"> <rdfs:subclassof rdf:resource="#van"/> <rdfs:subclassof rdf:resource="#passengervehicle"/> </rdfs:class> <rdfs:class rdf:id="person"/> <rdfs:datatype rdf:about="&xsd;integer"/> <rdf:property rdf:id="registeredto"> <rdfs:domain rdf:resource="#motorvehicle"/> <rdfs:range rdf:resource="#person"/> </rdf:property> <rdf:property rdf:id="rearseatlegroom"> <rdfs:domain rdf:resource="#passengervehicle"/> <rdfs:range rdf:resource="&xsd;integer"/> </rdf:property> <rdf:property rdf:id="driver"> <rdfs:domain rdf:resource="#motorvehicle"/> </rdf:property> <rdf:property rdf:id="primarydriver"> <rdfs:subpropertyof rdf:resource="#driver"/> </rdf:property> </rdf:rdf> FIGURA 15: Estrutura da arquitetura RDF Schema. Fonte: W3C (2004) Pode-se perceber pela figura 15, que a descrição de um recurso informacional em RDF Schema é escrita em XML (<?xml version="1.0"?>). O recurso descrito é indicado aqui, pela sua URL Universal Resource Locator (xmlns:rdfs=" O recurso é dado por uma classe, definida aqui, por exemplo, como (<rdfs:class rdf:id="truck">), possuindo uma subclasse, expressa por (<rdfs:subclassof rdf:resource="#motorvehicle"/>), possuindo como valor ("#MotorVehicle"). Além disso, o recurso é descrito com algumas propriedades, ou seja, é uma subclasse de

113 111 (rdfs:class), tal como: (<rdf:property rdf:id="registeredto">). Destaca-se ainda, que o recurso possui um domínio relativo à propriedade, dado por (<rdfs:domain rdf:resource="#motorvehicle"/>) e um valor expresso por ("#MotorVehicle"). O recurso, possui uma extensão relativa à propriedade domínio (<rdfs:range rdf:resource="#person"/>), cujo valor é expresso por ("#Person"). Vale dizer ainda, que o recurso possui uma subpropriedade (<rdfs:subpropertyof rdf:resource="#driver"/>), cujo valor é expresso por ("#driver"). A arquitetura de metadados RDF está sendo acoplada a outros padrões de metadados, tais como Dublin Core e também a linguagens computacionais do tipo XML, por exemplo, o que implica uma maior e melhor estruturação dos recursos informacionais e uma amplitude entre os relacionamentos e características semânticas dos metadados em ambientes informacionais digitais. 4.6 Apontamentos sobre as formas de representação da informação Faz-se necessário nesse momento retomarmos algumas questões acerca da representação da informação, a fim de tecermos discussões e reflexões com um olhar para os ambientes informacionais digitais. De acordo com a literatura disponível, os metadados são considerados uma condição sine qua non para a resolução de problemas de descrição e posteriormente de recuperação de informações no contexto Web. É possível visualizar-se o uso de metadados bem como aplicações em ambientes informacionais específicos, tais como as bibliotecas digitais e sob esse prisma precisa-se atentar para as seguintes abordagens: a) A adoção de um padrão de metadados ou outro está pautada e dependerá de uma lógica descritiva e o princípio para o qual o padrão foi criado que norteará uma representação mais efetiva do recurso informacional;

114 112 b) As bibliotecas digitais são apresentadas contemplando estruturas pré-estabelecidas e padronizadas (metadados) o que possibilita uma maior e melhor interoperabilidade, entre não somente bibliotecas digitais, mas também entre outros sistemas informacionais; c) Os padrões de metadados gerenciados por bibliotecários no âmbito de bibliotecas digitais terão que ser inteligentes/compreensíveis não somente por humanos, mas também para que possam ser interpretados e gerenciados semanticamente pelas máquinas ou agentes de softwares, trabalhando numa sinergia e de forma colaborativa entre ambientes informacionais digitais, como é o caso da Web semântica, Web 2.0, Repositórios Institucionais etc. (LOURENÇO, 2007). Pode-se dizer que cada tipo de formato ou padrão de metadados fornecerá um tipo de representação e quanto mais específica, completa e detalhada for uma representação, mais pontos de acesso à unidade informacional ela fornecerá e melhor ou mais possibilidades de recuperação haverá. A adoção de um padrão ou outro dependerá de uma lógica descritiva que contemple à realidade e às necessidades de cada instituição, de forma a possibilitar a individualização da unidade informacional e multidimensionar suas formas de acesso, evitando um re-trabalho na construção das formas de representação da informação bem como na descrição da unidade informacional. Além dos metadados e padrões de metadados, podemos dizer que XML, RDF e RDF Schema, são apontadas como tecnologias que poderão proporcionar estruturas de descrição do significado dos recursos informacionais em ambiências informacionais digitais específicas, por exemplo, Bibliotecas Digitais, Web Semântica e Repositórios Institucionais melhor explicitadas. Vale destacar que as bibliotecas digitais, ao adotarem a arquitetura de metadados RDF, podem encontrar um caminho para o estabelecimento da interoperabilidade semântica entre ambientes informacionais heterogêneos e distintos. Uma dessas iniciativas é o desenvolvimento do padrão MarcOnt que possui uma arquitetura baseada no modelo RDF e algumas aplicações preliminares em bibliotecas digitais semânticas específicas, tais como a JeromeDL, que será tratada posteriormente no capítulo 5.

115 113 Nessa perspectiva, vale salientar que até o presente momento ainda não se tem uma representação plena, de acordo com normas e padrões internacionais que contemple às necessidades informacionais dos usuários na sua totalidade. Sobre essa ótica, faz-se necessário a criação ou o reaproveitamento de teorias e metodologias sedimentadas e cristalizadas da Biblioteconomia e da Ciência da Informação no tocante às questões de descrição dos recursos informacionais para um estabelecimento mais efetivo da construção de formas de representação em ambientes informacionais digitais. Vale dizer ainda que tais metodologias oferecem respaldo para qualquer tipo de apresentação para a representação do recurso informacional. Assim, ao se pensar na construção de formas de representação da informação por metadados podemos considerar que estamos diante de um diálogo intersubjetivo entre o catalogador (sujeito pensante) - profissional responsável pela representação - e os recursos tecnológicos que estão à sua disposição. Uma coisa é pensarmos na representação do ponto de vista do catalogador e outra é para quem a representação foi construída (usuários que se apropriarão da representação), uma vez que tal representação estará numa constante mutação, ou seja, a representação poderá ser adequada e atender a determinados usuários num dado período. Vale destacar que a representação muda de acordo com as percepções da realidade. A construção da representação caracteriza-se exatamente pela não-linearidade e plasticidade, isto é, as contribuições no processo não são estáticas, muito pelo contrário, encontram-se em permanente mudança. Observa-se, atualmente, o surgimento de novos padrões para a descrição de forma e conteúdo dos recursos informacionais e a possibilidade de um aproveitamento das metodologias cristalizadas da Biblioteconomia e da Ciência da Informação para a construção de formas de representação da informação, bem como sua efetiva aplicação. Dentre esses padrões, destaca-se o MarcOnt, que será apresentado no capítulo seguinte.

116 114 Capítulo 5 MarcOnt Initiative: uma proposta para a representação e a descrição de recursos informacionais na Web

117 115 5 MARCONT INITIATIVE: UMA PROPOSTA PARA A REPRESENTAÇÃO E A DESCRIÇÃO DE RECURSOS INFORMACIONAIS NA WEB Será que, via Web Semântica, [...] o conto de fadas está a caminho de se tornar realidade? Jaime Robredo Nesse capítulo, procura-se apresentar o surgimento e o desenvolvimento de um novo padrão de descrição bibliográfica (MarcOnt Initiative), no contexto que atualmente se conhece por Web Semântica, cujo impacto repercute nas formas de tratamento, de armazenamento, de descrição, de representação, de preservação, e de uso dos recursos informacionais, no âmbito de ambientes informacionais digitais, especificamente na Biblioteca Digital Semântica JeromeDL. Apresenta-se também o Portal Colaborativo MarcOnt. 5.1 Web Semântica: novos olhares para a representação e a descrição de recursos informacionais Pode-se observar contemporaneamente um cenário marcado por grandes transformações tecnológicas e pelo surgimento e criação das mais variadas técnicas para as questões de representação, de descrição, de produção, de organização, de transmissão e de uso das informações em ambientes informacionais digitais. Conforme apontado nos capítulos 3 e 4, essas questões vem permeando o contexto digital e trazendo um constante repensar nos paradigmas informacionais. O ambiente Web, por possuir informações heterogêneas e efêmeras, pode ser caracterizado como caótico, onde profissionais de diversas áreas buscam soluções para um tratamento mais significativo dos conteúdos que ali estão armazenados e disponibilizados para um uso mais efetivo.

118 116 Idealizada por Tim Berners-Lee e liderada pelo World Wide Web Consortium (W3C) - a Web Semântica é um projeto que visa a solucionar e a minimizar os problemas de recuperação da informação na Web por meio do acesso automatizado aos recursos informacionais. Para tanto, pretende implantar uma estrutura tecnológica e instaurar uma maior representação do conhecimento na rede com o estabelecimento semântico das informações contidas nas unidades e assim, possibilitar técnicas mais eficazes de recuperação (BERNERS-LEE; HENDLER; LASSILA, 2001, tradução nossa). A Web Semântica, por meio de sua estrutura tecnológica, quer incorporar maior nível semântico nas representações dos recursos informacionais, tornando-os mais significativos para as ferramentas de busca e recuperação, além de possibilitar a criação de ferramentas mais eficazes, que serão capazes de entender e gerenciar os dados representados. De acordo com a literatura disponível na área de Ciência da Informação, que parece ser consensual, as teorias e os conceitos subjacentes à Web Semântica, encontram-se principalmente nos autores Berners-Lee, Hendler e Lassila (2001); Alves (2005); Ramalho (2006); Marcondes (2006); Feitosa (2006); Ferreira (2006); Campos, Campos e Campos (2006); Shadbolt, Hall e Berners-Lee (2006); e Pickler (2007). Conforme relatado por Marcondes (2006, p. 71), [...] a Web Semântica está ainda em seus estágios iniciais, mas há evidências de que sua consolidação depende apenas de tempo e do amadurecimento das tecnologias utilizadas. Uma dessas evidências é o investimento crescente de grandes fabricantes, organizações internacionais de padronização e comunidades, com destaque para a área de bibliotecas digitais, na qual problemas de tratamento de informações são cada vez mais críticos, devido ao volume e à complexidade cada vez maior de manipular e integrar informações heterogêneas e distribuídas de maneira dinâmica. De acordo com a assertiva acima, pode-se dizer que se visualizam teorias e aportes teóricos bem cristalizados e a ausência de aplicações práticas no cenário atual, destacando que, as bibliotecas digitais com sua estrutura pré-estabelecida (metadados) têm muito a contribuir no que concerne ao tratamento documentário, com a possibilidade de integrar e manipular recursos informacionais em ambientes e plataformas heterogêneas.

119 117 A Web Semântica pode ser definida como, [...] uma extensão da Web atual que apresentaria recursos informacionais melhor estruturados e representados, ou seja, o conteúdo informacional desses recursos seriam melhor explicitados e definidos semanticamente, formando uma rede de informações conectadas que por meio de ferramentas tecnológicas, tais como os agentes de softwares, proporcionaria uma melhor recuperação de informação (ALVES, 2005, p. 28). Com base nos autores Berners-Lee, Hendler e Lassila (2001), podemos dizer que a Web Semântica fornecerá estrutura para o conteúdo dos recursos informacionais, criando um ambiente onde agentes de softwares realizam atividades sofisticadas de processamento e entendimento dos dados solicitados na busca, com o propósito de oferecer uma recuperação mais precisa. A arquitetura da Web Semântica está representada em um esquema de camadas sobrepostas, onde cada camada apresenta uma ferramenta ou tecnologia responsável por uma determinada tarefa, ao mesmo tempo em que trabalham de modo complementar umas com as outras, com o intuito de melhorar a recuperação. Na primeira versão esquemática da arquitetura da Web Semântica temos, nas primeiras camadas, a indicação de algumas ferramentas tecnológicas responsáveis pela estruturação e representação dos dados. Era necessário estabelecer uma padronização nas camadas iniciais para posteriormente definir e indicar as ferramentas tecnológicas mais específicas das camadas superiores, que inicialmente continham apenas a indicação de modo mais geral das tecnologias envolvidas. (RAMALHO, 2006). As propostas atuais para a arquitetura da Web Semântica seguem o mesmo esquema da arquitetura anterior, com a diferença de possuir um pouco mais de detalhamento nas ferramentas tecnológicas 17 presentes em certas camadas, conforme pode ser visualizado na figura 16, a seguir. 17 Vale destacar que nessa pesquisa, não é nosso objetivo tratar com profundidade as ferramentas tecnológicas contempladas na arquitetura da Web Semântica, mas apontar a necessidade de estudá-las adequadamente e em consonância com os instrumentos e metodologias da Biblioteconomia e Ciência da Informação, para um estabelecimento pleno e efetivo.

120 118 Assinatura Digital complementada pela Criptografia Camada de Validação Camada de Prova Camada Lógica Camada de Ontologia Camada de dados Camada Sintática Característica Internacional FIGURA 16: Arquitetura da Web Semântica proposta em 2005 comentada pelo autor. Fonte: Berners-Lee (2005). Tendo como base a categorização em camadas apontadas por Moura (2002) e adaptada por Alves (2005), pode-se destacar, de modo resumido, as seguintes características dos elementos que compõe a arquitetura da Web Semântica: Característica Internacional: composta por padrões de descrição e identificadores universais, tais como a URI (Uniform Resource Identifier) e UNICODE, que são responsáveis por uma identificação e localização mínima do recurso informacional na rede; Camada Sintática: responsável pelo estabelecimento da sintaxe de descrição dos dados, essa camada é composta pela linguagem XML, namespaces e também pelo XML Schema, que permite uma melhor estruturação dos dados e conseqüentemente uma melhor visualização do conteúdo dos recursos pelos agentes de software;

121 119 Camada de Dados: essa camada trabalha com a representação, processamento e codificação dos metadados, é composta pela arquitetura de metadados RDF (RDF Core) e o RDF Schema, que são ferramentas responsáveis por expressar significados e promover a interoperabilidade. É importante destacar que nesta camada e na camada anterior está implícito o uso de padrões de metadados para garantir a representação dos recursos informacionais; Camada de Ontologia: o uso de ontologias permite o estabelecimento da semântica, ou o significado dos dados descritos e representados pelos metadados. A definição dos conceitos nessa camada servirá para os agentes inteligentes compreenderem a semântica dos dados e a linguagem recomendada pelo W3C é a OWL Ontology Web Language. Vale destacar que as ferramentas SparQL, DLP são canditadas a recomendação pelo W3C; Camada Lógica: é responsável por uma recuperação mais eficiente devido ao uso de agentes, regras (presentes também na camada de ontologia) e mecanismos de inferência, mas para isso contam como base as camadas responsáveis pela estruturação, representação e estabelecimento semântico dos dados, para posteriormente relacionar e processar as informações de forma lógica; Camada de Prova: responsável pelo intercâmbio entre agentes; é nessa camada onde serão processadas as definições lógicas pelos agentes para a construção da prova, que será criada para verificar se a dedução do agente estava correta; Camada de Validação: essa última camada é responsável pelo estabelecimento de verdades, autenticidade, confiabilidade e validade dos dados recuperados, garantindo aos agentes que raciocinam sobre os dados se a informação é verdadeira. (ALVES, 2005). O potencial da Web Semântica será notado pela troca de informações disponibilizadas em fontes de informações diversas e processadas pelos agentes de softwares; mas para isso é necessário o acesso a coleções de recursos informacionais estruturados e representados, além do trabalho conjunto das ferramentas citadas em sua arquitetura. (ALVES, 2005).

122 120 Quanto ao funcionamento da Web Semântica os autores Souza e Alvarenga (2004) explicam que os usuários teriam acesso a esta por meio de portais nos quais formulariam suas buscas. Em seguida os agentes de softwares, presentes nos mecanismos de busca e inferência, acessariam um repositório de metadados constituído por recursos informacionais representados pelos padrões de metadados e anotados semanticamente pelas definições estabelecidas nas ontologias. Nesse ambiente, os agentes trabalhariam formando uma espécie de sinergia ao trocarem informações entre si, além disso, proporcionando uma recuperação mais eficaz, pois teriam acesso a coleções de recursos informacionais melhores estruturados e representados. Neste cenário, dois pontos são destacados pelos autores: a) a questão da representação e indexação dos recursos, por meio dos metadados, padrões de metadados e as definições semânticas presentes nas ontologias, e; b) a questão da recuperação mais eficiente dos recursos informacionais ocasionadas pelos agentes de softwares, associados aos mecanismos de busca e inferência. Esses dois fatores promovem o acesso mais amplo aos recursos informacionais disponibilizados em comunidades de interesse distintos e uma recuperação mais eficiente, pois os mecanismos de busca são capazes de compreender o significado das informações presentes no conteúdo dos recursos devido a essa representação informacional (SOUZA; ALVARENGA, 2004). Deste modo, é importante destacar que as ferramentas e tecnologias presentes na arquitetura da Web Semântica trabalham em conjunto: os agentes de softwares responsáveis pela busca recuperam de modo mais eficiente porque encontram recursos informacionais melhor representados pelos metadados e ontologias, além disso, tem como apoio a linguagem XML que promove a estruturação dos dados e a arquitetura RDF responsável pelo estabelecimento da interoperabilidade. (ALVES, 2005). Nesse ponto, retoma-se a questão de a Web Semântica possuir uma estrutura elaborada de implementação, na qual todas as ferramentas tecnológicas devem estar atuando em conjunto para garantir seu funcionamento. Contudo, acreditamos que é na representação da informação que se encontra o núcleo de seu funcionamento, pois se não houver uma representação por metadados adequada dos recursos informacionais, as outras tecnologias envolvidas não terão onde se apoiar para realizar suas tarefas. Por isso, a necessidade de se ter uma estrutura bem representada a fim de potencializar a recuperação dos recursos

123 121 informacionais pelo usuário final. Deste modo podemos concordar com Berners-Lee, Hendler e Lassila (2001) quando dizem que o estabelecimento da Web Semântica irá se concretizar a partir da representação dos recursos informacionais e isso só será garantido pelo uso efetivo dos metadados. Na tentativa de solucionar problemas de descrição e representação dos recursos informacionais nos ambientes digitais, novas normas e novos horizontes encontram-se em constituição à luz da Web Semântica. 5.2 Descrição bibliográfica na era da Web Semântica Durante as últimas décadas observou-se que mais e mais informações têm sido publicadas, armazenadas e disponibilizadas na Web. No entanto, somente uma parte dessas informações e em ambientes específicos, tais como as bibliotecas digitais, por exemplo, possuem um padrão de metadados para a descrição bibliográfica e que possibilite a padronização dos recursos informacionais para atender aos requisitos da interoperabilidade. As bibliotecas digitais apresentam-se e atuam como um segmento na Internet onde procuram desenvolver e criar métodos e técnicas para a padronização dos recursos informacionais. Mas garantir/assegurar a interoperabilidade entre ilhas de informações bem estruturadas e padronizadas entre formatos bibliográficos distintos encontra-se numa questão de investigação e preocupação pela comunidade científica. Novas tecnologias baseadas em pesquisas na temática Web Semântica desenvolvem-se com o intuito de tentar agregar semântica à descrição bibliográfica para um tratamento mais efetivo dos conteúdos digitais. A Web Semântica oferece algumas soluções para diferentes problemas criando uma nova visão para o armazenamento e o processamento dos dados. Algumas dessas soluções poderiam ser implementadas para potencializar os resultados das buscas no âmbito das bibliotecas digitais. Sendo assim, o projeto MarcOnt Initiative surge nesse cenário numa perspectiva na tentativa de solucionar os problemas de descrição e de representação dos recursos

124 122 informacionais em ambientes digitais, tais como as bibliotecas digitais, por exemplo, atrelado aos padrões de metadados advindos das áreas da Biblioteconomia e da Ciência da Informação, como o MARC21 para a descrição bibliográfica e outros padrões, como o Dublin Core, para a localização de recursos na Web. MarcOnt Initiative se desenvolveu a partir da Biblioteca Digital Semântica JeromeDL. Como relata Synak (2005), num primeiro momento, as primeiras experiências na JeromeDL eram positivas, mas logo, foram detectados alguns problemas, pois os objetivos iniciais eram desenvolver e aumentar a busca automaticamente atribuindo semântica aos recursos informacionais a fim de potencializar os processos de recuperação de informação. As razões pelas falhas iniciais podem ser assim entendidas de acordo com dois fatos: 1. Aumentar a busca semanticamente requer a informação sobre os recursos armazenados inicialmente na biblioteca na forma de descrições semânticas. O problema era convencer realmente os bibliotecários que criando dados semânticos resolveria o problema de trabalhos futuros. Como um resultado as instalações existentes da primeira biblioteca digital semântica não usavam suas potencialidades semânticas e nem usavam um nível mínimo de capacidade semântica. 2. Verificou-se que as descrições na JeromeDL poderiam fornecer capacidade de descrição de formatos de metadados conhecidos e usados por comunidades da Biblioteconomia, tais como o MARC21. A ontologia simples da JeromeDL, consistindo de somente três conceitos, não foi projetada simplesmente para esse tipo de dado e metadado. (SYNAK, 2005, tradução nossa). Nesse sentido, depois de muitos estudos realizados pelos pesquisadores da JeromeDL e a equipe envolvida no projeto, decidiu-se tratar desses problemas criando-se uma ontologia bibliográfica que pudesse contemplar os aspectos semânticos de forma e conteúdo dos recursos informacionais e que pudessem atuar de forma mais efetiva numa biblioteca digital semântica. Assim, os requisitos iniciais foram elaborados por Sebastian Ryszard Kruk e se constituindo o projeto MarcOnt Initiative O projeto detalhado encontra-se disponibilizado no Portal MarcOnt no site: Disponível em: < Acesso em: 10 out

125 123 Nessa perspectiva, o que seria o MarcOnt Initiative? De acordo com Kruk, Synak e Zimmermann (2005a, p. 1, tradução nossa) o objetivo da iniciativa MarcOnt é desenvolver um novo padrão para a descrição bibliográfica na forma de uma ontologia e relacionar as ferramentas da Web Semântica utilizando tecnologias semânticas. Em outras palavras, e pautado nos autores supracitados, podemos dizer que o MarcOnt Initiative seria um padrão de descrição bibliográfica semântica que contempla forma e conteúdo do recurso informacional, a fim de sua identificação e individualização para leitura e processamento compreensíveis por máquina/computador, utilizando-se de instrumentos e ferramentas tecnológicas subjacentes à Web Semântica, podendo ser aplicado no contexto de ambientes informacionais digitais. O primeiro passo para agregar semântica à descrição das informações em bibliotecas digitais e sua compatibilidade para que ocorra a interoperabilidade é o desenvolvimento de uma ontologia comum. A ontologia pode ser considerada como um instrumento para a descrição bibliográfica dos recursos informacionais, pois se cria uma rede de conceitos com propriedades apropriadas e restritas. Kruk, Synak e Zimmerman (2005b, p. 1, tradução nossa) alegam que infelizmente, é muito difícil convencer os bibliotecários para realizarem o esforço da criação da descrição semântica dos recursos, tais como, livros, por exemplo. Nesse contexto, pode-se destacar nesse momento, a importância da participação ativa de profissionais de áreas interdisciplinares na criação do MarcOnt, em especial dos profissionais da Biblioteconomia, uma vez que este profissional, em sua formação, possui as técnicas e habilidades necessárias para o tratamento documentário dos recursos informacionais. A Catalogação, instrumento de descrição bibliográfica da área, pautada em regras e esquemas de descrição, fornece subsídios para a construção de formas de representação e descrição de forma padronizada, possibilitando o armazenamento, a preservação, o uso e o reuso das informações de forma mais efetiva. Como aponta Synak (2005), muitas são as razões para a construção de um novo padrão para a descrição bibliográfica semântica que podem ser assim delineadas:

126 124 O primeiro fato é o argumento de que o padrão de metadados MARC21 não fornece informação semântica necessária de forma a ser compreendida por uma máquina. Synak (2005, p. 50, tradução nossa) afirma que O formato MARC21 nos permite descrever dois tipos específicos de recursos: Língua dos materiais (que podem ser aproximadamente descritos como livros, periódicos, jornais etc.) e Língua de materiais manuscritos (tal como livros valiosos, livros antigos, escritos a mão). Em outras palavras, quando o autor se refere à Língua dos materiais e Língua de materiais manuscritos, podemos nos reportar à estrutura do MARC na posição 06 (Tipo de Registro) do LÍDER, onde utiliza-se a letra a para Material textual (Impresso) e a letra t para Material textual (Manuscrito). Um recurso que represente Língua dos materiais é identificado em MARC21 colocando a letra a no campo número 06 no líder do registro MARC21. Para Língua de materiais manuscritos, a marca apropriada requer colocar a letra t no mesmo lugar. O problema é que não há absolutamente nenhuma conexão entre a Língua do material e a Língua de material manuscrito. Para alguém que não tem uma pista quando o recurso vem do livro, estes dois tipos de recursos poderiam ser chamados Pedras e Flores. Este é o caso quando uma máquina é usada para processar o dado. (SYNAK, 2005, p. 51, tradução nossa). Nesse mesmo sentido, Synak (2005, p. 51, tradução nossa) para uma explicação ainda mais plausível, diz que: MARC21 não nos permite descrever que Língua dos materiais e Língua de materiais manuscritos são ambos adequados para leitura (têm algumas características comuns) ou que Língua de materiais manuscritos é de fato também, Língua dos materiais, mas tem algumas características específicas que as fazem diferentes. Se nós quiséssemos escrever uma busca na máquina que incluísse na busca manuscritos quando há uma falta de livros usuais no assunto, nós teríamos que especificar cada uma das conexões. Uma ontologia nos permite fazer isso automaticamente. Um dos motivos desta pesquisa e na busca por subsídios que procuramos responder e caracterizar o MarcOnt, está pautado na tese que o autor procura defender com tanta propriedade, ao mencionar que o MARC21 mesmo sendo um padrão mundial e internacionalmente aceito e adotado pelas bibliotecas e pela comunidade da Biblioteconomia, de um modo geral, possuindo uma estrutura completa e complexa, não há um padrão de

127 125 descrição semântica que contemple a profundidade da descrição, ou ainda, que cubra a extensão requerida ou suportada pelo MARC21 usado para os propósitos da Biblioteconomia. Pensando nisso, pode-se considerar que o padrão de descrição bibliográfica semântica MarcOnt pode possibilitar uma melhora na explicitação das informações de forma a permitir uma compreensão pela máquina nas solicitações de busca para o usuário final. Ao mencionar esse desafio, Synak (2005) questiona a necessidade do por que em se criar outra ontologia, dizendo que ainda não existe uma adequada que vá ao encontro dos objetivos da descrição bibliográfica e que atenda aos requisitos dos profissionais da Biblioteconomia. As novas soluções não podem negligenciar padrões e formatos existentes ou nunca se tornarão amplamente conhecidos. No momento, o formato de dados bibliográficos MARC21 é ainda o principal padrão utilizado em todas as bibliotecas do mundo. A ontologia que aspira ser seu sucessor (ou ao menos contrapartes semânticas) tem que oferecer não menos capacidade na descrição. (SYNAK, 2005, p. 63, tradução nossa). Ainda tentando responder a alguns questionamentos sobre a criação de uma ontologia bibliográfica, bem como sua relevância, o autor menciona que se vivenciou uma experiência com descrições semânticas na biblioteca digital semântica JeromeDL e que os resultados apontam uma melhora nos serviços de busca e de comunicação entre as bibliotecas digitais possibilitando uma amplitude na recuperação dos recursos informacionais. Vale destacar que para o desenvolvimento pleno do MarcOnt os estudos mostram e apontam algumas exigências ou requisitos a fim de atingir suas funcionalidades, onde seu idealizador procurou, por meio do estado da arte no domínio da Biblioteconomia, levantar os principais padrões de metadados na área com o objetivo de procurar se haveria compatibilidade com a iniciativa MarcOnt. Segundo Synak e Kruk (2005), dentre os principais requisitos, destacam-se: A ontologia deve prover não menos capacidade de descrição tal como o formato de descrição bibliográfica MARC21. Esta exigência é fácil de explicar. MARC21 é atualmente o padrão mais popular e forte para descrever recursos em bibliotecas. É muito provável que os futuros usuários do MarcOnt queiram mover seu registros armazenados em MARC21 para o novo formato. Permitiria que fizessem avaliações das vantagens da semântica e de novos serviços. O plano (esquema) de

128 126 conversão sem perda de informação requer que o MarcOnt seja extensível quando descrever recursos, assim como o MARC21. MARC21 é o nomemotivo para MarcOnt, que é basicamente uma fusão do MARC e a palavra ontologia. (SYNAK, 2005, p. 63, tradução nossa). Pelo que pode-se perceber é que a relação entre o MARC21 e o MarcOnt, não consiste em transformar a estrutura pré-estabelecida do MARC21 para a linguagem da ontologia, mas sim fornecer a informação semântica à descrição dos recursos informacionais que o MARC21 não oferece de modo a ser compreendida pela máquina/computador. A ontologia deve ser descrita usando OWL DL A linguagem OWL (Ontology Web Language) tem determinadas vantagens sobre outras, por ser a mais antiga especificação de linguagem para ontologia. Ela é um novo padrão, aprovado e recomendado pelo W3C (World Wide Web Consortium). Pode-se facilmente predizer que a maioria das ontologias no futuro serão descritas usando OWL. Foi selecionada a OWL Description Logic (OWL DL) Lógica de Descrição OWL. OWL DL tem expressado suficientemente as maiores razões para suportar outras ontologias. (SYNAK, 2005, p. 64, tradução nossa). Vale destacar que a linguagem OWL DL, assim como a OWL destinam-se ao processamento dos recursos informacionais de forma mais inteligente, localizada na camada de ontologias da arquitetura da Web Semântica, possuindo suas bases na arquitetura de metadados RDF, o que implica uma maior potencialidade de uso e reuso das informações no âmbito de bibliotecas digitais e no atendimento aos requisitos de interoperabilidade. A ontologia deve reusar (se possível) outras ontologias existentes ou suas partes. Ela deve ser relativamente fácil para aderir a ontologia MarcOnt com ontologias existentes se requerido. Estas exigências são mais fáceis para realizar com OWL, pois esta, já é uma exigência indicado primeiro. Nós não podemos somente importar alguns conceitos de outras ontologias, mas adicionar novas propriedades ou facetas a elas e criar subclasses etc. Tal prática é comum. Por exemplo, o Semantic Web Portal Ontology usa o conceito de foaf: Agent da ontologia Friend-of-afriend e o expande para refletir pessoas/organizações específicas no ambiente acadêmico. (SYNAK, 2005, p. 64, tradução nossa). Nesse caso, a existência de outras ontologias podem possibilitar um compartilhamento dos recursos tecnológicos para o desenvolvimento do MarcOnt indo ao encontro da filosofia de ambientes colaborativos subjacentes à Web 2.0, no cenário atual, principalmente com os conceitos de foaf: Agent que visa definir propriedades para os perfis dos usuários do sistema e

129 127 os responsáveis pela criação dos recursos. É usada para expressar os metadados sobre pessoas (usuários) assim como seus nomes, endereços, etc., na possibilidade de um agente de software acessar e fazer uso de uma descrição num processo de busca. Deve ser fácil traduzir descrições semânticas MarcOnt compatíveis para outros formatos, tais como MARC21, Dublin Core ou BibTeX. Isto vem ao encontro dos objetivos da Iniciativa MarcOnt. A definição para o problema da tradução encontra-se mais nas ferramentas que serão desenvolvidas junto com a ontologia do que a própria ontologia. Mas a exigência de traduções fáceis tem que ser mantida em mente ao projetar/delinear a estrutura da ontologia. A conversão de menos perdas de informações entre outros formatos e MarcOnt requer que MarcOnt seja capaz de preservar a informação em primeiro lugar. (SYNAK, 2005, p. 64, tradução nossa). Sobre esse aspecto, pode-se dizer que um dos propósitos do MarcOnt é possibilitar a integração entre recursos informacionais de padrões de metadados heterogêneos e o reaproveitamento das informações, agregando semântica às informações e torná-las armazenadas e disponíveis numa mesma interface ou plataforma, permitindo uma busca e recuperação de forma mais efetiva e significativa. O primeiro esboço/esquema da ontologia deve ser um ponto de partida para um trabalho futuro A primeira versão da ontologia não tem que estar completa ou imediatamente pronta para ser usada. Ela deve definir as principais estruturas e prover um mínimo de funcionalidades requeridas para começar as avaliações e estar pronta para um desenvolvimento colaborativo mais adicional. A primeira versão da ontologia MarcOnt será desdobrada testando suas funcionalidades na Biblioteca Digital JeromeDL. (SYNAK, 2005, p. 64, tradução nossa). Nesse ponto, pode-se destacar que o MarcOnt já encontra-se disponível na Biblioteca Digital Semântica JeromeDL, o que será tratado nas seções seguintes e o próprio Portal MarcOnt, disponibiliza um ambiente para a construção de descrições bibliográficas semânticas para experiência e testes.

130 Arquitetura MarcOnt Para uma melhor compreensão do padrão de descrição semântica MarcOnt, os autores Kruk, Synak e Zimmermann (2005) propuseram uma arquitetura inicial a fim de ter uma visualização como seria o seu funcionamento ao se pensar na questão da interoperabilidade semântica entre padrões de metadados heterogêneos bem como o acesso aos recursos informacionais numa única interface. Nesse sentido, a figura 17, em seguida, apresenta o delineamento de uma arquitetura inicial dos serviços de mediação MarcOnt. FIGURA 17: Arquitetura de serviços de mediação MarcOnt. Fonte: Kruk, Synak e Zimmermann (2005a, p. 2)

131 129 De acordo com a figura 17, pode-se nesse momento, traçar alguns comentários no que concerne ao funcionamento do padrão de descrição semântica MarcOnt. A arquitetura forma um fluxo, onde a parte superior é a entrada (input), as descrições semânticas estão no centro (MarcOnt ontology) e a parte mais inferior é a saída (output). Nota-se que o centro da arquitetura é o RDF (Resource Description Framework) considerado o núcleo para o armazenamento para descrições semânticas compiladas de outros padrões de metadados. As caixas na primeira fileira (na entrada) e na última fileira (na saída) da arquitetura representam os formatos inerentes aos tradicionais (arquivos neste formato). As caixas no meio (MARCXML, BibTeXML) representam a primeira fase do processo de tradução onde os arquivos inerentes são analisados gramaticalmente (sintaxe) e seus conteúdos são incluídos no formato XML. Os adaptadores de entrada e saída (input e output) são implementados usando o mecanismo de inferência Sesame 19. De um lado dos adaptadores, nós temos as descrições semânticas e do outro, dados de descrições bibliográficas convertidas para um modelo RDF. Converter diferentes formatos de descrição para o modelo RDF depende do formato original do arquivo. Registros em formato MARC21 são armazenados em arquivos binários; então a conversão exige primeiro que tais arquivos sejam transformados para o formato MARCXML e então, numa fase posterior, transformam-se os dados para o modelo RDF usando XSLT. Nesse aspecto, vale ressaltar que o autor destaca que ainda não há representações oficiais de dados de MARC21 em RDF, desenvolvido pela Library of Congress (LC) e que os pesquisadores do MarcOnt, criaram seu próprio formato (MARCRDF). Apoiar outros formatos é uma questão de desenvolver adaptadores e conversores apropriados. Atualmente, nós estamos desenvolvendo adaptadores para MARC21. (SYNAK, 2005, p. 75, tradução nossa). 19 Sesame é uma ferramenta, ou seja, um conjunto de classes-base desenvolvido em Java com código aberto para o desenvolvimento de sistemas, com o objetivo de armazenar e consultar dados em RDF. Este sistema é totalmente extensível e configurável no que concerne aos mecanismos de inferência e armazenamento de dados em formato RDF. Maiores informações sobre o sistema Sesame podem ser encontrados no site: Disponível em: < Acesso em: 10 mar

132 130 A fase final é traduzir os dados RDF para dentro de estruturas compatíveis com o padrão de descrição bibliográfica MarcOnt. Os estágios precedentes requerem escrever ferramentas simples para que as bibliotecas disponíveis usassem e pudessem ser relativamente fáceis para intercambiá-las. (SYNAK, 2005, tradução nossa). Assim, pode-se dizer que essa arquitetura inicial, visa o compartilhamento entre padrões de metadados distintos, podendo proporcionar a interoperabilidade semântica entre bibliotecas digitais, por exemplo, onde as informações semânticas estarão disponíveis e armazenadas em uma única interface, neste caso, no MarcOnt. Outra releitura sobre a questão da descrição bibliográfica, pautada na arquitetura de serviços de mediação MarcOnt, pode ser compreendida de acordo com a figura 18, reforçando a criação e a necessidade de um padrão de descrição bibliográfica semântica que contemple a representação de forma e de conteúdo dos recursos informacionais. FIGURA 18: Estrutura de representação em MarcOnt. Fonte: Kruk, Synak e Zimmermann (2005b, p. 27) Conforme se pode observar pela figura 18, temos a representação dos recursos informacionais no padrão de metadados MARC21, MARCXML (na estrutura MARC com a linguagem computacional XML) e MARC-RDF (estrutura MARC em RDF), uma vez que

133 131 essas representações passam por ferramentas de tradução/conversão, dadas por RDF Translator gerando nesse sentido, informações semânticas armazenadas em MarcOnt. Assim, pode-se dizer que o estabelecimento de uma linguagem comum (vocabulary) que proporcione e garanta uma busca e recuperação dos recursos informacionais para o uso e o reuso das informações pelo usuário final, será determinado por MarcOnt. Umas das grandes dificuldades apontadas pela literatura e um problema para a interoperabilidade entre padrões de metadados distintos em bibliotecas digitais é que os dados para a tradução das informações nem sempre estão representados em RDF, o que implica o desenvolvimento de novas tecnologias para o tratamento adequado dos recursos informacionais. O autor menciona a dificuldade em se criar regras que contemplem os objetivos do MarcOnt, dizendo que a tarefa requer escrever centenas de regras de inferência para traduzir aos usuários do MarcOnt sua lógica de funcionamento, bem como suas propriedades para garantir de forma apropriada um pouco mais de informação sem possíveis perdas. (SYNAK, 2005, p. 75, tradução nossa). Synak (2005) elucida que os formatos de descrição bibliográfica são exatamente tal caso. A informação é armazenada em cada arquivo binário ou textual (dependendo do formato). Para processar a informação usando as tecnologias da Web Semântica faz-se necessário que primeiramente representemos estas informações em RDF. Ainda nesse sentido, Synak (2005) enumera duas fases para a tradução/conversão entre os padrões de metadados: 1. Tradução do formato original para RDF 2. Tradução de um grafo RDF para outro. Os três formatos que foram avaliados são MARC21, BibTeX e Dublin Core, tratados de forma específica no capítulo 4. MARC21- formato binário, os arquivos necessitam de ser analisados gramaticalmente. O resultado de um arquivo no formato MARCXML pode ser transformado em RDF usando XSL Transform. O problema é que não há nenhuma representação oficial de MARC em RDF (ao menos

134 132 não desenvolvido pela LC). Para nossas necessidades, nós especificamos o formato MARCRDF (para RDF Schema de MARCRDF), que é uma representação RDF das estruturas de MARCXML. BibTeX- formato de texto. Segue a sintaxe TeX. Os arquivos BibTeX necessitam ser analisados gramaticalmente antes de ser processados mais adiante. Há representações BibTeX em XML (BibTeXML) e RDF (BibTeX em OWL). O arquivo XML analisado gramaticalmente pode ser facilmente transformado para RDF usando XSLT. Dublin Core- muitas sintaxes disponíveis (em XML, como metadado em HTML, RDF), os elementos de DC são usados geralmente em RDF. Ao contrário do MARC21 ou BibTeX, DC não é um formato de arquivo fechado, podendo ser mais flexível na transformação dos dados. (SYNAK, 2005, p. 73, tradução nossa). Nessa perspectiva, foram formuladas algumas regras para as transformações de descrições no padrão de metadados MARC21, a fim de possibilitar melhores níveis de relacionamento entre os registros bibliográficos. A figura 19, apresenta regras que poderiam ser usadas no processo de transformações de descrições em MARC21 para descrições semânticas em MarcOnt. No exemplo abaixo, visualiza-se um registro MARC21, descrevendo um tipo documental do tipo livro, com metadados de autor e título, utilizando os conceitos de MarcOnt (marcont:book) para o armazenamento das informações. As regras de transformações de um padrão de metadados específico para MarcOnt, e vice-versa, encontram-se disponíveis no Anexo A.

135 133 FIGURA 19: Regras para construção de descrição semântica de MARC21 para MarcOnt. Fonte: Synak (2005, p. 74) Vale lembrar que o padrão de metadados MARC21 descreve vários recursos informacionais e que o exemplo acima (livros) é apenas um dos tipos documentais contemplados pelo formato. Na figura 19, pode-se verificar a criação de regras para apenas dois campos específicos abarcados pelo padrão de metadados MARC21 (autor e título), o que implica, para um registro completo, a construção detalhada e padronizada de normas que forneçam a semântica tão necessária para o entendimento de cada campo para uma leitura das informações pela máquina/computador. A ontologia terá que ser atualizada constantemente para permitir uma melhor representação da informação. As regras existentes terão que refletir estas mudanças. Atualmente, existem um conjunto de regras que permite mover uma quantidade limitada de informações de formatos tradicionais para MarcOnt. A informação (a mais importante) como título ou autor é suportada. Criar ferramentas que simplificariam e acelerariam o processo de criação de regras será a próxima etapa e um dos assuntos de trabalhos no Portal Colaborativo MarcOnt. A primeira etapa que nós já fizemos foi criar um framework (estrutura), uma máquina (sistema) que poderia processar as regras. (SYNAK, 2005, p. 74, tradução nossa). Com a finalidade de um maior aproveitamento das informações em diferentes formatos bibliográficos, foram definidas algumas ferramentas a fim de constituir a estrutura MarcOnt, conforme pode ser visualizada na figura 20, a seguir.

136 134 FIGURA 20: Estrutura básica do MarcOnt. Fonte: Synak (2005, p. 65) As partes do padrão de descrição semântica MarcOnt, pautadas na figura 20, e de acordo com Synak (2005), podem ser assim entendidas: Material: Compreendida aqui como uma classe com suas subclasses. Vale dizer que Material é um nome comum designado para qualquer tipo de recurso informacional, o qual pode estar armazenado em uma biblioteca. Marc21Description: O conjunto de descrições das classes incorpora a terminologia oriunda do padrão de metadados MARC21, originando a classe Marc21Description. Marc21Description pode ser compreendida como uma superclasse usada para prover a descrição para diferentes tipos de materiais. Em geral, podemos simplesmente conectar Material a Marc21Description. Essa ligação seria afirmar que qualquer material pode ter um número de características derivados do MARC21. Mas essa ligação não transportaria qualquer informação semântica sobre que tipos de recursos estão associados aos tipos de propriedades. (SYNAK, 2005, p. 67, tradução nossa). As subclasses por sua vez, contemplam os seguintes tipos documentais: livros, periódicos, material cartográfico, arquivo de computador, música, material visual etc.

137 135 Foaf:Agent: Todo recurso informacional pode estar associado com seu criador, domínio e palavras-chave. MarcOnt utiliza foaf:agent que permite a descrição de pessoas e organizações/instituições responsáveis pela criação do recurso. Domain: O sistema Domain permite a visualização do conteúdo do recurso, compatível com normas e códigos de Classificação, como por exemplo, a Classificação Decimal de Dewey (CDD) e outros sistemas que utilizam algum tipo de código decimal. A classe domínio pode ser usada para sistemas que são baseados em classificações decimais. O tipo de classificação é especificada pela propriedade classificationtype da classe Domain. Para a definição dos tipos de classificação é utilizada a OWL. wnet:lexicalconcept: WordNet 20 pode ser descrito como uma ferramenta que proporciona serviços de referência lexicais via on-line. Substantivos, verbos e adjetivos em Inglês são organizados dentro de conjuntos de sinônimos. Cada conjunto representa um conceito léxico. Os usuários submetem a palavra e o sistema encontra palavras relacionadas (sinônimos, antônimos e outras). (SYNAK, 2005, p. 69, tradução nossa). É usado como uma classe para a representação de palavras-chave em MarcOnt. Em outras palavras podemos dizer que essa classe, funcionaria como uma ferramenta para a representação temática do recurso informacional, ou seja, definiria o conteúdo do recurso. Nesse momento, retomam-se algumas questões para a justificativa de criação do padrão de descrição bibliográfica semântica MarcOnt. Pode-se dizer que o padrão surgiu à luz da Web Semântica, projetado para atender aos requisitos de interoperabilidade semântica entre ambientes informacionais, por exemplo, as bibliotecas digitais. Para garantir uma melhora na performance na manipulação de formas de representação bibliográfica e da interação dos sujeitos com o ambiente informacional, tem-se no MarcOnt, um ponto de partida para a integração de fontes/sistemas que se utilizam de padrões de metadados heterogêneos, potencializando a busca e a recuperação dos recursos informacionais, e possibilitando a preservação, o uso e o reuso das informações de forma mais efetiva numa única interface. 20 Informações mais detalhadas podem ser encontradas no site: Disponível em: < Acesso em: 22 out

138 136 Assim, trataremos agora da aplicação do MarcOnt em um ambiente informacional específico, a biblioteca digital semântica denominada JeromeDL, onde pode-se verificar como está atuando em sua aplicabilidade e funcionalidade, fornecendo modelos de experiências e testes. 5.4 Biblioteca Digital Semântica JeromeDL Conforme abordado no capítulo 3 sobre as bibliotecas digitais, vale dizer que essas têm muito a contribuir com as questões da padronização da representação dos recursos informacionais, constituindo-se de uma ambiência pré-estabelecida (metadados) de acordo com regras e normas que permeiam a construção dos recursos, possibilitando um maior nível de interoperabilidade entre ambientes informacionais digitais. Entretanto, com a finalidade de potencializar os serviços que uma biblioteca digital pode oferecer e de acordo com as novas esferas tecnológicas trazidas no bojo da chamada Web Semântica, evidencia-se várias tentativas de melhorar os sistemas de busca e navegação por meio da agregação de tecnologias semânticas aos recursos informacionais, de forma a obter resultados mais significativos pelos usuários. Nesse sentido, para acompanhar esse cenário de evoluções tecnológicas e como um modelo de aplicação do padrão de descrição semântica MarcOnt, surge a Biblioteca Digital Semântica JeromeDL como uma ambiência que visa ou procura, por meio da semântica, possibilitar um refinamento nos mecanismos de busca. A Biblioteca Digital Semântica JeromeDL originou-se de experiências e testes da tese de Sebastian Ryzard Kruk na Gdańsk University of Technology (GUT) Polônia, em 2004/2005 contando com a participação e a supervisão da Digital Entreprise Research Institute (DERI), em Galway, na Irlanda, que é uma parte da National University of Ireland, na mesma cidade. JeromeDL consiste numa biblioteca digital semântica que utiliza as principais tecnologias abordadas na Web Semântica.

139 137 A descrição dos recursos informacionais tem como base a arquitetura de metadados RDF e a realização de buscas semânticas baseadas em ontologias, o que significa a possibilidade de melhorias na busca e na usabilidade com o estabelecimento de um maior nível de interoperabilidade entre ambientes informacionais digitais. (KRUK; DECKER; ZIEBORAK, 2005, tradução nossa). Nesse momento, é oportuno tecer algumas diferenças no que tange aos aspectos conceituais entre biblioteca digital e biblioteca digital semântica. Pautado nos autores supracitados, podemos dizer que uma biblioteca digital semântica pode ser considerada aquela que: Tem a possibilidade de integrar/compartilhar informações baseadas em diferentes padrões de metadados com anotações semânticas dos recursos e perfil dos usuários; Pode prover níveis de interoperabilidade não somente com bibliotecas digitais, mas com outros sistemas de informação, por exemplo, Repositórios Digitais, com metadados distintos; Possibilita a construção de interfaces mais amigáveis ao usuário com relação às buscas e à navegação determinadas pela semântica. Pode apresentar-se como um modelo no que concerne à transição de informações estáticas (somente armazenadas em bibliotecas digitais convencionais) para uma estrutura dinâmica e colaborativa na formação e geração de espaços de construção de conhecimento. Kruk (2006a, tradução nossa) elucida que as bibliotecas digitais, as quais se têm e conhecemos hoje, trazem descrições semânticas básicas e que juntamente com anotações semânticas comunitárias (perfil do usuário) e dos recursos informacionais, podem trazer a próxima ou a nova geração da Internet. Isso nos leva a inferir que as bibliotecas digitais apresentam-se com uma nova visão, caracterizadas como ambientes sociais colaborativos com o uso e o reuso de informações semânticas, indo ao encontro dos princípios do modelo que vem se constituindo hoje, como Web 2.0.

140 138 Pensando nisso, a Biblioteca Digital Semântica JeromeDL foi projetada a fim de atender desde os profissionais responsáveis pela confecção dos recursos informacionais até os usuários que irão se beneficiar e fazer uso desses recursos. Assim, de acordo com Kruk, Decker e Zieborak (2005, p. 2, tradução nossa) foram traçados os principais requerimentos para JeromeDL, tais como: Suportar a herança de bibliotecas clássicas/convencionais (ex., livros antigos), Prover características de navegação orientadas ao usuário, Permitir busca eficiente, Suportar múltiplos formatos dos recursos, Possibilitar a comunicação com outros sistemas de biblioteca digital, Utilizar resultados dos últimos resultados na Web Semântica bem como a comunicação e o gerenciamento da informação nas pesquisas. Esses requerimentos contemplam inicialmente, a arquitetura estabelecida para a Biblioteca Digital Semântica JeromeDL, que pode ser visualizada de acordo com a figura 21, a seguir. FIGURA 21: Arquitetura da Biblioteca Digital Semântica JeromeDL. Fonte: Kruk, Decker e Zieborak (2005, p. 3)

141 139 O produto central da JeromeDL implementa características dos aspectos dos recursos, busca e navegação, o gerenciamento do perfil dos usuários (baseado em FOAF) e o gerenciamento dos recursos informacionais. A descrição e o conteúdo dos recursos, por exemplo, o índice (do texto completo) do conteúdo dos recursos, descrições bibliográficas em MARC21 e BibTeX e a descrição semântica de acordo com a ontologia Jerome, estão empregadas em vários sistemas de armazenamento. (KRUK; DECKER; ZIEBORAK, 2005, tradução nossa). A parte dos recursos textuais do sistema da Biblioteca Digital JeromeDL tem sido designada para também assegurar o escaneamento de coleções de livros antigos e outros recursos binários, como por exemplo, apresentações em Macromedia Flash. Uma ligação na comunicação no ambiente Web fora do sistema possibilita a busca em uma rede de bibliotecas digitais. (KRUK; DECKER; ZIEBORAK, 2005, tradução nossa). O conteúdo da base de dados do sistema JeromeDL está traduzido em XHTML seguindo uma solicitação em HTTP. Para administrar o conteúdo da base de dados e descrever os recursos em uma aplicação de base de dados autônoma, é utilizado o JeromeAdmin. JeromeDL comunica-se diretamente com o sistema principal pelo protocolo RMI (Remote Method Invocation). O conteúdo da base de dados JeromeDL pode ser buscado não somente pelas páginas Web da biblioteca digital, mas também em outras bibliotecas digitais e outras aplicações Web, um serviço especial de interface Web baseado no Extensible Library Protocol (ELP). (KRUK; DECKER; ZIEBORAK, 2005, tradução nossa). Embora as bibliotecas construídas (convencionais), foram inicialmente criadas para lidar somente com livros, os usuários encontravam usualmente uma remota e ampla variedade de recursos. Segue o mesmo paradigma o sistema JeromeDL, suportando não somente recursos em formatos PDF ou RTF, mas também outro conteúdo multimídia (ex., apresentações em Flash). Para suportar ambos, flexibilidade e especialização no manusear os recursos, cada recurso tem sua própria descrição de sua estrutura. (KRUK; DECKER; ZIEBORAK, 2005, tradução nossa). É possível o recurso estar armazenado no formato XSL: FO o que permite a leitura para escolher entre diferentes tipos de tradução, ex. PDF, RTF, HTML. O conteúdo dos recursos pode ser adicionalmente protegido desde a impressão ou cópia (se aplicável) com o

142 140 ACL (Access Control List) anexado ao recurso. (KRUK; DECKER; ZIEBORAK, 2005, tradução nossa). Freqüentemente um usuário de uma biblioteca digital que busca por informações específicas é inundado com uma abundância de resultados inadequados na elaboração da pergunta. Muitas tentativas têm sido feitas para limitar o número de respostas do processo de pergunta. A pesquisa na usabilidade das características da busca cobre uma larga variedade de aproximações, desde palavras com sentido ambíguo baseadas nas expressões e léxicos booleanos até a dinâmica de perguntas usadas nas interfaces. (KRUK; DECKER; ZIEBORAK, 2005, tradução nossa). Desde prover o acesso aos recursos na base de dados, um sistema de biblioteca digital espera fornecer características da busca e da navegação dos recursos. A Biblioteca Digital Semântica JeromeDL almeja agregar alta qualidade nas características de busca e navegação do sistema. A diversidade de padrões de metadados utilizado no sistema da biblioteca digital reflete a sofisticação de algoritmos de busca. Para alcançar o conjunto de resultados (os mais próximos/exatos) às exigências dos usuários, conceitos de conteúdo, significado e preferências do usuário têm sido adaptados aos algoritmos de busca semântica. Enquanto o usuário está navegando, a base de dados da JeromeDL possibilita anotar semanticamente o perfil do usuário de acordo com informações estatísticas geradas pelo próprio sistema. Então, os perfis são utilizados no processo de busca. (KRUK; DECKER; ZIEBORAK, 2005, tradução nossa). Uma das maneiras para adicionar recursos à Biblioteca Digital Semântica JeromeDL e descrevê-los é usando a aplicação autônoma de administração de Java JeromeAdmin. A aplicação JeromeAdmin fornece uma interface para gerar a descrição dos recursos e o uploading do conteúdo dos recursos para o sistema da base de dados. Com JeromeAdmin um administrador/criador pode anexar a descrição bibliográfica em MARC21 e BibTeX bem como anotações ontológicas para o recurso. Os usuários podem submeter também recursos ao sistema de JeromeDL. Neste caso, um dos dois estágios do processo é requerido. Primeiro um usuário submete o conteúdo do recurso e o conjunto de descrições. Então, o administrador aprova e finaliza a submissão do recurso à base de dados. (KRUK; DECKER; ZIEBORAK, 2005, tradução nossa).

143 141 Para melhor entender-se o funcionamento da arquitetura da Biblioteca Digital Semântica JeromeDL, bem como a estrutura MarcOnt,vejamos como ela está disponibilizada para os usuários, a seguir Formas de representação dos recursos informacionais na Biblioteca Digital Semântica JeromeDL Ao se pensar em formas de representação da informação registrada, como visto no capítulo 4, além da descrição e da representação dos recursos em um ambiente informacional, de acordo com normas e padrões que norteiam sua construção, deve-se também pensar nas formas de apresentação do recurso informacional, de forma a possibilitar uma boa usabilidade dos sujeitos que se apropriarão das informações no sistema. Assim, as seções seguintes apresentarão de uma forma sucinta o ambiente da Biblioteca Digital Semântica JeromeDL, apontando como estão construídas as formas de representação dos recursos informacionais, bem como estão distribuídas ou apresentadas para os usuários. FIGURA 22: Interface de apresentação da Biblioteca Digital Semântica JeromeDL. Fonte: Disponível em: < Acesso em: 31 out

144 142 A figura 22 apresenta a interface de apresentação da biblioteca digital semântica, onde constam alguns links sobre a documentação da biblioteca, as formas de acesso e manuseio aos recursos informacionais, projetos relacionados à biblioteca, os órgãos e instituições que estão vinculados à JeromeDL, uma breve contextualização da criação da biblioteca etc. FIGURA 23: Formas de busca e tipos documentais. Fonte: Disponível em: < Acesso em: 31 out A figura 23 descreve outra interface que contempla as formas de busca aos recursos informacionais, bem como os tipos documentais que estão armazenados na biblioteca digital semântica. Vale destacar que no menu da biblioteca, tem-se uma opção de Idiomas, onde o usuário pode escolher em qual idioma ele deseja visualizar a interface da biblioteca. Vale destacar que nesse caso, nos reportaremos ao idioma português. Um dos grandes desafios da iniciativa da Biblioteca Digital Semântica JeromeDL, é oferecer e estender seus serviços a uma ampla variedade de países com a finalidade de se tornar uma biblioteca universal. O que se pode nesse momento, fazer uma analogia com os sonhos e ideais do visionário Paul Otlet (1934), que vislumbrava uma biblioteca universal, onde todos, sem a limitação de espaço e tempo, pudessem ter o acesso aos registros do conhecimento.

145 143 Ainda com relação a essa interface pode-se destacar as formas de busca aos recursos informacionais constando-se de três opções: simples, avançada e semântica. As buscas simples e avançadas constam de operadores booleanos encontrados em qualquer tipo de biblioteca digital. Vale atentar-nos para um diferencial na busca avançada onde se têm opções de pesquisarmos pelo conteúdo do recurso informacional, bem como pelo tipo de padrão de metadado (Dublin Core, BibTeX, MARC21), o que pode ser visto na figura 24, a seguir. metadados FIGURA 24: Interface de busca avançada. Fonte: Disponível em: < Acesso em: 31 out O grande impacto e o diferencial está na busca semântica, que se pode visualizar de acordo com a figura 25, a seguir.

146 144 FIGURA 25: Interface de Busca semântica. Fonte: Disponível em: < Acesso em: 31 out O desafio para a Biblioteca Digital Semântica JeromeDL está justamente em fornecer informações semânticas que outras bibliotecas digitais não oferecem. Na opção Select template, o usuário pode optar pelas seguintes opções: Exiba todos os recursos na biblioteca, Exiba todos os recursos criados por..., Exiba todos os recursos criados por meus amigos, Exiba todos os recursos criados por alunos de... Pode-se dizer que num primeiro momento a biblioteca digital semântica funciona como um ambiente colaborativo, como mencionado nas seções anteriores, com a participação, não somente de profissionais (bibliotecários, informáticos), mas também dos sujeitos (usuários) que se apropriarão dos recursos informacionais. Destaca-se, nesse momento, que a opção de busca semântica não está ativa e que segundo informações do idealizador da JeromeDL, Sebastian Kruk (2006a) encontra-se ainda em fase de experimentos e testes para um funcionamento breve.

147 145 Com relação aos tipos documentais que estão armazenados na Biblioteca Digital Semântica JeromeDL, escolhemos um recurso do tipo livro para analisar-se sob o prisma da Catalogação como o recurso estaria representado e apresentado ao usuário. FIGURA 26: Recurso informacional Livro. Fonte: Disponível em: < Acesso em 31 out A figura 26 apresenta algumas informações do recurso, como por exemplo, as palavras-chave, descrições adicionais do recurso e uma opção de apresentação do recurso de acordo com um padrão de metadado numa única interface. Além disso, a Biblioteca Digital Semântica JeromeDL possibilita a apresentação dos recursos informacionais no momento da busca e sua visualização num padrão de metadado de acordo com a preferência do usuário, conforme pode ser visto na figura 27, logo em seguida.

148 146 FIGURA 27: Formas de apresentação dos recursos informacionais Fonte: Disponível em: < Acesso em: 31 out A figura 27 mostra um recurso informacional apresentado ao usuário numa única plataforma contemplando os padrões de metadados vislumbrados na iniciativa MarcOnt (BibTeX, BibTeXML, BibTeXRDF, Dublin Core, MARC21, MARCXML, MARCRDF e MarcOnt) uma vez que temos nessa interface a possibilidade de interoperabilidade entre padrões de metadados heterogêneos. Assim, a figura 28 mostrará a apresentação da representação de um recurso informacional no padrão de descrição bibliográfica semântica MarcOnt.

149 147 FIGURA 28: Representação de um recurso informacional em MarcOnt. Fonte: Disponível em: < Acesso em: 31 out De acordo com a figura 28, pode-se considerar que o MarcOnt, utiliza-se para o armazenamento das suas descrições a arquitetura de metadados RDF, possibilitando um nível de interoperabilidade entre os campos do registro, bem como a possibilidade de compartilhamento entre outras bibliotecas digitais e sistemas de informação que fazem uso de padrões de metadados heterogêneos. Faz-se necessário tecermos alguns comentários, pautados e vivenciados na prática biblioteconômica, mais especificamente à luz dos fundamentos da Catalogação, que permite como visto no capítulo 4, a padronização da descrição e da representação dos recursos informacionais. Um dos pontos que vale a pena ser destacado é como se apresenta uma descrição em MARC21, por exemplo, na Biblioteca Digital Semântica JeromeDL. Em outras buscas realizadas na biblioteca com a finalidade de verificar a representação e a descrição de um recurso informacional, foram observadas algumas falhas nesses quesitos. Encontramos um registro MARC21 que possuía mais de um autor, responsável pela obra. E o mais curioso era que o campo 100 (Entrada Principal Nome Pessoal) do registro estava repetido. De acordo

150 148 com a estrutura MARC, este campo não se repete, pois de acordo com os esquemas de descrição AACR2, que antevêem ou norteiam a construção do campo numa estrutura legível por máquina MARC, seria necessário a criação de uma entrada secundária de autoria, que no registro MARC é dado pelo campo 700 (Entrada Secundária Nome Pessoal). Vale relembrar também que até o presente momento, não se encontram disponíveis representação e descrição em MARC21 na sua totalidade, julgando relevante, segundo Kruk (2007) apenas os campos de autoria (100) e título (245) para a busca e a recuperação dos recursos informacionais. Dessa forma, o bibliotecário é considerado protagonista na construção de regras para o estabelecimento da semântica para outros campos do registro MARC21, podendo estes compartilhar informações semânticas não só num mesmo registro/estrutura, mas também com outros padrões de metadados e em sistemas diferentes. Assim, pode-se dizer e reforçar a tese de que para um estabelecimento mais efetivo de representações na estrutura MarcOnt e para a funcionalidade da Biblioteca Digital Semântica JeromeDL, é imprescindível a participação ativa e direta do profissional bibliotecário, pois este é o sujeito que possui as técnicas e as habilidades necessárias para um tratamento das informações de forma padronizada, pautada em normas e regras na construção e confecção de registros bibliográficos. O bibliotecário em consonância com profissionais da Computação e outros atores envolvidos no processo, podem propiciar a clareza nos serviços oferecidos pela biblioteca digital semântica, no atendimento e na satisfação nas solicitações de busca requeridas pelo usuário. Ainda nesse sentido, pode-se dizer que, para o funcionamento pleno do padrão de descrição semântica MarcOnt, faz-se necessário que este compreenda e absorva a égide dos conceitos oriundos da Catalogação, uma vez que esta proporcionará e subsidiará os elementos fundamentais para a construção padronizada da representação. Além disso, a possibilidade de permitir uma melhora na performance de interoperabilidade semântica entre os padrões de metadados vislumbrados em JeromeDL e outros sistemas e ambientes informacionais digitais, de forma a garantir a apresentação dos recursos para a preservação, o uso e o reuso das informações para o usuário final.

151 Portal Colaborativo MarcOnt: um modelo de aplicação para recursos informacionais Conforme mencionado nesse capítulo, a proposta MarcOnt caminha para os novos paradigmas tecnológicos que vêem se constituindo hoje: Web Semântica, Bibliotecas Digitais Semânticas, Repositórios Institucionais Digitais, Web 2.0 etc. E o grande desafio é oferecer aos usuários de informações serviços que os atendam com qualidade e rapidez no acesso e no uso dessas informações. Nesse contexto, o padrão de descrição semântica MarcOnt emerge-se como uma ferramenta tecnológica que pode propiciar a semântica às informações, no que tange às formas de representação da informação registrada, de forma a atender uma diversidade de usuários num único ambiente. Pensando nisso, uma das iniciativas de MarcOnt, foi desenvolver um portal para que os usuários, profissionais de diversas áreas, pesquisadores etc., pudessem participar ativamente no processo de construção de representações e descrições semânticas, funcionando como um ambiente colaborativo, a fim de testar as potencialidades do padrão de descrição semântica MarcOnt. Assim, as seções seguintes, apresentam os cenários de construção e a aplicação da ferramenta MarcOnt, com o objetivo de reforçar sua relevância e a possibilidade de testes e experimentos nessa ambiência. Vale dizer que não é nosso objetivo nesse momento, relatar detalhadamente as ferramentas e os instrumentos tecnológicos desenvolvidos no Portal MarcOnt, mas sim apresentarmos um modelo e um sistema que já se encontram disponíveis para uso, aberto à comunidade. Faz-se necessário um estudo de forma mais aprofundado sobre tais tecnologias de modo a testar suas funcionalidades e potencialidades em aplicações efetivas.

152 150 FIGURA 29: Interface de entrada no Portal MarcOnt. Fonte: Disponível em: < Acesso em 31 out A figura 29 apresenta a interface inicial mostrando que o usuário ao entrar no sistema, deverá cadastrar-se por meio de um login e uma senha, que atualmente, o próprio sistema fornece aos usuários encontrados na página do Portal. FIGURA 30: Principais ferramentas para a construção de descrições semânticas. Fonte: Disponível em: < Acesso em: 31 out

153 151 Uma vez cadastrados e conectados ao sistema, os usuários são remetidos automaticamente para a interface onde estão disponibilizadas as ferramentas tecnológicas para a construção de descrições bibliográficas semânticas, conforme pode ser visto na figura 30. FIGURA 31: Ambiente das regras gerais de transformação. Fonte: Disponível em: < Acesso em: 31 out A figura 31 nos traz as regras e as ferramentas para a construção das descrições semânticas pautadas em algumas recomendações, tais como: Source ontology: nessa modalidade o usuário define uma classe (assunto tratado), bem como as propriedades, os atributos etc. que contemplarão a descrição semântica. Translation rules: nessa parte os usuários definem os namespaces, ou seja, regras para validar o endereço URI da ontologia, com alternativas de adicionar novas regras ou mudá-las quando necessário. Lembrando sempre que as estruturas que comportam as descrições estão calcadas na linguagem computacional XML e na arquitetura de metadados RDF.

154 152 FIGURA 32: Criação de múltiplas descrições. Fonte: Disponível em: < Acesso em: 31 out De acordo com a figura 32, podem-se criar vários tipos de descrições, atribuindo a cada uma delas as regras, as classes, as propriedades, de modo que elas possam interagir num mesmo ambiente. Além disso, o sistema possibilita a apresentação das descrições na opção SHOW DIFF, o que podemos verificar na figura 33, a seguir. FIGURA 33: Apresentação do recurso em forma de tripla. Fonte: Disponível em: < Acesso em: 31 out

155 153 Conforme apresentado na figura 33, o sistema permite uma visualização do recurso no processo de construção em forma de tripla, identificando o subject, predicate e object, onde o criador do recurso tem as possibilidades de adicionar uma nova tripla, bem como removê-la. Destaca-se que para a construção das descrições é utilizado à linguagem OWL, uma recomendação do W3C. FIGURA 34: Submissão da criação da descrição do recurso ao comitê de avaliação. Fonte: Disponível em: < Acesso em: 31 out No momento de criação da descrição do recurso informacional, os sujeitos construtores podem, conforme visto na figura 34, trabalharem em um mesmo ambiente, facilitando a visualização das diferentes características e etapas da confecção da representação, tais como: EDITOR: permite a consulta nas definições da classe, das propriedades e dos namespaces definidos e utilizados na construção da descrição. CODE: define o tipo de linguagem utilizado na construção da descrição do recurso, como por exemplo, OWL. TRIPLES: disponibiliza aos construtores da descrição do recurso as características dos tipos: subject, predicate e object. GRAPH: apresenta a descrição do recurso informacional na forma de grafo.

156 154 Definida a descrição do recurso informacional, os sujeitos encaminham-na para um comitê de avaliação, com as possibilidades de sugestões para possíveis alterações, descrevendo os níveis de descrição com campos para comentários. FIGURA 35: Verificação das normas exigidas para construção da descrição. Fonte: Disponível em: < Acesso em: 31 out Nessa apresentação de acordo com a figura 35, quando os sujeitos submetem as descrições criadas nessa interface, o sistema verifica alguns elementos para analisar se são compatíveis com as normas que permeiam a construção das descrições semânticas, como por exemplo: se a representação da descrição obedece ao quesito da estrutura do tipo XML ou está associada à linguagem OWL.

157 155 FIGURA 36: Acesso aos recursos informacionais. Fonte: Disponível em: < Acesso em: 31 out A interface final do sistema apresenta um repositório onde estão armazenadas e disponibilizadas as descrições para o uso e o reuso das informações; oferece as opções de busca por palavras-chave ao recurso, o nível (classe) do recurso, os comentários por parte da comunidade, a data de criação do recurso, permitindo ainda visualizar ou editar um modelo de descrição (View or edit selected model). Conforme pôde-se observar até o presente momento, o padrão de descrição semântica MarcOnt vislumbra ser uma nova tendência para os ambientes informacionais digitais de modo a permitir a descrição semântica dos recursos informacionais e a possibilidade de permitir a interoperabilidade semântica, não somente entre os campos de um registro bibliográfico, mas também entre outros padrões de metadados em plataformas e sistemas heterogêneos. Tem-se a Biblioteca Digital Semântica JeromeDL, juntamente com o Portal MarcOnt a possibilidade de sistemas que apresentam-se como ambiências propícias no sentido de compartilhar e colaborar com representações e descrições bibliográficas semânticas, onde os sujeitos psico-sociais têm a possibilidade de interação com o ambiente na construção das formas de representação dos recursos informacionais.

UNIVERSIDADE ESTADUAL PAULISTA

UNIVERSIDADE ESTADUAL PAULISTA unesp UNIVERSIDADE ESTADUAL PAULISTA JÚLIO DE MESQUITA FILHO Faculdade de Filosofia e Ciências, Campus de Marília SP Programa de Pós-Graduação em Ciência da Informação FABIANO FERREIRA DE CASTRO Padrões

Leia mais

18 Capítulo 1 INTRODUÇÃO

18 Capítulo 1 INTRODUÇÃO 18 Capítulo 1 INTRODUÇÃO 19 1 INTRODUÇÃO Conhecimento é a capacidade de atuar num contexto (Karl-Erik Sveiby) Esta pesquisa insere-se na linha de pesquisa Informação e Tecnologia do Programa de Pós-Graduação

Leia mais

Uso das tecnologias na representação descritiva: o padrão de descrição bibliográfica semântica MarcOnt Initiative

Uso das tecnologias na representação descritiva: o padrão de descrição bibliográfica semântica MarcOnt Initiative Uso das tecnologias na representação descritiva: o padrão de descrição bibliográfica semântica MarcOnt Initiative nos ambientes informacionais digitais Fabiano Ferreira de Castro Doutorando em ciência

Leia mais

História da catalogação no século

História da catalogação no século História da catalogação no século XX 1901 Impressão e vendas de fichas pela Libraryof Congress LC Bastava apenas acrescentar os cabeçalhos (entradas secundárias) que eram indicadas pela LC 1908 A AmericanLibraryAssociation(ALA)

Leia mais

Denise Gomes Silva Morais Cavalcante. Programa de Pós-graduação em Ciências da Informação/ECA- USP. Orientador: Nair Yumiko Kobashi

Denise Gomes Silva Morais Cavalcante. Programa de Pós-graduação em Ciências da Informação/ECA- USP. Orientador: Nair Yumiko Kobashi INTEGRAÇÃO DE ACERVOS MULTIMÍDIA NO CONTEXTO DA WEB SEMÂNTICA: ANÁLISE DE INSTRUMENTOS E METODOLOGIAS PARA REPRESENTAÇÃO E RECUPERAÇÃO DE DOCUMENTOS MULTIMÍDIA. Denise Gomes Silva Morais Cavalcante denisegsmc@usp.br

Leia mais

GESTÃO DE DOCUMENTOS DE ARQUIVO

GESTÃO DE DOCUMENTOS DE ARQUIVO GESTÃO DE DOCUMENTOS DE ARQUIVO Aula 3 Descrição Arquivística Formas de descrição de documentos e acervos. Os instrumentos de pesquisa. O perfil de metadados. Aplicando os instrumentos de pesquisa: divulgação,

Leia mais

Formas de Representação em Ambientes Informacionais Digitais

Formas de Representação em Ambientes Informacionais Digitais UNIVERSIDADE FEDERAL DE SERGIPE LABORATÓRIO DE TECNOLOGIAS INFORMACIONAIS (LTI) - NUCI Tecnologias de Informação e Comunicação aplicadas à Biblioteconomia I e II Formas de Representação em Ambientes Informacionais

Leia mais

BIBFRAME: tendência para a representação bibliográfica na Web

BIBFRAME: tendência para a representação bibliográfica na Web Powered by TCPDF (www.tcpdf.org) BIBFRAME: tendência para a representação bibliográfica na Web Felipe Augusto Arakaki (IFSP/UNESP) - arakaki@reitoria.unesp.br Luiz Felipe Galeffi (UNESP) - luizgaleffi@gmail.com

Leia mais

Repositórios Digitais

Repositórios Digitais 2007-10-17 Repositórios Digitais José Carlos Ramalho jcr@di.uminho.pt Conteúdo O que são? Como são constituídos? Como são concebidos e implementados? Que agentes e actores? Perspectivas de trabalho 2 Por

Leia mais

ANEXO I. DISCIPLINAS A SEREM OFERECIDAS PELO BiBEaD:

ANEXO I. DISCIPLINAS A SEREM OFERECIDAS PELO BiBEaD: ANEXO I DISCIPLINAS A SEREM OFERECIDAS PELO BiBEaD: DISCIPLINAS Ambientes, Serviços e Sistemas Informacionais Análise de Imagens (30h) Análise da Informação (30h) Bases Teóricas da Administração de Ambientes

Leia mais

EMENTAS BIBLIOTECONOMIA INGRESSANTES 2016/1 E 2016/2

EMENTAS BIBLIOTECONOMIA INGRESSANTES 2016/1 E 2016/2 EMENTAS BIBLIOTECONOMIA INGRESSANTES 2016/1 E 2016/2 EMENTAS COMUNS ÀS MATRIZES LEITURA E PRODUÇÃO DE TEXTOS Produção de textos (orais e escritos), leitura e análise linguística de textos em diferentes

Leia mais

Gerenciamento de conteúdo semântico ECI/UFMG. Eduardo Ribeiro Felipe.

Gerenciamento de conteúdo semântico ECI/UFMG. Eduardo Ribeiro Felipe. Gerenciamento de conteúdo semântico ECI/UFMG Eduardo Ribeiro Felipe www.erfelipe.com.br Proposta Trabalhar com tecnologias ligadas à gestão da informação com enfoque computacional utilizando a Ciência

Leia mais

O W3C e a Web Semântica. CPqD - abril/2009 Workshop Rede IP do Futuro

O W3C e a Web Semântica. CPqD - abril/2009 Workshop Rede IP do Futuro O W3C e a Web Semântica CPqD - abril/2009 Workshop Rede IP do Futuro Web, W3C e Web Semântica Tim Berners-Lee criou / propôs a Web em 1989 (há 20 anos) http://www.w3.org/history/1989/proposal.html (URI

Leia mais

A INFLUÊNCIA DO BIBFRAME PARA VISIBILIDADE DOS DADOS BIBLIOGRÁFICOS

A INFLUÊNCIA DO BIBFRAME PARA VISIBILIDADE DOS DADOS BIBLIOGRÁFICOS A INFLUÊNCIA DO BIBFRAME PARA VISIBILIDADE DOS DADOS BIBLIOGRÁFICOS Ma. Priscilla Lüdtke Espíndola priscillaludtke@gmail.com CONTEXTUALIZAÇÃO Atualmente, o perfil dos usuários está mais voltado à utilizar

Leia mais

UNIVERSIDADE ESTADUAL PAULISTA

UNIVERSIDADE ESTADUAL PAULISTA unesp UNIVERSIDADE ESTADUAL PAULISTA JÚLIO DE MESQUITA FILHO Faculdade de Filosofia e Ciências, Campus de Marília SP Programa de Pós-Graduação em Ciência da Informação FABIANO FERREIRA DE CASTRO ELEMENTOS

Leia mais

A perspectiva da educação continuada em catalogação: um estudo em bibliotecas universitárias em Sergipe

A perspectiva da educação continuada em catalogação: um estudo em bibliotecas universitárias em Sergipe A perspectiva da educação continuada em catalogação: um estudo em bibliotecas universitárias em Sergipe Sandra Vieira Santos Bibliotecária Universidade Federal de Sergipe Prof. Dr. Fabiano Ferreira de

Leia mais

Fundação Escola de Sociologia e Política de São Paulo Faculdade de Biblioteconomia e Ciência da Informação PLANO DE ENSINO (2019)

Fundação Escola de Sociologia e Política de São Paulo Faculdade de Biblioteconomia e Ciência da Informação PLANO DE ENSINO (2019) Fundação Escola de Sociologia e Política de São Paulo Faculdade de Biblioteconomia e Ciência da Informação PLANO DE ENSINO (2019) I. IDENTIFICAÇÃO DISCIPLINA CURSO PROFESSOR REPRESENTAÇÃO DESCRITIVA II

Leia mais

1 Formatos de registro

1 Formatos de registro Sumário 1 Formatos de registro bibliográficos 1.1 Introdução 1.2 Formato MARC 1.3 Formato comum de comunicação (FCC) 1.3.1 ISO 2709 1.3.1.1 Registro para FCC 1.3.1.1 Exemplos 2 Metadados 2.1a Definições

Leia mais

O Repositório Institucional UNESP: compartilhando experiências e desafios

O Repositório Institucional UNESP: compartilhando experiências e desafios O Repositório Institucional UNESP: compartilhando experiências e desafios Introdução Repositório da Produção Científica do CRUESP Lançamento em outubro de 2013 Portaria UNESP 88, de 28 fev. 2013, que instituiu

Leia mais

A Catalogação no Brasil

A Catalogação no Brasil A Catalogação no Brasil Década de 30 1934: Primeiro código de catalogação: Regras bibliográficas: ensaios de consolidação Autoria de Jorge Duarte Ribeiro. Entrada por nomes de pessoas 1936: Primeiro curso

Leia mais

Resource Description and Access Fabrício Silva Assumpção Mestrando em Ciência da Informação Bolsista CAPES UNESP, Marília, 11 de maio de 2012

Resource Description and Access Fabrício Silva Assumpção Mestrando em Ciência da Informação Bolsista CAPES UNESP, Marília, 11 de maio de 2012 Resource Description and Access Fabrício Silva Assumpção Mestrando em Ciência da Informação Bolsista CAPES UNESP, Marília, 11 de maio de 2012 fabricioassumpcao.blogspot.com.br assumpcao.f@gmail.com Sumário

Leia mais

Tecnologias aplicadas à representação documental: um estudo da produção científica nos eventos ISKO-Brasil e ENANCIB

Tecnologias aplicadas à representação documental: um estudo da produção científica nos eventos ISKO-Brasil e ENANCIB Tecnologias aplicadas à representação documental: um estudo da produção científica nos eventos ISKO-Brasil e ENANCIB Prof. Dr. Fabiano Ferreira de Castro Universidade Federal de São Carlos UFSCar São Carlos

Leia mais

PODCAST: UMA PROPOSTA DE DESCRIÇÃO POR MEIO DE PADRÕES DE METADADOS

PODCAST: UMA PROPOSTA DE DESCRIÇÃO POR MEIO DE PADRÕES DE METADADOS PODCAST: UMA PROPOSTA DE DESCRIÇÃO POR MEIO DE PADRÕES DE METADADOS METADADOS O termo metadados é definido como dados sobre dados e é usado por diversas áreas com o objetivo de tratar recursos informacionais

Leia mais

U NIVERSIDADE F EDERAL DE P ERNAMBUCO

U NIVERSIDADE F EDERAL DE P ERNAMBUCO U NIVERSIDADE F EDERAL DE P ERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 2015.1 Extensão do Dataset OpenCIn com Dados Referentes às Notícias e Eventos Relacionados ao Centro de Informática

Leia mais

Sumário: Tipos de Metadados

Sumário: Tipos de Metadados Sumário: Tipos de Metadados 1 Qual o motivo para tipos de metadados? 2 Primeira forma de classificar os metadados 2.1 Metadados segundo a sua aplicação: exemplos 2.2 Metadados segundo a sua aplicação:

Leia mais

EMENTAS CURSO DE BIBLIOTECONOMIA VERSÃO 2009/1 1º PERÍODO

EMENTAS CURSO DE BIBLIOTECONOMIA VERSÃO 2009/1 1º PERÍODO ATIVIDADE ACADÊMICA: Administração TGA EMENTAS CURSO DE BIBLIOTECONOMIA VERSÃO 2009/1 1º PERÍODO CÓDIGO: CAD-103 Princípios de administração. Funções administrativas. Evolução da teoria das organizações.

Leia mais

METADADOS PARA A REPRESENTAÇÃO DAS IMAGENS DIGITAIS

METADADOS PARA A REPRESENTAÇÃO DAS IMAGENS DIGITAIS SHINTAKU, M.; MEIRELLES, R. Manual do DSPACE: administração de repositórios. Salvador: EDUFBA, 2010. PÔSTER METADADOS PARA A REPRESENTAÇÃO DAS IMAGENS DIGITAIS Ana Carolina Simionato Resumo: As redes se

Leia mais

O W3C e a Web Semântica. Reunião de coordenação da e-ping, março/2009

O W3C e a Web Semântica. Reunião de coordenação da e-ping, março/2009 O W3C e a Web Semântica Reunião de coordenação da e-ping, março/2009 Web, W3C e Web Semântica 2 Tim Berners-Lee criou / propôs a Web em 1989 (há 20 anos) http://www.w3.org/history/1989/proposal.html (URI

Leia mais

O PROCESSO DE MODELAGEM CONCEITUAL CATALOGAÇÃO:

O PROCESSO DE MODELAGEM CONCEITUAL CATALOGAÇÃO: O PROCESSO DE MODELAGEM CONCEITUAL (ENTIDADE-RELACIONAMENTO) NA CATALOGAÇÃO: a criação dos Requisitos Funcionais para Dados Imagéticos Digitais (RFDID) ANA CAROLINA SIMIONATO DOCENTE DO DEPARTAMENTO DE

Leia mais

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total. INSTRUÇÕES Para a realização desta prova, você recebeu este Caderno de Questões. 1. Caderno de Questões Verifique se este Caderno de Questões contém a prova de Conhecimentos Específicos referente ao cargo

Leia mais

DISCIPLINA CRED CH PRÉ-REQUISITOS 1ª FASE Antropologia Cultural

DISCIPLINA CRED CH PRÉ-REQUISITOS 1ª FASE Antropologia Cultural CURSO DE BACHARELADO EM BIBLIOTECONOMIA HABILITAÇÃO: GESTÃO DA INFORMAÇÃO AUTORIZAÇÃO: Resolução nº 26/2001 CONSUNI RECONHECIMENTO: Decreto Estadual nº 847/2011 renovado pelo Decreto Estadual nº 1050/2017

Leia mais

STJ RONALDO VIEIRA I I EDITORA INTERCIÊNCIA. Rio de Janeiro

STJ RONALDO VIEIRA I I EDITORA INTERCIÊNCIA. Rio de Janeiro RONALDO VIEIRA I I I I EDITORA INTERCIÊNCIA Rio de Janeiro - 2014 Copyright 2014, by Ronaldo da Mota Vieira Direitos Reservados em 2014 por Editora Interciência Ltda. Diagramação:Wilma Gesta de Andrade

Leia mais

CATÁLOGO COLETIVO NACIONAL DE PUBLICAÇÕES SERIADAS (CCN) MANUAL DE OPERAÇÃO. Versão 2.0

CATÁLOGO COLETIVO NACIONAL DE PUBLICAÇÕES SERIADAS (CCN) MANUAL DE OPERAÇÃO. Versão 2.0 CATÁLOGO COLETIVO NACIONAL DE PUBLICAÇÕES SERIADAS (CCN) MANUAL DE OPERAÇÃO Versão 2.0 Brasília, maio de 1998 SUMÁRIO I APRESENTAÇÃO...3 II REDE CCN...4 2.1 Introdução...4 2.2 Objetivos...5 2.3 Conceitos...5

Leia mais

1.1 META VEM DO PREFIXO GREGO E SIGNIFICA JUNTO A, DEPOIS DE, ENTRE, COM PREFIXO QUE INDICA ALGO QUE SE APLICA A SI MESMO

1.1 META VEM DO PREFIXO GREGO E SIGNIFICA JUNTO A, DEPOIS DE, ENTRE, COM PREFIXO QUE INDICA ALGO QUE SE APLICA A SI MESMO SUMÁRIO 1 Metadados? 1.1 Meta 1.2 Dado 1.3 Primeira definição 1.4 Segunda definição 1.4 Metabuscador 1.5 Metaetiquetas 1.6 Um pouco de história 1.7 Um pouco de história 2 1.8 Outras definições 1.9 Quem

Leia mais

Repensando questões políticas e tecnológicas em tempos de RDA. Fabrício Silva Assumpção Universidade Federal do Paraná (UFPR)

Repensando questões políticas e tecnológicas em tempos de RDA. Fabrício Silva Assumpção Universidade Federal do Paraná (UFPR) Repensando questões políticas e tecnológicas em tempos de RDA Fabrício Silva Assumpção Universidade Federal do Paraná (UFPR) assumpcao.f@gmail.com Política de catalogação Traz princípios, confrontando-os

Leia mais

Fabiano Ferreira de Castro * Plácida Leopoldina V. A. da Costa Santos **

Fabiano Ferreira de Castro * Plácida Leopoldina V. A. da Costa Santos ** OS METADADOS COMO INSTRUMENTOS TECNOLÓGICOS NA PADRONIZAÇÃO E POTENCIALIZAÇÃO DOS RECURSOS INFORMACIONAIS NO ÂMBITO DAS BIBLIOTECAS DIGITAIS NA ERA DA WEB SEMÂNTICA artigo de revisão Fabiano Ferreira de

Leia mais

julho/2010 FISL O W3C e Dados abertos na Web

julho/2010 FISL O W3C e Dados abertos na Web julho/2010 FISL O W3C e Dados abertos na Web Web e W3C Tim Berners-Lee criou / propôs 2 a Web em 1989 (há 21 anos) http://www.w3.org/history/1989/proposal.html (URI + HTTP + HTML) Web e W3C 3 Tim Berners-Lee

Leia mais

Metodologia LILACS. Objetivo: Conhecer a metodologia LILACS e seus componentes.

Metodologia LILACS. Objetivo: Conhecer a metodologia LILACS e seus componentes. Metodologia LILACS Objetivo: Conhecer a metodologia LILACS e seus componentes. Conteúdo desta aula Definição de Metodologia LILACS Normas, manuais, guias Aplicativos e ferramentas Importância de aplicar

Leia mais

Biblioteca Digital: a experiência da USP

Biblioteca Digital: a experiência da USP Universidade de São Paulo Biblioteca Digital da Produção Intelectual - BDPI Departamento Técnico - SIBi/DT Comunicações em Eventos - SIBi/DT 2012-05 Biblioteca Digital: a experiência da USP Congresso Internacional

Leia mais

INTRODUÇÃO À INTERNET E À WORLD WIDE WEB

INTRODUÇÃO À INTERNET E À WORLD WIDE WEB INTRODUÇÃO À INTERNET E À WORLD WIDE WEB CURSO TÉCNICO DE INFORMÁTICA MODALIDADE SUBSEQÜENTE DESENVOLVIMENTO WEB I PROF. ALEXANDRO DOS SANTOS SILVA 1 1 SUMÁRIO Conceitos básicos Histórico Principais modelos

Leia mais

Aplicação de metadados

Aplicação de metadados PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA INFORMAÇÃO CULTURA E INFORMAÇÃO Mestrado profissional em Gestão da informação MPI4002 Bibliotecas Digitais: Implementação e Avaliação de Sistemas e Serviços Digitais

Leia mais

Padrões para Definição de Metadados

Padrões para Definição de Metadados Padrões para Definição de Metadados Marcos Vinícius Salgado Monteiro mvsmonteiro@midiacom.uff.br 1- Introdução 2- MPEG-7 3- TV-Anytime 4- RDF 4.1- OWL 5- Conclusão Roteiro Introdução Hoje em dia, cada

Leia mais

Metadados. Plano de manejo dos parques do trecho sul do Rodoanel

Metadados. Plano de manejo dos parques do trecho sul do Rodoanel 1 Metadados Plano de manejo dos parques do trecho sul do Rodoanel 1 Contexto Os metadados surgiram como pré-requisito para o compartilhamento de informações. Eles fazem parte da Infraestrutura de Dados

Leia mais

INFORMAÇÃO, MEMÓRIA E AS HUMANIDADES DIGITAIS

INFORMAÇÃO, MEMÓRIA E AS HUMANIDADES DIGITAIS INFORMAÇÃO, MEMÓRIA E AS HUMANIDADES DIGITAIS experiências do Repositório Institucional da Fundação João Pinheiro Roger Guedes Doutor em Ciência da Informação (UFMG). Bibliotecário. Fundação João Pinheiro

Leia mais

1 Base de Dados, são conjuntos de registros similares entre si e que contém relações entre esses registro.(jennifer Rowley.)

1 Base de Dados, são conjuntos de registros similares entre si e que contém relações entre esses registro.(jennifer Rowley.) I Ao longo da existências das bibliotecas, é seus respectivos serviços, sempre obteve-se de base de dados,catálogos,arquivos e lista de leitores assim todos tipos de base de dados. 1951 - Bases de dados

Leia mais

CONHECIMENTOS ESPECÍFICOS BIBLIOTECÁRIO - DOCUMENTALISTA

CONHECIMENTOS ESPECÍFICOS BIBLIOTECÁRIO - DOCUMENTALISTA CONHECIMENTOS ESPECÍFICOS BIBLIOTECÁRIO - DOCUMENTALISTA 26. No contexto da sociedade da informação e do conhecimento, as unidades de informação assumem um importante papel social, sobretudo quando se

Leia mais

Organização da Informação

Organização da Informação Organização da Informação P R O F A. L I L L I A N A L V A R E S F A C U L D A D E D E C I Ê N C I A D A I N F O R M A Ç Ã O U N I V E R S I D A D E D E B R A S Í L I A Organização da Informação Na Ciência

Leia mais

UNIDADE Escola de Ciência da Informação CARGA HORÁRIA TEÓRICA PRÁTICA TOTAL CRÉDITOS créditos ANO LETIVO 1. O Semestre de 2012

UNIDADE Escola de Ciência da Informação CARGA HORÁRIA TEÓRICA PRÁTICA TOTAL CRÉDITOS créditos ANO LETIVO 1. O Semestre de 2012 UNIVERSIDADE FEDERAL DE MINAS GERAIS ESCOLA DE CIÊNCIA DA INFORMAÇÃO DISCIPLINAS DO CURSO DE GRADUAÇÃO DISCIPLINA Fundamentos da Organização da Informação OTI 072 A1 PROFESSOR Lídia Alvarenga DEPARTAMENTO

Leia mais

O CONTROLE DE AUTORIDADE PARA A CATALOGAÇÃO: Análise da produção científica indexada na Scopus

O CONTROLE DE AUTORIDADE PARA A CATALOGAÇÃO: Análise da produção científica indexada na Scopus Powered by TCPDF (www.tcpdf.org) O CONTROLE DE AUTORIDADE PARA A CATALOGAÇÃO: Análise da produção científica indexada na Scopus Luiza de Menezes Romanetto 1 ; Plácida Leopoldina Ventura Amorim da Costa

Leia mais

Visualizando Padrões: A visualização do Universo de Metadados

Visualizando Padrões: A visualização do Universo de Metadados Fonte: Riley, J. Seeing Standards: a visualization of the metadata universe. USA: Indiana University Libraries, 2009-2010. Visualizando Padrões: A visualização do Universo de Metadados Compilação, tradução

Leia mais

Fontes de Acesso Livre

Fontes de Acesso Livre Biblioteca Virtual Fontes de Acesso Livre NACIONAIS http://books.scielo.org/ Scielo Livros: oferece acesso gratuito e texto completo de publicações de caráter acadêmico. Neste portal são encontrados livros

Leia mais

O trabalho bibliotecário em rede: a cooperação em jogo

O trabalho bibliotecário em rede: a cooperação em jogo XVIII Seminário Nacional de Bibliotecas Universitárias (SNBU) Belo Horizonte, 16-21 nov. 2014 O trabalho bibliotecário em rede: a cooperação em jogo Cristina Dotta Ortega Escola de Ciência da Informação

Leia mais

O acesso à informação e assimetrias informacionais no Brasil: um estudo preliminar

O acesso à informação e assimetrias informacionais no Brasil: um estudo preliminar Powered by TCPDF (www.tcpdf.org) O acesso à informação e assimetrias informacionais no Brasil: um estudo preliminar Fernanda Gabrielli de Castro (USP) - fernanda.gabrielli.castro@usp.br Deise Maria Antonio

Leia mais

Cíntia de Azevedo Lourenço Doutora em Ciência da Informação Universidade Federal de Minas Gerais Contato:

Cíntia de Azevedo Lourenço Doutora em Ciência da Informação Universidade Federal de Minas Gerais Contato: Cíntia de Azevedo Lourenço Doutora em Ciência da Informação Universidade Federal de Minas Gerais Contato: cal@eci.ufmg.br 1 INTRODUÇÃO A palavra representação remete a inúmeras noções: Lingüística e Semiótica:

Leia mais

Análise estratégica do serviço de referência e informação a partir do ponto de vista do bibliotecário de referência

Análise estratégica do serviço de referência e informação a partir do ponto de vista do bibliotecário de referência Universidade de São Paulo Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto Curso de Ciências da Informação e da Documentação e Biblioteconomia MÁRCIA DELFINO HAYAXIBARA Análise estratégica do

Leia mais

Em 1945 Vannevar Bush,diretor do ministério de desenvolvimento e pesquisa científica dos Estados Unidos, escreve o artigo As we may think, como nós

Em 1945 Vannevar Bush,diretor do ministério de desenvolvimento e pesquisa científica dos Estados Unidos, escreve o artigo As we may think, como nós Mídias digitais Em 1945 Vannevar Bush,diretor do ministério de desenvolvimento e pesquisa científica dos Estados Unidos, escreve o artigo As we may think, como nós pensamos, onde ele desenvolve a idéia

Leia mais

A gestão de obras digitalizadas na BND

A gestão de obras digitalizadas na BND A gestão de obras digitalizadas na BND José Luís Borbinha, Gilberto Pedrosa, João Penas, João Gil National Library of Portugal Jose.Borbinha@bn.pt; gfsp@ext.bn.pt; penas@ext.bn.pt; jgil@ext.bn.pt Palavras

Leia mais

U NIVERSIDADE F EDERAL DE P ERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA

U NIVERSIDADE F EDERAL DE P ERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA U NIVERSIDADE F EDERAL DE P ERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 2014.2 OpenCIn Dados Abertos e Interligados Acerca dos Docentes do Centro de Informática PROPOSTA DE TRABALHO

Leia mais

O W3C Futuro da Web HTML5. janeiro/2010 Campus Party

O W3C Futuro da Web HTML5. janeiro/2010 Campus Party O W3C Futuro da Web HTML5 janeiro/2010 Campus Party Web e W3C Tim Berners-Lee criou / propôs a Web em 1989 (há 21 anos) http://www.w3.org/history/1989/proposal.html (URI + HTTP + HTML) o W3C em 1994 (há16

Leia mais

Universidade Federal da Bahia Biblioteca Central Macedo Costa. Reitor Naomar Monteiro de Almeida Filho

Universidade Federal da Bahia Biblioteca Central Macedo Costa. Reitor Naomar Monteiro de Almeida Filho Universidade Federal da Bahia Biblioteca Central Macedo Costa Reitor Naomar Monteiro de Almeida Filho Pró - Reitor de Pós Graduação Maria de Fátima Dias Costa Diretora do Sistema de Bibliotecas Maria das

Leia mais

O ESTADO DA ARTE DA PRODUÇÃO CIENTÍFICA EM CATALOGAÇÃO NAS REGIÕES NORTE E NORDESTE

O ESTADO DA ARTE DA PRODUÇÃO CIENTÍFICA EM CATALOGAÇÃO NAS REGIÕES NORTE E NORDESTE Powered by TCPDF (www.tcpdf.org) O ESTADO DA ARTE DA PRODUÇÃO CIENTÍFICA EM CATALOGAÇÃO NAS REGIÕES NORTE E NORDESTE Maurício José Morais Costa (UFMA) - mauricio.jmc@outlook.com Valdirene Pereira da Conceição

Leia mais

REPOSITÓRIO DO INSTITUTO DE ENGENHARIA NUCLEAR: CURADORIA DIGITAL, PUBLICAÇÕES AMPLIADAS E GESTÃO DE PESQUISA

REPOSITÓRIO DO INSTITUTO DE ENGENHARIA NUCLEAR: CURADORIA DIGITAL, PUBLICAÇÕES AMPLIADAS E GESTÃO DE PESQUISA Powered by TCPDF (www.tcpdf.org) REPOSITÓRIO DO INSTITUTO DE ENGENHARIA NUCLEAR: CURADORIA DIGITAL, PUBLICAÇÕES AMPLIADAS E GESTÃO DE PESQUISA Luana Farias Sales (CNEN-IEN) - luanafsales@gmail.com Luís

Leia mais

POLÍTICA DE INDEXAÇÃO PARA BIBLIOTECAS UNIVERSITÁRIAS

POLÍTICA DE INDEXAÇÃO PARA BIBLIOTECAS UNIVERSITÁRIAS M ESA REDONDA: O RGANIZAÇÃO DA INFORMAÇÃO E DO CONHECIMENTO EM CONTEXTOS COLABORATIVOS E INTEGRADOS EM REDE POLÍTICA DE INDEXAÇÃO PARA BIBLIOTECAS UNIVERSITÁRIAS Dra. Mariângela Spotti Lopes Fujita (Nível

Leia mais

POLÍTICA INFORMACIONAL DO REPOSITÓRIO INSTITUCIONAL DA UNIVERSIDADE FEDERAL DE ITAJUBÁ

POLÍTICA INFORMACIONAL DO REPOSITÓRIO INSTITUCIONAL DA UNIVERSIDADE FEDERAL DE ITAJUBÁ POLÍTICA INFORMACIONAL DO REPOSITÓRIO INSTITUCIONAL DA UNIVERSIDADE FEDERAL DE ITAJUBÁ 1 O Repositório Institucional da UNIFEI é um conjunto de serviços oferecidos pela Biblioteca Mauá para a gestão e

Leia mais

Resource Description

Resource Description XII Encontro Nacional de Usuários da Rede Pergamum Curitiba, 7 de junho de 2013 Resource Description and Access (RDA) Introdução e panorama atual Fabrício Silva Assumpção fabricioassumpcao.com assumpcao.f@gmail.com

Leia mais

Este capítulo aborda os fundamentos principais aplicados neste trabalho.

Este capítulo aborda os fundamentos principais aplicados neste trabalho. 2 Fundamentos Este capítulo aborda os fundamentos principais aplicados neste trabalho. 2.1 Linked Data Linked Data é um padrão de práticas a serem seguidas para a publicação e interligação de dados estruturados

Leia mais

BIBLIOTECAS DIGITAIS Bibliotecas Digitais

BIBLIOTECAS DIGITAIS Bibliotecas Digitais Automação de Bibliotecas BIBLIOTECAS DIGITAIS Bibliotecas Digitais 1 Contexto tecnológico Paul Otlet, Vannevar Bush, Theodore Nelson suas ideias se apoiaram em tecnologias que ainda não existiam ou que

Leia mais

CONVERSÃO DE METADADOS DO PADRÃO DUBLIN CORE PARA O RDF Arlindo Leal Boica Leandro Henrique Mendonça de Oliveira

CONVERSÃO DE METADADOS DO PADRÃO DUBLIN CORE PARA O RDF Arlindo Leal Boica Leandro Henrique Mendonça de Oliveira 8 GLOBAL SCIENCE AND TECHNOLOGY (ISSN 1984-3801) CONVERSÃO DE METADADOS DO PADRÃO DUBLIN CORE PARA O RDF Arlindo Leal Boica Leandro Henrique Mendonça de Oliveira Resumo: Atualmente, a descrição de recursos

Leia mais

Aprendizagem Informacional ACV Canal Ciência Mapa da Inclusão Corredor Digital Rede APL SBRT

Aprendizagem Informacional ACV Canal Ciência Mapa da Inclusão Corredor Digital Rede APL SBRT Criado na década de 50, tem como missão promover o desenvolvimento do setor de informação, mediante proposição de políticas, execução de pesquisas e difusão de inovações capazes de contribuir para o avanço

Leia mais

GESTÃO DA INFORMAÇÃO NA PERSPECTIVA DO USUÁRIO

GESTÃO DA INFORMAÇÃO NA PERSPECTIVA DO USUÁRIO GESTÃO DA INFORMAÇÃO NA PERSPECTIVA DO USUÁRIO gestao_informacao ( valendo).indd 1 17/6/2013 09:46:31 gestao_informacao ( valendo).indd 2 17/6/2013 09:46:31 Ana Lúcia Ferreira Gonçalves GESTÃO DA INFORMAÇÃO

Leia mais

Organização institucional e estruturas contemporâneas de comunicação científica

Organização institucional e estruturas contemporâneas de comunicação científica Organização institucional e estruturas contemporâneas de comunicação científica Sueli Mara S.P. Ferreira USP/ECA II Simpósio Brasileiro de Comunicação Científica Universidade Federal de Santa Catarina

Leia mais

CÓDIGO: BIB10086 TIPOLOGIA: OBRIGATÓRIA CHS:60 Créditos: 4

CÓDIGO: BIB10086 TIPOLOGIA: OBRIGATÓRIA CHS:60 Créditos: 4 UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO CENTRO DE CIÊNCIAS JURÍDICAS E ECONÔMICAS COLEGIADO DE BIBLIOTECONOMIA CURSO: BIBLIOTECONOMIA TÍTULO: BACHAREL EM BIBLIOTECONOMIA PERIODIZAÇÃO IDEAL: 1º PERÍODO IDENTIFICAÇÃO:

Leia mais

3º INTEGRAR - Congresso Internacional de Arquivos, Bibliotecas, Centros de Documentação e Museus PRESERVAR PARA AS FUTURAS GERAÇÕES

3º INTEGRAR - Congresso Internacional de Arquivos, Bibliotecas, Centros de Documentação e Museus PRESERVAR PARA AS FUTURAS GERAÇÕES Preservação da memória institucional: relato de experiência da biblioteca virtual da fundação de amparo à pesquisa do Estado de São Paulo (BV- ) Thais Fernandes de Morais Rosaly Fávero Krzyzanowski Fabiana

Leia mais

INSTRUMENTOS DE REPRESENTAÇÃO DOCUMENTAL: BREVE ABORDAGEM

INSTRUMENTOS DE REPRESENTAÇÃO DOCUMENTAL: BREVE ABORDAGEM INSTRUMENTOS DE REPRESENTAÇÃO DOCUMENTAL: BREVE ABORDAGEM Instruments of documentary representation: brief approach Ana Maria Pereira Doutora em Tecnologias e Sistemas de Informação Universidade do Estado

Leia mais

A implantação do RDA na University of Illinois at Urbana- Champaign Liliana Giusti Serra

A implantação do RDA na University of Illinois at Urbana- Champaign Liliana Giusti Serra A implantação do RDA na University of Illinois at Urbana- Champaign Liliana Giusti Serra SophiA Biblioteca / UNESP lgiustiserra@gmail.com Primeira biblioteca universitária a implantar o RDA (março de 2013)

Leia mais

Alimentação de Metadados em Repositórios Institucionais

Alimentação de Metadados em Repositórios Institucionais Especialização em Informação Científica e Tecnológica em Saúde Rio 2014 Alimentação de Metadados em Repositórios Institucionais Éder Freyre Rio de Janeiro 24/07/2014 Explosão bibliográfica na Internet

Leia mais

Metadados e aplicação em Repositórios Digitais Institucionais

Metadados e aplicação em Repositórios Digitais Institucionais Metadados e aplicação em Repositórios Digitais Institucionais Karina Gama Cubas da Silva Disciplina: CBD5140-1 Produção e Recepção de Informações: Teorias e Métodos Profa. Dra. Nair Yumiko Kobashi e Profa.

Leia mais

1 Introdução. 1 World Wide Web Consortium -

1 Introdução. 1 World Wide Web Consortium - 1 Introdução A internet é uma ampla fonte de disseminação de informações, abrangendo praticamente todas as áreas de conhecimento. A maioria das informações disponíveis hoje para a grande parte dos usuários

Leia mais

Um olhar para o passado. Um olhar para o futuro: democratizando o acesso à história dos afro brasileiros preservada pela Biblioteca Nacional

Um olhar para o passado. Um olhar para o futuro: democratizando o acesso à história dos afro brasileiros preservada pela Biblioteca Nacional Powered by TCPDF (www.tcpdf.org) Um olhar para o passado. Um olhar para o futuro: democratizando o acesso à história dos afro brasileiros preservada pela Biblioteca Nacional Andreia Sousa Da Silva (UFSC)

Leia mais

GESTÃO DE DOCUMENTOS DE ARQUIVO

GESTÃO DE DOCUMENTOS DE ARQUIVO GESTÃO DE DOCUMENTOS DE ARQUIVO Aula 7 Descrição Arquivística. Revisão, estudo de caso e elaboração de instrumentos de pesquisa. Revisão do conteúdo Descrição Arquivística Aula 7 O caráter dinâmico do

Leia mais

ASSOCIAÇÃO ANTÔNIO VIEIRA ASAV UNIVERSIDADE DO VALE DO RIO DOS SINOS UNISINOS BIBLIOTECA

ASSOCIAÇÃO ANTÔNIO VIEIRA ASAV UNIVERSIDADE DO VALE DO RIO DOS SINOS UNISINOS BIBLIOTECA 1 ASSOCIAÇÃO ANTÔNIO VIEIRA ASAV UNIVERSIDADE DO VALE DO RIO DOS SINOS UNISINOS BIBLIOTECA POLÍTICAS: ATUALIZAÇÃO, INFORMATIZAÇÃO, ACESSO E UTILIZAÇÃO SÃO LEOPOLDO, 2019 2 SUMÁRIO 1 INTRODUÇÃO... 3 2 DESCRIÇÃO

Leia mais

As influências de Seymour Lubetzky na catalogação descritiva no século XXI

As influências de Seymour Lubetzky na catalogação descritiva no século XXI As influências de Seymour Lubetzky na catalogação descritiva no século XXI Alessandra Atti Mestranda em Ciência da Informação na Universidade de São Paulo alessandraatti@usp.br Dr. José Fernando Modesto

Leia mais

Introdução à Biblioteconomia e à Ciência da Informação

Introdução à Biblioteconomia e à Ciência da Informação Instituto de Ciência da Informação Biblioteconomia e Documentação Disciplinas Obrigatórias CÓDIGO ICI 014 TÌTULO Introdução à Biblioteconomia e à Ciência da Informação Ementa: Biblioteconomia, Documentação

Leia mais

Comunicação e Documentos

Comunicação e Documentos Habilidades e Qualificações do Bibliotecário em Ciências da Saúde Informe Técnico Grupo de Bibliotecários da Área da Saúde A área da Biblioteconomia foi e, continua sendo, uma das mais impactadas pela

Leia mais

Mudanças e desafios na utilização do RDA Fabrício Silva Assumpção

Mudanças e desafios na utilização do RDA Fabrício Silva Assumpção Mudanças e desafios na utilização do RDA Fabrício Silva Assumpção fabricioassumpcao.com assumpcao.f@gmail.com Curso online Porto Alegre 28 de maio de 2015 Necessidade de mudanças Novos tipos de documentos

Leia mais

forma legível por máquina

forma legível por máquina 1964 Financiamento de um estudo sobre os possíveis métodos para a conversão de fichas catalográficas da Library of Congress para uma forma legível por máquina com o objetivo de utilizar computadores na

Leia mais

UNIVERSIDADE FEDERAL DE ALAGOAS ICHCA/ CURSO DE BIBLIOTECONOMIA INFORMÁTICA APLICADA À BIBLIOTECONOMIA I

UNIVERSIDADE FEDERAL DE ALAGOAS ICHCA/ CURSO DE BIBLIOTECONOMIA INFORMÁTICA APLICADA À BIBLIOTECONOMIA I UNIVERSIDADE FEDERAL DE ALAGOAS ICHCA/ CURSO DE BIBLIOTECONOMIA INFORMÁTICA APLICADA À BIBLIOTECONOMIA I Professor:Ronaldo Ferreira de Araujo ronaldfa@gmail.com Aula 12/03 O QUE É INFORMÁTICA? O QUE É

Leia mais

TemaTres e a construção de tesauros: aspectos de aplicabilidade para o profissionald a informação

TemaTres e a construção de tesauros: aspectos de aplicabilidade para o profissionald a informação Powered by TCPDF (www.tcpdf.org) TemaTres e a construção de tesauros: aspectos de aplicabilidade para o profissionald a informação Rejane Galdino (IFSP) - rejanegaldino@gmail.com Deise Maria Antonio Sabbag

Leia mais

SUGESTÕES DE TEMAS PARA ORIENTAÇÃO DE TCC ANO: Professores orientadores: Angélica Conceição Dias Miranda. Fabiano Couto Correa da Silva

SUGESTÕES DE TEMAS PARA ORIENTAÇÃO DE TCC ANO: Professores orientadores: Angélica Conceição Dias Miranda. Fabiano Couto Correa da Silva SUGESTÕES DE TEMAS PARA ORIENTAÇÃO DE TCC ANO: 2018 Professores orientadores: Angélica Conceição Dias Miranda Fabiano Couto Correa da Silva Cláudio Renato Moraes da Silva Geise Ribeiro da Silva Gisele

Leia mais

Ciências da Computação Disciplina:Computação Gráfica

Ciências da Computação Disciplina:Computação Gráfica Ciências da Computação Disciplina:Computação Gráfica Professora Andréia Freitas 2013 7 semestre Aula 06 MEMORIA, F. Design para a Internet. 1ª Edição. Rio de Janeiro: Campus, 2005. ALVES, W. P. Crie, anime

Leia mais

PEP: Prontuário Eletrônico do Paciente

PEP: Prontuário Eletrônico do Paciente PEP: Prontuário Eletrônico do Paciente Revisando... O Prontuário Eletrônico é... um repositório onde todas as informações de saúde, clínicas e administrativas, ao longo da vida de um indivíduo estão armazenadas,

Leia mais

INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO TRIÂNGULO MINEIRO CAMPUS PARACATU

INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO TRIÂNGULO MINEIRO CAMPUS PARACATU 1 INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO TRIÂNGULO MINEIRO CAMPUS PARACATU CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS MAX VICTOR HENRIQUES CORRÊA W3C PARACATU,

Leia mais

Metodologia Científica. Construindo Saberes

Metodologia Científica. Construindo Saberes Metodologia Científica Construindo Saberes Trabalho com Projetos A pesquisa promove saberes Estímulo ao desenvolvimento da ciência Construção e busca por novos conhecimentos Buscar novos horizontes Desenvolvimento

Leia mais

Proposta de gestão para a ABRAPSO Editora quadriênio

Proposta de gestão para a ABRAPSO Editora quadriênio Proposta de gestão para a ABRAPSO Editora quadriênio 2018-2021 Atendendo à Convocatória para Seleção para a Editoria Científica da Editora da Associação Brasileira de Psicologia Social [ABRAPSO] Andrea

Leia mais

CONTEÚDO ESPECÍFICO AO CARGO DE NÍVEL E

CONTEÚDO ESPECÍFICO AO CARGO DE NÍVEL E CONTEÚDO ESPECÍFICO AO CARGO DE NÍVEL E BIBLIOTECÁRIO/DOCUMENTALISTA 1. Conceitos básicos de Biblioteconomia e Ciência da Informação; 2. Ética profissional, legislação; 3. Organização e administração de

Leia mais

INFORMAÇÃO, MEMÓRIA E IDENTIDADE INSTITUCIONAL: COLEÇÃO DE FOLDERS DA FUNDAÇÃO JOÃO PINHEIRO

INFORMAÇÃO, MEMÓRIA E IDENTIDADE INSTITUCIONAL: COLEÇÃO DE FOLDERS DA FUNDAÇÃO JOÃO PINHEIRO Powered by TCPDF (www.tcpdf.org) INFORMAÇÃO, MEMÓRIA E IDENTIDADE INSTITUCIONAL: COLEÇÃO DE FOLDERS DA FUNDAÇÃO JOÃO PINHEIRO Roger De Miranda Guedes (FJP) - rogerotoni@gmail.com Resumo: Relato de experiência

Leia mais

Uso das redes sociais como forma de disseminação da informação nas bibliotecas do Instituto Federal de Educação, Ciência e Tecnologia da Bahia (IFBA).

Uso das redes sociais como forma de disseminação da informação nas bibliotecas do Instituto Federal de Educação, Ciência e Tecnologia da Bahia (IFBA). Powered by TCPDF (www.tcpdf.org) Uso das redes sociais como forma de disseminação da informação nas bibliotecas do Instituto Federal de Educação, Ciência e Tecnologia da Bahia (IFBA). VALFREDO LIMA DA

Leia mais

Projeto 2B Portal de Teses da BVS Saúde Pública 19 de janeiro de 2005

Projeto 2B Portal de Teses da BVS Saúde Pública 19 de janeiro de 2005 http://www.bvs.br/ 19 de janeiro de 2005 Introdução Este documento descreve o projeto para continuidade do programa de desenvolvimento de um conjunto de dissertações e teses na área de saúde pública através

Leia mais

Web Services - Definição. Web Services - Introdução. Universidade Federal de Santa Catarina. DSOOII Web Services

Web Services - Definição. Web Services - Introdução. Universidade Federal de Santa Catarina. DSOOII Web Services Universidade Federal de Santa Catarina DSOOII Web Services Web Services - Introdução Havia inconsistência de plataformas, sistemas operacionais e/ou linguagens de programação; Acadêmicos: Ariane Talita

Leia mais