Universidade Fernando Pessoa

Documentos relacionados
DESENVOLVIMENTO WEB DENTRO DOS PARADIGMAS DO HTML5 E CSS3

UFG - Instituto de Informática

Ajuda ao SciEn-Produção O Artigo Científico da Pesquisa Experimental

Núcleo de Pós Graduação Pitágoras

XHTML 1.0 DTDs e Validação

PADRÕES PARA O DESENVOLVIMENTO NA WEB

BIBLIOTECA ANACOM MANUAL DO UTILIZADOR

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

Web Services. Autor: Rômulo Rosa Furtado

XML e Banco de Dados de Internet. Tópicos Especiais em Tecnologia da Informação Profa. Késsia R. C. Marchi

Conceito. As empresas como ecossistemas de relações dinâmicas

Intranets. FERNANDO ALBUQUERQUE Departamento de Ciência da Computação Universidade de Brasília 1.INTRODUÇÃO

PROGRAMAÇÃO SERVIDOR WEBSERVICES EM SISTEMAS WEB. Prof. Dr. Daniel Caetano

DESENVOLVIMENTO DE SOFTWARE DE VOTAÇÃO WEB UTILIZANDO TECNOLOGIA TOUCHSCREEN

PROGRAMA. Unidade Curricular: Informática Docente: Mestre José Avelino Moreira Victor

Critérios para certificação de Sites SciELO: critérios, política e procedimentos para a classificação e certificação dos sites da Rede SciELO

Capítulo 9. Gerenciamento de rede

INTEGRAÇÃO DE APLICAÇÕES UTILIZANDO WEB SERVICE 1. Kellen Kristine Perazzoli 2 ; Manassés Ribeiro 3

CENTRO ESTADUAL DE EDUCAÇÃO TECNOLÓGICA PAULA SOUZA ETEC PROF. MÁRIO ANTÔNIO VERZA CURSO TÉCNICO EM INFORMÁTICA PARA INTERNET

Universidade da Beira Interior

Construção Páginas de Internet

Manual de Utilizador

Semântica para Sharepoint. Busca semântica utilizando ontologias

PLANIFICAÇÃO MODULAR ANO LECTIVO 2015 / 2016

GUIA DE CURSO. Tecnologia em Sistemas de Informação. Tecnologia em Desenvolvimento Web. Tecnologia em Análise e Desenvolvimento de Sistemas

Universidade Anhanguera Uniderp Centro de Educação a Distância

A VISTA BACKSTAGE PRINCIPAIS OPÇÕES NO ECRÃ DE ACESSO

Introdução à Computação

Alberto Manuel Simões, José João Almeida, and Xavier Gomez Guinovart

EMENTAS DAS DISCIPLINAS

QUALIDADE E EXCELÊNCIA NA SOCIEDADE DA INFORMAÇÃO. Manuel Antunes

15 Computador, projeto e manufatura

DESENVOLVENDO APLICAÇÃO UTILIZANDO JAVA SERVER FACES

UNIVERSIDADE. Sistemas Distribuídos

... Calendarização: 2 blocos de 90 m Metas/Objetivos Descritores Conceitos/Conteúdos Estratégias/Metodologias Avaliação

1. NÍVEL CONVENCIONAL DE MÁQUINA

A SÈTIMA. O nosso principal objectivo

Requisitos de Software

Palavras-chave: i3geo, gvsig, Mapserver, integração, plugin. Contato: ou

Guia de Utilização. A consulta dos e-books não exige a instalação de nenhum programa específico.

Novell. Novell Teaming 1.0. novdocx (pt-br) 6 April 2007 EXPLORAR O PORTLET BEM-VINDO DESCUBRA SEU CAMINHO USANDO O NOVELL TEAMING NAVIGATOR

O propósito deste trabalho foi o de apresentar os programas de. catalogação cooperativa, centralizada e catalogação-na-publicação, os quais,

Gestão dos Níveis de Serviço

Sistema Tutor Inteligente baseado em Agentes. Pedagógicas da Universidade Aberta do Piauí. Prof. Dr. Vinicius Ponte Machado

Organizar a estrutura do site

SHAREPOINT Ligação e autonomização das pessoas. Plataforma de colaboração

gerenciamento de portais e websites corporativos interface simples e amigável, ágil e funcional não dependendo mais de um profissional especializado

CONCEITOS INICIAIS. Agenda A diferença entre páginas Web, Home Page e apresentação Web;

Metadados. 1. Introdução. 2. O que são Metadados? 3. O Valor dos Metadados

3 Um Framework Orientado a Aspectos para Monitoramento e Análise de Processos de Negócio

GERÊNCIA DE DADOS SEMIESTRUTURADOS -XML. Prof. Angelo Augusto Frozza, M.Sc.

AGRUPAMENTO DE ESCOLAS DR. FRANCISCO SANCHES PLANIFICAÇÃO DISCIPLINA. TECNOLOGIAS da INFORMAÇÃO e COMUNICAÇÃO (TIC) 7º Ano. Ano letivo

Gerenciador de Referências. EndNote. Nonato Ribeiro Biblioteca de Ciências e Tecnologia (UFC)

Visão geral do Microsoft Office Word Crie conteúdo com aparência profissional

Introdução a Informática. Prof.: Roberto Franciscatto

Intellikon 2.2. Código de Manual: Ik22001POR Versão do Manual: 1.0 Última revisão: 21/2/2006 Aplica-se a: Intellikon 2.2.

Hardware & Software. SOS Digital: Tópico 2

PLANIFICAÇÃO ANUAL DA DISCIPLINA DE TECNOLOGIAS DE INFORMAÇÃO E COMUNICAÇÃO ANO LETIVO DE 2013/2014 Curso CEF Tipo 2

Guia de Estudo Folha de Cálculo Microsoft Excel

PHC dcontroldoc. O acesso a diversos tipos de ficheiros

DWEB. Design para Web. Fundamentos Web I. Curso Superior de Tecnologia em Design Gráfico

Apresentação da Solução. Divisão Área Saúde. Solução: Gestão de Camas

Manual de Navegação. Para conhecer melhor a estrutura do novo site. V02

Hoje é inegável que a sobrevivência das organizações depende de dados precisos e atualizados.

Artur Petean Bove Júnior Tecnologia SJC

Anexo VI Edital nº 03361/2008. Projeto de Integração das informações de Identificação Civil. 1. Definições de interoperabilidade adotadas pela SENASP

TIC Unidade 2 Base de Dados. Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado.

DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS

MIG - Metadados para Informação Geográfica

Introdução ao EBSCOhost 2.0

Orientação a Objetos

PHC Serviços CS. A gestão de processos de prestação de serviços

Após a confirmação de pagamento de sua inscrição para o congresso, você estará apto a entrar no sistema de submissão de trabalho.

SISTEMA GERENCIADOR DE BANCO DE DADOS

Kit de Auto-Diagnóstico de Necessidades, Auto-Formação e Auto-Avaliação da Formação em Gestão

Figura 1 - O computador

HTML5. Prof. Salustiano Rodrigues de Oliveira

O aumento da força de vendas da empresa

Hardware (Nível 0) Organização. Interface de Máquina (IM) Interface Interna de Microprogramação (IIMP)

Manual Operacional SIGA

Sistemas Numéricos bit / Byte BIT BYTE. Prof. Celso Candido ADS / REDES / ENGENHARIA

ADM041 / EPR806 Sistemas de Informação

ESTOQUE. Manual Estoque Atualizado em 29/06/2007 Pág. 1

Roteiro para a escrita do documento de Especificação de Requisitos de Software (ERS)

Internet. Gabriela Trevisan Bacharel em Sistemas de Infomação

Tópicos de Ambiente Web Web Design III

BREVE INTRODUÇÃO À LINGUAGEM XML

yuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnm qwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxc

02 - Usando o SiteMaster - Informações importantes

Construir um e-portefólio com o Blogger

Quadros Interactivos CLASUS

PROJETO DE REDES

Requisitos de Software. Requisitos de Software. Requisitos de Software. Requisitos de Software. Requisitos de Software. Requisitos de Software

Microsoft Office FrontPage 2003

Wilson Moraes Góes. Novatec

Imobilizado 2008 Imobilizado Imobilizado 2008

Transcrição:

Universidade Fernando Pessoa Pós-graduação em Ciências da Informação e da Documentação Tecnologias de Informação Documental Ana Lúcia Matos dos Reis Os tesauros e as vantagens do formato XML Porto, Junho de 2006 Universidade Fernando Pessoa Praça 9 de Abril, 349 P-4249-004 Porto Tel. +351-22550.82.70 Fax. +351-22550.82.69 geral@ufp.pt

0. Resumo Tesauro vem do latim thesaurus, que significa tesouro. É-o de facto pois os tesauros têm como produtos finais uma base de conhecimento sobre a terminologia de um determinado domínio, permitindo inserir dados e recuperar informação através de pontos de acesso. Cada tesauro funciona como um sistema, cuja estrutura assenta em relações hierárquicas ou associativas entre os termos (numéricos, a alfabéticos ou alfanuméricos), que permitem uma visão sistémica da área. No entanto, é imperativo reforçar a consistência do vocabulário e relações estabelecidas para que os tesauros on-line possam transferir dados entre si. O formato xml parece ser aos olhos dos especialistas na área o mais adequado para a automatização do tesauro, a gestão de informação e o intercâmbio de dados estruturados via internet, pois gere devidamente a complexidade dos sistemas, adapta-se aos termos a descrever, é flexível e quase sem ambiguidades devido à simplicidade das linguagens de marcação utilizadas.

1. Índice Resumo pág. 2 Introdução pág. 5 Descrição do problema pág. 5 Revisão bibliográfica pág. 6 Aspectos importantes pág. 13 Conclusões pág.14 Bibliografia pág. 15 i

2. Introdução A sociedade da informação é uma realidade incontornável do mundo actual. Contudo, tal como explanado no seminário de Tecnologias da Informação Documental, para além do acesso a dados, importa organizá-los, dando origem a informação e também ao conhecimento. Eis a razão pela qual a temática dos tesauros é actual, pertinente e transversal pois pode abranger múltiplas áreas do saber. Cada tesauro deve ser uma teia de conceitos entralaçados em função das relações que se estabelecem entre os termospermitindo assim aceder à informação sob diferentes ângulos. Qual a origem do tesauros? O que é um tesauros? Como construir um tesauros à luz da era informática? Que formato tecnológico utilizar? Que vantagens são apresentadas pelos especialistas acerca do formato XML? Eis os principais objectivos que servirão de pano de fundo ao presente trabalho, 3. Descrição do problema O presente trabalho reflecte acerca do tesauros e do modo como se adapta ao mundo das Novas Tecnologias e da World Wide Web,. Procurando adoptar a perspectiva do especialista em Ciências da Informação e da Documentação, a questão central reside em descobrir por que razão o formato XML é considerado o mais vantajoso para os tesauros Dada a complexidade e abrangência do tema, este será organizado em subsecções a desenvolver no ponto seguinte, revisão bibliográfica: A origem e a história do tesauros Definição e caracterização de um tesauros Algumas considerações acerca da criação de um tesauros Vantagens do formato XML 2

4. Revisão bibliográfica 4.1 A origem e a história dos tesauros Thesaurus Linguae Romanae e Britannicae, publicado em 1565 foi uma das primeiras obras a incluir o termo tesauro no seu título. Contudo, o sentido actual da palavra aproxima-se mais do então aplicado por Mark Roget, médico inglês que em 1805 criou para seu uso particular um catálogo classificado de palavras, reunindo-as pela ordem alfabética, de acordo com as idéias que exprimem : conceitos abstractos, espaço, matéria, intelecto, vontade e afeição. Mais tarde, em 1852, a obra foi publicada pela primeira vez como Roget s Thesaurus, atingindo as trinta edições. No entanto, só mais tarde, por volta dos anos 50 os tesauros começam a surgir em maior número, em consequência do aumento da produção de documentos científicos e técnicos, requerendo assim uma representação de conteúdo mais elaborada, para além dos cabeçalhos de assunto. Na década de 70, é editado o primeiro padrão internacional para construção de tesauro, a ISO 2788-74 (International Organization For Standardization), que foi revista em 1986 (Guidelines for the Establishment and Development of Monolingual Thesauri). Em 1971, Mikhailov define o tesauro com referência ao conceito de recuperação de informação: es un diccionario de reenvíos destinado a ayudar al usuario a establecer sus necesidades de información en un lenguaje de descriptores, proporcionar una indización fina y detallada de los documentos y solicitar información por esos términos. (http://www.elprofesionaldelainformacion.com/contenidos/1999/julio/tesauros_tesauros_automa ticos_tesauros_automaticos_online.html) O desafio actual lançado ao tesauro é a sua adaptação às novas tecnologias, nomeadamente à World Wide Web, como veremos no seguimento deste trabalho. 3

4.2 Definir e caracterizar um tesauro O Tesauro é uma ferramenta da linguagem artificial de um domínio do conhecimento, construído por especialistas, especificando as relações entre os conceitos. Assim sendo, os tesauros são úteis não só a profissionais da informação, mas também a cientistas, tradutores, engenheiros, especialistas,... O tesauro é utilizado na indexação das informações (entrada de dados numa base) e na recuperação da informação (saída de dados de uma base), independentemente da área do saber em que se enquadre. Segundo Domènec Turuguet, o tesauros é um vocabulario controlado de términos, tanto alfabéticos como numéricos o alfanuméricos, con relaciones jerárquicas y asociativas entre ellos, el cual contiene tanto los términos aceptados (descriptores) como aquellos que remiten a los aceptados, con indicación del alcance de uso de cada uno de los términos aceptados y, en general, con un esquema clasificatorio amplio, dentro del cual pueden adscribirse todos los términos aceptados. (www.elprofessionaldelainformacion.com/contenidos/1994/febrero/consideraciones_sobre_los_ tesauros.html) Na verdade, a elaboração de um tesauros parte da ideia de sistema. Neste sistema os conceitos relacionam-se entre si e são representados por termos. Cada termo tem obrigatoriamente uma vinculação com outro termo e esta vinculação é que forma a estrutura do Tesauro. Podem existir três tipos de relações entre os termos: equivalência ou substituição (relação entre termos sinónimos ou quase sinónimos a nível do tesauros), hierarquia (relação entre um termo mais genérico e outro mais específico; a parte pelo todo ou o todo pela parte), associação (relação de causa e efeito; estabelecimento de relações livres no âmbito do tesauros). A propósito deste último tipo de relações entre os termos, o autor já citado afirma que el principal espíritu tesaurístico de flexibilidade há-de permitir la realización de búsquedas creativas e acrescenta mi opinión es que un 4

tesauro no ha de ser un simple vocabulario controlado, pero tampoco una red de encorsetamiento que impida la creatividad del indizador o recuperador de la información Tal como expõe a Wikipédia, em sintonia com a ANSI/NISO Z39.19-200X, cada relacionamento possui a propriedade de reciprocidade. Os indicadores de relacionamentos são operadores binários (ou pares). Alguns indicadores são simétricos, e alguns são assimétricos: RT é simétrico: se A RT B, então B RT A. USE e UF são assimétricos: se A USE B, então B UF A. Igualmente para BT e NT: se A BT B, então B NT A. Relacionamento Indicador de relacionamento Abreviação Equivalência USE/USED FOR Nada ou UUF Hierarquia BROADER TERM/NARROWER TERM BT/NT Associação RELATED TERM RT A título de exemplo vejamos com brevidade e parcialmente o funcionamento do tesauro da Unesco (http://databases.unesco.org/thesfr/) Liste alphabétique Taper les premières lettres du terme puis cliquer sur - 'Recherche' pour afficher la liste alphabétique ou sur -'Index' pour afficher la liste permutée des termes education Liste hiérarchique Liste des sept principaux domaines classés en microthésauri, permettant d'avoir un rapide aperçu du sujet traité > Choisir un domaine > Choisir un microthésaurus São-nos apresentadas pelo menos duas modalidades para recuperarmos informação, atendamos de modo especial à estrutura da lista hierárquica e ao tipo de relações que podem estabelecer-se entre os termos. Exemple: MT 1.65 Évaluation de l'éducation > Signification des symboles 5

Évaluation de l'éducation TS Évaluation de l'enseignant....ts2 Compétence pédagogique... TS2 Rendement de l'enseignant TS Évaluation de l'étudiant...ts2 Contrôle scolaire...ts3 Contrôle de rendement scolaire...ts3 Épreuve à choix multiple NE Note explicative (Scope Note) : explication de l'emploi d'un terme MT Microthesaurus : numéro et nom du microthésaurus auquel le descripteur appartient. EP TG Employé pour (Used For) : synonyme ou terme proche d'un descripteur. Terme générique (Broader Term) : descripteur générique ou apparenté au descripteur, situé un niveau au-dessus dans la structure du thésaurus. TS Terme spécifique (Narrower Term) : descripteur(s) spécifique(s), situé un niveau audessous dans la structure du thésaurus TA Terme associé (Related Term) : descripteur(s) associé(s)...ts3 Test d'aptitudes...ts3 Test d'intelligence...ts3 Test de lecture Importa igualmente referir a diferença entre o conceito tradicional de tesauros e o tesauros automático Tradicionalmente se concebía como un lenguaje de indización desarrollado por instituciones individuales para cubrir sus necesidades específicas (...) Se ha producido en los últimos años una serie de factores que han obligado a cambiar esta concepción tradicional. Entre ellos el aumento de la cooperación internacional a todos los niveles y, por lo tanto, del intercambio de información, el crecimiento ingente de las redes de comunicación de datos, especialmente de internet, y sobre todo el web, sendo a UNESCO exemplo de uma organização internacional, de alcance mundial. (www.elprofesionaldelainformacion.com/contenidos/1999/julio/tesauros_tesauros_automaticos_tesauros_ automaticos_online.html) 4.3 Algumas considerações acerca da criação de um tesauros automático Em primeiro lugar, a construção de um tesauros exige conhecimento muito consolidado e profundo acerca da área em questão. Importa delimitar o campo temático e investigar a existência de tesauros na mesma área através da realização de um diagnóstico na interface. Além disso, é necessário considerar os meios financeiros, assim como os recursos 6

humanos e informáticos disponíveis, porque a construção de um tesauros é dispendiosa. Los requisitos básicos para cualquier software de automatización son, además del campo para el término, uno destinado a notas de alcance que definan su sentido e otro dedicado a anotaciones para facilitar la estruturación del vocabulario. O software deve prever um tamanho adequado aos termos, deve admitir os três tipos de relações entre os termos e controlar a consistência dos termos e respectivas relações. (www.elprofessionaldelainformacion.com/contenidos/1994/febrero/consideraciones_sobre_los_ tesauros.html) 4.4 Vantagens do formato XML O formato XML parece ser aos olhos dos especialistas o mais adequado para a gestão de informação, o intercâmbio de dados estruturados via internet e a automatização do tesauros. Comecemos por investigar o significado da abreviatura XML: Extensible Markup Language, tradução em português, linguagem de marcação de dados estruturados, XML is a simple, very flexible text format derived from SGML (Standard Generalized Markup Language) (ISO 8879). Originally designed to meet the challenges of large-scale electronic publishing, XML is also playing an increasingly important role in the exchange of a wide variety of data on the Web and elsewhere. (http://www.w3.org/xml/) O XML é baseado em padrões de tecnologia comprovadamente optimizados para a Web. Os padrões que compõem o XML são definidos pelo W3C (World Wide Web Consortium), Extensible Markup Language (XML) - é uma Recomendação, que é vista como o último estágio de aprovação do W3C. Isso significa que o padrão é estável e pode ser aplicado à Web e utilizado pelos desenvolvedores de ferramentas. ( www.gta.ufrj.br/grad/00_1/miguel/) Por que razão será o formato XML tão utilizada para transferência e intercâmbio de informação? Vejamos algumas das vantagens que apresenta em detrimento de outros formatos (HTML, RDF). 7

Segundo Pedro Coelho, o XML é uma tecnologia de conteúdos alternativa e também complementar ao HTML (...) Por ser altamente adaptável aos dados que pretende descrever, por facilitar a interacção entre aplicações e documentos, e por produzir documentos auto-descritivos, a tecnologia XML vai com toda a certeza tornar-se um standard para a publicação, armazenamento e transferência de documentos por via electrónica, a muito curto prazo (Coelho, 2001, pág. 28). Las ventajas que presenta xml se basan en su carácter de especificación independiente de cualquier sistema, por un lado, y de lenguaje de marcas por otro. Permite a integração de dados de outros sistemas e de diferentes tipos, por exemplo um elemento XML pode ter dados declarados como sendo preços de venda, taxas de preço, um título de livro, a quantidade de chuva, ou qualquer outro tipo de elemento de dado. Paulo Heitlinger afirma que vemos os dialectos xml avançar céleres nos mais variados sectores: Medicina, Química, Biologia, Matemática, Ensino e Formação, Publicidade, Comunicação Social, Artes Gráficas, Desktop Publishing, Bibliotecas e Arquivos (www.centroatl.pt/titulos/tecnologias/guia_pratico_xml.php3) Na verdade, O XML proporciona um padrão que pode codificar o conteúdo, as semânticas e as esquematizações para uma grande variedade de aplicações desde simples até às mais complexas (http://www.gta.ufrj.br/grad/00_1/miguel/). Heitlinger explica que o formato xml facilita declarações precisas não só dos conteúdos de um documento, como também dos elementos convenientes à estruturação desses conteúdos (...) [Vejamos] um exemplo bem simples: <pessoa> <nome>pedro Tripeiro</nome> <morada>rua dos Prazeres, 233</morada> <codigo.postal>4000-319</codigo.postal> <localidade>porto</localidade> <telefone>22 33 44 55</telefone> </pessoa>... Este pequeno exemplo demonstra de forma evidente que este formato serve magnificamente para a estruturação de dados e para descrevê-los sem dúvidas ou ambiguidades em forma de um texto. Isto porque permitiu ao autor 8

do documento definir os seus próprios <elementos>, criando e usando os <marcadores> (=Tags) mais adequados à descrição e à estruturação dos dados O mesmo autor avança que o xml tornou-se, em pouco tempo, um formato universal para a partilha de dados entre aplicações. O conceito e a filosofia da xml são simples, os seus derivados e as possíveis aplicações são inúmeras (...): transacções comerciais, catálogos de produtos, relatórios financeiros ou estatísticos, grafismos vectoriais, equações matemáticas, anúncios publicitários, todos os dados que necessitem de uma representação estruturada. Sus implicaciones en cuanto a intercambio vía web de datos terminológicos en particular, e información muy estruturada en general, son claras e importantes, sin olvidar la estructuración y la géstion de bases de datos. Relativamente a este último aspecto, este formato possibilita várias apresentações, por exemplo o desenho das estruturas arbóreas, o documento como base de dados, a apresentação gráfica. Assim, apresentamos seguidamente a estrutura de uma árvore XML, composta por: um nó externo, contendo, entre outros elementos, dados de caracteres e instruções de processamento; um nó interno, contendo um nome, um conjunto de atributos. (www.gta.ufrj.br/grad/00_1/miguel/) De notar igualmente la flexibilidad y compatibilidad de la especificación xml y sus más que probable futura implantación en algunos editores como Word de Microsoft. (www.elprofessionaldelainformacion.com/contenidos/1994/febrero/consideraciones_sobre_los_ 9

tesauros.html) A referida flexibilidade deste formato poderá dever-se também à capacidade de interoperação dos computadores por ter um padrão flexível e aberto e independente de dispositivo. As aplicações podem ser construídas e actualizadas mais rapidamente e também permitem múltiplas formas de visualização dos dados estruturados e actualizações granulares do conteúdo (http://www.gta.ufrj.br/grad/00_1/miguel/) Procurámos apresentar uma série de vantagens do formato XML que o coroam como formato universal e que além disso, nas palavras de Paulo Heitlinger é a "língua-mãe de outras linguagens. Em só três anos (...) serviu para gerir um sem número de linguagens de marcação. Entre os mais conhecidos dialectos (também chamados "vocabulários") derivados da xml figuram MathML, SVG, AdXML, ICE, SMIL, SOAP, BML, BizTalk, UDDI, WML, e muitos mais. 5. Aspectos importantes Um tesauros é uma linguagem artificial que permitir organizar o saber de forma estruturada, O tesauros parte da ideia de sistema, pois os conceitos relacionam-se entre si e são representados por termos. Cada termo tem obrigatoriamente uma relação com outro termo (relação de sinonímia, de hierarquia ou de associação) e esta vinculação forma a estrutura do Tesauro. É imperativo passar do tesauro tradicional ao tesauro automático pois aquele deixou de ser uma ferramenta de uso restrito em contexto de empresa ou de um grupo limitado de pessoas para ser consultado on-line à escala mundial. O formato XML é o mais vantajoso para criação de um tesauro automático devido às suas características: XML is a simple, very flexible text format (http://www.w3.org/xml/), adapta-se a dados de natureza muito diversa, provenientes de áreas do saber díspares, desde a Biologia à Comunicação Social, da Biologia a Marketing (www.centroatl.pt/titulos/tecnologias/guia_pratico_xml.php3), facilita a interacção entre aplicações e documentos, fornece elementos destituídos de 10

ambiguidade quer a nível dos conteúdos de um documento, como também dos elementos necessários à sua estruturação. Ainda relativamente à versatilidade e à flexibilidade deste formato, possibilita várias apresentações e visualizações dos conteúdos, por exemplo o desenho das estruturas arbóreas, o documento como base de dados, a apresentação gráfica (www.centroatl.pt/titulos/tecnologias/guia_pratico_xml.php3). 6. Conclusões A realização deste trabalho foi um verdadeiro desafio por ter implicado mergulhar em terreno totalmente desconhecido e ir-se construindo um puzzle virtual acerca dos tesauros e do formato XML ao ritmo de navegações cibernáuticas e leituras. Atrevemo-nos a confirmar que os tesauros automáticos podem de facto corresponder ao sentido etimológico da palavra thesaurus, tesouro, pois guardam e organizam de forma dinâmica e flexível informação proveniente de múltiplas áreas do Saber, além de estarem virtualmente acessíveis e disponíveis para intercâmbios. Contudo, o puzzle virtual ficou muito incompleto, por imperativos temporais e de pouca experiência pessoal. Como repto final, elegeriámos a problemática do formato XML. Embora apresente inúmeras vantagens, não está isento de fragilidades. Segundo Paulo Heitlinger A enorme profusão de dialectos e vocabulários XML demonstra a versatilidade desta meta-linguagem. Mas quais destes dialectos XML serão verdadeiros padrões? E quais são os standards que, por carência de adesão geral, já hoje são de facto standards puramente fictícios? www.centroatl.pt/titulos/tecnologias/guia_pratico_xml.php3 11

7. Bibliografia ANDRADE, Julietti de. As Contribuições das Linguagens Documentárias e da Terminologia à Arquitetura da Informação em Websites. São Paulo, 2005. Monografia (Trabalho de Conclusão de Curso) Curso de Biblioteconomia e Documentação, Escola de Comunicação e Artes, Universidade de São Paulo. Disponível em: Texto completo. COELHO, Pedro. HTML 4 & XHTML. Lisboa, 2001.FCA HEITLINGER, Paulo. O Guia Prático da XML,2001.Tecnologias www.centroatl.pt/titulos/tecnologias/guia_pratico_xml.php3 MURAKAMI, Tiago R. M. Tesauros e a World Wide Web. São Paulo, 2005. Monografia (Trabalho de Conclusão de Curso) Curso de Biblioteconomia e Documentação, Escola de Comunicação e Artes, Universidade de São Paulo. Disponível em: Texto completo NATIONAL INFORMATION STANDARDS ORGANIZATION (U.S.). Guidelines for the construction, format and management of monolingual controlled vocabularies / developed by the National Information Standards Organization: Ballot Period: April 11 May 25, 2005. ANSI/NISO Z39.19-200X. Bethesda (USA): NISO Press, 2005. ISBN: 1-880124-65-3 Wikipédia/Biblioteconomia - http://bici.inf.br/index.php?title=tesauro http://www.brics.dk/~amoeller/xml/ http://databases.unesco.org/thesfr/ www.elprofesionaldelainformacion.com/contenidos/1999/julio/tesauros_tesauro s_automaticos_tesauros_automaticos_online.html www.gta.ufrj.br/grad/00_1/miguel/ http://msdn.microsoft.com/workshop/c-frame.htm#/xml/index.asp http://www.oasis-open.org/cover/xml.html#applications http://www.projectcool.com/developer/xmlz/index.html http://www.w3.org/xml/ 12