CTTO: Semelhanças e Diferenças. Classificações, Tesauros,Taxonomias e Ontologias

Documentos relacionados
Tipos de Sistemas de Organização do Conhecimento

Sistemas de PROFA. LILLIAN ALVARES FACULDADE DE CIÊNCIA DA INFORMAÇÃO

Sistemas de Organização do Conhecimento

Quais os principais objetivos dos sistemas de organização do conhecimento?

O tesauro pode ser pesquisado no menu da Jurisprudência pelo link Vocabulário Jurídico.

Linguagens Documentárias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília

Ontologias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília

Tesauros: organização dos termos/conceitos

Taxonomia. Profa. Lillian Alvares, Faculdade de Ciência da Informação. Universidade de Brasília

Organização da Informação

Este capítulo aborda os fundamentos principais aplicados neste trabalho.

Classificação. Profa. Lillian Alvares, Faculdade de Ciência da Informação, Universidade de Brasília

Tesauro: um tipo de ontologia

Pôster PRINCÍPIOS PARA UTILIZAÇÃO DE ONTOLOGIAS NA INDEXAÇÃO AUTOMÁTICA. Maria Elisa Valentim Pickler UNESP/MARÍLIA Edberto Ferneda UNESP/MARÍLIA

Tesauro. Profa. Lillian Alvares, Faculdade de Ciência da Informação, Universidade de Brasília

Tesauro: um instrumento de representação do conhecimento e inovação para área militar

Modelagem de Sistemas Web. Modelagem de BD

Taxonomia. Profa. Lillian Alvares, Faculdade de Ciência da Informação. Universidade de Brasília

3 Kuaba: Uma Ontologia para Design Rationale

VOCABULÁRIOS CONTROLADOS. Prof. Cesar A. Tacla/UTFPR Curitiba

Modelagem Usando Orientação à Objetos (Programação Orientada a Objetos) Prof. Responsáveis Wagner Santos C. de Jesus

MODELAGEM DE DADOS. Projeto de Banco de Dados Modelo Conceitual. Prof. Rosemary Melo

Ontologias: Definições e Tipos

Notas de Aula 03: Introdução a Orientação a Objetos e a UML

UNIVERSIDADE DE BRASÍLIA Faculdade de Ciência da Informação Curso de Graduação em Biblioteconomia

Ontologias: definições e conceitos básicos

Ontologias: Definições e Tipos

PRINCÍPIOS CLASSIFICATÓRIOS PARA A CONSTRUÇÃO DE TAXONOMIAS

Fundamentos em Organização da Informação

TATIANE CRISTINA GHENO. ESTRUTURA DE TESAURO EM CIÊNCIA DA INFORMAÇÃO: Análise dos tesauros das bases de dados LISA e LISTA

Organização e Representação da

MATA60 BANCO DE DADOS Aula 3- Modelo de Entidades e Relacionamentos. Prof. Daniela Barreiro Claro

COMPUTAÇÃO COLABORATIVA. Prof. Cícero Quarto cicerocq.wordpress.com

Diagramas de Classes. ESII Profª. Andressa Falcade URI Santiago

5 Conclusão e trabalhos futuros

Ontologias MARIANNA ARAÚJO

PROJETO DE BANCO DE DADOS -PROJETO CONCEITUAL. Prof. Angelo Augusto Frozza, M.Sc.

Paradigmas de Representação de Conhecimento

SUMÁRIO DA NORMA PORTUGUESA Tesauros monolingues: diretivas para a sua construção e desenvolvimento

FONTES DE INFORMAÇÃO ON LINE: NÍVEL BÁSICO

5 Usando as Representações de Design Rationale

Web Semântica: Conceitos, Tecnologias e Aplicações

DIAGRAMAS DE CLASSE UML

Castro (2008, p.7) define a palavra ontologia de forma mais simplificada:

Semântica na Web Vocabulários

6. Considerações Finais

SERVIÇO PÚBLICO FEDERAL UNIVERSIDADE FEDERAL DO RIO GRANDE INSTITUTO DE CIÊNCIAS HUMANAS E DA INFORMAÇÃO - ICHI - INDEXAÇÃO: TEORIA E PRÁTICA

BANCO DE DADOS I/MODELAGEM DE DADOS Prof. Ricardo Rodrigues Barcelar

4 Ontologia 4.1. O que é ontologia

Arquitetura de um Ambiente de Data Warehousing

Maria Luiza de A. Campos Pré ConfOA

Introdução a UML (Unified Modeling Language)

Inteligência Artificial

4 Representando Design Rationale com Kuaba

2 Metodologias para Projetos de Aplicações Hipermidia

MODELAGEM DE DADOS UNIDADE 3 Modelo Entidade-Relacionamento. Luiz Leão

Conceitos de Orientação a Objetos. Objeto Atributo Classe Método

Modelo Entidade-Relacionamento

IA - Ontologias. Professor Paulo Gurgel Pinheiro. 09 de Novembro de 2010

Metadados e aplicação em Repositórios Digitais Institucionais

BANCO DE DADOS I. Prof. Luiz Antônio Vivacqua C. Meyer

Cíntia de Azevedo Lourenço Doutora em Ciência da Informação Universidade Federal de Minas Gerais Contato:

Gestão de Ontologias

DeCS - Descritores em Ciências da Saúde

ABD Arquivos e Bibliotecas Digitais

UML (Unified Modelling Language)

Manipulação de uma ontologia desenvolvida em OWL através da utilização da API JENA 2 Ontology

Universidade Federal do Estado do Rio de Janeiro - UNIRIO Centro de Ciências Humanas e Sociais

ONTOLOGIAS E ONTOLOGIAS DIFUSAS

RESPOSTAS AOS RECURSOS CARGO: TÉCNOLOGO/ÁREA: ANÁLISE E DESENVOLVIMENTO DE SISTEMAS

Unidade 3 23/10/2008. Curso Superior de Tecnologia: Banco de Dados Sistemas para Internet Redes de Computadores

6 Comparação com Trabalhos Relacionados

Modelagem de Dados MODELAGEM DE DADOS. Projeto de Banco de Dados Modelo Conceitual. Profa. Rosemary Melo

Modelagem de Dados MODELAGEM DE DADOS. Projeto de Banco de Dados Modelo Conceitual. Profa. Rosemary Melo

Introdução à Inteligência Artificial. Agentes Baseados em Conhecimento Representações em rede e estruturadas

TESAUROS CONCEITUAIS E ONTOLOGIAS DE FUNDAMENTAÇÃO: MODELOS CONCEITUAIS PARA REPRESENTAÇÃO DE DOMÍNIOS

Sumário. BD Orientado a Objetos

LINGUAGENS DOCUMENTÁRIAS: ANÁLISE DE PERIÓDICOS QUALIS A1 DE CIÊNCIA DA INFORMAÇÃO.

Modelagem semântica permite aproximar o modelo obtido do mundo real Exemplo de modelos:

Integração de Dados. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri

Unidade 2 Modelo Conceitual

Banco de Dados 08/08/2010

Taxonomia e Folksonomia. São Paulo, 28 de maio de 2010

Banco de dados. Conteúdo: Modelo relacional Prof. Patrícia Lucas

Ciência da Computação. Análise e Projeto Orientado a Objetos UML. Anderson Belgamo

Luciana Danielli BIREME: centro latino-americano e do caribe de informação em ciências da saúde. convênio OPAS/MS/MEC 1967

TERMINOLOGIAS EM SAÚDE: para uma linguagem comum

Prof. Walter Moreira Unesp / Marília, 2017

UMA PROPOSTA METODOLÓGICA PARA CONSTRUÇÃO DE ONTOLOGIAS:

ANEXO I INTRODUÇÃO À CLASSIFICAÇÃO INTERNACIONAL DE PATENTES

Q d( ) P. a( ) c( ) e( ) c( ) S. c( ) d( )

APOSTILAS: NORMAS; ABNT NBR ISO; MPS BR

Introdução à Modelagem Conceitual 1. Conceitos Básicos

SISTEMA DE INFORMAÇÃO Modelo Conceitual. Prof. Luiz Fernando Laguardia Campos FMS

Leitura de Documentos. Priscila Engiel

6 Conclusão. 6.1 Trabalhos relacionados

Classificação Internacional de Patentes - IPC

Introdução à Programação

1 Introdução. 1 World Wide Web Consortium -

FUNDAÇÃO UNIVERSIDADE ESTADUAL DE MARINGÁ

Transcrição:

CTTO: Semelhanças e Diferenças Classificações, Tesauros,Taxonomias e Ontologias

Classificações, tesauros, taxonomias e ontologias estruturam, classificam, modelam e representam conceitos e seus relacionamentos pertinentes num domínio do conhecimento.

São formados, basicamente, por vocabulários controlados acompanhados de relacionamentos semânticos entre os termos. Desempenham a função de organizar e recuperar informações. No entanto, como veremos a seguir, os quatro sistemas mantêm pontos em comum, mas diferenciam em alguns aspectos.

Vários tipos de bases de conhecimento: Esquemas de classificação e tesauro, Dicionários e ontologias desenvolvidos para aplicações de Inteligência Artificial, sistemas linguísticos ou definições de elementos de dados. Apesar de se desenvolverem com diferentes objetivos, os diferentes tipos de bases de conhecimento sobrepõem-se muito e seguem princípios e métodos muito similares para sua construção.

Uschold (2010) destaca os seguintes aspectos comuns acerca de vocabulários, taxonomias, tesauros, ontologias e meta-modelos: São diferentes abordagens para ajudar a estruturar, classificar, modelar e/ou representar conceitos e relações de uma área de interesse de uma comunidade. Estabelecem um conjunto de termos que a comunidade concorda em usar para referir-se a estes conceitos e relações. Especificam o significado dos termos em algum nível. São noções não muito bem definidas e usadas de diferentes maneiras por diferentes indivíduos e comunidades.

Ponto comum as seguintes funções fundamentais: Eliminar ambiguidades Controlar sinônimos Estabelecer relacionamentos (hierárquicos e associativos) Apresentar propriedades (dos conceitos)

Há diferenças entre os SOCs quanto ao nível de especificação do significado de cada termo e quanto ao tipo de notação ou linguagem adotada para especificar o significado. Fato que observamos, também, em relação às classificações, tesauros, taxonomias e ontologias.

Aspectos Comuns

Princípios de Classificação CTTOs compartilham os princípios de classificação, que orientam a estrutura sistemática e possibilitam o agrupamento de conceitos que possuem características comuns.

Rótulos ou Etiquetas Os CTTOs utilizam algum tipo de signo para representar os conceitos.

Rótulos ou Etiquetas Na classificação, o uso concomitante do código numérico e do termo (622. Engenharia de Minas). No tesauro e na taxonomia, o uso de termos (azeite, farinha, queijo e revistas, televisão, rádio). Na ontologia, o uso de uma forma de expressão compatível com padrões como XML11, XML Namespaces12, RDF13, e OWL14. Ex.: foaf:group, foaf:agent.

Rótulos ou Etiquetas Os exemplos não esgotam as possibilidades. Tesauros e taxonomias podem utilizar códigos numéricos ou alfanuméricos para representar os conceitos, mas, o que comumente se observa é que esses dois sistemas tendem a utilizar termos.

Rótulos ou Etiquetas As classificações são as que mais empregam os códigos numéricos. Já as ontologias necessitam expressar o conceito para que o computador possa identificá-lo, daí a necessidade de formalismos definidos pelos padrões da web semântica.

Padronização Terminológica Os CTTOs cumprem a função de padronizar os termos empregados para representar os conceitos. A padronização contempla: aspectos de forma, como, por exemplo, uso do gênero masculino e feminino, plural e singular, sigla e nome por extenso; controle de sinonímias e controle de homografias. A diferença está, mais uma vez, na maneira como cada sistema efetua a padronização.

Padronização Terminológica Para elaboração de tesauros, há normas internacionais que definem os aspectos de controle terminológico (ISO 2788 (1986), ISO 5964 (1985) e ANSI / NISO Z39.19 (2005) e que determinam, entre outras convenções, o uso da relação de equivalência, representada pelos símbolos USE e UP para controle de sinônimos e o uso de qualificadores15 para controlar homografias.

Padronização Terminológica As ontologias contam com padrões definidos pela OWL, entre os quais destacamos, no caso dos sinônimos, as relações equivalentclass, utilizada para indicar classes sinônimas ; equivalentproperty, que indica a sinonímia entre propriedades de conceitos ou classes e a relação sameas, empregada para criar diferentes nomes que referem ao mesmo indivíduo. (fonte: http://www.w3.org/tr/2004/rec-owl-features- 20040210/#sameAs)

Padronização Terminológica Para as classificações e taxonomias, no entanto, não há padrão definido acerca da padronização terminológica. Nesse caso, sobretudo em relação às taxonomias, observamos alguns problemas terminológicos.

Padronização Terminológica Ao analisar taxonomias navegacionais, observamos, por exemplo, a ausência de padrões relativos ao uso de termos em português e de abreviaturas e siglas, como na taxonomia de livrarias virtuais, em que encontramos alguns exemplos: Pocket Books e Franchising; Adm. Financeira / Mat. Finan. ; Dic. Francês/Port., (AQUINO; CARLAN; BRÄSCHER, 2009). Numa rápida consulta a taxonomias de sítios de comércio eletrônico o leitor encontrará diversos problemas relativos à forma dos termos.

Especificação do Conceito CTTO apresentam recursos para delimitar o significado que compreendem, desde o simples agrupamento de termos em classes ou categorias adotado pelas classificações, até as complexas definições de propriedades/atributos e formalismos empregados pelas ontologias.

Especificação do Conceito As classificações e taxonomias, de maneira geral, não incluem definições precisas dos termos que arrolam, como nos exemplos do quadro 1 e da figura 4. No entanto, o posicionamento dos termos em determinadas classes ou cadeias hierárquicas delimita o significado. A inclusão de gol na classe de empresas aéreas, por exemplo, restringe o seu significado e exclui outras possibilidades, tais como marca de automóvel e evento do futebol.

Especificação do Conceito Nos tesauros os termos costumam ser acompanhados de definições expressas em linguagem natural. A norma ANSI/NISO Z39.19 determina que o escopo dos termos é restrito aos significados que possuem no domínio que o tesauro abrange, e, ainda, que os termos devem ser formulados de maneira a tornar claro, a qualquer usuário do tesauro, qual o escopo pretendido.

Especificação do Conceito Para tanto, o recurso utilizado em tesauros são as notas explicativas ou de escopo, que devem exprimir o significado selecionado para o termo e, também, indicar outros significados reconhecidos na linguagem natural, mas que foram deliberadamente excluídos do vocabulário controlado (ANSI/NISO Z39.19, 2005, p. 22). A inclusão dos termos em categorias e seus relacionamentos são outros recursos que auxiliam na delimitação dos conceitos em tesauros, como no exemplo da Figura 2.

Especificação do Conceito O termo indexação é empregado em sentidos diferentes na Ciência da Informação e na Economia, portanto, é um termo homógrafo. O qualificador (economia) é utilizado para solucionar a homografia e já restringe o significado do termo. Mesmo que observássemos apenas a subclasse 330 Economia Finanças públicas ou as relações termo específico e termo relacionado e não atentássemos para o qualificador, já poderíamos inferir que se trata do conceito de indexação usado na economia.

Especificação do Conceito No entanto, a definição que acompanha o termo é o recurso que melhor cumpre a função de delimitar o significado. Assim como nos tesauros, os recursos de categorização, relacionamentos conceituais e definições estão presentes nas ontologias. No entanto, as ontologias dispõem de mecanismos mais complexos que permitem elencar todos os atributos ou propriedades de determinada classe ou conceito, restringir propriedades e definir sua cardinalidade. A figura 8 exemplifica os recursos mencionados no desenvolvimento de uma ontologia na ferramenta Protégé.

Relacionamento conceitual CTTO estabelecem relações entre conceitos. Os tipos de relacionamentos e a forma de representá-los variam segundo o sistema, sendo que os quatro contemplam a noção de hierarquia entre conceitos. Em tesauros e ontologias, as hierarquias seguem princípios rígidos, por outro lado, as classificações e taxonomias não possuem recursos para a diferenciação precisa dos tipos de relacionamentos hierárquicos.

Relacionamento Conceitual As diretrizes e normas de elaboração de tesauros definem os seguintes relacionamentos hierárquicos: a) relações gênero/espécie (TG termo genérico / TE termo específico). Ex.: instituição de ensino superior / universidade b) relações todo/parte (TGP - termo genérico partitivo / TEP termo específico partitivo). Ex.: universidade/faculdade/departamento c) relação de instanciação (é um, ou IsA)17. Ex.: universidade /Universidade de Brasília.

Relacionamento Conceitual Nas ontologias, a relação gênero/espécie orienta a hierarquia de classes, como vimos no exemplo da ontologia de vinho. Em tesauro teríamos que vinho é um termo específico de bebida, na ontologia temos que vinho é uma subclasse de bebida.

Relacionamento Conceitual Nas ontologias, a relação de instanciação ocorre pela ligação de cada indivíduo como membro de determinada classe. Assim, ainda no exemplo do domínio vinho, Casillero del Diablo, Cabernet Sauvignon, 2007 18 é uma instância da classe vinho tinto. A relação todo/parte, assim como outros tipos de relacionamentos entre conceitos podem ser especificados nas ontologias por meio das propriedades (rdf:property, na OWL), as quais são definidas segundo os objetivos da ontologia.

Relacionamento Conceitual A identificação do relacionamento hierárquico em classificações e taxonomias é feita, de maneira geral, pelo posicionamento, na estrutura desses sistemas, de um conceito abaixo de outro, como nos exemplos a seguir, extraídos da taxonomia navegacional da loja virtual submarino (http://www.submarino.com.br/)

Referência BRÄSCHER, Marisa; CARLAN, Eliana. Sistemas de organização do conhecimento: antigas e novas linguagens. In: Jaime Robredo; Marisa Bräscher (Orgs.). Passeios no Bosque da Informação: Estudos sobre Representação e Organização da Informação e do Conhecimento. Brasília DF: IBICT, 2010, 335 p. ISBN: 978-85-7013-072-3. Capíitulo 8, p. 147-176 Edição eletrônica. Disponível em: http://www.ibict.br/publicacoes/eroic.pdf. (Edição comemorativa dos 10 anos do Grupo de Pesquisa EROIC).