Maria Luiza de A. Campos Pré ConfOA

Documentos relacionados
Denise Gomes Silva Morais Cavalcante. Programa de Pós-graduação em Ciências da Informação/ECA- USP. Orientador: Nair Yumiko Kobashi

ANEXO I. DISCIPLINAS A SEREM OFERECIDAS PELO BiBEaD:

Uma ferramenta para Definição de Mapeamentos entre Vocabulários usados na publicação de Dados Linkados

REPOSITÓRIO DO INSTITUTO DE ENGENHARIA NUCLEAR: CURADORIA DIGITAL, PUBLICAÇÕES AMPLIADAS E GESTÃO DE PESQUISA

5 Conclusão e trabalhos futuros

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Castro (2008, p.7) define a palavra ontologia de forma mais simplificada:

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

POLÍTICA DE INDEXAÇÃO PARA BIBLIOTECAS UNIVERSITÁRIAS

julho/2010 FISL O W3C e Dados abertos na Web

Ontologias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília

Padrões para Definição de Metadados

1 Formatos de registro

O W3C e a Web Semântica. CPqD - abril/2009 Workshop Rede IP do Futuro

Apresentação do Capítulo 4 MDA (Model-Driven Archtecture) ALUNO: DOMENICO SCHETTINI FILHO NÚMERO USP:

PT Unida na diversidade PT A8-0188/298. Alteração. Marco Zullo em nome do Grupo EFDD

Sistemas de PROFA. LILLIAN ALVARES FACULDADE DE CIÊNCIA DA INFORMAÇÃO

Integração de Bases de Dados

Universidade Federal da Paraíba CCEN Departamento de Informática Disciplina: Banco de Dados. Aula 1 Introdução a Banco de Dados

Obtendo Interoperabilidade Semântica em Sistemas. Metamorphosis

Ontologias: Definições e Tipos

MIDB-OP: um Modelo de Integração de Dados Biológicos apoiado em Ontologias e Procedência de dados Caroline Beatriz Perlin

Este capítulo aborda os fundamentos principais aplicados neste trabalho.

Linguagens Documentárias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília

Universidade de Santa Cruz do Sul UNISC Departamento de informática COMPILADORES. Introdução. Geovane Griesang

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

6 Conclusão. 6.1 Contribuições

Sistemas de Organização do Conhecimento

Gestão de Ontologias

Tecnologias aplicadas à representação documental: um estudo da produção científica nos eventos ISKO-Brasil e ENANCIB

FACULDADE LEÃO SAMPAIO

Descrição do Perfil de Aprendizagem

A QUESTÃO DAS PALAVRAS- CHAVE E A PROPOSTA DO USO DE VOCABULÁRIO CONTROLADO PARA AS REVISTAS CIENTÍFICAS DA UNESP

2 Integração de Dados

Projeto de Banco de Dados. Componentes de um Sistema de Informação. Arquitetura de SI. Sistema de Informação (SI) SI nas Organizações

Miguel Ángel Márdero Arellano

FERRAMENTA DE MIGRAÇÃO DE BASE DE DADOS CDS/ISIS PARA O REPOSITÓRIO DIGITAL PATUÁ, DO INSTITUTO EVANDRO CHAGAS

Gerenciamento de conteúdo semântico ECI/UFMG. Eduardo Ribeiro Felipe.

O W3C Futuro da Web HTML5. Março/2010 1o. - FIEB - ITB Profa. Maria Sylvia Chaluppe Mello

UMA FERRAMENTA DE APOIO A DETERMINAÇÃO DE EQUIVALÊNCIAS SEMÂNTICAS ENTRE ESQUEMAS GML UTILIZANDO ONTOLOGIAS OWL

Universidade Estadual da Paraíba - UEPB Curso de Licenciatura em Computação

Figura 1 - Uma possível forma de acesso à informação compartilhada.

Projeto de Interface Homem- Máquina

1 Introdução. 1.1.Motivação

Metadados. Plano de manejo dos parques do trecho sul do Rodoanel

Indexação automática. CBD/ECA Indexação: teoria e prática

4 Integração DLMS e LMS

Introdução à Programação

Ontologias: Definições e Tipos

UNIVERSIDADE FEDERAL DE GOIÁS INSTITUTO DE INFORMÁTICA. Sistemas Distribuídos

1 Introdução. 1 World Wide Web Consortium -

INFORMAÇÃO PARA A ÁREA DE SAÚDE

TERMINOLOGIAS EM SAÚDE: para uma linguagem comum

Quais os principais objetivos dos sistemas de organização do conhecimento?

Integração de Ontologias: o domínio da Bioinformática

FONTES DE INFORMAÇÃO ON LINE: NÍVEL BÁSICO

O W3C Futuro da Web HTML5. janeiro/2010 Campus Party

Padrões de Objetos de Aprendizagem -

Introdução à Ciência da Computação. Prof. Dr. Rogério Vargas

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Inteligência Artificial. Sistemas Baseados em Conhecimento. Representação de Conhecimento (continuação)

PMR3507 Fábrica digital

ORIENTAÇÕES DE RESPOSTA DAS ATIVIDADES FORMATIVAS 1

PROJETO DE INCLUSÃO DE DISCIPLINAS OPTATIVAS NO CURSO DE BACHARELADO EM SISTEMAS DE INFORMAÇÃO CAMPUS CURITIBA

Comunicação Oral DESCRITORES EM CIÊNCIAS DA SAÚDE (DECS): UM ESTUDO DE COMPATIBILIDADE SEMÂNTICA NA ÁREA DE TECNOLOGIA DE ALIMENTOS

Instrumento de avaliação de LDD de física

Arquitetura de um Ambiente de Data Warehousing

onio Baseado em Casos

EXEHDA-SS: Uma Contribuição a Sensibilidade ao Contexto na Medicina Ubíqua

DSPACE 6 REPOSITÓRIOS INSTITUCIONAIS CARACTERÍSTICAS E REQUISITOS TÉCNICOS

Bases de dados. Conceitos, estrutura e sistemas de gestão

Capítulo. 2. Conceitos Básicos. 2.1 Sistemas de Banco de Dados

QUALIFICAÇÃO DE EVENTOS

Inovação com uso de tecnologias inteligentes: o ecossistema dos Parques Industriais no Estado de São Paulo Brasil

Uso da Tecnologias da Web Semântica para Publicação e Integração Semântica de Glossários

SUMÁRIO GPE-NI /12/2020. Diretrizes Gerais para Elaboração de Projetos Através da Metodologia BIM. Gerência de Projetos de Engenharia - GPE

Banco de Dados. SGBDs. Professor: Charles Leite

6 Conclusão. 6.1 Trabalhos relacionados

Conceitos de Linguagens de Programação

Ensino Superior: aspectos

Ciências da Informação e da Documentação e Biblioteconomia. LINGUAGENS DOCUMENTÁRIAS Construção de Tesauros Disciplina

Sistemas de Informação Geográficos. Informação na Organização. O Valor da Informação. Sistemas de Informação Tradicionais. O Valor da Informação

Uma ontologia para os processos de negócio da Administração

DISCIPLINA CRED CH PRÉ-REQUISITOS 1ª FASE Antropologia Cultural

Seleção de fontes de informação científica. Biblioteca da Universidade de Aveiro 2013

O tesauro pode ser pesquisado no menu da Jurisprudência pelo link Vocabulário Jurídico.

1 Introdução. pela comunidade de computação em vários países de língua não-inglesa.

Conteúdo. Integração de Dados, Web e Warehousing. Introdução. Introdução. BD Heterogêneos. Introdução. Introdução

Planificação ANUAL - Tecnologias de Informação e Comunicação - 3 º Ciclo 7º Ano

TECNOLOGIA DE PROCESSO

Cíntia de Azevedo Lourenço Doutora em Ciência da Informação Universidade Federal de Minas Gerais Contato:

Como as bibliotecas podem ajudar no aperfeiçoamento dos periódicos

Programa de apoio às publicações científicas periódicas da USP

COLÓQUIO INTERNACIONAL DE GUARAMIRANGA A LÍNGUA PORTUGUESA NA INTERNET E NO MUNDO DIGITAL

Escrita ( W ) do Resultado

ABD Arquivos e Bibliotecas Digitais

Perguntas Sobre Max Cardoso

5 Estudo de Caso. 5.1.O Cenário

Curso de Tecnologia em Sistemas Eletrônicos MATRIZ CURRICULAR. Módulo I /Semestre 1 Carga horária total: 400h

Transcrição:

Interoperabilidade Semântica e Compatibilização de Linguagens em ambientes heterogêneos: a questão do acesso aberto e as possibilidades de tratamento terminológico Profa. Dra Maria Luiza de Almeida Campos Universidade Federal Fluminense Departamento de Ciência da Informação Programa de Pós-Graduação em Ciência da Informação Grupo de Pesquisa - Estudos ônticos e ontológicos em contextos informacionais: representação, recuperação e métricas

A Ciência Aberta e o TratamentoTerminológico O tema Ciência Aberta vem alterando, não só conceitos, mas também o modus operandi das instituições de pesquisa científica em todo o mundo, principalmente, nas universidades, institutos de pesquisa e laboratórios. Oriunda do movimento de Acesso Aberto ao Conhecimento, a Ciência Aberta vem, aos poucos implantando mudanças expressivas principalmente relacionadas à organização, recuperação e acesso às informações e dados científicos. Neste sentido, uma questão que se apresenta está relacionada a integração entre esses diversos dados através de uma terminologia consistente para obtenção de uma recuperação precisa em Ambientes Heterogêneos.

Ambientes Heterogênicos e os Produtos Informacionais Tipos de dados podem incluir, por exemplo, números, imagens, textos, vídeos, áudio, software, algoritmos, equações, animações, modelos, simulações.

No Espaço da Ciência Exemplos específicos: sequência genômica, exemplar de uma planta, dados atmosféricos Fonte: http://www.scielo.br/scielo.php?script=sci_arttext&pid=s0102-261x2009000100010

A questão da Heterogeneidade Um problema de difícil tratamento e de recuperação devido a diversidade de fontes de informação e formas de tratamento Essas fontes possuem diferenças de natureza sintática, semântica e estruturais entre os sistemas Envolve interoperabilidade e cooperação entre essas múltiplas fontes de informação

A questão que se coloca Como possibilitar o intercâmbio desses dados e o compartilhamento de informações e conhecimentos de maneira que as informações recebidas sejam processadas de maneira significativa?

Interoperabilidade Semântica Capacidade dos sistemas de tecnologias de informação e comunicação (TIC) para o intercâmbio de dados e compartilhamento de informações e conhecimentos de forma significativa.

Objetivo Contribuir para a discussão no âmbito do acesso aberto de algumas questões que envolvem a interoperabilidade semântica em ambientes heterogêneos Apresentar procedimentos teóricos e metodológicos no âmbito da Ciência da Informação relacionados a compatibilização de linguagens, visando melhorias no tratamento e recuperação de informação nesses ambientes

O Universo de Ciência e de Tecnologia nos Sistemas de Informação de Pesquisa (CRIS) UM AMBIENTE HETEROGÊNIO Indústria Instituições de Pesquisa Organizações de Pesquisa Oportunidades de Investimento Publicações Publicadores Patentes Produtos Bibliotecas Projetos Pesquisadores Equipamento Governos Dados de Pesquisa Infraestrutura Financiadores Centros de Dados Pesquisadores Fonte: EUROCRIS.org Enorme Diversidade de Recursos

Uso Racional de Metadados Descrição de Dados de Forma Consistente Uso de Ontologias Fontes de Dados Heterôgeneos podem ser tratados através de associações semânticas Fonte: EUROCRIS.org

00110001110001101010001011000101110100101100101001111101010100 Informação não estruturada X estruturada INFORMAÇÃO DESCONTEXTUALIZADA Buscar por João Brasil??? Informações precisam ser contextualizadas INFORMAÇÃO CONTEXTUALIZADA Fonte: material didático do prof. Carlos Henrique Marcondes (UFF)

A questão fundamental é que queremos possibilitar o acesso a estas informações em um espaço de uma Web que se quer semântica INFORMAÇÃO CONTEXTUALIZADA = SENTIDO APROPRIADO PARA ATENDER A UM PROPÓSITO

Onde está a Semântica? Na Web Semântica Maria Luiza de A. Campos PréConfOA

O Cavalo Canadense é um herbívoro que come folhas de Plátano A Semântica está na linguagem?

come Vegetal É-um Árvore herbívoro É-um Cavalo É-um Plátano É-parte-de Folha É-um Cavalo Canadense A Semântica está no processo cognitivo de um indivíduo?

M A Semântica está no Modelo Cognitivo de compreensão de indivíduos?

A Semântica na Web Semântica deve ser extraída dos dados contidos nas informações e deverão ser transportados para um Modelo Formal. M

A linguagem natural para a máquina pode ser definida como um conjunto de caracteres que não fazem sentido.! # $ " % " % " É necessário que subjacente a estes caracteres exista uma linguagem formalizada $ " " $ % " & & # ' $ " $ " % % % " " $ " ( % " ) " *

A Linguagem Natural deve ser escrita para a máquina como um modelo formal.

O MODELO DEVE SER TRANSFERIDO DA MENTE DO INDIVÍDUO PARA A MÁQUINA ATRAVÉS DE UMA LINGUAGEM FORMALIZADA QUE POSSA POSSIBILITAR INFERÊNCIAS SOBRE UM DADO CONHECIMENTO

Web semântica Ontologias são fundamentais para a interoperabilidade semântica possuem uma linguagem formalizada Uma ontologia é (definindo de forma bem simples) um vocabulário consensual, compartilhado, de entendimento comum de um domínio. Escrito através de uma especificação formal, que a máquina entende. 21 Fonte: material didático - Disciplina Representação da Informação / UFF

Ontologia do dinossauro 22 Fonte: material didático - Disciplina Representação da Informação / UFF

Trecho do código OWL da ontologia 23 Fonte: material didático - Disciplina Representação da Informação / UFF

Ligações comuns x nomeadas: exemplo WEB SINTÁTICA X WEB SEMÂNTICA Fonte: material didático - Disciplina Representação da Informação / UFF

Relações nomeadas Buscas apoiadas por ontologias leves/tesauros 25 NECESSIDADE DE CONTROLE TERMINOLÓGICO

A Web semântica: características Uma Web de dados descritos com metadados Capaz de ser entendida por humanos e máquinas simultaneamente Informação estruturada e com semântica bem definida Permite a realização de inferências sobre o seu conteúdo Oferece suporte a aplicações inteligentes e inovadoras Agentes de software capazes de processar e entender os dados Facilita a automação, integração e distribuição dos dados Cooperação entre pessoas e agentes de software Fonte: material didático - Disciplina Representação da Informação / UFF

Web semântica Interoperabilidade Sintática Formatos de dados e linguagens compatíveis Interoperabilidade Semântica É preciso ser capaz de concordar sobre o significado de dados e operações sobre esses dados Fonte: material didático - Disciplina Representação da Informação / UFF

Fonte: Santos, F. C. L. Interoperabilidade Semântica entre repositórios de saúde pública. Conferência luso-brasileira de acesso aberto.

Eis a questão... Hoje em dia, os dados manipulados pelas instituições estão dispersos nos mais variados recursos de informação, tais como bases de dados e documentos de diferentes tipos. Com isso, a integração da informação contida nessas fontes é uma tarefa árdua. Diferentes abordagens podem ser seguidas para conseguir a integração, porém o desafio principal será conquistar a interoperabilidade semântica entre as fontes de informação, garantindo a manipulação do conjunto sem forçar a conversão das partes em um formato único.

Para atingir a interoperabilidade semântica é necessário adotar princípios de Compatibilização A Ciência da Informação e seus aportes teóricos

Compatibilização Ciência da Computação Capacidade dos computadores de vários tipos de utilizar programas escritos para outros sem conversão para outras linguagens de máquinas Ciência da Informação Medida de similaridade entre duas linguagens, onde se introduz o conceito de graus de compatibilidade e estabelecem a distribuição entre compatibilidade no plano semântico e no plano linguístico.

Compatibilidade de Linguagens de Tratamento e Recuperação de Informações: o desafio do profissional de informação Maria Luiza de A. Campos PréConfOA

Compatibilidade Medida de similaridade entre duas linguagens, onde se introduz o conceito de graus de compatibilidade e estabelecem a distribuição entre compatibilidade no plano semântico e no plano linguístico.

Compatibilidade pode ser definida, em outras palavras, como... a qualidade de um vocabulário de se articular com outro de temática afim, direta ou indiretamente, seja para definir equivalências conceituais entre seus termos, estabelecendo relações de semelhança, seja para complementá-lo em seu escopo, estabelecendo relações de natureza lógica ou ontológica

Compatibilidade - motivação Possibilidade de recuperar informação que pode coexistir ou ser conectada de forma coerente entre sistemas que utilizam esses vocabulários, permitindo um intercâmbio de informações entre esses sistemas. Para tanto cria-se Matriz de Compatibilização Mapeamento das potencialidade semânticas e linguísticas as Linguagens Taxa de Coincidência Verbal Grau de Compatibilidade Conceitual

Taxa de coincidência verbal Analise da medida de similaridade entre o símbolo linguístico e seu conteúdo conceitual Autor no Sistema A = Produtor intelectual de um Documento Autor no Sistema Y = O que promove uma demanda judicial A problemática dos Metadados

Grau de Compatibilidade Conceitual Compreende três fases: Coincidência conceitual Termos possuem a mesma forma verbal e todas as sua características são idênticas. Termos são idênticos conceitualmente e possuem/ e não possuem o mesmo termo genérico problemas encontrados nas Ontologias da GO Correspondência conceitual Dois conceitos combinam a maior parte de suas características, sendo similares São considerados quase sinônimos - problemas encontrados nas Ontologias da GO Correlação Conceitual Dois conceitos são correlacionados através de símbolos matemáticos, por exemplo. Indica que um conceito em uma linguagem equivale a uma combinação de conceitos na outra linguagem

A Medida de Compatibilidade Conceitual está diretamente relacionada com o estudo das definições e das relações conceituais As características dos conceitos, são também conceitos e estão expressas na definição conceitual e nas relações Estudo das definições conceituais Estudo das relações Método de Dalhberg matriz de compatibilidade conceitual- mapear as potencialidade semânticas Compatibilização pressupõe o estudo das definições e relações conceituais

Produto da compatibilização Pode ser : Um novo vocabulário, fruto da junção de vocabulários compatíveis, ou Uma linguagem intermediária que estabelece correspondências entre os termos destes vocabulários.

Existem diversas Propostas metodológicas Linguagem Mundial possibilidade de elaboração de uma linguagem universal Linguagem de Comutação propõe a criação de uma estrutura básica comum, servindo de elemento norteador no desenvolvimento de linguagens individuais Linguagem Intermediária é uma linguagem de conversão que integra diversas linguagens Este conceito surge em 1963, esboçado pelo Groupe d Etude sur Information Scientifique (GEIS) no projeto de criação de um léxico intermediário.

Linguagem Intermediária Criação de uma léxico intermediário com um sistema de códigos que possa convergir para dois ou mais instrumentos de representação a ser compatibilizados Características: As Linguagens originais são mantidas Criação de uma linguagem de conversão ( sistema de códigos) Propõe a adoção de uma Linguagem Base A linguagem de maior abrangência no domínio. Será utilizada como padrão para análise

Linguagem Intermediária Criação de uma léxico intermediário com um sistema de códigos que possa convergir para dois ou mais instrumentos de representação a ser compatibilizados Características: Estabelece onze níveis de correspondência correspondência exata (idiomas diferentes, plural/singular); termos sinônimos; termo específico para o termo genérico... Ex: O vocabulário de origem usa uma só um descritor para designar um conceito, enquanto que para o mesmo conceito o vocabulário destino precisa usar dois ou mais descritores em conjunto Ex: o descriptor do vocabulário de origem existe no vocabulário de destino descriptor mais genérico

Léxico intermediário Vocabulário central que atua como um mediador de mapeamentos entre n vocabulários com os quais queremos estabelecer compatibilidade. O Mapeamento é feito entre cada vocabulário e o léxico. Método de Neville Reconciliação de Tesauros propõe uma linguagem intermediária através do mapeamento entre vocabulários

Mapeamento no mapeamento busca-se obter uma correspondência entre dois vocabulários, onde se estabelecem critérios de conversão de um vocabulário para o outro. é unidirecional, ou seja, é feito tendo em vista a conversão de um vocabulário para outro, mas não vice-versa.

Uma outra Proposta... O Vocabulário Integrado Na integração o foco é gerar um novo vocabulário, que possivelmente tem seu escopo ampliado em relação aos vocabulários originais, uma vez que é o resultado da agregação desses vocabulários. Essa visão contrasta com a abordagem do léxico intermediário, que têm por princípio a preservação dos vocabulários originais e o estabelecimento de equivalências entre os vocabulários, enquanto que na integração essa preservação é perdida uma vez que se cria um novo vocabulário.

Abordagens para integração Uso de diversas estratégias de casamento léxico a normalização prévia dos termos dos vocabulários a exploração da estrutura hierárquica a análise de documentos indexados com os vocabulários a participação de especialistas para validar o resultado proposto de casamentos propostos por processos semi-automatizados

Qual o princípio adotar? O que serve aos nossos propósitos visando possibilitar o acesso aberto???? Grupo de pesquisa OBRIGADA!!! Estudos ônticos e ontológicos em contextos informacionais: representação, recuperação e métricas