Este capítulo aborda os fundamentos principais aplicados neste trabalho.

Documentos relacionados
A Web Semântica: Conceitos e Aplicações. Valéria M. Pequeno Universidade Autónoma de Lisboa

U NIVERSIDADE F EDERAL DE P ERNAMBUCO

1 Introdução. 1 World Wide Web Consortium -

U NIVERSIDADE F EDERAL DE P ERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA

Linked Data Management. Capítulo 1: Linked Data & the Semantic Web Standards

Uma ferramenta para Definição de Mapeamentos entre Vocabulários usados na publicação de Dados Linkados

Padrões para Definição de Metadados

Introdução à Web Semântica

Dados Abertos Governamentais e a Web Semântica

Web Semântica: Conceitos, Tecnologias e Aplicações

Manipulação de uma ontologia desenvolvida em OWL através da utilização da API JENA 2 Ontology

6 Conclusão. 6.1 Contribuições

MÓDULO II A Dados & Metadados: Como Organizar - Ver 1.1

6 Conclusão. 6.1 Trabalhos relacionados

3 Arquitetura do Sistema

TECNOLOGIAS LOD E A PUBLICAÇÃO E INTERLIGAÇÃO DE ACERVOS DIGITAIS DE ARQUIVOS, BIBLIOTECAS E MUSEUS NA WEB

Universidade Federal da Paraíba CCEN Departamento de Informática Disciplina: Banco de Dados. Aula 1 Introdução a Banco de Dados

O W3C e a Web Semântica. CPqD - abril/2009 Workshop Rede IP do Futuro

Gestão de Ontologias

Melhoria na Publicação de Dados Abertos: Automatização na

Ontologias MARIANNA ARAÚJO

Web Services - Definição. Web Services - Introdução. Universidade Federal de Santa Catarina. DSOOII Web Services

1 Introdução. 1.1 A Web Semântica

MIDB-OP: um Modelo de Integração de Dados Biológicos apoiado em Ontologias e Procedência de dados Caroline Beatriz Perlin

5 Usando as Representações de Design Rationale

3. Descrição Geral do Esquema Conceitual de Composição de Objetos de Aprendizagem

4 EduCO: Representando a Informação Contida em Materiais de Aprendizagem

O W3C e a Web Semântica. Reunião de coordenação da e-ping, março/2009

Um esquema de nomes para localização de fontes de informação na Web, esse esquema chama-se URI.

Para descrever os metadados das aplicações, desenvolvemos um método chamado SHDM (Semantic Hypermedia Design Method) [Lima & Schwabe 2002a, 2002b,

A ABORDAGEM LINKED OPEN DATA PARA DADOS GEOGRÁFICOS HARMONIZADOS DE ACORDO COM A DIRETIVA INSPIRE: Resultados do projeto ibérico CROSS-NATURE

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

ONTOLOGIAS E ONTOLOGIAS DIFUSAS

Semântica na Web. Carlos Bazilio. Depto de Computação Instituto de Ciência e Tecnologia Universidade Federal Fluminense

IA - Ontologias. Professor Paulo Gurgel Pinheiro. 09 de Novembro de 2010

Uma Abordagem para Publicação de Metadados de Proveniência na Web de Dados

Castro (2008, p.7) define a palavra ontologia de forma mais simplificada:

Modelos. Banco de dados. Professor: Jarbas Araújo CENTRO EDUCACIONAL RADIER.

Ontologias: Definições e Tipos

Sistemas de PROFA. LILLIAN ALVARES FACULDADE DE CIÊNCIA DA INFORMAÇÃO

Bases de dados. Conceitos, estrutura e sistemas de gestão

3 Kuaba: Uma Ontologia para Design Rationale

1 Introdução Motivação

Universidade Federal de Pernambuco Centro de Informática. GovPEx3: uma ferramenta para publicação das despesas do Governo de Pernambuco em RDF

Ontology-Based Data Access. Diogo Espinhara Oliveira Banco de Dados

1 Introdução Motivação

Ontologias: Definições e Tipos

Política de Privacidade Este aplicativo coleta alguns dados pessoais de seus usuários. Resumo

Web Semântica. Web Semântica. uma

3 Estado da arte. 3.1 A linguagem de consultas SPARQL

Aula 3 - Modelo Entidade-Relacionamento

2.1. Visão Geral das Ferramentas utilizadas no Ciclo de Vida de Desenvolvimento de Software

Seleção e Otimização de Fontes

OntologyManagementTool UMA FERRAMENTA PARA GERENCIAMENTO DE ONTOLOGIAS COMO TEORIAS LÓGICAS

RDFMat Um serviço para criação de repositórios de dados RDF a partir de crawling na Web de dados

Denise Gomes Silva Morais Cavalcante. Programa de Pós-graduação em Ciências da Informação/ECA- USP. Orientador: Nair Yumiko Kobashi

Desenvolvimento de Aplicações Distribuídas

Boas Práticas para Dados na Web: Desafios e Benefícios

Figura 2 An ontology spectrum (McGuinness, 2003) Figura 3 - Semantic Continuum 4 (Uschold, 2003).

ara entender os Sistemas Gerenciadores de Banco de Dados é importante conhecer

Modelos Conceituais de Dados

UMA FERRAMENTA DE APOIO A DETERMINAÇÃO DE EQUIVALÊNCIAS SEMÂNTICAS ENTRE ESQUEMAS GML UTILIZANDO ONTOLOGIAS OWL

Minicurso: Introdução ao RDF e SPARQL

MER e DER Entidades Relacionamentos Atributos Ferramentas CASE Exemplos de DERs Exemplo de Minimundo. Banco de Dados. Aula 1.

PROTÓTIPO DE FERRAMENTA DE CONSULTA DE INFORMAÇÕES BASEADAS EM ONTOLOGIAS PETER ANTONY RAUSCH JOYCE MARTINS

Bancos de Dados Orientados a Grafos. Mateus Lana e Thiago Santana

1 Introdução Motivação

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

XML - Extensible Markup Language

Introdução. descrever os tipos de interfaces e linguagens oferecidas por um SGBD. mostrar o ambiente de programas dos SGBD s

Classes e Objetos. Sintaxe de classe em Java

Banco de Dados I Parte I: Introdução

Modelagem de dados usando o modelo Entidade- Relacionamento (ER)

OpenSBBD: Usando Linked Data para Publicação de Dados Abertos sobre o SBBD

Agregação de conteúdos e construção de redes de recursosdigitais à medida

Banco de Dados. Profs: - Ana Carolina - Fernando Fonseca 2017

Resumo da Política de Privacidade. Política de privacidade completa

Banco de Dados 08/08/2010

POLÍTICA DE PRIVACIDADE DO nsmobile RESUMO DA POLÍTICA DE PRIVACIDADE POLÍTICA DE PRIVACIDADE COMPLETA

Construção de Linked Data Mashup: Integração de Dados na Saúde Pública. Gabriel Lopes, Vânia Vidal e Mauro Oliveira.

Ao subscreveres o nosso serviço, estás aceitando os termos e condições definidos em baixo:

proposto, que podem potencialmente ser de interesse dentro desta área de pesquisa (seção 7.4).

Ontologias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília

5 Conclusão e trabalhos futuros

CIN 7601 PLANO DE ENSINO (2018.2)

Herança Tiago Eugenio de Melo

(com a colaboração de Nuno Oliveira) Departamento de Informática Universidade do Minho

UNINGÁ UNIDADE DE ENSINO SUPERIOR INGÁ FACULDADE INGÁ CIÊNCIA DA COMPUTAÇÃO PROJETO DE BANCO DE DADOS RELACIONAL. Profº Erinaldo Sanches Nascimento

Indexação e Modelos Clássicos

Roteiro 01. Professor: Prof. M.Sc. Odilon Corrêa da Silva. Curso: Engenharia de Computação. Disciplina: Programação para WEB

Web Semântica para Máquinas de Busca

julho/2010 FISL O W3C e Dados abertos na Web

FUNDAÇÃO UNIVERSIDADE ESTADUAL DE MARINGÁ

MODELAGEM DE SISTEMAS. Introdução a Computação e Engenharia de Software. Profa. Cynthia Pinheiro

introdução à web semântica

Boas Práticas para Dados na Web: Desafios e Benefícios

POLÍTICA DE PRIVACIDADE

introdução à web semântica

Engenharia de Software. Projeto de Arquitetura

Transcrição:

2 Fundamentos Este capítulo aborda os fundamentos principais aplicados neste trabalho. 2.1 Linked Data Linked Data é um padrão de práticas a serem seguidas para a publicação e interligação de dados estruturados na Web. Seguindo esse padrão, eles precisam ser publicados com características específicas: machine-readable, semântica explicitamente definida, e a possibilidade de serem referenciados e referenciar conjuntos de dados externos. Com o objetivo de distribuí-los em uma escala global de maneira estruturada, Berners-Lee (2009) definiu quatro regras conhecidas como Princípios de Linked Data, listadas a seguir. 1. Utilize Uniform Resource Identifiers (URIs) para nomear entidades; 2. Utilize URIs HTTP de forma que pessoas possam consultar esses nomes; 3. Quando alguém acessar uma URI, providencie informações úteis utilizando padrões (RDF, SPARQL); 4. Inclua ligações para outras URIs, a fim de permitir que outras entidades sejam descobertas. A ideia do primeiro princípio é a criação de URIs não apenas para documentos, mas também para conceitos do mundo real, tanto concretos quanto abstratos (pessoas, sentimentos, cores, etc.). O segundo princípio determina a utilização de URIs que sigam o protocolo HTTP para possibilitar a publicação de mais informações associadas a uma determinada entidade. Tais informações precisam ser acessíveis, e o protocolo HTTP é o principal protocolo para acesso a informações na Internet.

14 O terceiro princípio defende o uso de padrões, pois essa utilização permite que diferentes tipos de aplicações possam, de alguma forma, processar o conteúdo publicado. Por fim, o quarto princípio pode ser considerado como o mais importante para o escopo do nosso trabalho. Nele, é incentivada a criação de ligações entre os dados publicados na Web. Tais ligações devem ser criadas não apenas entre documentos, mas principalmente entre entidades publicadas. Além disso, devem ser criadas não apenas ligações com dados proprietários, mas também com dados publicados por fontes de dados externas, possibilitando uma maior expansão de conhecimentos. Essas ligações entre entidades podem ser distribuídas nos três grupos abaixo (Heath & Bizer, 2011). Ligações de relacionamento; Ligações de vocabulário; Ligações de identidade. As ligações de relacionamento representam algum tipo de relação entre as duas entidades interligadas. Por exemplo, a representação de uma relação de paternidade entre uma entidade pai e uma entidade filho. As ligações de vocabulário interligam a entidade com o vocabulário utilizado para descrevê-la. Por exemplo, a característica de uma entidade e o termo de uma ontologia que descreve o significado de tal característica. Por fim, as ligações de identidade são utilizadas para interligar entidades equivalentes, mas representados por diferentes URIs. Tais ligações permitem a existência de diferentes interpretações para um mesmo termo. Esse último grupo foi escolhido como escopo do nosso trabalho. 2.2 Web de Dados Atualmente, muitas organizações estão alterando radicalmente a forma de compartilhar conhecimento, diminuindo as barreiras para publicação de seus dados na Web (Bizer, Heath, & Berners-Lee, 2009). Elas adotaram os princípios de Linked Data como forma de publicá-los, resultando em um espaço global e bem definido chamado Web de Dados: um grafo composto por bilhões de dados publicados de vários domínios e fontes de dados distintos.

15 Publicar dados na Web como Linked Data envolve os seguintes passos básicos: Atribuir URIs às entidades descritas pelo conjunto de dados e utilizar estas URIs no protocolo HTTP para representações RDF; Criar ligações RDF para outras fontes de dados na Web, permitindo que os clientes naveguem a Web de Dados como um todo, seguindo tais ligações; Fornecer metadados sobre os dados publicados, permitindo que os clientes possam acessar a qualidade desses dados, e escolher entre as diferentes formas de acessá-los. Partindo destes passos, uma etapa importante para a publicação na Web é a escolha de URIs. As entidades devem possuir URIs únicas, mas podem existir diferentes URIs para descrever uma mesma identidade. Tratam-se de URI aliases. Os URI aliases são importantes, pois permitem diferentes descrições para um mesmo objeto. Com isso, é possível a existência de diferentes opiniões expressas na Web. Os diferentes fornecedores de dados interligam URI aliases - quando as conhecem - através da propriedade owl:sameas, propriedade utilizada para indicar que duas URIs diferentes representam uma mesma entidade. Ou seja, além da escolha de URIs, ligações RDF precisam ser publicadas para permitir a descoberta de novas bases. Elas permitem a navegação entre diferentes fontes e acesso a informações relacionadas. Sendo assim, para fazer parte da Web de Dados, as fontes publicadoras devem criar ligações para entidades relacionadas que estejam em outras fontes. Devido ao grande número de entidades que normalmente uma fonte possui, é comum a geração desse tipo de ligação de maneira automática ou semiautomática. Para facilitar a geração dessas ligações entre diferentes bancos de dados publicados, uma abordagem é utilizar nomes conhecidos como identificadores dos dados (por exemplo, utilizar o International Standard Book Number (ISBN) quando o domínio de banco for de publicações). Quando é utilizado um esquema de nomes conhecidos, ligações implícitas entre entidades de diferentes fontes podem se tornar explícitas com as ligações geradas. Há casos em que as fontes de dados não utilizam essa nomenclatura compartilhada. Nestes casos, é comum as ligações RDF serem geradas baseadas na similaridade das entidades dos diferentes bancos de dados. Existem vários

16 frameworks para identificação de entidades similares, ou seja, possíveis ligações. Na maioria, por exemplo, é possível especificar que tipo de ligações RDF serão criadas (através de uma linguagem declarativa); que combinação de similaridade de métricas é utilizada para comparar entidades; e como valores de similaridade para propriedades específicas são agregadas em um valor mais geral. Tais frameworks contribuem para uma Web de Dados cada vez mais conectada. 2.3 OWL e ligações owl:sameas OWL, uma sigla para Web Ontology Language, é desenvolvida como uma extensão do vocabulário RDF, acrescentando novas propriedades que permitem expressar mais características dos dados publicados na Web (por exemplo, cardinalidades e equivalências) (Bechhofer, et al., 2004). Dentre essas novas propriedades, destacamos a de equivalência. Na Web, não é possível determinar que duas URIs distintas correspondem a entidades diferentes ou equivalentes, a menos que essa característica esteja publicada. Para publicar esse tipo de característica, OWL fornece duas propriedades sobre a identidade das entidades: owl:differentfrom owl:sameas A propriedade owl:differentfrom indica que duas URIs referem-se a entidades diferentes. Em contrapartida, a propriedade owl:sameas, utilizada no escopo deste trabalho, permite representar que duas entidades são, de alguma forma, equivalentes. Ou seja, uma declaração sameas entre duas URIs indica que ambas referem-se a uma mesma entidade e possuem uma mesma identidade. A Figura 1 contém um exemplo do uso desse tipo de declaração para afirmar que duas URIs correspondem a uma mesma pessoa. No exemplo, as URIs Luiz_Inacio_Lula_da_Silva e Presidente_Lula descrevem uma mesma entidade. Ou seja, suas propriedades podem ser agrupadas.

17 Figura 1: Exemplo de tripla RDF contendo a propriedade owl:sameas A partir do aumento do número de fontes de dados publicadas na Web como Linked Data, a propriedade owl:sameas tem sido cada vez mais utilizada para conectar dados equivalentes e publicados por diferentes fontes (Halpin & Hayes, 2010). Figura 2: Exemplo de uso alternativo da propriedade owl:sameas Essa propriedade possui ainda outra aplicação. Em OWL Full 1, podemos utilizá-la para definir igualdade de classes quando dois conceitos possuem o mesmo significado. No exemplo apresentado na Figura 2, a ligação owl:sameas entre as classes FootballTeam e SoccerTeam define que ambas denotam o mesmo conceito, apesar de serem de ontologias diferentes. 2.4 Uma crítica ao uso da propriedade owl:sameas A utilização de ligações owl:sameas é imprescindível para a Web de Dados. No entanto, existe uma suspeita de mau uso dessas ligações, uma vez que podem determinar que duas entidades são de alguma forma equivalentes, permitindo diferentes interpretações. Halpin & Hayes (2010) delineiam quatro interpretações alternativas para a equivalência entre entidades: Igual, mas referencialmente opaca: são equivalentes, mas nem todas as propriedades de uma são aceitas pela outra, não podendo se substituir; Igual, mas em contexto diferente: são equivalentes e todas as propriedades de uma são aceitas pela outra, mas são de contextos diferentes e não podem ser reutilizadas em outros contextos; 1 OWL atualmente possui três sublinguagens, em ordem de expressividade: OWL Lite, OWL DL e OWL Full. Elas foram projetadas para uso por comunidades específicas de programadores e usuários.

18 Representação: não são equivalentes, sendo uma a representação da outra. Por exemplo, uma ligação entre uma pessoa e seu Web site; Muito semelhante: não são equivalentes, sendo apenas parecidas. Obviamente, a questão de como expressar as relações de identidade entre dados é mais complexa do que apenas a aplicação de ligações de equivalência. Ao mesmo tempo, uma abordagem mais detalhada que cubra essas quatro possíveis interpretações seria um passo útil para a evolução da Web de Dados.