UMA FERRAMENTA DE APOIO A DETERMINAÇÃO DE EQUIVALÊNCIAS SEMÂNTICAS ENTRE ESQUEMAS GML UTILIZANDO ONTOLOGIAS OWL

Documentos relacionados
6 Conclusão. 6.1 Trabalhos relacionados

Obtendo Interoperabilidade Semântica em Sistemas. Metamorphosis

5 Conclusão e trabalhos futuros

Ontologias: Definições e Tipos

Interoperabilidade entre Objetos Geográficos Heterogêneos

Protótipo de Protocolo de Aplicação para Troca de Documentos da Área Extra Judicial. Acadêmico: Fabrício Bento Orientador: Paulo Fernando da Silva

Ontologias: Definições e Tipos

Universidade Federal da Paraíba CCEN Departamento de Informática Disciplina: Banco de Dados. Aula 1 Introdução a Banco de Dados

Manipulação de uma ontologia desenvolvida em OWL através da utilização da API JENA 2 Ontology

SISTEMAS DE INFORMAÇÕES GEOGRÁFICAS Aula 1 - Conceitos. SIG- Eng. Cartográfica Prof. Luciene Delazari

Este capítulo aborda os fundamentos principais aplicados neste trabalho.

U NIVERSIDADE F EDERAL DE P ERNAMBUCO

ONTOLOGIAS E ONTOLOGIAS DIFUSAS

6 Conclusão. 6.1 Contribuições

MIDB-OP: um Modelo de Integração de Dados Biológicos apoiado em Ontologias e Procedência de dados Caroline Beatriz Perlin

Metamodelos para Banco de Dados. Carlos Julian Menezes Araújo Prof. Dr. Robson do Nascimento Fidalgo

Mineração de Textos na Web

Sistemas de Informação Geográficos. Informação na Organização. O Valor da Informação. Sistemas de Informação Tradicionais. O Valor da Informação

O W3C e a Web Semântica. CPqD - abril/2009 Workshop Rede IP do Futuro

USANDO XML PARA CARGA AUTOMÁTICA DE DADOS EM BANCOS DE DADOS DE PROJETO INDUSTRIAL DE MAQUETE ELETRÔNICA PROPOSTA DE TRABALHO DE GRADUAÇÃO

Figura 2 An ontology spectrum (McGuinness, 2003) Figura 3 - Semantic Continuum 4 (Uschold, 2003).

Projeto. Observatório Nacional de Clima e Saúde

INTRODUÇÃO AO GEOPROCESSAMENTO

6.1. Teste Baseado em Gramática e Outras Abordagens de Teste

Web Semântica: Conceitos, Tecnologias e Aplicações

Padrões para Definição de Metadados

DESENVOLVIMENTO DE UM SISTEMA DE INFORMAÇÃO GEOGRÁFICA PARA GERAÇÃO DE MAPAS PLUVIOMÉTRICOS

ANGELO AUGUSTO FROZZA UM MÉTODO PARA DETERMINAR A EQUIVALÊNCIA SEMÂNTICA ENTRE ESQUEMAS GML

SIG: Sistemas de Informações Geográficas

Qualidade das bases de dados geoespaciais: conceitos e tendências. Wilson Holler

Infra-Estrutura de Dados Espaciais. Bruno Rabello Monteiro

3 Arquitetura para a Coordenação e a Composição de Artefatos de Software

1 Introdução Motivação

Modelagem Semântica de Aplicações na WWW

Implementação de um Sistema de Informações Georeferenciado (Geoufes) Utilizando Bibliotecas de Software Livres em Java

Aula 2 BD Introdução. Profa. Elaine Faria UFU

Gestão de Ontologias

Uma ferramenta para Definição de Mapeamentos entre Vocabulários usados na publicação de Dados Linkados

132 6 Conclusão 6.1. Contribuições da Tese

1 Introdução. 1 World Wide Web Consortium -

Projeto de Banco de Dados. Componentes de um Sistema de Informação. Arquitetura de SI. Sistema de Informação (SI) SI nas Organizações

1 Introdução. pela comunidade de computação em vários países de língua não-inglesa.

Ontology-Based Data Access. Diogo Espinhara Oliveira Banco de Dados

Sistemas da Informação. Banco de Dados I. Edson Thizon

Introdução à Web Semântica

Semântica na Web Vocabulários

INTEROPERABILIDADE NA REPRESENTAÇÃO DE DADOS GEOGRÁFICOS: GEOBR E GML 3.0 NO CONTEXTO DA REALIDADE DOS DADOS GEOGRÁFICOS NO BRASIL

Gerador de Esquema Conceitual Global através da Integração de Esquemas Conceituais Locais de Fontes de Dados XML no Ambiente BInXS

Ontologias MARIANNA ARAÚJO

Introdução a Web Services

PROTÓTIPO DE FERRAMENTA DE CONSULTA DE INFORMAÇÕES BASEADAS EM ONTOLOGIAS PETER ANTONY RAUSCH JOYCE MARTINS

Apresentação do Capítulo 4 MDA (Model-Driven Archtecture) ALUNO: DOMENICO SCHETTINI FILHO NÚMERO USP:

RELEVÂNCIA PARA A FORMAÇÃO DO BOLSISTA

Aula 01 Conceito de Banco de Dados e SGBD

Rui Carneiro, Rui Pereira, Tiago Orfão

5 Estudo de Caso. 5.1.O Cenário

Adaptação do Sistema de Busca Semântica ao Padrão XML e Automatização do Processo de Modelagem dos Objetos de Aprendizagem no ROAI para o Padrão OWL

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Desenvolvimento de Ferramentas no igeom: Utilizando a Geometria Dinâmica no Ensino

COMPARATIVO DE ESQUEMAS DE CLASSIFICAÇÃO. Acadêmica: Kátia Simone Hamann Orientador: Everaldo Artur Grahl

SISTEMA DE INFORMAÇÃO GEOGRÁFICA APLICADO AO GERENCIAMENTO DE INFORMAÇÃO DE TRANSPORTE URBANO

ABD Arquivos e Bibliotecas Digitais

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Curso online de. Formação em Front-End. Plano de Estudo

Requisitos de Software e UML Básico. Janaína Horácio

Título do trabalho: e-sciencenet 2.0: Uma Rede Ponto-a-Ponto Semântica; Nome do aluno: Tadeu Moreira de Classe; Nome do(s) orientador(es): Regina

Utilizando a GML na identificação de candidatos a padrão de análise para BDG

DOSSIER DA DISCIPLINA

VisEdu-MAT: Visualizador de material educacional, módulo de matemática

José Maria Villac Pinheiro colaborador PMSS

5 Arquitetura de implementação

UNIVERSIDADE FEDERAL DE GOIÁS INSTITUTO DE INFORMÁTICA. Sistemas Distribuídos

Figura 16 Niagara - Visão de grupos de notas.

Introdução à Computação

Estendendo GeoDWCASE para Oracle Spatial e MySQL PROPOSTA DE TRABALHO DE GRADUAÇÃO

Para descrever os metadados das aplicações, desenvolvemos um método chamado SHDM (Semantic Hypermedia Design Method) [Lima & Schwabe 2002a, 2002b,

Bancos de Dados Notas de Aula Introdução Prof. Dr. Daniel A. Furtado

5 Usando as Representações de Design Rationale

SISTEMA DE INFORMAÇÃO GEOGRÁFICA APLICADA À GESTÃO PÚBLICA

Maria Luiza de A. Campos Pré ConfOA

Bancos de Dados Geográficos Lúbia Vinhas

U NIVERSIDADE F EDERAL DE P ERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA

Modelagem de Dados MODELAGEM DE DADOS. Sistemas de Banco de Dados. Profa. Rosemary Melo

3 Kuaba: Uma Ontologia para Design Rationale

1 Introdução e Motivação

Utilização de XML no Desenvolvimento de Hiperdocumentos Educacionais

Adriano Maranhão PROFISSIONAIS E ATIVIDADES ENVOLVIDAS EM UM SGBD

Banco de Dados I Parte I: Introdução

MAPEAMENTO OBJETO RELACIONAL COM HIBERNATE EM APLICAÇÕES JAVA WEB

Implementação de algoritmos para consultas de segmentos em janelas

Resumo parcial da Tese de Doutorado. Um modelo de Sistema de Gestão do Conhecimento para grupos de pesquisa e desenvolvimento.

M V C, J S O N E X M L P R O F. M E. H É L I O E S P E R I D I Ã O

Implementação da Especificação de Tempo Real Java para o EPOS

Ontologias: definições e conceitos básicos

O uso consciente da tecnologia para o gerenciamento. Editora Saraiva Emerson de Oliveira Batista

Gerenciamento de Anotações de Biosseqüências utilizando Associação entre Ontologias e Esquemas XML

Calculadora Geográfica

Webmedia 06 Diego Fiori de Carvalho Júlio Cézar Estrella Renata Pontin de Mattos Fortes Rudinei Goularte

O W3C Futuro da Web HTML5. janeiro/2010 Campus Party

Transcrição:

UNIVERSIDADE FEDERAL DE SANTA CATARINA DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA CURSO DE SISTEMAS DE INFORMAÇÃO UMA FERRAMENTA DE APOIO A DETERMINAÇÃO DE EQUIVALÊNCIAS SEMÂNTICAS ENTRE ESQUEMAS GML UTILIZANDO ONTOLOGIAS OWL LEONARDO ROMAN DA ROSA Trabalho de conclusão de curso apresentado como parte dos requisitos para obtenção do grau de Bacharel em Sistemas de Informação. Florianópolis - SC 2006 / 2

LEONARDO ROMAN DA ROSA UMA FERRAMENTA DE APOIO A DETERMINAÇÃO DE EQUIVALÊNCIAS SEMÂNTICAS ENTRE ESQUEMAS GML UTILIZANDO ONTOLOGIAS OWL Trabalho de conclusão de curso apresentado como parte dos requisitos para obtenção do grau de Bacharel em Sistemas de Informação. Orientador: Ronaldo dos Santos Mello, Dr. Banca examinadora Lia Caetano Bastos, Dr. Marília Abrahão Amaral, Dr. 2

Dedicatórias 3

Agradecimentos 4

Sumário Agradecimentos... 4 Sumário... 5 Lista de Figuras... 6 Resumo... 7 Palavras-chave... 7 Introdução... 8 SIGs e a GML... 9 Interoperabilidade entre Esquemas GML... 9 O Uso da Ontologia na Integração... 10 Trabalhos Relacionados... 13 O Método para a Interoperabilidade entre GMLs... 15 A Ferramenta de Interoperabilidade Semântica... 16 Trabalhos Futuros... 17 Referências Bibliográficas... 19 Anexos... 21 5

Lista de Figuras Ilustração 1- Funcionamento do método proposto (Frozza 2006)... 15 6

Resumo Um dos problemas existentes na Web é a identificação semântica adequada do conteúdo de um site. O uso da XML permite resolver ambigüidades no significado desses conteúdos. Em sistemas de informações geográficas existe um problema similar relacionado a integração semântica entre esquemas GML. Sendo um padrão aberto, o GML é muito utilizado para armazenamento de informações geográficas codificadas em XML. Enquanto a GML facilita o intercâmbio de informações geográficas, ela não resolve por si só a questão da integração semântica de esquemas heterogêneos entre diferentes sistemas de informações geográficas. O que queremos, portanto, é fazer uma análise entre dois esquemas relacionados a um mesmo domínio e encontrar seus elementos semanticamente equivalentes. Para facilitar essa análise, será utilizada uma ontologia OWL com a representação dos conceitos do domínio da aplicação. Neste trabalho temos como propósito final a criação da ferramenta com o objetivo de demonstrar na prática essa integração de dados geográficos. Palavras-chave XML, Extensible Markup Language, GML, Geography Markup Language, OWL, Web Ontology Language, Ontologias, SIG, GIS, Integração Semântica 7

Introdução A maior parte da informação na Web é atualmente apresentada na linguagem HTML (Hypertext Markup Language), que foi desenvolvida para possibilitar o acesso a informações através dos navegadores Web. Enquanto a linguagem HTML permite visualizar essas informações, ela não tem muita capacidade de descrevê-las. Essa capacidade de descrição da informação facilita a interoperabilidade entre diferentes aplicações. A Geography Markup Language (GML) é um padrão aberto para o transporte e armazenamento de informações geográficas em arquivos codificados na linguagem XML. A integração entre dois esquemas GML que tratam sobre as mesmas informações geográficas tem grande importância para órgãos públicos e privados que utilizem informações geográficas de diferentes fontes. Nesse trabalho usaremos especificamente esquemas GML referentes ao domínio de cadastro urbano, muito utilizado no planejamento da infra-estrutura das cidades. 8

SIGs e a GML Um Sistema de Informações Geográficas ou SIG, é definido como um sistema computacional capaz de coletar, armazenar, gerenciar, manipular, recuperar, transformar e visualizar dados geo-referenciados, com habilidade para integrar grandes quantidades de informação e com capacidade de utilizar ferramentas analíticas para explorar esses dados [SILVA 03]. A linguagem GML, de Geography Markup Language, é uma gramática XML para a modelagem, transporte e armazenamento de informações geográficas [GML 04]. A GML inclui uma variedade de objetos para descrição geográfica, tais como sistemas de coordenadas, geometria, topologia, unidades de tempo e medida. Por ser um padrão aberto, a GML tem sido muito utilizada como meio de armazenamento de dados geográficos de diferentes SIGs, da mesma forma como a XML é utilizada por uma grande variedade de aplicativos e sistemas das áreas mais diversas como formato para armazenamento de dados e informações. Interoperabilidade entre Esquemas GML Informações geográficas são abstrações de fenômenos do mundo real [GML 04]. Elas são representações digitais de alguma parte do mundo real. Como tal, estão sujeitas à cultura (regionalismos), ao domínio dos programadores sobre o tema, entre outros. Diferenças a nível semântico entre esquemas GML dizem respeito aos aspectos relacionados à compreensão e utilização de seus dados, em 9

diferentes aplicações, diferentes modelos de dados e diferentes interpretações desses dados. O nível semântico da integração abrange a questão da unificação da nomenclatura utilizada para representar os fenômenos da realidade a serem modelados e os relacionamentos entre eles. Neste sentido, é necessário criar uma estrutura de organização do conhecimento, tal como um vocabulário controlado, uma taxonomia, um thesaurus ou uma ontologia [FROZZA 06]. A opção do uso de uma ontologia deve-se exatamente pela maior facilidade de comparação entre dois esquemas GML se utilizarmos como modelo de comparação uma estrutura padronizada. O Uso da Ontologia na Integração Em computação, uma ontologia é um modelo de dados que representa um domínio. É utilizada para abstrair sobre os objetos desse domínio e as relações entre eles [WIKI 06-1]. Segundo Duarte 2000, uma ontologia é uma descrição de conceitos e relações que existem em um domínio de interesse. Basicamente, uma ontologia consiste desses conceitos e relações, e suas definições, propriedades e restrições, descritas na forma de axiomas. Ontologias são úteis para apoiar a especificação e implementação de qualquer sistema de computação complexo. Uma ontologia pode ser desenvolvida para vários fins, mas, de uma forma geral, os seguintes propósitos são atingidos: Ajuda as pessoas a compreender melhor certa área de conhecimento: no desenvolvimento de uma ontologia, as pessoas envolvidas no processo se vêem diante de um desafio: explicar 10

seu entendimento sobre o domínio em questão, o que as faz refletir e melhorar sua compreensão sobre esse domínio; Ajuda as pessoas a atingir um consenso em seu entendimento sobre uma área de conhecimento: geralmente, em uma determinada área de conhecimento, diferentes especialistas têm entendimento diferenciado sobre os conceitos envolvidos, o que gera problemas na comunicação. Ao se construir uma ontologia, essas diferenças são explicitadas e busca-se um consenso sobre seu significado e sua importância; Ajuda outras pessoas a compreender certa área de conhecimento: uma vez que haja uma ontologia sobre uma determinada área de conhecimento desenvolvida, uma pessoa que deseje aprender mais sobre essa área não precisa se reportar sempre a um especialista. Ela pode estudar a ontologia e aprender sobre o domínio em questão, absorvendo um conhecimento geral e de consenso. A linguagem de ontologia escolhida para a integração dos esquemas GML foi a OWL. A OWL (Web Ontology Language) é uma linguagem de representação criada justamente para que a informação contida em documentos possa ser processada por aplicações, ao invés de somente ser apresentada para visualização [OWL 04]. A OWL pode ser utilizada para representar o significado de termos em vocabulários e o relacionamento entre esses termos. Essa linguagem também possui um suporte muito melhor a interpretação de conteúdo Web do que outras linguagens com abordagem semelhante como 11

XML, RDF e RDF Schema (RDF-S). Isso é conseguido através de vocabulário adicional juntamente com uma semântica formal. A OWL é dividida em três sub-linguagens de expressividade crescente: OWL Lite, OWL DL, e OWL Full. 12

Trabalhos Relacionados Em Dorneles 2005 é descrita uma solução de abordagem para consultas que utilizem argumentos de busca booleanos. A proposta é a adoção de uma função de similaridade em substituição aos operadores booleanos. Com o uso de funções de similaridade, o sistema pode gerar um escore de semelhança entre cada objeto na base e o argumento de consulta. Hess 2004 propõe uma solução de conflitos entre esquemas conceituais de bancos de dados geográficos, suportada por uma arquitetura de software, com duas etapas: uma sintática que deve converter os esquemas para o formato GML e a outra semântica que utiliza uma ontologia para a integração semântica. Esse modelo de resolução de conflitos entre esquemas conceituais de BDGs é proposto para ser universal, de forma a aceitar esquemas conceituais de diferentes domínios geográficos. Para solucionar os conflitos entre esquemas conceituais foi desenvolvida uma metodologia, suportada por uma arquitetura de software, a qual divide a fase de pré-processamento em duas etapas, uma sintática e uma semântica. A fase sintática visa converter os esquemas em um formato canônico, a Geographic Markup Language (GML). Para cada um dos diferentes modelos de dados um conjunto de regras foi desenvolvido e um wrapper implementado. Para suportar a etapa semântica da integração uma ontologia é utilizada para integrar semanticamente os esquemas conceituais dos diferentes projetos. Uma abordagem para a interoperabilidade na representação de dados geográficos é feita por Silva 2003. Seu estudo tem como objetivo analisar e validar a hipótese da viabilidade da integração entre duas soluções para representação de dados geográficos: GeoBR/INPE e GML 3.0/OGC. Esses 13

modelos de representação foram escolhidos em virtude de seu uso no INPE, para fazer um estudo de caso. O tratamento do tempo na representação da informação geográfica foi abordado e explorado dentro do contexto do caso estudado, utilizando os recursos da especificação GML 3.0 e estendida ao formato GeoBR. Para a validação do trabalho, ferramentas de conversão e visualização foram desenvolvidas e adaptadas, em particular adaptações no conversor TerraTranslator, no aplicativo geográfico para Internet denominado SpringWeb, e um demonstrativo do uso de SVG para dados animados. 14

O Método para a Interoperabilidade entre GMLs Um método para a determinação de equivalências semânticas entre esquemas GML é proposta por Frozza 2006, especificamente para o domínio do cadastro urbano. Em seu estudo sobre a interoperabilidade de SIGs desse domínio, é feito todo o embasamento teórico necessário para a criação de uma ferramenta de integração semântica de esquemas GML através de ontologias OWL. Sua proposta tem como objetivo a determinação de equivalências através de métodos semi-automáticos e prevê a aplicação de seus resultados em softwares que possibilitem a troca de informações entre bases de dados geográficos sobre uma determinada cidade. Abaixo, a ilustração 1 fornece uma visão geral do funcionamento do método. Ilustração 1- Funcionamento do método proposto [Frozza 06] 15

A Ferramenta de Interoperabilidade Semântica...... 16

Trabalhos Futuros 17

18

Referências Bibliográficas [DORNELES 04] DORNELES, Carina F. et al. Measuring Similarity between Collection of Values. In: ACM INTERNATIONAL WORKSHOP ON WEB INFORMATION AND DATA MANAGEMENT (WIDM), Nov. 12-13. Proceedings, Washington DC, USA. ACM, 2004. p 56-63. [DORNELES 05] DORNELES, Carina F.; HEUSER, Carlos A.; PADILHA, Alvaristo A. Suporte a Argumentos de Consulta Vagos Através da XPath. UFRGS Instituto de Informática. Porto Alegre. 2005. [FROZZA 06] FROZZA, Angelo Augusto; MELLO, Ronaldo dos Santos. Interoperabilidade entre Sistemas de Informações Geográficas: uma Abordagem Semântica. Florianópolis, 2006. [GML 04] COX, Simon et al. OpenGIS Geography Markup Language (GML) Implementation Specification. OpenGIS Recomendation Paper. 2004. 601p. [HESS 04] HESS, Guillermo Nudelman. Unificação Semântica de Esquemas Conceituais de Bancos de Dados Geográficos. Porto Alegre: UFRGS, 2004. 110p. Dissertação (mestrado) - Universidade Federal do Rio Grande do Sul, Programa de Pós Graduação em Computação, Porto Alegre, 2004. [JDOM 06] HUNTER, Jason et al. JDOM v1.0 API Specification. Disponível em <http://www.jdom.org/docs/apidocs/> Acesso em jun. 2006. 19

[OWL 04] MCGUINNESS, Deborah L.; VAN HARMELEN, Frank. OWL Web Ontology Language Overview. 2004. Disponível em: <http://www.w3.org/tr/owl-features/> Acesso em: jun. 2006. [SILVA 03] BUSQUIM E SILVA, Rovedy A. Interoperabilidade na representação de dados geográficos: GEOBR e GML 3.0 no contexto da realidade dos dados geográficos no Brasil. São José dos Campos. 146p. Dissertação (mestrado). INPE. 2003. [DUARTE 00] DUARTE, Kátia C.;FALBO, Ricardo de A. Uma Ontologia de Qualidade de Software. Mestrado em Informática. Vitória, UFES 2000. [WIKI 06-1] Ontology (computer science) Wikipedia. Disponível em: <http://en.wikipedia.org/wiki/ontology_%28computer_science%29> Acesso em jul. 2006. 20

Anexos -código - fonte 21