Publicação de Dados Governamentais no Padrão Linked Data 1.4 Linked Data Karin Breitman José Viterbo Edgard Marx Percy Salas LA C Laboratory for Advanced Collaboration
Objetivo deste módulo 1.Apresentar os conceitos relacionados ao padrão Linked Data; 2
Sumário 1.Introdução 2.Motivação 3.Princípios 4.Características 5.Aplicações 3
Páginas web tradicionais Espaço de informação global único Search Engines Web Browsers 2. URLs são usadas como: IDs globalmente únicas Mecanismo de recuperação de informação HTML HTML HTML hyperlinks A 4 B C 3. HTML como formato de compartilhamento de informação 4. Hyperlinks
Problema e Solução Problema Como o conteúdo da Web é apenas fracamente estruturado, é difícil para aplicações realizarem tarefas inteligentes com essas informações. Solução Melhorar a estrutura do conteúdo da Web 5
APIs e Mashups 6
APIs e Mashups Mashup Up Desvantagens Web API Web API Web API Web API 2. APIs provide proprietary interfaces Mashups are based on a fixed set of data sources. A 7 B C D 4. You can not set hyperlinks between data objects.
APIs compartimentam a Web 8 Imagem: Bob Jagensdorf, http://flickr.com/photos/darwinbell/, CC-BY
Linked Data Usa tecnologias da Web Semântica para: Publicar dados estruturados na Web, Estabelecer links entre dados de uma fonte para outras. link A 9 links B links C links D E
Princípios de Linked Data 1. Usar URIs como nomes para os itens. 2. Usar URIs HTTP para que as pessoas possam consultar esses nomes. 3. Quando alguém consulta uma URI, prover informação útil. 4. Incluir sentenças com links para outras URIs, a fim de permitir que itens relacionados possam ser descobertos. Tim Berners-Lee 2007 http://www.w3.org/designissues/linkeddata.html 10
Modelo de dados pd:cygri rdf:type foaf:name foaf:based_near 11 foaf:person Richard Cyganiak dbpedia:berlin
Identificando itens com URIs HTTP pd:cygri rdf:type foaf:name foaf:based_near foaf:person Richard Cyganiak dbpedia:berlin pd:cygri = http://richard.cyganiak.de/foaf.rdf#cygri dbpedia:berlin = http://dbpedia.org/resource/berlin 12
Resolvendo URIs na Web pd:cygri rdf:type foaf:name foaf:based_near foaf:person 3.405.259 Richard Cyganiak dp:population dbpedia:berlin skos:subject dp:cities_in_germany 13
Dereferenciando URIs na Web pd:cygri rdf:type foaf:name foaf:based_near foaf:person 3.405.259 Richard Cyganiak dp:population dbpedia:berlin skos:subject dbpedia:hamburg dbpedia:muenchen 14 skos:subject dp:cities_in_germany skos:subject
The Disco Hyperdata Browser 15
The Disco Hyperdata Browser 16
Propriedades Qualquer um pode publicar dados Entidades são conectadas por links O grafo de dados globais se espalha por diversas fontes e permitem a descoberta de novas fontes de dados. Dados são auto-descritos Se uma aplicação encontra dados representados com um vocabulários desconhecido, a aplicação pode resolver as URIs que identificam termos deste vocabulário para achar suas definições S ou OWL. A Web de Dados é aberta Significa que aplicações podem descobrir novas fontes de dados durante tempo de execução seguindo os links. 17
Implementação É assim mesmo? link A 18 links B links C links D E
Projeto Linking Open Data/W3C Esforço da comunidade de pesquisa para: Publicar conjuntos de dados de licença aberta existentes como Linked Data na Web Interconectar itens entre diferentes fontes de dados 19
Dados disponíveis / maio - 2007 Mais de 500 milhões de triplas Cerca de 120 mil links entre fontes de dados 20
Examplo de links Links da DBpedia para outra fonte <http://dbpedia.org/resource/berlin> owl:sameas <http://sws.geonames.org/2950159>. <http://dbpedia.org/resource/tim_berners-lee> owl:sameas <http://www4.wiwiss.fuberlin.de/dblp/resource/person/100007>. 21
Dados disponíveis / julho - 2009 22
Estatísticas / julho - 2009 Domínio Triplas Mídia Publicações Ciências 698.000.000 212.000.000 2.429.000.000 Dados geográficos Links % 0,8% 3,3% 89,4% 3.097.000.000 10,4% 1.238.000 3,2% 4.922.000 36,1% 133.199.00 0 46,0% 4.038.000 76.000.000 1,1% 1.559.000 1,0% 3,2% 3.992.000 148.948.00 0 + 2 bilhões de triplas publicadas pelo Data.gov 2,7% Conteúdo de usuários Cross-Domain Total 23 % 214.000.000 6.726.000.000 2,7%
Aplicações Linked Data Browsers Linked Data Mashups Thing Thing Thing Thing Thing Thing Thing Thing Thing Thing typed links A 24 Search Engines typed links B typed links C typed links D E
Browsers para Linked Data Tabulator Browser (MIT, USA) Marbles (FU Berlin, DE) OpenLink Browser (OpenLink, UK) Zitgist Browser (Zitgist, USA) Humboldt (HP Labs, UK) Disco Hyperdata Browser (FU Berlin, DE) Fenfire (DERI, Irland) 25
Browsers: Marbles 26
Mashups Aplicações específicas para um determinado domínio que utilizam Linked Data 27
DBpedia em dispositivos móveis Geospatial entry point into the Web of Data Starts with DBpedia, Revyu and Flickr data 28
DERI Semantic Web Pipes 29
Mecanismos de busca de dados Falcons (IWS, China) Sig.ma (DERI, Ireland) Swoogle (UMBC, USA) VisiNav (DERI, Ireland) Watson (Open University, UK) 30
Mecanismos de busca: Falcons 31
Mecanismos de busca: VisiNav 32
Mecanismos de busca: SIG.MA 33
Participação das grandes empresas Yahoo! e Google já começaram a pesquisar dados no padrão Linked Data, na forma a serializada e também como Microformats. Yahoo! Provê accesso a dados através da API Yahoo BOSS Usa esses dados no Yahoo Search Monkey para tornar os resultados de busca mais úteis e com maior apelo visual. Google Usa dados para sua API Social Graph Planeja usar esses dados para melhorar o resultado da busca sobre resenhas e pessoas. 34
Yahoo! Search Monkey 35
Próximos passos Mais dados se tornam disponíveis... Dados dos governos americano e britânico Dados bibliográficos via Open Archives ORE O que falta? 36
Principais Referências Christian Bizer, Tom Heath, Tim Berners-Lee. Linked Data The Story So Far. Disponível em: http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf Linking Open Data Project Wiki. Disponível em: http://esw.w3.org/topic/sweoig/taskforces/communityprojects/linkingopendata Christian Bizer, Richard Cyganiak, Tom Heath. Tutorial How to Publish Linked Data on the Web. Disponível em: http://www4.wiwiss.fu-berlin.de/bizer/pub/linkeddatatutorial 37