Estudo sobre Recuperação de Informações Geográficas

Tamanho: px
Começar a partir da página:

Download "Estudo sobre Recuperação de Informações Geográficas"

Transcrição

1 UNIVERSIDADE CATÓLICA DE PELOTAS ESCOLA DE INFORMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA Estudo sobre Recuperação de Informações Geográficas por Cleber Gouvêa Trabalho Individual I TI-2007/2-05 Orientador: Prof. Dr. Stanley Loh Pelotas, Novembro de 2007.

2 2 Não sei pois nasci para isso e aquilo E o enguiço de tanto querer. Carpinteiro do universo inteiro eu sou, assim No final, carpinteiro de mim -- RAUL SEIXAS

3 3 SUMÁRIO LISTA DE ABREVIATURAS E SIGLAS... 4 LISTA DE FIGURAS... 5 LISTA DE TABELAS... 5 RESUMO INTRODUÇÃO RECUPERAÇÃO DE INFORMAÇÕES GEOGRÁFICAS Geo-Parsing Raciocício Espacial Extração do Contexto Geográfico de Textos Heurísticas Geo-Coding Web Semântica Geoespacial Ontologias Geográficas (Gazetteers) Índices Geográficos Ranking Avaliação em RIG Sistemas de Busca Geográfica (Exemplos) GeoTumba Spirit GEORREFERENCIAMENTO DE NOTÍCIAS Formato dos Textos Jornalísticos Métodos para Visualização de Notícias CONCLUSÃO e TRABALHOS FUTUROS REFERÊNCIAS BIBLIOGRÁFICAS... 49

4 4 LISTA DE ABREVIATURAS E SIGLAS ADL API CLEF GeoCLEF GeoRSS GKB GML GPS GRDDL IP MBR ODP OGC PLN REM RI RIG RLM RSS SIG SRI TGN W3C XHTML XML Alexandria Digital Library Application Programming Interface Cross-Language Evaluation Forum Geographic Cross-Language Evaluation Forum Really Simple Syndication Geográfico Geographic Knowledge Base Geography Markup Language Global Positioning System Gleaning Resource Descriptions from Dialects of Languages Internet Protocol Minimum Bounding Rectangle Open Directory Project Open Geospatial Consortium Processamento de Linguagem Natural Reconhecimento de Entidades Mencionadas Recuperação de Informações Recuperação de Informações Geográficas Retângulo de Limite Mínimo Really Simple Syndication Sistema de Informações Geográficas Sistema de Recuperação de Informações Getty Thesaurus of Geographic Names World Wide Web Consortium Extensible Hypertext Mark-up Language Extensible Markup Language

5 5 LISTA DE FIGURAS Figura 1: Principais Componentes da RIG Figura 2: Resultados de Técnicas para o Georreferenciamento de Textos Figura 3: Extração de Informação Geográfica na Web Figura 4: Representação de uma Localização Usando Pontos e Polígonos Figura 5: Exemplo de GeoRSS e GeoRSS com GML Figura 6: Exemplo de Microformato Geo Figura 7: Principais Componentes de um Gazetteer Figura 8: Esquema Conceitual da Ontologia de Lugar OMT-G Figura 9: Índice focado no Escopo Geográfico Figura 10: Proposta de Integração Geográfica e Temática Figura 11: Arquitetura do Sistema SPIRIT Figura 12: Design Conceitual da Ontologia Geografia do sistema SPIRIT Figura 13: Técnica Jornalística da Pirâmide Invertida Figura 14: Fase 1 da Visualização de Notícias na Web Figura 15: Fase 2 da Visualização de Notícias na Web Figura 16: Fase 3 da Visualização de Notícias na Web LISTA DE TABELAS Tabela 1: Classificação Binária dos Problemas na RI... 35

6 6 RESUMO Com o advento da Internet e o crescente número de informações disponíveis surge a necessidade de uma organização e estruturação desses dados como forma de atender as necessidades reais dos usuários. Vários esforços vêm sendo desenvolvidos com vistas ao desenvolvimento de uma Web Semântica. Com isso, em um mundo onde os conceitos de lugar e proximidade geográfica evoluem para uma desterritorialização criada por esses novos meios de comunicação, o conceito de informação relevante evolui na mesma medida, no sentido de valorizar não somente informações relacionadas ao usuário, mas também ao lugar e tempo em que ele se encontra. Como a Web têm grandes proporções de recursos relacionados a localizações geográficas é necessário recuperar e estruturar essas informações de forma a poder relacioná-las com o contexto e realidade das pessoas, através de métodos e sistemas automáticos. Para isso é necessário o estudo da Recuperação de Informações Geográficas, a qual conceitua um novo campo unindo às áreas tradicionais de Sistemas de Informações Geográfica e Recuperação de Informações e possibilita assim os primeiros passos de uma evolução da web como repositório de informações desestruturadas para um banco de dados de informações semânticas geo-espaciais. Palavras-chave: Recuperação de Informações, Recuperação de Informações Geográficas, Geotagging, Web Semântica Geo-espacial.

7 7 ABSTRACT With the coming of Internet and the crescent number of available information appears the need of an organization and structuring of those data as form of assisting the users' real needs. Several efforts have been developed with views to the development of a Semantic Web. With that, in a world where the place concepts and geographical proximity develop for a territory lack created by those new communication means, the concept of relevant information develops in the same measure in the sense of valuing not only information related to the user, but also at the place and time in that he meets. As the Web has great proportions of resources related to geographical locations is necessary to recover and to structure those form information to relate them with the context and the people's reality, through methods and automatic systems. For that it is necessary the study of the Geographical Information Retrieval, which considers a new area uniting to the traditional areas of Geographical Information Systems and Information Retrieval making possible the first steps of an evolution of the web as repository of structureless information for a database of geospatial semantic information. Palavras-chave: Information Retrieval, Geographical Information Retrieval, Geotagging, Geospatial Semantic Web.

8 8 1 INTRODUÇÃO Com a evolução das telecomunicações e dos meios de transporte as noções relacionadas aos espaços geográficos têm sido modificadas propondo uma atualização nos limites e subdivisões territoriais tradicionalmente aceitas. Para (Harvey, 1989 apud Câmara, 2000) os novos conceitos de espaço e tempo e seu impacto na experiência humana representam a mudança cultural mais importante nos anos recentes. Com o surgimento da Internet essa noção de espaço e tempo evolui ainda mais, onde fluxos (de capital, de informação, de imagens, sons e símbolos) passam a ser um componente essencial. (Castells,1999). Não impedindo no entanto que os indivíduos mantenham-se unidos por interesses e problemas devido a distância geográfica. Isso ajuda a representar uma desterritorialização que por sua vez traz o conceito de lugar imaginário (Lévy,1996), onde a localização e comunicação entre as pessoas é facilitada. Essa mudança no conceito de proximidade tem subvertido a lógica previsível de organização do espaço (Câmara, 2000) e consequentemente limitado a utilidade dos Sistemas de Informação Geográfica, o qual fazem uso de relações espaciais entre entidades geográficas definidas, seguindo a lei de Tobler, a qual define que: no mundo, todas as coisas se parecem, mas as coisas mais próximas são mais parecidas que aquelas mais distantes. (Tobler, 1979) Na internet a recuperação de informações proporcionada pelos sistemas de busca tem ajudado a indexar e representar os fluxos de informação facilitando e agilizando sua recuperação. Apesar de iniciativas recentes esses mecanismos, no entanto apresentam deficiência na recuperação de conteúdos semânticos, como por exemplo, informações geográficas relacionadas ao contexto (temporal e local) do usuário. Com isso, segundo (Larson, 1996) a falta e a demanda por uma pesquisa integrada entre os Sistemas de Informação Geográfica e a Recuperação de Informações tradicional, proporcionou a criação de uma nova área de pesquisa definida como Recuperação de Informações Geográficas, a qual combina também aspectos de banco de dados e interação homem máquina.

9 9 O processo de identificação do contexto geográfico de textos é denominado de geotagging (Amitay, 2004) e envolve duas etapas principais, o geo-parsing e o geocoding (ou gecodificação). (McCurley, 2001) A fase de geo-parsing envolve a identificação das entidades geográficas (diretas e indiretas) presentes no texto por meio da análise do seu conteúdo ou de informações relativas ao servidor em que ele se encontra armazenado. As técnicas mais utilizadas empregam a análise do texto, para isso baseiam-se em heurísticas ou em técnicas de Inteligência Artificial como o Reconhecimento de Entidades Nomeadas (NER) e o Aprendizado de Máquina. Já a fase de geo-codificação tem o objetivo de identificar o contexto ou extensão geográfica do texto (footprint) por meio de coordenadas geográficas (latitude e longitude). Para isso faz uso de ontologias geográficas ou gazetteers, os quais integram técnicas de representação do conhecimento (Câmara, 2000) e ajudam a estabelecer correspondências e relações entre os diferentes domínios de entidades espaciais. (Smith et al., 1998 apud Câmara, 2000). Outro desafio importante é a identificação do contexto geográfico de consultas visando o seu georreferenciamento. Em sistemas de RIG as consultas segundo (Martins et al., 2006) são compostas de três componentes: O quê, o qual indica o que o usuário está procurando, Onde que representa a área geográfica de interesse e uma relação geográfica a qual relaciona os dois outros componentes. Atualmente através da Web Semântica iniciativas têm surgido visando a representação e estruturação distribuída de conhecimento na web. (Berners-Lee et al., 2001). Esse fato têm sido particularmente útil para a RIG, visto que alguns formatos como o GeoRSS e o GML são exclusivos para representar o conhecimento geográfico. Esse fato, unido com a popularização de serviços de navegação geográfica (geobrowser) e das API públicas as quais distribuem os mais variados tipos de informação, tem ajudado a popularizar o processo de anotação do Planeta (Udell, 2005 apud Scharl, 2007). Possibilitando assim a contextualização de conteúdos diversos e a sua visualização por meio de mapas, os quais segundo (Morris, 1988 apud Cai, 2002) apresentam maior preferência pelos usuários do que simples menus textuais. Isso tudo vêm contribuindo para os primeiros passos da Web Semântica Geo-espacial, a qual segundo (Egenhofer, 2002) por proporcionar a representação semântica em variados processos da recuperação de informações irá permitir aos usuários recuperar mais

10 10 precisamente as informações pretendidas baseando-se na semântica associada a essas informações. O presente trabalho tem o objetivo, portanto de descrever em mais detalhes a área da Recuperação de Informações Geográficas e está dividido da seguinte forma: na seção 2 contextualiza-se a área de RIG com os principais desafios, etapas e perspectivas futuras. Na seção 3 ilustram-se as características das informações jornalísticas e os desafios da RIG focada exclusivamente nesse tipo de conteúdo, os quais serão motivo de estudo e desdobramento desse trabalho. Por fim na seção 4 apresentam-se as principais conclusões completando com os trabalhos futuros pretendidos após a realização do trabalho.

11 11 2 RECUPERAÇÃO DE INFORMAÇÕES GEOGRÁFICAS Desde o surgimento dos primeiros Sistemas de Informação Geográfica na década de 1960 no Canadá até os dias atuais a Recuperação de Informações Geográfica (RIG) têm evoluído e ganhado cada vez mais importância. Com o surgimento da web e com enorme quantidade de informações não estruturadas ou semi-estruturadas (Abiteboul et al., 2000 apud Borges et al., 2003) disponíveis atualmente, surge a necessidade do uso de tecnologias semânticas para a obtenção de informações relevantes visando evitar assim problemas como a sobrecarga de informações (information overload). (Perry et al., 2007) Os algoritmos de recuperação de informação desenvolvidos tradicionalmente para lidar com coleções pequenas de documentos (Arasu et al., 2001) tiveram, portanto, que adaptar-se ao ambiente dinâmico e geograficamente distribuído da Internet, assim como com a sintaxe específica das informações presentes na web. Segundo (Larson, 1996) a área de Recuperação de Informação Geográfica (RIG) pode ser vista como um ramo da área de Recuperação de Informação tradicional, incluindo todas suas áreas de pesquisa mas enfatizando a recuperação e indexação de informações geográficas e espaciais. O objetivo é lidar com todos os problemas da recuperação de informações que contenham algum tipo de consciência espacial (spatial awareness), ou seja, que incluam referências geográficas (georreferências) as quais são essenciais para o significado da consulta, por exemplo: encontre-me hotéis interessantes e baratos próximos a Madrid. (Lana-Serrano et al., 2007) A recuperação de informações na web se dá por meio dos mecanismos de busca, que consultam os sites e através da análise do seu conteúdo desenvolvem métodos próprios de classificação de propósito geral como o PageRank (Page et al., 1999) ou focados em conteúdos específicos, como por exemplo o CiteSeer (Giles et al., 1998). No entanto os sistemas de busca tradicionais não apresentam suporte para informações contextuais, analisando o conteúdo da página ou as ligações entre seus hiperlinks, mas não possibilitando a verificação de informações semânticas, como por exemplo a localidade referenciada pelos textos, impedindo assim a verificação de informações dentro ou próximo a determinadas regiões geográficas. (Buyukkokten et. al., 1999)

12 12 Uma larga proporção da informação presente na web pode ser incluída dentro do espaço geográfico e, como consequência, muitos usuários desejariam especificar nomes geográficos de lugares como parte das consultas (queries). (Jones, 2001) Web Sites que contém por exemplo, informações sobre restaurantes, teatros e cinemas são mais interessantes para usuários vizinhos dessas localidades (Buyukkokten et. al., 1999). Variadas informações como as jornalísticas (tempo, condições de tráfego) também são mais úteis se diretamente relacionadas com a região em que ocorrem. Consultas que incluem pelo menos um termo relacionado a geografia, como nomes de lugar e feições naturais (ex., praia, serra ), são hoje um subconjunto significativo das consultas submetidas aos mecanismos de busca (Sanderson et al., 2004 apud Borges, 2006). O caráter semi-estruturado da web dificulta, no entanto o acesso a informações geográficas. (Jones et al., 2006) relaciona as principais dificuldades no uso da web como fonte de informações geográficas: O contexto Geográfico é incluído junto das descrições via linguagem natural. Nomes de lugares são ambíguos e confundidos com nomes de organizações, pessoas, construções e ruas. Dependência de presença e relação com os termos do texto. Interpretação das relações espaciais ( próximo, ao oeste, etc). Construção de ranking específico para definição da relevância geográfica. Visando solucionar esses problemas e trazer à web todas as vantagens relacionadas a descrição semântica e geográfica das informações, técnicas têm sido desenvolvidas tanto em ambiente acadêmico como comercial visando acessar recursos com base em seu contexto geográfico. (Gey, 2005 e Jones, 2003 apud Martins et al., 2006) De acordo com (Santos et al., 2006) a RIG pressupõe o seguinte: a possibilidade de associar à coleção de documentos, informações geográficas. a existência ou a possibilidade de criação de repositórios semânticos (ontologias geográficas) que permitam a inferência geográfica (geographical reasoning). Com isso segundo (Larson,1996) a RIG está relacionada com a recuperação de

13 13 informações determinística (por exemplo para encontrar todos os documentos relacionados a determinada coordenada geográfica) e com a recuperação de informações probabilística (por exemplo para encontrar todas as cidades próximas a um determinado rio). O processo de georreferenciamento de textos, também definido como geotagging, possui de forma geral os componentes apresentados conforme a figura 1. Interface do Usuário Documentos Crawler Resultado Ordenado Querie Geo Parsing Geo Coding FootPrints (Extensão) Ranking Geo Ontologia Gazetteer Índice Espacial Doc X Pos. Espacial Figura 1: Principais Componentes da RIG Diferente dos modelos de recuperação de informação tradicionais como o modelo Vetorial (Salton, 1989) que representa os documentos como índices de termos (posição x freq) relacionados ao conteúdo parcial ou integral do texto, na RIG os termos extraídos como índices devem ser relacionados a descrições espaciais, ou seja, a entidades geometricamente definidas e localizadas no espaço (De Floriani, 1993 apud Larson, 1996) Os processos de reconhecimento do contexto geográfico de textos e a definição

14 14 de coordenadas espaciais (latitude, longitude, etc) são definidos respectivamente como geo-coding (ou geo-codificação) e geooparsing (McCurley, 2001). Os índices dos arquivos podem também ser estruturados conforme um lista invertida (Li et al., 2006 e Andrade et al, 2006), com a diferença que a lista agora apresenta as relações espaciais (documentos X contexto geográfico) em vez de relacionar apenas as palavras com os documentos em que elas ocorrem. O processo de ranking por sua vez tem o objetivo de ordenar os resultados de acordo com o grau de associação com a localidade espacial exposto na consulta. O componente mais importante é a ontologia geográfica ou gazetteer que é organizada em uma estrutura hierárquica (Fonseca et al, 2000) codificando termos geográficos e relacionamentos semânticos (Tochtermann, 1997) e tornando-se uma das melhores formas de representação do mundo geográfico (Fonseca et al., 2000). Cada componente será melhor detalhado nos capítulos seguintes. 2.1 Geo-Parsing A extração do contexto geográfico de textos envolve vários desafios. Os próximos capítulos têm o objetivo de ilustrar os principais problemas, desafios e as técnicas atualmente empregadas. Primeiramente buscamos descrever qual é o tipo de informação e como ela pode estar presente dentro dos textos, após será detalhado os principais métodos utilizados para extração propriamente dita. Por último são ilustradas as heurísticas mais comuns utilizadas para a identificação geográfica de textos Raciocício Espacial Raciocínio espacial (spatial reasoning) é o termo usado para denotar inferências sobre relacionamentos espaciais entre objetos no espaço, usando um subconjunto conhecido de relações espaciais. Este tipo de raciocínio permite fazer predições e diagnósticos. O raciocínio espacial pode ser classificado como quantitativo e qualitativo, dependendo do tipo de informação usada no processo de raciocínio. (Rodríguez, 2002 apud Borges, 2006) Segundo (Frank, 1996), geográfos utilizam-se extensivamente de "raciocínio espacial" em espaços de larga escala, ou seja, espaços que não podem ser vistos ou compreendidos sob um único ponto de vista. O "raciocínio espacial" diferencia diversas

15 15 relações espaciais, por exemplo relações topológicas ou métricas, e é tipicamente formalizado usando um sistema de coordenadas cartesianas e álgebra vetorial. Este processamento quantitativo da informação é claramente distinto da forma como as pessoas interpretam relações espaciais. Assim, processos de raciocínio qualitativo tornam-se necessários em, por exemplo, sistemas especialistas espaciais e SIG s. O "raciocínio espacial" qualitativo é amplamente utilizado por seres humanos para entenderem e analisarem um ambiente espacial, quando a informação disponível está na forma qualitativa, como ocorre em documentos textuais. As pessoas pensam e se comunicam a respeito do mundo em termos de conceitos vagos, que são imprecisos ou probabilísticos, como, por exemplo, centro da cidade, perto de, nos arredores de (Montello, 2003 apud Borges, 2006) As pessoas raramente dizem o restaurante está a 35,93 metros a oeste, por outro lado fornecem algumas instruções qualitativas como o restaurante está à direita, a duas quadras da rodovia. (Borges, 2006) (Egenhofer, 1995) apresenta também a geografia do cotidiano (naïve geografia), a qual é uma disciplina com o objetivo de capturar e refletir o jeito que as pessoas pensam e raciocinam a respeito do espaço e tempo geográfico, tanto consciente como subconscientemente. Nas ontologias geográficas (capítulo 2.2.2) esses termos são associados ou relacionados a features (ou entidades) os quais eles representam. A ISO define feature como um objeto com significado em um domínio selecionado do discurso. No contexto geográfico, países, cidades e ruas são exemplos desses objetos. Exemplos de features são Rua Bento Gonçalves e Arroio São Lourenço, os quais seriam representados respectivamente pelas features de nome Bento Gonçalves e São Lourenço e pelas features de tipo Rua e Arroio Extração do Contexto Geográfico de Textos Para entendermos como é possível extrair o contexto geográfico de textos a partir da análise de seu conteúdo é necessário primeiramente analisar como as relações espaciais são determinadas para relacionar lugares ou espaços geográficos na Terra. As 1

16 16 relações espaciais são comumente agrupadas segundo (Egenhofer et al., 1991) em três categorias: Topológicas: descrevem os conceitos de vizinhança, incidência, sobreposição sem variar com escalas e rotações (ex. dentro de). Métricas: são consideradas em termos de direções (orientações no espaço = ao leste, ao oeste...) e distâncias (dependem de definições métricas = perto de) De Ordem: expressam a ordem, total ou parcial, dos objetos espaciais (em frente a, acima de) No entanto, embora seguindo determinados padrões relacionados as referências espaciais, outra característica é que as entidades geográficas podem estar também mencionadas no texto de forma implícita (quando apresenta relação topológica) ou explícita (quando aparece de forma direta no texto). (Li et al., 2006) Já (Borges et al., 2003) define as informações espaciais que não possuem associação direta com coordenadas geográficas (ceps, telefones...) como referências espaciais indiretas. No entanto, não basta encontrar as informações espaciais no texto, visto que a vasta maioria dos nomes encontrados na Web apresentam algum tipo de ambigüidade (SMITH et. al., 2001 apud Amitay et al., 2004). Segundo (Amitay et al., 2004) as ambigüidades podem ser de dois tipos: geo/geo (ex: lugares com o mesmo nome) e geo/não-geo (lugares que apresentam também uma referência não geográfica). (Larson, 1996) incluí também que os nomes podem mudar ao longo do tempo por mudanças políticas e por outras convenções. Para superar esses problemas (Amitay et al., 2004 apud Borges, 2006) apresenta as duas abordagens principais para o reconhecimento do contexto geográfico em páginas da Web. A primeira abordagem, chamada de Geografia da Fonte (Source Geography) é relacionada com a origem das páginas e utiliza os elementos de infraestrutura da Internet para obtenção de informações sobre a localização física dos servidores onde esses documentos estão hospedados. A segunda abordagem, denominada Geografia do Alvo (Target Geography), é baseada no conteúdo das páginas, utilizando elementos nelas contidos para deduzir uma ou mais localizações encontradas em seus textos. Esses elementos consistem em nomes de lugar,

17 17 coordenadas geográficas, códigos postais e endereços que são usados para classificar e indexar as páginas. Os trabalhos publicados geralmente apresentam estratégias híbridas, evolvendo ambos os tipos de geografia. Alguns exemplos de uso da geografia de fonte pode ser encontrada nos seguintes trabalhos (Wang et al, 2005) (Pyalling et al., 2006), (Zhang, 2006) os quais recuperam a localização geográfica de documentos por dados relacionados ao IP do servidor e outras informações contidas em órgãos como a Internic ou Registro.br ou regras relacionadas ao nome ou posição do site dentro do contexto geográfico do conjunto de sites de seu domínio. Um dos problemas dessas técnicas é que nem sempre o conteúdo da página condiz com o lugar onde ela está armazenada, o que traz desvantagens com relação a geografia do alvo. Os trabalhos envolvendo o georreferenciamento de textos a partir do seu conteúdo utilizam técnicas especias. Dentro da área de Geografia de Alvo o Reconhecimentos de Entidades Mencionadas (REM) têm sido bastante utilizado pra suportar a extração e organização de textos de acordo com seu contexto geográfico. O Reconhecimento de Entidades Mencionadas é o problema relacionado à identificação de nomes próprios em um texto e sua posterior classificação dentro de várias categorias de interesse ou em uma categoria padrão chamada Outros. Há três categorias principais: Pessoas, Organizações e Localizações, algumas das categorias adicionalmente incluídas mas menos usuais são: Tempo, Evento, Coisa e Valor. (Duarte et al., 2006) Embora o Reconhecimento de Entidades Mencionadas (REM) seja uma subárea característica da Extração de Informações o problema da identificação de entidades geográficas apresenta-se com maior complexidade devido às normalizações necessárias para tornar os nomes de lugares identificados únicos. Isso envolve desambiguar referências com respeito a seu tipo (rua, país) e relacionar elas a características na ontologia geográfica. (Martins et al., 2005) (Amitay et al, 2004) apresenta as técnicas de aprendizado de máquina, processamento de linguagem natural e grounding como as principais relacionadas a

18 18 identificação de lugares geográficos nos textos, citando variados trabalhos relacionados a cada uma. Técnicas de machine learning utilizam técnicas de indução (a partir de exemplos fornecidos) visando a geração semi-automática de wrappers. As técnicas de linguagem natural utilizam regras de extração baseadas em restrições sintáticas e semânticas existentes nos documentos (Como Rua..., Endereço..., Dr..., Telefone...). Já as técnicas de grounding baseiam-se em REM com a característica adicional de utilizar gazetteers para o apoio na extração de termos geográficos. (Amitay et al, 2004) relata também que a maioria dos algoritmos publicados não utiliza técnicas de aprendizado de máquina (devido a seu custo e restrições de dados específicos) mas sim heurísticas relacionadas ao processamento de linguagem natural. Técnicas de aprendizado de máquina podem ser encontradas em (McNamee et al., 2002; Malouf, 2002), de PLN em (Silva et al., 2006; Clough, 2005) já as técnicas de grounding são utilizadas nos trabalhos de (Li et al, 2002; Li et al., 2003) Algumas das técnicas utilizadas relacionadas ao aprendizado de máquina são: Support Vector Machines e Hidden Markov Models., as quais são melhor ilustradas em (Duarte et al., 2006) A importância da utilização de gazetteers visando encontrar georreferencias em textos é discutida por vários trabalhos. Mikheev mostra que uma simples comparação de textos com gazetteers apresenta resultados interessantes, no entanto para outras entidades não seria necessário o seu uso (Mikheev et al., 1999 apud Martins et al., 2005). (Malouf, 2002) verificou também que gazetteer não aumentam a performance, já (Carreras et al., 2002 apud Silva et al., 2005) percebeu melhoras significativas na utilização de gazetteers associados a certos padrões. (Silva et al., 2006) propõe relacionar as páginas de acordo com seu escopo geográfico para isso ele utiliza heurísticas e uma ontologia própria GKB (melhor detalhada no capítulo 2.2.2) para analisar a hierarquia das entidades geográficas, determinando a relevância segundo um algoritmo similar ao PageRank (Page et al.,1999) Como a tarefa de recuperar referências em documentos é diferente de recuperar documentos a partir de consultas (queries), visto que as consultas são geralmente curtas

19 19 e não constituem nomes próprios, alguns trabalhos visam identificar e relacionar documentos de acordo com as consultas informadas, dentre eles (Martins et al., 2006; Graupmann et al., 2006) (Borges, 2006) apresenta um resumo das principais técnicas apresentadas no georreferenciamento de textos na web. Já (Martins et al., 2005) ilustra os resultados encontrados por alguns trabalhos relacionados ao georreferenciamento de textos e de acordo com determinadas métricas, conforme a figura 2. Figura 2: Resultados de Técnicas para o Georreferenciamento de Textos (Borges, 2006) apresenta um exemplo de geo-parsing. De acordo com a autora o reconhecimento dos componentes (geo-parsing) do endereço Rua Gamboa de Cima, Gamboa - Cep Fone: (71) pode ser feito utilizando-se os seguintes padrões: (1) Endereço Básico + CEP, (2) Endereço Básico + Telefone, (3) CEP, (4) Telefone e (5) Endereço Básico + CEP + Telefone. Por exemplo, se opadrão utilizado for Endereço Básico + CEP será reconhecido o endereço RuaGamboa de Cima, 236, o complemento - Gamboa - e o CEP Já se o padrão utilizado for Endereço Básico + Telefone será reconhecido o endereço Rua Gamboa de Cima, 236, o complemento - Gamboa - Cep e o telefone (71) Neste caso, uma vez que - Gamboa - Cep ocupa menos de 30 posições e o padrão utilizado procura por um telefone após o endereço, o CEP será considerado como um complemento. O endereço completo é reconhecido pelo padrão Endereço Básico + CEP + Telefone. O trabalho de Morimoto et al. (Morimoto et al., 2003 apud Borges, 2006) conforme ilustra a figura 3, apresenta o problema da extração de conhecimento espacial a partir do conteúdo da Web. Partindo do princípio que páginas comerciais na Web

20 20 normalmente contêm endereço, telefone e também descrições dos produtos e serviços oferecidos. Figura 3: Extração de Informação Geográfica na Web Heurísticas Para apoiar o processo de extração de informações geográficas, vários sistemas utilizam observações ou padrões relacionados ao georreferenciamento de textos, dentre as heurísticas mais importantes pode-se citar: Uma referência por discurso assume que um lugar mencionado em um texto refere-se a mesma localidade durante todo o texto da mesma forma que uma palavra pode conter determinado sentido durante o texto inteiro. (Gale et al., 1992) No caso onde lugares distintos são mencionados na mesma parte do texto, a menor região capaz de abranger toda a área representa a localidade geográfica. Nomes de Lugares presentes em um contexto específico (por exemplo no mesmo

Uma Abordagem para o Enriquecimento de Gazetteers a partir de Notícias visando o Georreferenciamento de Textos na Web

Uma Abordagem para o Enriquecimento de Gazetteers a partir de Notícias visando o Georreferenciamento de Textos na Web UNIVERSIDADE CATÓLICA DE PELOTAS CENTRO POLITÉCNICO PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA Uma Abordagem para o Enriquecimento de Gazetteers a partir de Notícias visando o Georreferenciamento de Textos

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

Uma introdução à Web Semântica no domínio dos Sistemas de Informações Geográficas

Uma introdução à Web Semântica no domínio dos Sistemas de Informações Geográficas Uma introdução à Web Semântica no domínio dos Sistemas de Informações Geográficas Angelo Augusto Frozza, Rodrigo Gonçalves {frozza,rodrigog}@inf.ufsc.br Universidade Federal de Santa Catarina UFSC Florianópolis

Leia mais

LOCUS: UM LOCALIZADOR ESPACIAL URBANO

LOCUS: UM LOCALIZADOR ESPACIAL URBANO LOCUS: UM LOCALIZADOR ESPACIAL URBANO Ligiane A. de Souza, Tiago M. Delboni, Karla A. V. Borges,2, Clodoveu A. Davis Jr.,2 e Alberto H. F. Laender UFMG Universidade Federal de Minas Gerais Departamento

Leia mais

Geoprocessamento e Padrões OGC

Geoprocessamento e Padrões OGC Geoprocessamento e Padrões OGC Martin Pereira 36 slides Agenda Geoprocessamento Definição Histórico SIG OGC Definição Importância Histórico Padrões Slide 2 de 36 Geoprocessamento Definição Disciplina do

Leia mais

3 Ferramentas de busca

3 Ferramentas de busca 3 Ferramentas de busca A Internet se transformou em um vasto repositório de informações. Podemos encontrar sites sobre qualquer assunto, de futebol a religião. O difícil, porém é conseguir encontrar a

Leia mais

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperação de Informação GSI521 Prof. Rodrigo Sanches Miani FACOM/UFU Introdução Organização e Recuperação de Informação(GSI521) Tópicos Recuperação de informação (RI); Breve histórico; O

Leia mais

Concepção e Desenvolvimento de Interfaces para o Motor de Busca Geográfico GeoTumba!

Concepção e Desenvolvimento de Interfaces para o Motor de Busca Geográfico GeoTumba! Concepção e Desenvolvimento de Interfaces para o Motor de Busca Geográfico GeoTumba! Sérgio Freitas, Ana Paula Afonso, Mário Silva Faculdade de Ciências da Universidade de Lisboa Departamento de Informática

Leia mais

LOCUS: Um Sistema de Localização Geográfica Através de Referências Espaciais Indiretas

LOCUS: Um Sistema de Localização Geográfica Através de Referências Espaciais Indiretas LIGIANE ALVES DE SOUZA LOCUS: Um Sistema de Localização Geográfica Através de Referências Espaciais Indiretas Dissertação apresentada ao Curso de Pós-Graduação em Ciência da Computação da Universidade

Leia mais

Web Semântica e Matching de Ontologias: Uma Visão Geral

Web Semântica e Matching de Ontologias: Uma Visão Geral Web Semântica e Matching de Ontologias: Uma Visão Geral Hélio Rodrigues de Oliveira Departamento de Computação Universidade Federal do Ceará heliorodrigues@lia.ufc.br Bernadette Farias Lóscio Departamento

Leia mais

GEOPROCESSAMENTO. Herondino Filho

GEOPROCESSAMENTO. Herondino Filho GEOPROCESSAMENTO Herondino Filho Sumário 1. Introdução 1.1 Orientações Avaliação Referência 1.2 Dados Espaciais 1.2.1 Exemplo de Dados Espaciais 1.2.2 Aplicações sobre os Dados Espaciais 1.3 Categoria

Leia mais

Diferenças entre Sistemas Gerenciadores de Banco de Dados para GIS - SGBDs

Diferenças entre Sistemas Gerenciadores de Banco de Dados para GIS - SGBDs Diferenças entre Sistemas Gerenciadores de Banco de Dados para GIS - SGBDs O objetivo deste documento é fazer uma revisão bibliográfica para elucidar as principais diferenças entre os SGBDs, apontando

Leia mais

Introdução ao SIG. Objetivos Específicos 18/11/2010. Competência: Apresentar: Utilidade de um SIG

Introdução ao SIG. Objetivos Específicos 18/11/2010. Competência: Apresentar: Utilidade de um SIG MINISTÉRIO DO MEIO AMBIENTE - MMA INSTITUTO CHICO MENDES DE CONSERVAÇÃO DA BIODIVERSIDADE - ICMBio DIRETORIA DE PLANEJAMENTO, ADMINISTRAÇÃO E LOGÍSTICA - DIPLAN COORDENAÇÃO GERAL DE GESTÃO DE PESSOAS -

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

2 Conceitos Gerais de Classificação de Documentos na Web

2 Conceitos Gerais de Classificação de Documentos na Web Conceitos Gerais de Classificação de Documentos na Web 13 2 Conceitos Gerais de Classificação de Documentos na Web 2.1. Páginas, Sites e Outras Terminologias É importante distinguir uma página de um site.

Leia mais

Indexação e Recuperação de Imagens por Conteúdo. Cleigiane Lemos Josivan Reis Wendeson Oliveira

Indexação e Recuperação de Imagens por Conteúdo. Cleigiane Lemos Josivan Reis Wendeson Oliveira Indexação e Recuperação de Imagens por Conteúdo Cleigiane Lemos Josivan Reis Wendeson Oliveira 1 Content-based Image Retrieval (CBIR) 2 Roteiro Introdução Arquitetura Extração de Características Indexação

Leia mais

Sistemas de Informação Geográfica Prof. Tiago Eugenio de Melo, MSc.

Sistemas de Informação Geográfica Prof. Tiago Eugenio de Melo, MSc. Sistemas de Informação Geográfica Prof. Tiago Eugenio de Melo, MSc. SUMÁRIO Apresentação da ementa Introdução Conceitos Básicos de Geoinformação Arquitetura de SIGs Referências Bibliográficas APRESENTAÇÃO

Leia mais

Dublin Core e MARC 21 : um estudo de correspondência de elementos de metadados

Dublin Core e MARC 21 : um estudo de correspondência de elementos de metadados Dublin Core e MARC 21 : um estudo de correspondência de elementos de metadados Maria das Dores Rosa Alves¹, Marcia Izabel Fugisawa Souza¹ ¹Embrapa Informática Agropecuária Caixa postal 6014 Campinas, SP

Leia mais

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS ISBN 978-85-61091-05-7 Encontro Internacional de Produção Científica Cesumar 27 a 30 de outubro de 2009 RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS Marcello Erick Bonfim 1

Leia mais

XML e Banco de Dados. Prof. Daniela Barreiro Claro DCC/IM/UFBA

XML e Banco de Dados. Prof. Daniela Barreiro Claro DCC/IM/UFBA XML e Banco de Dados DCC/IM/UFBA Banco de Dados na Web Armazenamento de dados na Web HTML muito utilizada para formatar e estruturar documentos na Web Não é adequada para especificar dados estruturados

Leia mais

PLATAFORMA URBANMOB Aplicativo para captura de trajetórias urbanas de objetos móveis

PLATAFORMA URBANMOB Aplicativo para captura de trajetórias urbanas de objetos móveis PLATAFORMA URBANMOB Aplicativo para captura de trajetórias urbanas de objetos móveis Gabriel Galvão da Gama 1 ; Reginaldo Rubens da Silva 2 ; Angelo Augusto Frozza 3 RESUMO Este artigo descreve um projeto

Leia mais

ARQUITETURA DE UM SISTEMA SPATIO-TEXTUAL. PALAVRAS-CHAVE: banco de dados espaciais, busca spatio-textual. aplicativo.

ARQUITETURA DE UM SISTEMA SPATIO-TEXTUAL. PALAVRAS-CHAVE: banco de dados espaciais, busca spatio-textual. aplicativo. ARQUITETURA DE UM SISTEMA SPATIO-TEXTUAL Fellipe de Lima Fonseca 1 ; João Batista Rocha-Junior 2 1. Bolsista CNPq, Graduando em Engenharia de Computação, Universidade Estadual de Feira de Santana, e-mail:

Leia mais

MIG - Metadados para Informação Geográfica

MIG - Metadados para Informação Geográfica MIG - Metadados para Informação Geográfica Introdução à Norma ISO 19115 Henrique Silva, Instituto Geográfico Português, hsilva@igeo.pt Lisboa, 14 de Fevereiro de 2008 Metadados para Informação Geográfica

Leia mais

Núcleo de Pós Graduação Pitágoras

Núcleo de Pós Graduação Pitágoras Núcleo de Pós Graduação Pitágoras Professor: Fernando Zaidan Disciplina: Arquitetura da Informática e Automação MBA Gestão em Tecnologia 1 da Informaçao 2 Figura: Tela do IBM Mainframe Fonte: Arquivo próprio

Leia mais

Sistemas de Gerência de Bancos de Dados

Sistemas de Gerência de Bancos de Dados Sistemas de Gerência de Bancos de Dados - Módulo 8a - Armazenamento e Recuperação de Dados Geográficos modulo8a.prz 1 29/0 Tópicos Motivação Indexação Espacial Grid files Árvores-R e variantes Armazenamento

Leia mais

Introdução 17. 1 Introdução

Introdução 17. 1 Introdução Introdução 17 1 Introdução O volume de informações que gerenciamos tem crescido a cada dia. Realizamos milhões de pesquisas na Web, postamos mensagens em blogs, enviamos mensagens de correio eletrônico,

Leia mais

Recuperação de Imagens na Web Baseada em Informações Textuais

Recuperação de Imagens na Web Baseada em Informações Textuais Recuperação de Imagens na Web Baseada em Informações Textuais André Ribeiro da Silva Mário Celso Candian Lobato Universidade Federal de Minas Gerais Departamento de Ciência da Computação {arsilva,mlobato}@dcc.ufmg.br

Leia mais

BANCO DE DADOS GEOGRÁFICOS

BANCO DE DADOS GEOGRÁFICOS BANCO DE DADOS GEOGRÁFICOS E WEBMAPPING -KML(KEYHOLE MARKUP LANGUAGE) Prof. Angelo Augusto Frozza, M.Sc. http://about.me/tilfrozza INTRODUÇÃO KML é um formato de arquivo usado para exibir dados geográficos

Leia mais

PRnet/2013. Linguagem de Programação Web

PRnet/2013. Linguagem de Programação Web Linguagem de Programação Web Linguagem de Programação Web Prnet/2013 Linguagem de Programação Web» Programas navegadores» Tipos de URL» Protocolos: HTTP, TCP/IP» Hipertextos (páginas WEB)» HTML, XHTML»

Leia mais

HTML5 E WEB SEMÂNTICA, A WEB COM SIGNIFICADO

HTML5 E WEB SEMÂNTICA, A WEB COM SIGNIFICADO HTML5 E WEB SEMÂNTICA, A WEB COM SIGNIFICADO Djalma Gonçalves Costa Junior¹, Willian Barbosa Magalhães¹ ¹Universidade Paranaense (Unipar) Paranavaí - PR - Brasil djalma.g.costajr@gmail.com wmagalhaes@unipar.br

Leia mais

Dado Vetorial. Características do Dado Vetorial. Usa entidades como ponto, linha e polígono para identificar localizações;

Dado Vetorial. Características do Dado Vetorial. Usa entidades como ponto, linha e polígono para identificar localizações; Estrutura dos Dados Geográficos Organização lógica dos dados para preservar sua integridade e facilitar o seu uso. Vetorial Raster ou Matricial Dado Vetorial Usa entidades como ponto, linha e polígono

Leia mais

Cadernos UniFOA. Web Semântica: Uma Rede de Conceitos. Semantic Web: A Network of ConceptsONCEPTS

Cadernos UniFOA. Web Semântica: Uma Rede de Conceitos. Semantic Web: A Network of ConceptsONCEPTS 23 Web Semântica: Uma Rede de Conceitos Semantic Web: A Network of ConceptsONCEPTS Professor Especialista José Maurício dos Santos Pinheiro Artigo Original Original Paper Palavras-chaves: Internet Semântica

Leia mais

1 Introdução. 1.1. Motivação

1 Introdução. 1.1. Motivação 1 Introdução A adoção do Ginga-NCL como middleware declarativo do SBTVD (Sistema Brasileiro de Televisão Digital) estabeleceu um marco no desenvolvimento de aplicações interativas para TV Digital terrestre

Leia mais

Integração de Dados na Web. Ana Carolina Salgado Bernadette Lóscio

Integração de Dados na Web. Ana Carolina Salgado Bernadette Lóscio Integração de Dados na Web Ana Carolina Salgado Bernadette Lóscio Conteúdo Introdução Integração de Informações Consultando a Web Introdução Motivação Web e BD Arquitetura na Web Introdução Evolução da

Leia mais

METADADOS PARA A PRESERVAÇÃO DA INFORMAÇÃO DIGITAL

METADADOS PARA A PRESERVAÇÃO DA INFORMAÇÃO DIGITAL 354 METADADOS PARA A PRESERVAÇÃO DA INFORMAÇÃO DIGITAL José Carlos Abbud Grácio (UNESP) Bárbara Fadel (UNESP) 1. Introdução Com os avanços das tecnologias de informação e comunicação (TIC) as instituições

Leia mais

UFG - Instituto de Informática

UFG - Instituto de Informática UFG - Instituto de Informática Especialização em Desenvolvimento de Aplicações Web com Interfaces Ricas EJB 3.0 Prof.: Fabrízzio A A M N Soares professor.fabrizzio@gmail.com Aula 13 Web Services Web Services

Leia mais

Otimização de Recuperação de Informação usando Algoritmos Genéticos

Otimização de Recuperação de Informação usando Algoritmos Genéticos Otimização de Recuperação de Informação usando Algoritmos Genéticos Neide de Oliveira Gomes, M. Sc., nog@inpi.gov.br Prof. Marco Aurélio C. Pacheco, PhD Programa de Doutorado na área de Métodos de Apoio

Leia mais

Prova INSS RJ - 2007 cargo: Fiscal de Rendas

Prova INSS RJ - 2007 cargo: Fiscal de Rendas Prova INSS RJ - 2007 cargo: Fiscal de Rendas Material de Apoio de Informática - Prof(a) Ana Lucia 53. Uma rede de microcomputadores acessa os recursos da Internet e utiliza o endereço IP 138.159.0.0/16,

Leia mais

Estudo Sobre Armazenamento de Modelagem Digital de Terreno em Banco de Dados Geográficos

Estudo Sobre Armazenamento de Modelagem Digital de Terreno em Banco de Dados Geográficos Estudo Sobre Armazenamento de Modelagem Digital de Terreno em Banco de Dados Geográficos Eduilson L. N. C. Carneiro, Gilberto Câmara, Laércio M. Namikawa Divisão de Processamento de Imagens (DPI) Instituto

Leia mais

2 Conceitos básicos. 2.1 Arquiteturas tradicionais para integração de dados. 2.1.1 Arquitetura de mediadores

2 Conceitos básicos. 2.1 Arquiteturas tradicionais para integração de dados. 2.1.1 Arquitetura de mediadores 17 2 Conceitos básicos 2.1 Arquiteturas tradicionais para integração de dados 2.1.1 Arquitetura de mediadores Um mediador é um componente de software que intermedia o acesso de clientes (usuários ou componentes

Leia mais

CAPÍTULO 1 INTRODUÇÃO

CAPÍTULO 1 INTRODUÇÃO CAPÍTULO 1 INTRODUÇÃO A atuação do homem no meio ambiente, ao longo da história, fornece provas de suas ações em nome do progresso. Esta evolução tem seu lado positivo, pois abre novos horizontes, novas

Leia mais

MAPEAMENTO E LOCALIZAÇÃO DE REGIÕES DE INTERESSE UTILIZANDO REALIDADE AUMENTADA EM DISPOSITIVOS MÓVEIS COM PLATAFORMA ANDROID

MAPEAMENTO E LOCALIZAÇÃO DE REGIÕES DE INTERESSE UTILIZANDO REALIDADE AUMENTADA EM DISPOSITIVOS MÓVEIS COM PLATAFORMA ANDROID MAPEAMENTO E LOCALIZAÇÃO DE REGIÕES DE INTERESSE UTILIZANDO REALIDADE AUMENTADA EM DISPOSITIVOS MÓVEIS COM PLATAFORMA ANDROID Alessandro Teixeira de Andrade¹; Geazy Menezes² UFGD/FACET Caixa Postal 533,

Leia mais

25/05/2015. Relevance Feedback. Expansão de Consulta. Relevance Feedback

25/05/2015. Relevance Feedback. Expansão de Consulta. Relevance Feedback Relevance Feedback Expansão de Consulta Relevance Feedback 1 Relevance Feedback Baeza-Yates; Ribeiro-Neto, (2011, cap 5) distinguem dois métodos: Explicit Relevance Feedback a informação para a reformulação

Leia mais

XML e Banco de Dados de Internet. Tópicos Especiais em Tecnologia da Informação Profa. Késsia R. C. Marchi

XML e Banco de Dados de Internet. Tópicos Especiais em Tecnologia da Informação Profa. Késsia R. C. Marchi XML e Banco de Dados de Internet Tópicos Especiais em Tecnologia da Informação Profa. Késsia R. C. Marchi Motivação Diversas aplicações Web utilizam Fontes de Dados (BD); Arquitetura Cliente-Servidor (2

Leia mais

Desenvolvimento Web. Saymon Yury C. Silva Analista de Sistemas. http://www.saymonyury.com.br

Desenvolvimento Web. Saymon Yury C. Silva Analista de Sistemas. http://www.saymonyury.com.br Desenvolvimento Web Saymon Yury C. Silva Analista de Sistemas http://www.saymonyury.com.br Vantagens Informação em qualquer hora e lugar; Rápidos resultados; Portabilidade absoluta; Manutenção facilitada

Leia mais

ESTUDO TÉCNICO N.º 14/2012

ESTUDO TÉCNICO N.º 14/2012 ESTUDO TÉCNICO N.º 14/2012 MANUAL DE INSTRUÇÕES PARA UTILIZAÇÃO DO ARQUIVO EM FORMATO XML PARA IMPORTAÇÃO DOS DADOS DO REGISTRO MENSAL DE ATENDIMENTOS DOS CRAS MINISTÉRIO DO DESENVOLVIMENTO SOCIAL E COMBATE

Leia mais

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados: MC536 Introdução Sumário Conceitos preliminares Funcionalidades Características principais Usuários Vantagens do uso de BDs Tendências mais recentes em SGBDs Algumas desvantagens Modelos de dados Classificação

Leia mais

Organização e Recuperação da Informação

Organização e Recuperação da Informação GSI024 Organização e Recuperação da Informação Introdução Ilmério Reis da Silva ilmerio@facom.ufu.br www.facom.ufu.br/~ilmerio/ori UFU/FACOM - 2011/1 Arquivo 1a Introdução Porque RI? Problemas da solução

Leia mais

Governo Federal / Governo Estadual. Imagem suportando a Infraestrutura Nacional de Dados Espaciais INDE Carlos Toledo

Governo Federal / Governo Estadual. Imagem suportando a Infraestrutura Nacional de Dados Espaciais INDE Carlos Toledo Governo Federal / Governo Estadual Imagem suportando a Infraestrutura Nacional de Dados Espaciais INDE Carlos Toledo Plenária Desafios comuns Governança de dados espaciais; Informação geográfica é um ativo

Leia mais

Otimização da exposição de websites em mecanismos de busca vista como atividade de indexação

Otimização da exposição de websites em mecanismos de busca vista como atividade de indexação Otimização da exposição de websites em mecanismos de busca vista como atividade de indexação Bruno Viana Rezende 1 Marcello Peixoto Bax 2 Resumo O artigo apresenta a atividade considerada de webmarketing

Leia mais

Integração de Sistemas de Gerenciamento de Redes de Telecomunicações Utilizando GML

Integração de Sistemas de Gerenciamento de Redes de Telecomunicações Utilizando GML Integração de Sistemas de Gerenciamento de Redes de Telecomunicações Utilizando GML Novembro/2003 Agenda Introdução Contexto Problema Objetivo Solução Integração de Sistemas de Telecom Rede Externa de

Leia mais

3 Serviços na Web (Web services)

3 Serviços na Web (Web services) 3 Serviços na Web (Web services) 3.1. Visão Geral Com base na definição do Word Wide Web Consortium (W3C), web services são aplicações autocontidas, que possuem interface baseadas em XML e que descrevem

Leia mais

Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL

Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL Diretoria de Sistema - DS Superintendência de Arquitetura de Sistemas - SAS Gerência de Arquitetura de Informação - GAAS

Leia mais

Consultas Visuais em Sistemas de Informações Geográficas baseadas em Padrões de Metadados Espaciais

Consultas Visuais em Sistemas de Informações Geográficas baseadas em Padrões de Metadados Espaciais Consultas Visuais em Sistemas de Informações Geográficas baseadas em Padrões de Metadados VALÉRIA GONÇALVES SOARES 1 2, ANA CAROLINA SALGADO 1 1 Universidade Federal de Pernambuco DI - CP7851, 50732-970

Leia mais

ONTOLOGIA DE DOMÍNIO PARA ANÁLISE DE BLOGS

ONTOLOGIA DE DOMÍNIO PARA ANÁLISE DE BLOGS Centro Universitário Feevale ONTOLOGIA DE DOMÍNIO PARA ANÁLISE DE BLOGS Fernando Mertins Prof. Orientador: Rodrigo Rafael Villarreal Goulart Dezembro de 2007 Roteiro da Apresentação Introdução Objetivos

Leia mais

PRODUTO 1 (CONSTRUÇÃO DE PORTAL WEB)

PRODUTO 1 (CONSTRUÇÃO DE PORTAL WEB) RELATÓRIO DE ENTREGA DO PRODUTO 1 (CONSTRUÇÃO DE PORTAL WEB) PARA A ELABORAÇÃO DOS PLANOS MUNICIPAIS DE GESTÃO INTEGRADA DE RESÍDUOS SÓLIDOS PMGIRS PARA OS MUNICÍPIOS DE NOVO HORIZONTE, JUPIÁ, GALVÃO,

Leia mais

Integração da Informação e do Conhecimento no Contexto da Copa do Mundo e os Jogos Olímpicos no Brasil

Integração da Informação e do Conhecimento no Contexto da Copa do Mundo e os Jogos Olímpicos no Brasil Integração da Informação e do Conhecimento no Contexto da Copa do Mundo e os Jogos Olímpicos no Brasil Ivan Guilherme 1, Jonas Queiroz 1, Caio Marques 2 1 Universidade Estadual Paulista, IGCE, DEMAC, Caixa

Leia mais

04/03/2013. Gerenciamento de Dados e Informação. Recuperação de Dado X Informação. Histórico

04/03/2013. Gerenciamento de Dados e Informação. Recuperação de Dado X Informação. Histórico Recuperação de Dado X Informação Gerenciamento de Dados e Informação Fernando Fonseca Ana Carolina Robson Fidalgo Comparação (matching) Recuperação de Dados Exata Recuperação de Informação Aproximada Dados

Leia mais

POLÍTICA DE GEOPROCESSAMENTO DA ELETROSUL

POLÍTICA DE GEOPROCESSAMENTO DA ELETROSUL POLÍTICA DE GEOPROCESSAMENTO DA ELETROSUL Abril - 2013 SUMÁRIO 1. OBJETIVO... 3 2. ABRANGÊNCIA... 3 3. CONCEITOS... 3 3.1. Geoprocessamento... 3 3.2. Gestão das Informações Geográficas... 3 3.3. Dado Geográfico

Leia mais

Aplicações de Ontologias na Recuperação de Informações Jurídicas na Web Semântica

Aplicações de Ontologias na Recuperação de Informações Jurídicas na Web Semântica Aplicações de Ontologias na Recuperação de Informações Jurídicas na Web Semântica Marcus de Melo Braga 1 2, Hélio Santiago Ramos Júnior 1, Tatianna de Faria Coelho 1 1 Universidade Federal de Santa Catarina,

Leia mais

Autoria Web Apresentação e Visão Geral sobre a Web

Autoria Web Apresentação e Visão Geral sobre a Web Apresentação e Visão Geral sobre a Web Apresentação Thiago Miranda Email: mirandathiago@gmail.com Site: www.thiagomiranda.net Objetivos da Disciplina Conhecer os limites de atuação profissional em Web

Leia mais

Análise Comparativa dos Recursos e Diferenças das Tecnologias de Programação HTML5 e HTML4

Análise Comparativa dos Recursos e Diferenças das Tecnologias de Programação HTML5 e HTML4 Análise Comparativa dos Recursos e Diferenças das Tecnologias de Programação HTML5 e HTML4 Guilherme Miranda Martins 1, Késsia Rita da Costa Marchi 1 1 Universidade paranaense (Unipar) Paranavaí PR Brasil

Leia mais

GeoBR: intercâmbio sintático e semântico de dados espaciais

GeoBR: intercâmbio sintático e semântico de dados espaciais Informática Pública vol. 4 (2): 251-281, 2002 GeoBR: intercâmbio sintático e semântico de dados espaciais PAULO DE OLIVEIRA LIMA JÚNIOR¹ GILBERTO CÂMARA² (recebido em 18/10/2002; aprovado em 26/11/2002)

Leia mais

Web Semântica. Web Semântica. uma introdução @yaso

Web Semântica. Web Semântica. uma introdução @yaso Web Semântica uma introdução @yaso O que é SEMÂNTICA Semântica é o estudo do signifcado. Incide sobre a relação entre signifcantes, tais como palavras, frases, sinais e símbolos, e o que eles representam,

Leia mais

O MODELO ESPAÇO VETORIAL NO DESENVOLVIMENTO DE INTERFACES DE BUSCA E RECUPERAÇÃO DE INFORMAÇÃO

O MODELO ESPAÇO VETORIAL NO DESENVOLVIMENTO DE INTERFACES DE BUSCA E RECUPERAÇÃO DE INFORMAÇÃO O MODELO ESPAÇO VETORIAL NO DESENVOLVIMENTO DE INTERFACES DE BUSCA E RECUPERAÇÃO DE INFORMAÇÃO RESUMO LOPES, T.S.F. 1., FERNEDA, E. 2 1 Mestranda do Programa de Pós-graduação em Ciência da Informação Rua

Leia mais

RSS no desenvolvimento de uma Central de Notícias

RSS no desenvolvimento de uma Central de Notícias RSS no desenvolvimento de uma Central de Notícias Darley Passarin 1, Parcilene Fernandes de Brito 1 1 Sistemas de Informação Centro Universitário Luterano de Palmas (CEULP/ULBRA) Palmas TO Brasil darley@centralrss.com.br,

Leia mais

NOÇÕES DE GEOPROCESSAMENTO. Módulo 2

NOÇÕES DE GEOPROCESSAMENTO. Módulo 2 NOÇÕES DE GEOPROCESSAMENTO Módulo 2 Sistema Metropolitano de Informações Georreferenciadas MetroGeo Curso Noções de Geoprocessamento Módulo 2 Oscar Ricardo M. Schmeiske Programação Curso Noções de Geoprocessamento

Leia mais

SIG - Sistemas de Informação Geográfica

SIG - Sistemas de Informação Geográfica SIG - Sistemas de Informação Geográfica Gestão da Informação Para gestão das informações relativas ao desenvolvimento e implantação dos Planos Municipais de Conservação e Recuperação da Mata Atlântica

Leia mais

Banco de Dados Multimídia

Banco de Dados Multimídia Banco de Dados Multimídia Nomes: Ariane Bazilio Cristiano de Deus Marcos Henrique Sidinei Souza Professor Mauricio Anderson Perecim Conteúdo Banco de Dados Multimídia... 3 Conceitos... 3 Descrição... 3

Leia mais

Modelagem de Banco de Dados Geográficos

Modelagem de Banco de Dados Geográficos CBG 2013 Modelagem Conceitual de Dados Espaciais Modelagem de Banco de Dados Geográficos Paulo José de Alcantara Gimenez paulo.gimenez@ibge.gov.br Diretoria de Geociências Coordenação de Cartografia 1

Leia mais

Serviço de Consulta Versão: outubro/ 2010

Serviço de Consulta Versão: outubro/ 2010 Serviço de Consulta Versão: outubro/ 2010 1 Índice Portal CopaGIS...3 1 - Como se cadastrar...4 2 - Serviços do Portal de Geoprocessamento...8 3 - Serviço de Consulta...9 3.1 - Dados informativos... 10

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

EXTRAÇÃO DE INFORMAÇÃO DE MÍDIAS SOCIAIS NA WEB

EXTRAÇÃO DE INFORMAÇÃO DE MÍDIAS SOCIAIS NA WEB EXTRAÇÃO DE INFORMAÇÃO DE MÍDIAS SOCIAIS NA WEB Fernando Alberto Zambelan Bossarino Engenharia de Computação CEATEC fernandozambelan@hotmail.com Carlos Miguel Tobar Toledo Sistemas Inteligentes CEATEC

Leia mais

D2R EDITOR: HABILITANDO A PUBLICAÇÃO AUTOMÁTICA DE ANOTAÇÕES SEMÂNTICAS DE SITES DINÂMICOS

D2R EDITOR: HABILITANDO A PUBLICAÇÃO AUTOMÁTICA DE ANOTAÇÕES SEMÂNTICAS DE SITES DINÂMICOS UNIVERSIDADE FEDERAL DE SANTA CATARINA PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO André Guerreiro Cantarelli D2R EDITOR: HABILITANDO A PUBLICAÇÃO AUTOMÁTICA DE ANOTAÇÕES SEMÂNTICAS DE SITES DINÂMICOS

Leia mais

ONTOLOGIA PARA PUBLICAÇÃO CIENTÍFICA 1 ONTOLOGY FOR SCIENTIFIC PUBLICATION

ONTOLOGIA PARA PUBLICAÇÃO CIENTÍFICA 1 ONTOLOGY FOR SCIENTIFIC PUBLICATION ONTOLOGIA PARA PUBLICAÇÃO CIENTÍFICA 1 ONTOLOGY FOR SCIENTIFIC PUBLICATION Andrenizia Aquino Eluan Mestranda do Programa de Pós-Graduação em Ciência da Informação Universidade Federal de Santa Catarina

Leia mais

Conheça o Projeto. Apresentação. Finalidade. Objetivo

Conheça o Projeto. Apresentação. Finalidade. Objetivo Manual do Usuário Índice Conheça o Projeto...3 Apresentação...3 Finalidade...3 Objetivo...3 Histórico...4 Usando o Portal...5 Efetuando o cadastro na biblioteca digital...5 Logando na Biblioteca Digital...6

Leia mais

INTRODUÇÃO AO DESENVOLVIMENTO WEB. PROFª. M.Sc. JULIANA H Q BENACCHIO

INTRODUÇÃO AO DESENVOLVIMENTO WEB. PROFª. M.Sc. JULIANA H Q BENACCHIO INTRODUÇÃO AO DESENVOLVIMENTO WEB PROFª. M.Sc. JULIANA H Q BENACCHIO Internet Internet é o conjunto de diversas redes de computadores que se comunicam entre si Internet não é sinônimo de WWW (World Wide

Leia mais

Opala: uma biblioteca de indexação e busca de textos e imagens por conteúdo

Opala: uma biblioteca de indexação e busca de textos e imagens por conteúdo Opala: uma biblioteca de indexação e busca de textos e imagens por conteúdo Lidijanne de Miranda Santos (1); Aécio Solano Rodrigues Santos (2); Ricardo Martins Ramos (3); Valéria Oliveira Costa (4) Instituto

Leia mais

PRODUÇÃO CARTOGRÁFICA SERVIÇOS WEB

PRODUÇÃO CARTOGRÁFICA SERVIÇOS WEB SERVIÇOS WEB World Wide Web Evolução de simples páginas com conteúdo estático para páginas com conteúdos dinâmicos (extraídos, principalmente, de Sistemas Gerenciadores de Bancos de Dados SGBD) Tecnologias

Leia mais

Sistemas de Informação Geográficas

Sistemas de Informação Geográficas Sistemas de Informação Geográficas Trabalhos em desenvolvimento pelo IMPA e INPE César Candido Xavier Mestrando CG pela COPPE/UFRJ/LCG 1 Objetivo Apresentar os principais conceitos relacionados com SIG

Leia mais

Localização Geográfica no Google Maps com o Auxílio de Redes Wireless

Localização Geográfica no Google Maps com o Auxílio de Redes Wireless Localização Geográfica no Google Maps com o Auxílio de Redes Wireless Henrique G. G. Pereira 1, Marcos L. Cassal 1, Guilherme Dhein 1, Tarcízio R. Pinto 1 1 Centro Universitário Franciscano (UNIFRA) Rua

Leia mais

INSTITUTO VIANNA JÚNIOR LTDA FACULADE DE CIENCIAS ECONOMICAS VIANNA JUNIOR

INSTITUTO VIANNA JÚNIOR LTDA FACULADE DE CIENCIAS ECONOMICAS VIANNA JUNIOR INSTITUTO VIANNA JÚNIOR LTDA FACULADE DE CIENCIAS ECONOMICAS VIANNA JUNIOR WEB SEMÂNTICA: A nova internet que fará com que os computadores entendam a lógica humana. Lúcia Helena de Magalhães 1 Márcio Aarestrup

Leia mais

EMENTAS DAS DISCIPLINAS

EMENTAS DAS DISCIPLINAS EMENTAS DAS DISCIPLINAS CST SISTEMAS DE INFORMAÇÃO DISCIPLINA: Algoritmo e Programação I A disciplina aborda o estudo de algoritmos, envolvendo os conceitos fundamentais: variáveis, tipos de dados, constantes,

Leia mais

Roteiro 2 Conceitos Gerais

Roteiro 2 Conceitos Gerais Roteiro 2 Conceitos Gerais Objetivos: UC Projeto de Banco de Dados Explorar conceitos gerais de bancos de dados; o Arquitetura de bancos de dados: esquemas, categorias de modelos de dados, linguagens e

Leia mais

António José Silva d2011090@isegi.unl.pt

António José Silva d2011090@isegi.unl.pt Integração de Dados de Geospatial Crowdsourcing em IDE's Utilizando o INSPIRE António José Silva d2011090@isegi.unl.pt JIIDE 2014 Sumário Motivação e Objectivos Utilizadores e Produtilizadores Desafios

Leia mais

ESTRUTURAÇÃO DE UM BANCO DE DADOS DE IMAGENS ORBITAIS PARA WEBMAPPING

ESTRUTURAÇÃO DE UM BANCO DE DADOS DE IMAGENS ORBITAIS PARA WEBMAPPING ESTRUTURAÇÃO DE UM BANCO DE DADOS DE IMAGENS ORBITAIS PARA WEBMAPPING RAFAELA S. NIEMANN 1 ; SOPHIA D. RÔVERE 2 ; WILSON A. HOLLER 3 N 10508 RESUMO A organização de imagens de satélite direcionada à implementação

Leia mais

Novas Mídias e Relações Sociais.

Novas Mídias e Relações Sociais. Novas Mídias e Relações Sociais. Eduardo Foster 1 1 Caiena Soluções em Gestão do Conhecimento, Av. 34-578, CEP 13504-110 Rio Claro, Brasil foster@caiena.net Resumo. A comunicação é uma disciplina que acompanha

Leia mais

OBTENÇÃO DE IMAGEM DO GOOGLE EARTH PARA CLASSIFICAÇÃO DE USO E OCUPAÇÃO DO SOLO

OBTENÇÃO DE IMAGEM DO GOOGLE EARTH PARA CLASSIFICAÇÃO DE USO E OCUPAÇÃO DO SOLO OBTENÇÃO DE IMAGEM DO GOOGLE EARTH PARA CLASSIFICAÇÃO DE USO E OCUPAÇÃO DO SOLO ROGER TORLAY 1 ; OSVALDO T. OSHIRO 2 N 10502 RESUMO O sensoriamento remoto e o geoprocessamento trouxeram importantes avanços

Leia mais

Infra estrutura da Tecnologia da Informação

Infra estrutura da Tecnologia da Informação Infra estrutura da Tecnologia da Informação Capítulo 3 Adaptado do material de apoio ao Livro Sistemas de Informação Gerenciais, 7ª ed., de K. Laudon e J. Laudon, Prentice Hall, 2005 CEA460 Gestão da Informação

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Administração de Banco de Dados

Administração de Banco de Dados Administração de Banco de Dados Professora conteudista: Cida Atum Sumário Administração de Banco de Dados Unidade I 1 INTRODUÇÃO A BANCO DE DADOS...1 1.1 Histórico...1 1.2 Definições...2 1.3 Importância

Leia mais

Bancos de Dados não Convencionais

Bancos de Dados não Convencionais Bancos de Dados não Convencionais Profa. Valéria Gonçalves Soares DI/UFPB Conteúdo 1. Introdução Integração de BDs com outras áreas Visão dos sistemas Visão das aplicações Limitações dos BDs Relacionais

Leia mais

Intranets. FERNANDO ALBUQUERQUE Departamento de Ciência da Computação Universidade de Brasília 1.INTRODUÇÃO

Intranets. FERNANDO ALBUQUERQUE Departamento de Ciência da Computação Universidade de Brasília 1.INTRODUÇÃO Intranets FERNANDO ALBUQUERQUE Departamento de Ciência da Computação Universidade de Brasília 1.INTRODUÇÃO As intranets são redes internas às organizações que usam as tecnologias utilizadas na rede mundial

Leia mais

XML (extensible Markup Language)

XML (extensible Markup Language) Sumário 1. Introdução a Aplicações Não-Convencionais 2. Revisão de Modelagem Conceitual 3. BD Orientado a Objetos (BDOO) 4. BD Objeto-Relacional (BDOR) 5. BD Temporal (BDT) 6. BD Geográfico (BDG) 7. BD

Leia mais

Introdução ao Desenvolvimento e Design de Websites

Introdução ao Desenvolvimento e Design de Websites Introdução ao Desenvolvimento e Design de Websites Prof.: Salustiano Rodrigues de Oliveira Email: saluorodrigues@gmail.com Site: www.profsalu.wordpress.com Introdução ao Desenvolvimento e Design de Websites

Leia mais

SISTEMAS DE INFORMAÇÃO GEOGRÁFICA

SISTEMAS DE INFORMAÇÃO GEOGRÁFICA SISTEMAS DE INFORMAÇÃO GEOGRÁFICA Jugurta Lisboa Filho Departamento de Informática Universidade Federal de Viçosa (MG) jugurta@dpi.ufv.br Universidade Federal de Viçosa Departamento de Informática Tópicos

Leia mais

Utilizando Ontologias para Expansão Semântica de Consultas

Utilizando Ontologias para Expansão Semântica de Consultas Utilizando Ontologias para Expansão Semântica de Consultas Danusa Ribeiro B. da Cunha Universidade Federal do Ceará (UFC) danusarbc@lia.ufc.br Bernadette Farias Lóscio Universidade Federal do Ceará (UFC)

Leia mais

SIG como uma ferramenta de análise espacial Um estudo de caso da saúde no RN

SIG como uma ferramenta de análise espacial Um estudo de caso da saúde no RN SIG como uma ferramenta de análise espacial Um estudo de caso da saúde no RN Adeline M. Maciel, Luana D. Chagas, Cláubio L. L. Bandeira Mestrado em Ciência da Computação (MCC) Universidade do Estado do

Leia mais

Visual Library: Uma Biblioteca para Criação de Ferramentas de Modelagem Gráfica

Visual Library: Uma Biblioteca para Criação de Ferramentas de Modelagem Gráfica Visual Library: Uma Biblioteca para Criação de Ferramentas de Modelagem Gráfica Tiago A. Gameleira 1, Raimundo Santos Moura 2, Luiz Affonso Guedes 1 1 Universidade Federal do Rio Grande do Norte (UFRN)

Leia mais