Integração de Dados em GIS. Charles Ferreira Gonçalves

Documentos relacionados
Gazetteers - Aplicação em RI Geográfica. Ivre Marjorie R. Machado

Identificação em Documentos

Expansão do conteúdo de um gazetteer: nomes hidrográficos

Método não supervisionado para monitoramento de assuntos de governo nos países de língua portuguesa

3 Sistema de Informação geográfica

Encontro 10 Anos da Linguateca PROPOR 2008 Aveiro Portugal

Índice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed

Infra-Estrutura de Dados Espaciais. Bruno Rabello Monteiro

Identificação da Cobertura Espacial de Documentos usando Mineração de Textos

Mineração de Textos na Web

SEMINÁRIO DOS ARTIGOS:

Revisão Sistemática da Literatura sobre Métodos de Localização de Características

Descritores de Imagens

Geomática INSTITUTO FEDERAL DE CIÊNCIA E TECNOLOGIA DE SC CAMPUS FLORIANÓPOLIS DEPARTAMENTO ACADÊMICO DE CONSTRUÇÃO CIVIL CURSO TÉCNICO DE AGRIMENSURA

Linked Geospatial Data: desafios e oportunidades de pesquisa

PROGRAMA ANALÍTICO E EMENTA DE DISCIPLINA DA PÓS GRADUAÇÃO

Aula 3: Análise Exploratória de Dados Espaciais (AEDE) Prof. Eduardo A. Haddad

Uma Estratégia Eficiente de Treinamento para Programação Genética Aplicada a Deduplicação de Registros.

Sistemas de Informação Geográficos. Informação na Organização. O Valor da Informação. Sistemas de Informação Tradicionais. O Valor da Informação

GEORREFERENCIAMENTO NO SETOR DE SANEAMENTO

UNIVERSIDADE FEDERAL DE SANTA CATARINA SISTEMAS DE INFORMAÇÃO E CIÊNCIAS DA COMPUTAÇÃO INE CTC DATA MINING Prof.: Luis Otavio Campos Alvares

UNIVERSIDADE ESTADUAL PAULISTA JÚLIO DE MESQUITA FILHO Campus de Presidente Prudente Curso de Pós-Graduação em Ciências Cartográficas

Ministrantes: Alex Lemos e Marco Malagodi

Resumo Componente de software para extração e desambiguação de topônimos. Index Terms Extração de informação, Extração e desambiguação de topônimos

Arquiteturas de Computadores. Programa de Pós-Graduação em Ciência da Computação. Plano da aula

Teoria e Método em Geoprocessamento. Fernando Shinji Kawakubo

PROJETO DE INTERFACES PARA ÁLGEBRA DE MAPAS EM GEOPROCESSAMENTO NO AMBIENTE SPRING

Profª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni

SISTEMAS DE INFORMAÇÃO GEOGRÁFICA E CARTOGRÁFICA. Setembro/ 2014

PROCESSAMENTO DE TEXTO

Conjunto de técnicas (ou tecnologias) ligadas à informação espacial, que engloba a coleta, tratamento e análise de dados.

CC-226 Introdução à Análise de Padrões

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais

Detecção de Réplicas de Sítios Web Usando Aprendizado Semi-supervisionado baseado em Maximização de Expectativas. Cristiano Rodrigues de Carvalho

Técnicas de Cartografia Digital

UNIVERSIDADE ESTADUAL PAULISTA JÚLIO DE MESQUITA FILHO Campus de Presidente Prudente Curso de Pós-Graduação em Ciências Cartográficas

Programa Analítico de Disciplina EAM433 Cartografia Digital I

INF 1771 Inteligência Artificial

DADOS GEORREFERENCIADOS

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Avaliação de Classificação

Arquitetura de software de um sistema geoespacial orientado a serviços para gestão de risco de inundações

Determinação do escopo geográfico de textos através de uma hierarquia adaptativa de classificadores

Sistemas Colaborativos na Gestão de Desastres. MSc. Lívia Castro Degrossi

Programa Analítico de Disciplina ECV496 Sistema de Informação Geográfica

UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ UNIOESTE CAMPUS UNIVERSITÁRIO DE CASCAVEL CURSO DE CIÊNCIA DA COMPUTAÇÃO LISTA DE EXERCÍCIOS

Descoberta de conhecimento em textos - Análise semântica. Diogo Cardoso Eduardo Camilo Inácio Eduardo Monteiro Dellandréa Guilherme Gomes

Investimentos na América Latina Desafios e oportunidades

Livro: Sistemas e Ciências da Informação Geográfica. SUMÁRIO 1 Introdução

Universidade Federal do Ma Pós-Graduação em Eng. Elétrica

Elementos de Cartografia Sistemática. Prof. Dr. Alfredo Pereira de Queiroz Filho

PMR2560 Visão Computacional Visão estéreo. Prof. Eduardo L. L. Cabral

Recuperação de Informação em Bases de Texto

Sistemas para Informação Geo-Referenciada DEI-IST 2011/2012

INTRODUÇÃO AO SIG. Programa. Referências Bibliográficas. Prof. Luciene Delazari

Um Método para Melhoria de Dados Estruturados de Imóveis

SISTEMA DE APOIO À DECISÃO DE INFORMAÇÕES ESPACIAIS VIA WEB PARA TRANSPORTE PÚBLICO URBANO

Combinando Fatores de Ponderação para Melhorar a

eeoprocessamento APLICADO AO MANEJO DE SOLO E ÁGUA

Aplicação da técnica de mineração de dados por meio do algoritmo J48 para definição de limiares de imagens de sensoriamento remoto

Geoprocessamento. Aula - 01/08/2016. Professor: Diogenes Carvalho Viana

Proposição de um conjunto de relações espaciais representativo dos vocábulos usados na tarefa de descrição espacial C U R I T I B A J U N H O

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo

GEOVISUALIZAÇÃO DE SUBPROJETOS DO INNOVATE NO ENTORNO DO RESERVATÓRIO DE ITAPARICA

4 Microscopia Microscopia Ótica de Luz Refletida em Campo Claro

Eduardo Vargas Ferreira

PROGRAMA DE ENSINO. Cartografia Temática 3º Área de Concentração AQUISIÇÃO, ANÁLISE E REPRESENTAÇÃO DE INFORMAÇÕES ESPACIAIS

1. INTRODUÇÃO. Projeto e análise de redes geodésicas

UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO

Introdução a Sistema de Informações Geográficas - SIG

Percepção e cognição visual em soluções cartográficas. Claudia Robbi Sluter

Vítor Oliveira ANÁLISE SINTÁTICA. Aulas de Morfologia Urbana

B A N C O D E D A D O S G E O G R Á F I C O S M A R C O N I D E A R R U D A P E R E I R A

Detecção de Posicionamento no contexto de Fake News

SISTEMAS DE INFORMAÇÃO GEOGRÁFICA NO ZONEAMENTO AMBIENTAL DO CAMPUS DA UFSCAR EM SÃO CARLOS: VEGETAÇÃO E HIDROGRAFIA

Estudo Sobre Armazenamento de Modelagem Digital de Terreno em Banco de Dados Geográficos

Geoprocessamento. SIG: IDE e VGI PROFA. MARIANA A. G I ANNOT TI

Ambientes integrados para análise estatística em SIG interfaces R/C++

Marco Paulo dos Santos Carrasco

"Geotecnologias, Geomática, Geoprocessamento: Conjunto de Tecnologias ou Ciência da Informaçao?" Prof. Roberto W. Lourenço UNESP Sorocaba

Técnicas de Cartografia Digital

Análise de vetores de crescimento para a quantificação das transformações urbanas no município de Goiânia

NORMA PARA ESPECIFICAÇÃO TÉCNICA PARA PRODUTOS DE CONJUNTO DE DADOS GEOESPACIAIS (ET-PCDG)

MANUAL DO USUÁRIO DE PRODUTOS CARTOGRÁFICOS. Cartographic Product User s Manual

Nivio Ziviani. Conjunto de transparências elaborado por Nivio Ziviani, Patrícia Correia e Fabiano C. Botelho

Caracterização de Imagens via Redes Neurais Artificiais

Técnicas de recuperação de informação: filtragem, agrupamento

Linguagens para Programação Paralela. October 26, 2010

Visualização por Computador: Teoria, Prática e Aplicações

Gabarito P2. Álgebra Linear I ) Decida se cada afirmação a seguir é verdadeira ou falsa.

Escola de Artes, Ciências e Humanidades da Universidade de São Paulo

UM GAZETTEER ONTOLÓGICO PARA RECUPERAÇÃO DE INFORMAÇÃO GEOGRÁFICA

Departamento de Geografia FFLCH USP. Prof. Dr. Alfredo Pereira de Queiroz Filho. Mapas: transformações e desafios. Escala

Aula 2: Planejamento da RS

Métodos de Acesso Métrico

Banco de Dados Geográficos

Workload Characterization Practical Examples

4ª REUNIÃO ORDINÁRIA DA COMAT/CBIC

Sistema Nacional de Gestão de Informações Territoriais - SINTER

Tipos de Sistemas de Organização do Conhecimento

Transcrição:

Integração de Dados em GIS Charles Ferreira Gonçalves

Introdução Crescimento e Disponibilidade de dados GeoEspaciais tem aumentado o interesse em KDD aplicado a GIS Existem várias fontes de dados o que implica em integração antes da efetiva utilização Objetivo em Integração: Encontrar localizações correspondentes entre bases diferentes Criar uma base única com o mínimo de ruído e réplicas possíveis

Desafios: Dados espaciais contínuos captura de dados é imprecisa e pode conter ruídos Dados com diferentes escalas e estruturas Ex: Montanhas podem ser pontos ou regiões Semânticas diferente: Ilha e região insular Dimensionalidade dos Dados: Dados apresentados em diversos níveis : 1. Nome da Localização 2. Coordenadas Espaciais 3. Tipo de Localização 4. Informações demográficas e além de outras

Abordagens Existem várias abordagens para os problemas de integração em GIS na literatura cada um com um objetivo específico: Entity Resolution Ex.: Integração de Dados Geográficos Data Conflation Ex.: Digital Gazetteer Conflation. Toponym Resolution in Text Mapeamento entre nomes de locais e coordenadas geográficas com desambiguação de nomes de entidades espaciais

General Entity Resolution Definição do Problema: Sejam duas Bases de Dados Geográficas A e B com registros do tipo: Lx = {nome do local, coordenadas espaciais, tipo do local} O objetido da Resolução de Entidades Espaçiais é encontrar pares de localidades {Li,Lj} tal que : Li pertença a A Lj pertença a B Li e Lj representem a mesma entidade geográfica no mundo real.

Entity Resolution Base GNDB: A = Qaryat an Nu'aymiyah, 'Populated Place' Base NGADB: B = Qaryat an Na'imiyah. 'Pop. Place'

General Entity Resolution Métricas de Similaridade: Nome :Métricas tradicionais de String Distância de Edição, Jaccard, Jaro, Winkler Coordenadas Ex: Inverso da Distância Tipos Co-ocorrência: N(Ti,Tj) / N(Ti) + N(Tj)

General Entity Resolution Abordagens: Procura por correspondentes baseados em: Nome Coordenadas Uma combinação ( mas como?!) Qual melhor combinação? Como distribuir pesos para nomes, coordenadas, e tipos? Um saída : Machine Learning SVM, Redes Neurais

Digital Gazetteers Conflation Conflation: "A blend or fusion,to combine two or more things to form a single new thing" Longman Dictionary "The collapsing of distinct items in such a way that their differences are apparently lost" 'Science and religion' By John F. Haught Gasetteers: Um dicionário geográfico,um compêndio de descrições de lugares: Cada entrada normalmente contém informações sobre os nomes de lugares, tipos e uma "footprint" (coordenadas)

Digital Gazetteers Conflation Baseia-se no princípio que um "lugar geográfico" é definido por: pelo menos um nome (placename) pelo menos um tipo de lugar (placetype) pelo menos um localização georeferênciada no mundo (footprint) Desafio: combinar descrições de gazetteers distintos mantendo a unicidade entre uma entidade espacial e sua correspondente entrada no gazetteer.

DG Conflation: Metricas Similaridade Geoespacial: Aplica-se no footprint

DG Conflation: Metricas Similaridade "Geotaxial" (Geotaxonomias) aplica-se no placetypes

DG Conflation: Metricas Similaridade Geonomial: Aplica-se aos nomes (placename)

DG Conflation: Metodologia 1. Todas entidades devem conter: geometria, tipo e nome 2. Realiza Blocagem por similaridade Geospacial 3. Computa as outras duas similaridade para cada par: Geotaxial e Geonominal 4. Soma-se as 3 métricas 5. Se a soma passa de um limite Delta : Agrupa-os sobre determinado critério

Toponym Resolution in Text Topônimo (Toponym): substantivo próprio que designa nome de lugar. Toponym Resolution : Tenta realizar um mapeamento, automático, entre trechos de texto que se referem a entidades espaciais com unidades georeferenciadas, resolvendo ambiguidades se necessário. Metodologia : Faz uso técnicas de Machine Learning com dados de Gazetters para detectar entidades espaciais em texto, resolvê-las usando evidências locais e retornar dados georeferenciados como coordenadas geográficas.

Conclusões Varios dos problemas que se encontram em Banco de Dados comuns aparecem em GIS, porém agravados As características dos dados geográficos (nomes, hierarquias, coordenadas, projeções, etc...) aumentam o grau de incerteza tornando o processo de integração (seja ela qual for) mais difícil Muitas aplicações em breve serão dependente desses tipos de dados, integração automatizada é essencial para o sucesso dessas. Muito trabalho a ser feito...

Referências: J. T. Hastings (2008) 'Automated conflation of digital gazetteer data',international Journal of Geographical Vivek Sehgal et Al. (2006) 'Entity Resolution in Geospatial Data Integration' ACM-GIS'06 - International Symposium on Advances in Geographic Information Systems J. L. Leidner (2004) 'Toponym resolution in text : "which sheffield is it?"', ACM SIGIR 04 Conference on Research and development in information retrieval