Capítulo 5 DIGITALIZAÇÃO, EDIÇÃO E ESTRUTURAÇÃO DE DADOS CARTOGRÁFICOS



Documentos relacionados
CONTROLE DE QUALIDADE e VALIDAÇÃO DE PRODUTO CARTOGRÁFICO

AULA 1 Iniciando o uso do TerraView

Este documento foi elaborado sob a licença

SISTEMAS DE INFORMAÇÃO GEOGRÁFICA (I)

Banco de Dados BrOffice Base

Sphinx Scanner Informações gerais V

Treinamento GVcollege Módulo Acadêmico - Pedagógico

Dicas para usar melhor o Word 2007

Aula 3 - Registro de Imagem

CorelDRAW UM PROGRAMA DE DESIGN

AULA 6 - Operações Espaciais

PRINCÍPIOS DE INFORMÁTICA PRÁTICA OBJETIVO 2. BASE TEÓRICA. 2.1 Criando Mapas no Excel. 2.2 Utilizando o Mapa

Status. Barra de Título. Barra de Menu. Barra de. Ferramentas Padrão. Caixa de nomes. Barra de. Ferramentas de Formatação. Indicadores de Coluna

Fluxo de trabalho do Capture Pro Software: Indexação de OCR e separação de documentos de código de correção

AULA 3 Ferramentas de Análise Básicas

Aula 3 - Registro de Imagem

Pesquisa e organização de informação

Guia de Início Rápido

4ª aba do cadastro: Mapa Orientações para upload de shapefiles

MANUAL DO SISTEMA GT WEB CALL. Teledata

ArcGIS 1: Introdução ao GIS (10.2)

Engenharia de Software III

UNIVERSIDADE FEDERAL DA BAHIA - UFBA

AULA 2 Planos, Vistas e Temas

Dados Matriciais (Raster) e Dados Vetoriais (Vector) (Raster and vector data)

Clique no menu Iniciar > Todos os Programas> Microsoft Office > Publisher 2010.

PROCEDIMENTOS PARA CONVERSÃO DE IMAGENS DIGITALIZADAS EM DOCUMENTO PDF ÚNICO UTILIZANDO A IMPRESSORA FREEPDF XP.

Universidade Federal de Santa Maria UFSM Centro de Tecnologia CT. Power Point. Básico

Lidar com números e estatísticas não é fácil. Reunir esses números numa apresentação pode ser ainda mais complicado.

1. NÍVEL CONVENCIONAL DE MÁQUINA

Microsoft Office PowerPoint 2007

1) MANUAL DO INTEGRADOR Este documento, destinado aos instaladores do sistema, com informações de configuração.

Conceitos de Banco de Dados

Série ArcGIS Online I. Aprenda em 20. Módulo 4. Configure pop-ups.

1- Tela inicial do AUTOCAD 2013

UFGD FCA PROF. OMAR DANIEL BLOCO 4 PROCESSAMENTO DE IMAGENS

GARANTIA DA QUALIDADE DE SOFTWARE

Manual do Publicador. Wordpress FATEA Sistema de Gerenciamento de Conteúdo Web

15 Computador, projeto e manufatura

Tutorial Mapa-Temático

UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS

Treinamento em BrOffice.org Calc

Glossário Apresenta a definição dos termos, siglas e abreviações utilizadas no contexto do projeto Citsmart.

ISO/IEC 12207: Gerência de Configuração

Aula 01 - Formatações prontas e condicionais. Aula 01 - Formatações prontas e condicionais. Sumário. Formatar como Tabela

ANDRÉ APARECIDO DA SILVA APOSTILA BÁSICA SOBRE O POWERPOINT 2007

Tutorial Gerar arquivo PDF. Gerando um documento pdf com várias imagens 1- Inserir imagem no Word

PLANOS DE CONTINGÊNCIAS

2 de maio de Remote Scan

Modelagem Digital do Terreno

COLÉGIO ESTADUAL PAULO LEMINSKI APOSTILA SOBRE O BROFFICE IMPRESS

ATENÇÃO: * Arquivos com tamanho superior a 500 KB NÃO SERÃO ACEITOS * SOMENTE serão aceitos documentos do formato: PDF

Mozart de Melo Alves Júnior

PROVA DE NOÇÕES DE MICROINFORMÁTICA

Manual AGENDA DE BACKUP

Tabela de Símbolos. Análise Semântica A Tabela de Símbolos. Principais Operações. Estrutura da Tabela de Símbolos. Declarações 11/6/2008

Índice: CMS 3 O que é Content Management System? Clientes 4 O que é o Cliente? 4 Configurando o i-menu/i-view para trabalhar. com o CMS.

Teoria : Estruturas de Dados. Estrutura Vetorial. Quais tipos de dados são representados por estruturas vetoriais? Mapa temático:

AULA 5 Manipulando Dados Matriciais: Grades e Imagens. 5.1 Importando Grades e Imagens Interface Simplificada

Criação de formulários no Sphinx

Iniciação à Informática

ArpPrintServer. Sistema de Gerenciamento de Impressão By Netsource Rev: 02

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

Dado Vetorial. Características do Dado Vetorial. Usa entidades como ponto, linha e polígono para identificar localizações;

Fluxo de trabalho do Capture Pro Software: Indexação de código de barras e separação de documentos

A VISTA BACKSTAGE PRINCIPAIS OPÇÕES NO ECRÃ DE ACESSO

Disciplina: Unidade III: Prof.: Período:

SIG - Sistemas de Informação Geográfica

MODELAGEM DIGITAL DE SUPERFÍCIES

Manual Captura S_Line

Manual do Painel Administrativo

GEADA. Gerador de Expressões Algébricas em Digrafos Acíclicos. para versão 1.0, de agosto/2008. Autor: Márcio Katsumi Oikawa

O que há de novo. Audaces Idea

2. ENTRADA DE DADOS 2.1. TEXTOS

O Windows 7 é um sistema operacional desenvolvido pela Microsoft.

Desenhador de Escadas

Bem- Vindo ao manual de instruções do ECO Editor de COnteúdo.

SISTEMAS DE INFORMAÇÃO GEOGRÁFICA

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

VERSÃO 1 PRELIMINAR MÓDULO 3 - PRESENCIAL

Algoritmos: Lógica para desenvolvimento de programação de computadores. Autor: José Augusto Manzano. Capítulo 1 Abordagem Contextual

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

Processo de Controle das Reposições da loja

Prof. Msc Elvis Pontes. Unidade IV TECNOLOGIA DA INFORMAÇÃO

Introdução ao SIG. Objetivos Específicos 18/11/2010. Competência: Apresentar: Utilidade de um SIG

CAPÍTULO 1 Introduzindo SIG

Manual para Envio de Petição Inicial

LASERTECK SOFTECK FC MANUAL DO USUÁRIO

AULA 1 Iniciando o Uso do TerraView

MANUAL DE UTILIZAÇÃO SISTEMA DE CADASTRO INTRANET

O Windows 7 é um sistema operacional desenvolvido pela Microsoft.

Cópia. Copiadora e Impressora WorkCentre C2424

Apostila para uso do Power Point

UNIVERSIDADE FEDERAL DE PELOTAS. Índice

MÓDULO 7 Modelo OSI. 7.1 Serviços Versus Protocolos

Anexo III Funcionamento detalhado do Sistema Montador de Autoria

Guia de Início Rápido

Medição tridimensional

COMO COLABORAR NO WIKI DO MOODLE 1. Orientações para produção escolar colaborativa no wiki do Moodle:

Transcrição:

Capítulo 5 DIGITALIZAÇÃO, EDIÇÃO E ESTRUTURAÇÃO DE DADOS CARTOGRÁFICOS INTRODUÇÃO Muita da tecnologia de computação voltada à manipulação / tratamento de dados geográficos está disponível, em diferentes níveis de sofisticação, desde meados dos anos 1970, no entanto, é apenas no final dos anos 1980 que esta tecnologia passou a ser amplamente usada. Uma das razões para isso é o fato de que a aplicação de um SIG depende da existência de dados digitais, relacionados especificamente tanto a aplicações individuais quanto a mapas topográficos base aos quais devem ser referidos. Embora com os métodos modernos de levantamentos seja possível produzir resultados diretamente na forma digital, a grande quantidade de levantamentos topográficos que foram armazenados originalmente em documentos cartográficos convencionais, que deve ser convertido para a forma digital para ser de uso em SIG. A conversão de mapas para a criação de bases de dados digitais traz um problema maior para as agências nacionais de mapeamento 1. Nos Estados Unidos há cerca de 54.000 folhas em escala básica, escala 1:24.000, enquanto o British Ordnance Survey, que foi uma das primeiras organizações a mudar para mapeamento digital, mantém mais de 220.000 mapas em escalas base de 1:1.250, 1:2.500 e 1:10.000. Não foi antes do início dos anos 1990 que parte suficiente deste mapeamento básico tornou-se disponível em forma digital para satisfazer as demandas de um conjunto significativo de usuários de mapas, tal como os planejadores de governos locais, e as companhias de serviços como eletricidade, água, gás e telecomunicações. O processo de digitalização de mapas pode ser considerado como uma aquisição de dados secundária, no sentido de que é uma transformação de uma forma de armazenamento (analógica) para outra forma de armazenamento (digital). Isto pode ser diferenciado de aquisição de dados primária, em que novos dados são obtidos a partir de levantamento. Os métodos de levantamento terrestres e os métodos de sensoriamento remoto são agora altamente dependentes de tecnologia de processamento, com o efeito ou a conseqüência de ter resultados rapidamente disponíveis em formatos digitais. As técnicas de aquisição de dados primárias são tratadas no Capítulo 6. O restante deste capítulo será destinado à revisão das tecnologias e dos procedimentos envolvidos na digitalização de documentos cartográficos existentes. Nisso se inclui descrições da digitalização manual, de digitalizadores seguidores de linhas semiautomáticos, e dos sistemas que demandam a transformação das feições cartográficas de uma imagem matricial completa para uma representação vetorial. Também serão consideradas as questões relacionadas à verificação e correção de dados, e estruturação de dados para produção de bases de dados estruturadas topologicamente. 1 No Brasil são consideradas como agências nacionais de mapeamento o IBGE Instituto Brasileiro de Geografia e Estatística e a DSG Diretoria do Serviço Geográficos do Exército. (N.T.)

DIGITALIZAÇÃO MANUAL Os digitalizadores operados manualmente se constituem no meio mais amplamente utilizado para converter mapas pré-existentes para a forma digital. Os sistemas de digitalização normalmente dispõem de recursos para registro tanto da informação espacial quanto da informação não espacial. Os dados espaciais são armazenados na forma de pares de coordenadas para representar pontos, e de conjuntos de coordenadas para representar linhas e limites de regiões. Dados não espaciais, que descrevem os dados espaciais, consistem em códigos de atributos de feições, classes de feições estabelecidas, textos usados para dar nome a feições individuais, e números que quantificam a entidade representada (p.ex. curvas de nível, população, medidas geoquímicas). Os componentes principais dos digitalizadores manuais são: uma superfície plana, cujas dimensões variam de pequenas mesas, de 30x30cm, a grandes mesas, de 120x80cm, ou mais; um cursor ou um apontador manual, usado pelo operador para indicar a posição a ser registrada; e um teclado para a entrada de dados alfanuméricos e, possivelmente comandos (Figura 5.1). Geralmente os dispositivos grandes são os que têm mais uso em cartografia. O posicionamento exato do cursor é possível por meio de uma mira (+) inserida num painel transparente plano que pode eventualmente ser uma lente. Montados no cursor também pode haver botões que podem ser usados para controlar a entrada de dados. A tecnologia mais comumente empregada nos digitalizadores faz uso de propriedades eletromagnéticas, em que uma mesa embutida de uma fina rede de fios elétricos é associada com o cursor que tem uma bobina de metal. A rede de fios interna à mesa e o cursor com sua bobina atuam tanto como transmissor e receptor como receptor e transmissor. Se o cursor é o transmissor, então a posição (x, y) da mira (+) é obtida pela varredura na grade de fios de modo a identificar aquelas linhas mais próximas do cursor. A posição exata do cursor é então encontrada por interpolação em relação aos fios adjacente em função da natureza dos sinais recebidos. Em mesas de pequeno formato, uma caneta, com a bobina na ponta, pode substituir o cursor, como o dispositivo de localização. Figura 5.1 Mesa de digitalização com cursor, teclado e monitor. Cortesia de Laser-Scan.

Operação de digitalizadores manuais Normalmente, o procedimento operacional de digitalização de um mapa inicia-se pela fixação do documento fonte sobre a superfície de digitalização. Os pontos de grade ou de reticulado podem então ser digitalizados de modo a registrar o sistema de coordenadas do mapa, antes de realizar a digitalização das feições propriamente ditas. É essencial na digitalização cartográfica garantir que a informação de referência de posição, representada por grades ou reticulado do mapa, seja retida na versão digital do mapa. A maioria dos mapas de escala média para grande (maiores que 1:50.000, p.ex.) contém uma grade retangular que pode ser usada como base para uma transformação linear de coordenadas de digitalizador para coordenadas de grade. Se o mapa pode ser considerado como não deformado, ou a acurácia na seja prioridade, então isso pode ser feito pela digitalização de pelo menos três pontos não colineares (i.e. não alinhados) do mapa, as suas coordenadas devem ser conhecidas e pode haver a necessidade de digitá-las quando se digitaliza. Nos casos em que altos padrões de acurácia são necessários, e especialmente nos casos em que se sabe que o documento apresenta deformações, um número muito maior de coordenadas de pontos de controle deve ser digitalizado. Modos de amostragem São comumente aplicados dois modos distintos de amostragem, por ponto e por fluxo (sucessão), para digitalizar coordenadas. O modo por ponto consiste em explicitamente introduzir pares de coordenadas, com um pressionar de botão no cursor. Estas podem ser tratadas como feições referidas por pontos tais como os pontos trigonométricos, pontos de altitude comprovada ou não, ou posições de cidades em mapas de escala pequena, ou para feições lineares ou poligonais tais como reios ou limites de municípios. Neste caso, o operador seleciona pontos característicos ao longo do caminho descrito pelas feições. O modo de sucessão de pontos é apropriado para o incremento em velocidade na digitalização, pela automatização do registro de coordenadas como resposta ao movimento realizado com o cursor pelo operador ao seguir uma feição linear. Ao invés de obrigá-lo a identificá-los individualmente (Figura 5.2). Isto pode ser feito tanto com base em tempo, em que o ponto é registrado a um dado intervalo de tempo (p.ex., a cada 1/5 de segundo), ou com base em distância, em que o ponto é registrado para o caso em que o cursor foi movido uma certa distância ao longo de x, de y ou de ambos, de um ponto anterior. A digitalização de secessão de pontos baseada em tempo é caracterizada pelo fato de que menos pontos serão digitalizados ao longo de seções de linha que sejam relativamente retas, ao longo das quais o operador pode mover o cursor rapidamente, comparativamente a seções complicadas e sinuosas, que tomam mais tempo para perseguir, e, como conseqüência, resulta em mais pontos digitalizados, o que é coerente e apropriado para seu grau de detalhe. Apesar do modo sucessão (tempo ou distância) ser freqüentemente definido, e assim haver grande redundância de dados, há o perigo de que detalhes menores, como cantos agudos possam não ser registrados de modo correto. Por conta disso, algumas organizações operam apenas com a digitalização no modo ponto e estruturam as operações de modo a garantir que todos os detalhes de interesse sejam registrados com acurácia.

Chrisman (1987b) ressaltou que no caso de operadores sem experiência, a amostragem por distância apresenta a vantagem de reduzir a probabilidade de subamostragem, pois não atribui ao operador a carga de responsabilidade de escolher pontos apropriados. Um efeito colateral da amostragem por distância é super-amostragem de seções retilíneas. Isso pode ser compensado por meio de subseqüente filtragem de pontos desnecessários. No projeto descrito por Chrisman, mapas de solos (com limites sinuosos) havia distâncias amostradas com uma razão de amostragem igual a três vezes a espessura da linha. Para propriedades que normalmente consistem de linhas retas com cantos definidos (isto é, pontos de amostragem) a amostragem manual foi realizada. Este autor aponta que mapas de propriedades que continham arcos suaves que deveriam ser digitalizados de modo apropriado com ferramentas de software de digitalização de propósito especial. Figura 5.2 Modos de amostragem de sucessão de pontos por distância e por tempo. (a) Na amostragem por distância um ponto é registrado a cada vez que o cursor se move nas direções x e y mais do que uma distância especificada. (b) Na amostragem de sucessão de pontos pelo modo tempo, um ponto é registrado a cada intervalo regular de tempo transcorrido. Se o operador move o cursor lentamente, tal como pode ocorrer em linhas intrincadas, são registrados pontos com densidade maior. Codificação de feições de ponto, de linha, de polígono e texto Para cada feição de ponto, linha e polígono que tenha a sua posição digitalizada, devem ser providos dados adicionais para informar seu significado. Isto poderia consistir em uma classificação, como edificação ou rodovia primária, ou um identificador específico que poderia ser complementado por um nome específico, pela informação, p. ex., do nome do edifício, seu endereço, ou se para uma rodovia, o seu número ou nome. Esta informação poderia ser normalmente digitada de um teclado ou escolhida num menu de opções, tanto imediatamente antes como após a digitalização da feição. Entretanto, isso também poderia ser feito como uma fase de codificação separada após a entrada de posições. Esta última abordagem tem a vantagem de ser menos prejudicial à continuidade da operação, e necessariamente implica no uso, de certo modo, alternado entre o cursor da mesa de digitalização e o teclado do computador. Por outro lado, pode incrementar o risco

de erro em associar o identificador com um objeto gráfico específico. Isto poderia envolver a ação de clicar o objeto com o mouse ou cursor, antes de inserir a identificação. Uma alternativa poderia ser o programa realçar o objeto gráfico na tela do computador, um a um, e solicitar ao usuário que insira os dados apropriados, caso em que não há necessidade de usar o dispositivo físico de posicionamento. Codificação de polígono Codificação de feições de pontos e linhas é uma operação relativamente direta, mas o processo de codificar polígonos é complicado pelo fato de que cada segmento de linha, ou ligação, que contorna um polígono individual normalmente pertencerá a pelo menos um outro polígono. Se cada polígono tivesse que ser codificado como uma unidade gráfica inteira e separada, haveria muita digitalização em duplicata de linhas compartilhadas entre polígonos adjacentes. Um método de contorno à duplicação de segmentos de linhas consiste em associar a cada segmento de linha um par de códigos de feição para descrever as entidades polígono à esquerda e à direita da linha digitalizada. Os termos direita e esquerda passam a ter significado ao se saber a direção em que a linha foi digitalizada (Figura 5.3). Ao se codificar os segmentos de contorno desse modo, o software pode posteriormente construir cada polígono a partir da busca daquelas ligações que os referencia. Os segmentos serão ordenados automaticamente, a partir da determinação dos pontos comuns de início e fim. Deve-se ter em mente que os enquanto as ligações pertencem a mais de um polígono, não será necessário armazená-los mais do que uma vez. Cada ligação obtida está destinada a um único identificador, é uma questão de apenas criar uma lista de identificadores que referenciarão os dados geométricos relevantes. Outro método para evitar a duplicação da digitalização de linhas é conhecido como solução spaghetti ou meatballs (Chrisman, 1978), e é utilizada em vários SIGs comerciais, e é algo mais simples do que registrar explicitamente os polígonos à direita e à esquerda. O método envolve uma fase inicial de digitalização de todas as partes de linhas de um mapa em qualquer ordem. Isso é o spaghetti. O operador então digitaliza um ponto dentro de cada polígono e associa-o (por meio de digitação num teclado) ao identificador do polígono. Estes pontos são chamados de meatballs, ou pontos semente (Figura 5.3). A organização do spaghetti é deixada para o software, que deve produzir ligações discretas que são usadas para construir os polígonos (uma lista de ligações relevantes). O software usa os pontos semente para deduzir a identidade de cada polígono a partir da realização de busca de ponto em polígono (Capítulo 11). Codificação de texto Ao digitalizar produtos cartográficos existentes, normalmente o operador pode determinar a identidade dos objetos no mapa tanto a partir de sua forma, de sua simbolização (p.ex., cor ou estilo de linha), ou a partir de sua legenda no mapa (identificação textual explícita, N.T.) Em algumas organizações, tem sido prática comum realizar o registro de texto como objetos independentes ao realizar a digitalização. Isso é aceitável no caso em que o único propósito da digitalização do mapa seja a reprodução do documento fonte em meio computacional de modo acurado, mas se feito com o propósito de realizar algum tipo de análise de informação geográfica, ou para criar mapas em

diferentes escala diferente da original, será de pouca valia ter textos desligados dos objetos representados. Se há texto, em geral é desejável procurar associá-lo diretamente a um objeto espacial, de modo que quando a base de dados é construída o texto servirá como um atributo daquele objeto. Será possível então, usar o nome como um meio de referência à geometria associada, e alternativamente, recuperar o nome ao acessar a geometria, de modo a inserir um texto num mapa. Figura 5.3 Os polígonos podem ser digitalizados tanto com codificação por pontos semente (spaghetti e meatballs) ou codificação esquerda/direita. Em (a) os pontos e as letras maiúsculas indicam os pontos semente, as flechas indicam a direção das ligações (numerados L1 a L15), e os círculos indicam os nós. Em (b) são listadas cada ligação com seus polígonos esquerda e direita. Polígonos completados por um ou por outro método resultam na identificação de cada ligação em termos de seus nós de início de término. DETECÇÃO E CORREÇÃO DE ERRO Todo dado cartográfico digital pode ser assumindo como afetado de algum tipo de erro. Os erros surgem de uma combinação de falta de acurácia da fonte de dados e da limitação do operador de digitalização e o sistema de computacional em uso. Certos tipos de erros, tais como aqueles devidos à falta de acurácia dos dados originais, são implícitos ao mapa e não podem ser corrigidos sem obter outra fonte de dados. Outros erros surgem devido a falhas do operador em posicionar acuradamente o cursor sobre o objeto gráfico a ser digitalizado, ou de maneira mais óbvia, perder objetos do mapa ou inserir de modo incorreto a identificação de um objeto. Como uma regra geral, se um erro pode ser detectado ao tempo de sua aquisição então será mais facilmente corrigido do que se for

detectado mais tarde, quando alguém tenta usar os dados. Também é verdade que os erros serão mais facilmente detectados durante a aquisição. Indubitavelmente, muitos conjuntos de dados digitais são afetados de erros que podem nunca ser detectados. De modo particular, erros posicionais freqüentemente não se tornam aparentes enquanto não são combinados dados similares de fontes diferentes. Inspeção visual e plotagens de verificação As modernas estações de digitalização normalmente provêm uma apresentação visual das feições que estão sendo e foram digitalizadas, e uma tela adjacente à mesa de digitalização. O exame desta apresentação visual pode revelar erros maiores tais como nós e picos introduzidos pelo operador em feições lineares, ou falha em completar um objeto linear ou poligonal. Então, se podem corrigir os erros por interação com a apresentação visual e, re-digitalizar ou eventualmente digitalizar fora do documento fonte. Um método mais completo, ou mais atentivo, voltado à detecção de erros posicionais e objetos perdidos, é baseado na realização de uma plotagem dos dados recentemente adquiridos na escala fonte em um filme transparente e que pode ser sobreposto ao documento original. Nos locais em que as discrepâncias aparecem, a transparência conhecida como plotagem para verificação, pode ser marcada para indicar o local em que a digitalização existente deverá ser removida, repetida ou inserida. Erros em digitalização de feições lineares e de polígono Chrisman (1978b) apresenta uma discussão acerca de erros característicos que surgem da digitalização de dados que devem ser estruturados como polígonos. Os erros consistem em: 1. uma incoerência ao produzir a conexão entre linhas - dangling chain, erro por ultrapassar ou por não alcançar o ponto correto de conexão, 2. polígono sem rótulo, 3. rótulos conflitantes para um polígono, 4. segmentos lineares (cadeias de pontos) como rótulos esquerda e direita iguais. Numa rede de segmentos lineares, ou cadeias, que constituem um mapa, é essencial que as cadeias terminem exatamente em pontos denominados nós, que são compartilhados com cadeias conectadas. Ao se digitalizar linhas que tem encontro em junções, é freqüente encontrar casos em que o final de uma linha termina antes (undershoot) ou depois (overshoot) de uma linha com a qual deveria estar conectada (Figura 5.4). Estes erros (dangling chain) podem ser detectados visualmente numa tela ou numa plotagem para verificação e podem ser corrigidos interativamente por meio do deslocamento dos pontos finais das linhas normalmente associado a uma função de captura (snap) que pode unificar dois ou mais pontos (ou um ponto e uma linha) que estão separado a uma distância menor do que um valor de tolerância. Por outro lado, a identificação de um undershoot, pode, por exemplo, disparar uma função de extensão, para extrapolar a linha em direção a uma linha vizinha. Também é possível que estas correções sejam realizadas automaticamente. Para isso um valor mínimo de erro de conexão (overshoot) deve ser especificado de modo a ter a função de igualar dois pontos ou atar um ponto final de uma linha em outra linha. Deve

haver cuidado para selecionar o valor de tolerância e também ao verificar o resultado de sua aplicação, pois há casos em que as feições lineares não são de fato conectadas em um ou nos dois extremos. Um exemplo desta caso, são as estradas sem saída (culs-de-sac), e cercas e paredes que não cercam uma região. Num mapa hidrográfico, muitas seções de canais poderão ser não conectadas em um dos extremos (suas nascentes). Figura 5.4 (a) Erros de digitalização undeshoot e overshoot. Erros de overshoot demandam pela remoção de uma cadeia de dangling e o erro de undershoot implica na necessidade de alongar uma cadeia dangling de modo a produzir dados corretos como (b). Considera-se nesse caso que o operador não terminou a digitalização de uma linha exatamente na junção entre as linhas. Outro problema que pode aparecer ao se usar tolerâncias para capturar pontos (snap) é denominado creep. Neste caso um ponto que foi capturado para outro ponto dentro da tolerância de distância pode ser capturado para outro ponto que está também dentro da tolerância do segundo ponto, mas além da tolerância do primeiro. Assim o primeiro ponto pode ter sido deslocado de uma distância superior àquela especificada (Figura 5.5). Isso pode ocorrer em agrupamentos (clusters) de pontos, e causar deslocamentos "ilegais" significativos. Figura 5.5 O creep pode ocorrer em pontos que foram unidos e que podem ter sido deslocados de mais do que a tolerância. (a) Cada par de pontos (AB), (BC) e (CD) está dentro da tolerância, mas uma seqüência de operações de snap em que (b) é um estado intermediário, resulta na situação mostrada em (c), em que A se tornou ligado a D, apesar de inicialmente estes pontos apresentarem afastamento maior do que a tolerância.

Os erros devido a polígonos não identificados podem ter origem em falha ao digitalizar o ponto semente do polígono (o meatball), mas tais erros também podem ser originados em digitalização duplicada de uma cadeia. Pequenas discrepâncias entre duas versões de cadeias podem produzir polígonos com aparência de ser muito estreitos e para os quais nenhum ponto de identificação foi digitalizado (Figura 5.6). Figura 5.6 Os polígonos estreitos podem surgir como uma conseqüência da digitalização duplicada de alguma feição, em que as linhas digitalizadas são ligeiramente diferentes. A ocorrência de rótulos conflitantes para um polígono poder ser devido a erro de operador ao atribuir rótulos a pontos semente em casos em que múltiplos pontos sementes tenham sido digitalizados (intencionalmente ou não) para um dado polígono. O uso de múltiplos pontos semente pode ser considerado vantajoso como auxílio para a redução de erros de codificação, uma vez que o operador deve deliberadamente repetir uma operação de codificação individual. As discrepâncias poderiam, portanto, realçar erros que de outro modo poderiam não ser detectados se somente um ponto for usado. Podem ocorrer rótulos, esquerda e direita de uma cadeia, que são idênticos se dois polígonos adjacentes forem erroneamente codificados com o mesmo identificador. Em algumas situações pode não ser de fato um erro, caso a cadeia é genuinamente não conectada, como se mencionou acima. Fatores humanos em erro posicional Numa discussão sobre os efeitos, em que Jenks (1981) tratou como, características humanas que afetam a digitalização de um mapa, ocorreu a distinção entre erros psicológicos, fisiológicos e lógicos. Aquele autor ilustra os resultados de experimente em digitalização em que parece haver a possibilidade de surgimento de erros de posição bastante significativos por conta do modo de digitalização em seqüência (stream mode). O autor ainda identifica erros de desvio lateral de uma seqüência correta devidos a erros de origem psico-motora, caso em que o operador falha em posicionar o cursor, acuradamente, sobre o centro da linha a digitalizar. Os erros longitudinais, ao longo da linha são considerados tratados como "espasmos musculares involuntários" e resultam em picos e nós de polígonos na linha digitalizada. No que diz respeito ao modo ponto de digitalização, Jenks sugere a noção de erro lógico, para refletir a pobre avaliação do operador ao selecionar os pontos críticos que melhor representem o caráter da linha que está sendo digitalizada. Jenks também relata o

trabalho de C.T.Taylor que demonstrou que o erro humano na digitalização pode em geral ser reduzido em cerca de 50% por meio de treinamento. Detectou-se em particular que a direção do movimento do cursor de digitalização poderia ter efeito maior no erro de incidência. Fatores de hardware em erro posicional Todas as coordenadas obtidas da mesa de digitalização são limitadas em acurácia pela resolução da mesa, e pela acurácia física do dispositivo de modo consistente, em devolver coordenadas que sejam mais o próximo possível da cruzeta do cursor. Ambos os valores são normalmente da ordem do décimo de milímetro, o que está de acordo com a espessura das linhas na maioria dos mapas. Entretanto, pela prevalência do uso do modo de digitalização seqüência, a ocorrência de erros é consideravelmente maior do que este valor pode sugerir. Por isso o intervalo de amostragem normalmente é estabelecido para ser muito maior do que a resolução do dispositivo, de modo a evitar a geração de grandes quantidades de dados redundantes. A conseqüência disso é que qualquer feição que ocorra entre o intervalo de amostragem será perdida. Um efeito característico disso seria que pontos extremos de uma feição pontiaguda poderiam ser perdidos na representação da digitalização. INTEGRAÇÃO DE DADOS CARTOGRÁFICOS DIGITAIS DE MAPAS E FONTES MÚLTIPLAS Combinação ou casamento de limites A digitalização sistemática de uma região geográfica grande freqüentemente demandará pelo uso de vários originais de carta que partilham seus limites. Quando se digitaliza conjuntos de cartas, ocorrem problemas devido ao fato de que as feições que estão em folhas adjacentes podem não combinar exatamente ao longo de seus limites correspondentes. Por isso para os casos em que os dados digitalizados de regiões de limites são plotados, certas feições que cruzam o limite podem ter pequenas descontinuidades que refletem tanto falta de acurácia aos documentos originais quanto erros de digitalização. Tais descontinuidades devem ser removidas se uma base de dados única e contínua deve ser criada, i.e., uma que não seja condicionada de nenhum modo pelos limites dos dados do mapa fonte. Para contornar o problema os dados do mapa digital devem ser editados nos limites das zonas para garantir que não haja quebras nas feições que deveriam ser contínuas (Figura 57). Esse processo é denominado concordância de limites (edge matching) ou 'zipping' e pode se automatizado até certo ponto pela aplicação da transformação rubber sheet (deformação elástica) em que os pontos correspondentes são deslocados, ao passo que há a garantia de que as feições vizinhas seja pouco modificadas em posição para que se mantenha os relacionamentos originais (Beard e Chrisman, 1988). Integração/combinação de dados - Conflation A integração de dados fica mais complicada nos casos em que as folhas originais se de algum modo se sobrepõem. Isso pode surgir ao se almejar integrar um conjunto de

levantamentos de uma mesma região, talvez realizados em diferentes datas ou por instituições diferentes. Nos casos em que tais conjuntos de dados são combinados, ou reunidos (conflated), certas feições podem ser duplicadas entre os mapas, caso em que uma versão da feição normalmente será mantida, ao passo que outras serão descartadas. Ao fazer isso se deve tomar cuidado para assegurar-se de que feições associadas, anteriormente conectadas, ou que são adjacentes, à feição descarada, sejam apropriadamente inseridas com as feições restantes, de modo a garantir a correta estruturação topológica. O processo de reunião (conflation) é de difícil automação, pois envolve a combinação de feições equivalentes, ou partes de feições, que devido ao próprio levantamento e digitalização podem estar em posições ligeiramente diferentes (Saafield, 1988). O processo de combinação ou de mistura de dados pode envolver o uso de transformações de deformação elástica. Se os conjuntos de dados a misturar estão em diferentes níveis de generalização, e demandam pela manutenção da versão mais detalhada, então a combinação se torna mais complexa, pelo fato de que pode haver diferenças significativas entre as representações generalizadas da mesma feição no mundo real (Jones, 1996). Figura 5.7 Combinação de limites. No caso em que mapas adjacentes digitalizados são unidos para criar uma base de dados única, a combinação de segmentos lineares pode demandar algum pequeno deslocamento para assegurar a continuidade. As diferenças entre as linhas a combinar pode ser devidas à inconsistências nos levantamentos originais ou a erros de digitalização. DIGITALIZADORES SEGUIDORES DE LINHAS SEMI-AUTOMÁTICOS Pelo fato da digitalização manual ser um procedimento demorado, muito esforço foi dispensado em pesquisa para o desenvolvimento de digitalizadores automáticos. Este esforço resultou no desenvolvimento dos dispositivos seguidores de linhas automáticos, que na prática são apenas semi-automáticos, pois devem ser posicionados manualmente no início de cada feição linear a se digitalizada. Algumas vezes estes dispositivos podem ter de ser guiados manualmente, isso pode ocorrer nos casos em que encontram junções entre duas ou mais feições lineares. Os dispositivos mais automatizados, usados para escanear documentos inteiros de uma única vez, são descritos na próxima seção. Os digitalizadores seguidores de linhas mais antigos eram baseados em projetos mecânicos que normalmente consistiam de uma superfície plana sobre a qual o documento estava apoiado e sobre a qual um dispositivo sensível capaz de ser movido estava montado

em uma plataforma com eixos que permite o seu deslizamento (Petrie, 1990a). Estes dispositivos foram substituídos pelas tecnologias baseadas em laser, cujos exemplos podem ser os sistemas Fastrack e Lasertrack da companhia Laser-Scan. Neste caso o mapa estava representado numa folha transparente. Um feixe laser, defletido por espelhos, executava um padrão de varredura local sobre uma porção da linha a ser digitalizada e registrava a imagem em um negativo de filme. Isto era automaticamente analisado para determinar o caminho que define o centro da linha. As coordenadas resultantes serviam então para o propósito de ajudar a determinar onde deveria ser posicionado o próximo centro de varredura para seguir a linha. A empresa Laser-Scan incrementou consideravelmente a eficiência do digitalizador seguidor de linhas baseado em laser com a introdução do sistema VTRAK que opera inteiramente no modo matricial, com início numa imagem total do mapa digitalizado a ser digitalizado (ver a próxima seção). O operador pode monitorar o progresso da digitalização em uma tela de visualização convencional e por esta razão o processo é referenciado como digitalização head-up (cabeça erguida). As linhas que foram digitalizadas são marcadas automaticamente com uma mudança de cor ou simbolização. As tarefas que o operador deve realizar são a seleção das feições a vetorizar 2, e descrevê-las por meio de códigos e atributos. Algumas vezes pode ser necessário guiar o processo pela incapacidade do procedimento automático em seguir a linha a contento. Esta situação, descrita acima, poderia surgir a partir de definição pobre em um documento fonte, ou mais especificamente, em locais em que as linhas são irregularmente descontínuas devido à existência de textos ou pela presença de símbolos que interrompem as linhas. As curvas de nível, por exemplo, são frequentemente interrompidas pelos textos com os seus valores de altitude, e nos locais em que muitas curvas de nível se fundem devido a acentuados gradientes de declividade. Para o caso das linhas que são regularmente descontínuas, devido à simbolização por hachuras, é possível introduzir inteligência no software para que atravesse as ausências de linha automaticamente. A eficiência dos digitalizadores seguidores de linhas é uma função da freqüência com que o operador deve interferir para guiá-lo. Por isso estes digitalizadores são menos eficientes em mapas urbanos detalhados, que tem muitas junções de linhas a pequenas distâncias no mapa. De modo oposto, estes digitalizadores, comprovam ser mais eficientes para a digitalização de linhas longas, relativamente descontínuas e suaves. Do ponto de vista ideal, para mapas de curvas de nível, o documento a ser digitalizado deveria ser uma folha separada, sem outros dados cartográficos, além dos seus valores de altitude. ESCANERS DE FOLHA INTEIRA Os escaners que permitem escanear folhas inteiras são destinados à criação de uma representação digital da fonte na forma de um vetor (array) 2D de valores de pixels. Para a maioria das aplicações cartográficas e de SIG, este vetor (array) ou varredura (raster) 3 devem então ser analisados ou tratados para daí derivar uma representação vetorial das feições geográficas e dos textos, como indicado acima para o sistema VTRAK. Com relação ao seu funcionamento primário, os escaners comerciais normalmente têm sido bastante eficientes em geração de varreduras de alta resolução tanto de valores binários, 2 Pela primeira vez, no capítulo, o autor se utiliza do termo vetorizar. N.T. 3 O autor usa os termos array 2D e raster como sinônimos. N.T.

como em valores tons de cinza quanto em valores de cor. Somente recentemente, entretanto, é que softwares de conversão varredura para vetor se tornaram suficientemente sofisticados para serem capazes de identificar e digitalizar corretamente (em formato vetorial) uma proporção significativa de informação gráfica e textual encontrada em mapas topográficos. Mesmo assim, ainda é necessário despender muito esforço para validar, codificar feições e editar graficamente dados vetorizados. As aplicações mais antigas de sistemas de scanners eram limitadas à digitalização de linhas em originais de alta qualidade separados por cor de impressão de mapas publicados. Os sistemas atuais fazem uso de técnicas de reconhecimento de padrões para distinguir entre uma variedade de símbolos pontuais, lineares e de área, e então realizar a atribuição de códigos de identificação apropriados. Estes sistemas também podem, com um alto grau de sucesso, realizar interpretações tanto de texto impresso quanto escrito à mão livre. Uma discussão acerca da conversão varredura para vetor será tratada até o Capítulo 8. Poderia ser interessante que os sistemas de escaners tem grande potencial para tratar a grande quantidade de tarefas não realizadas dos mapas analógicos tradicionais que devem ser digitalizados em muitas das organizações em que se deseja tirar proveito da tecnologia d SIG. Com os recentes avanços em processamento de dados escanerizados pode-se esperar que estes sistemas continuarão sendo bastante usados. Normalmente os projetos de scanner de varredura são baseados um tambor ou numa mesa plana (Petrie, 1990a). Nos escaners de tambor, tais como aqueles fabricados pelas empresas Optronix, Scitex e Tektronix, o documento a escanear envolve o tambor que é rotado em relação a uma cabeça fotodetectora que se move ao longo do comprimento do tambor. O documento pode ser monocromático ou colorido, no primeiro caso um detector é usado e no segundo caso diversos detectores podem ser usados (Figura 5.8). Como uma alternativa aos relativamente grandes e caros escaners, existem dispositivos de pequeno formato que usam dispositivos ccd (charge coupled devices) lineares ou de área que são móveis. Os ccds podem ser combinados com lentes para formar câmeras que, no caso de ccds lineares, se movem na direção do comprimento do documento numa única varredura. Figura 5.8 Escaner de documento. Escaner Calcomp, cortesia de Laser-Scan.

SUMÁRIO A aquisição de dados por meio de digitalização de documentos cartográficos existentes foi, e em algumas organizações ainda é, o maior obstáculo o sucesso na introdução da tecnologia SIG. Atualmente o meio mais comum de digitalização continua sendo aquele das mesas de digitalização operadas manualmente, nas quais o operador identifica as feições pontuais, lineares e de área representadas em mapas. O processo essencialmente é tedioso e traz consigo a responsabilidade de garantir que os padrões de qualidade em acurácia sejam mantidos. Isso ocorre no processo de operação com feições em que o operador deve tomar cuidado para posicionar o cursor do digitalizador de modo acurado e garantir que todas as feições sejam registradas. Isso também ocorre em procedimentos associados à atribuição de feições demandados para realizar a ligação dos dados geométricos a outros dados específicos da aplicação e para criar dados topologicamente estruturados. Os aspectos de erros e de qualidade de dados são tratados com mais detalhes no Capítulo 7. Os procedimentos de digitalização semi-automáticos estão se tornando cada vez mais difundidos com a introdução da digitalização denominada cabeça-erguida (head-up), em que o operador controla o software seguidor de linhas e reconhecedor de feições que opera na representação escaneada (varredura) do mapa. Tem havido muitas tentativas na história da cartografia digital de introduzir a digitalização inteiramente automática, mas uma vez em mapas escaneados, mas o software para seguir linhas e particularmente para identificação de feições e reconhecimento de caracteres ainda não é suficientemente inteligente para prevenir a considerável interação de um operador no pós-processamento. Leitura complementar Dangermond (1990), provê uma pequena revisão acerca de diferentes tipos de dados e de algumas questões práticas envolvidas em aquisição de dados secundária. Para rever a tecnologia de digitalização, ver Jackson e Woodsford (1991). Para uma introdução prática a uma ampla variedade de recursos disponíveis para digitalização de mapas no ARC/INFO, veja ESRI (1995). Os trabalhos de Chrisman (1987) e Jenks (1981), citados no texto, são recomendados para uma discussão de diversas questões práticas em digitalização de mapas. Como indicado neste capítulo, a digitalização inteiramente automática continua sendo uma tarefa bastante desafiadora. Alguns aspectos de tecnologias relacionados à digitalização automática são encontrados adiante, no Capítulo 8. A qualidade dos dados digitalizados, que foi de algum modo tratada neste capítulo, é uma questão importante, mas é elaborada em mais detalhes no Capitulo 7.