ESTUDO COMPARATIVO DE ABORDAGENS BINÁRIA E MULTICLASSE PARA O ISOLAMENTO DE REGIÕES DE VIA NUM PROCESSO DE CLASSIFICAÇÃO DE IMAGENS



Documentos relacionados
INTEGRAÇÃO DE IMAGEM AÉREA DE ALTA RESOLUÇÃO E DADOS DE VARREDURA A LASER NA CLASSIFICAÇÃO DE CENAS URBANAS PARA DETECTAR REGIÕES DE VIA

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

EXTRACÇÃO DE SOMBRA A PARTIR DE IMAGENS DE SATÉLITE DE ALTA RESOLUÇÃO

Classificação de imagens aéreas de alta-resolução utilizando Redes Neurais Artificiais e dados de varredura a laser

10 FÓRUM DE EXTENSÃO E CULTURA DA UEM COMPARAÇÃO DE FUSÃO ENTRE AS IMAGENS DO SATÉLITE RAPID EYE, CBERS E SPOT.

Comparação entre classificadores por pixel e por região com imagem SPOT-5 para o estado de Minas Gerais

Cálculo de volume de objetos utilizando câmeras RGB-D

Análise das técnicas de fusão de imagens aplicadas ao satélite CBERS-2B (CCD-HRC) Claudinei Rodrigues de Aguiar¹ Danielli Batistella¹

REGINA ISHIBASHI 1 ALUIR PORFÍRIO DAL POZ 2

Análise e visualização de dados utilizando redes neurais artificiais auto-organizáveis

Renzo Joel Flores Ortiz e Ilka Afonso Reis

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

MODELAGEM DE EDIFICAÇÕES UTILIZANDO IMAGENS DE ALTIMETRIA

SEPARAÇÃO DE TELHADOS DE EDIFÍCIOS A PARTIR DE TIN/LASER E ANÁLISE DE COMPONENTES CONEXOS

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões

Flavio Marcelo CONEGLIAN, Rodrigo Antonio LA SCALEA e Selma Regina Aranha RIBEIRO. Universidade Estadual de Ponta Grossa

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto

Classificação de Imagens

UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS

Fabiana Silva Pires de Castro 1,2 Paula Debiasi 1 Jorge Antonio Silva Centeno 1

3 Estado da arte em classificação de imagens de alta resolução

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS

MINISTÉRIO DA CIÊNCIA E TECNOLOGIA INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS

Processamento de Imagem. Prof. Herondino

Modelagem Digital do Terreno

Classificação de Imagens de Sensoriamento Remoto usando SVM

Aplicação de laser scanner para detecção de áreas para coleta de água de chuva

UNIVERSIDADE F EDERAL DE P ERNAMBUCO ANÁLISE DE UM MÉTODO PARA DETECÇÃO DE PEDESTRES EM IMAGENS PROPOSTA DE TRABALHO DE GRADUAÇÃO

METODOLOGIA PARA AQUISIÇÃO DE POLÍGONOS 3D A PARTIR DA CLASSIFICAÇÃO E DO TRATAMENTO DE NUVENS DE PONTOS LIDAR

PREDIÇÃO DE SOMBRAS DE EDIFÍCIOS SOBRE VIAS URBANAS COM BASE EM MODELOS DIGITAIS DE ELEVAÇÕES E DADOS DE IMAGENS AÉREAS DE ALTA RESOLUÇÃO

2 Trabalhos Relacionados

EXTRAÇÃO DE EDIFICAÇÕES EM AMBIENTES URBANOS UTILIZANDO IMAGEM DE ALTA RESOLUÇÃO E DADOS DO LASER SCANNER. Máximo Miqueles 1 Jorge Centeno 1

MundoGEOXperience - Maratona de Ideias Geográficas 07/05/2014

Complemento II Noções Introdutória em Redes Neurais

5 Extraindo listas de produtos em sites de comércio eletrônico

Boletim de Ciências Geodésicas ISSN: Universidade Federal do Paraná Brasil

3 Classificação Resumo do algoritmo proposto

Sensoriamento Remoto

CLASSIFICAÇÃO DE IMAGENS

FEN Processamento Digital de Imagens. Projeto 2 Utilização de máscaras laplacianas

4 Segmentação Algoritmo proposto

Características das Imagens de SAR

SINERGIA ENTRE DADOS DE VARREDURA A LASER E IMAGENS AÉREAS DE ALTA RESOLUÇÃO NA RECONSTRUÇÃO DE EDIFÍCIOS. Aluir Porfírio Dal Poz RESUMO

IDENTIFICAÇÃO DE EDIFICAÇÕES PRESENTES EM IMAGEM DE ALTA RESOLUÇÃO UTILIZANDO REDES NEURAIS E DADOS DO LASER SCANNER

CAPÍTULO I 1 INTRODUÇÃO 1.1 CONSIDERAÇÕES INICIAIS

Redes neurais aplicadas na identificação de variedades de soja

PROCESSAMENTO DOS DADOS AVHRR DO SATÉLITE NOAA E APLICAÇÃO SOBRE A REGIÃO SUL DO BRASIL. Leonid Bakst Yoshihiro Yamazaki

UTILIZAÇÃO DA TECNOLOGIA LIDAR EM PROJETOS DE ENGENHARIA DE INFRAESTRUTURA VIÁRIA

2 Classificação de Imagens de Sensoriamento Remoto

Laser scanner aerotransportado no estudo de áreas urbanas: A experiência da UFPR. Jorge Antonio Silva Centeno Edson Aparecido Mitishita

Utilização de Support Vector Machine para classificação multiclasses de imagens Landsat TM +

PROF. DR. JACQUES FACON

Aula 5 - Classificação

Utilização de Análise de Características Dinâmicas em analises estáticas.

15- Representação Cartográfica - Estudos Temáticos a partir de imagens de Sensoriamento Remoto

4 Avaliação Experimental

Estudo Sobre Armazenamento de Modelagem Digital de Terreno em Banco de Dados Geográficos

Gerenciamento de Projetos Modulo II Ciclo de Vida e Organização do Projeto

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

RECONHECIMENTO DE PLACAS DE AUTOMÓVEIS ATRAVÉS DE CÂMERAS IP

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Introdução ao Processamento de Imagens

USO DO MATLAB NA GERAÇÃO DE IMAGEM SINTÉTICA COM MENOR PROPORÇÃO DE NUVEM

Aula 2 RNA Arquiteturas e Treinamento

MLP (Multi Layer Perceptron)

CONTROLE DE QUALIDADE e VALIDAÇÃO DE PRODUTO CARTOGRÁFICO

ADM041 / EPR806 Sistemas de Informação

Detecção de mudanças em imagens oriundas de sensoriamento remoto, usando conjuntos fuzzy.

Processamento digital de imagens. introdução

Desenvolvendo uma Arquitetura de Componentes Orientada a Serviço SCA

29/08/2011. Radiologia Digital. Princípios Físicos da Imagem Digital 1. Mapeamento não-linear. Unidade de Aprendizagem Radiológica

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD

Verificação de Qualidade de Imagens de Fundo de Olho a Partir de Descritores Baseados em Histogramas. Marina Silva Fouto - Reconhecimento de Padrões

Análise comparativa de imagens de alta resolução para classificação através de Geometria Fractal. Graziella Valença de Souza 1 Jorge Centeno 1

Análise e Projeto de Software

Descritores de textura na análise de imagens de microtomografia computadorizada

7.Conclusão e Trabalhos Futuros

Análise e Projeto Orientados por Objetos

Este documento foi elaborado sob a licença

Detecção e Rastreamento de Objetos coloridos em vídeo utilizando o OpenCV

VCA Treinamento em Algoritmo

Departamento de Engenharia Civil Caixa Postal CEP:88010/970 - Florianópolis, SC {lia, lapolli, franzoni}@ecv.ufsc.br

Análise Univariada de Sinais Mioelétricos

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

de Ciências do Ambiente e Sustentabilidade na Amazônia

Universidade Federal do Rio de Janeiro - IM/DCC & NCE

Cloud Detection Tool Uma ferramenta para a detecção de nuvens e sombras em imagens de satélite

DISTRIBUIÇÃO DO USO E COBERTURA DA TERRA POR DOMÍNIOS GEOMORFOLÓGICOS NA BACIA HIDROGRÁFICA DO RIO SÃO JOÃO - RIO DE JANEIRO

Sistema de Visão Computacional sobre Processadores com Arquitetura Multi Núcleos

ANÁLISE DE DIFERENTES MODELOS DE ATRIBUIÇÃO DE NOTAS DA AVALIAÇÃO INTEGRADORA (AVIN) DO CURSO DE ENGENHARIA CIVIL DO UNICENP

Instituto de Computação, Universidade Federal do Amazonas (UFAM) Manaus-AM, Brasil

ATENÇÃO: * Arquivos com tamanho superior a 500 KB NÃO SERÃO ACEITOS * SOMENTE serão aceitos documentos do formato: PDF

ROTEIRO PARA TREINAMENTO DO SAGRES DIÁRIO Guia do Docente

5 Resultados Avaliação Baseada na Taxa de Igual Erro

Projeto de Redes Neurais e MATLAB

O Software Face Match

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Clip-art Retrieval using Sketches PTDC/EIA-EIA/108077/2008

Transcrição:

ESTUDO COMPARATIVO DE ABORDAGENS BINÁRIA E MULTICLASSE PARA O ISOLAMENTO DE REGIÕES DE VIA NUM PROCESSO DE CLASSIFICAÇÃO DE IMAGENS Tatiana Sussel Gonçalves Mendes 1 Aluir Porfírio Dal Poz 2 1 Universidade Estadual Paulista Instituto de Ciência e Tecnologia - Departamento de Engenharia Ambiental tatiana.mendes@ict.unesp.br 2 Universidade Estadual Paulista Faculdade de Ciências e Tecnologia - Departamento de Cartografia aluir@fct.unesp.br RESUMO A extração automática da malha viária baseada em imagens de alta resolução é um relevante tema científico, ganhando destaque também por contribuir com a implementação e atualização de banco de dados de Sistemas de Informação Geográfica (SIG). Um dos desafios na extração da malha viária, principalmente quando se trata de ambientes urbanos, consiste no fato de que as vias sofrem obstruções provocadas por veículos, copas de árvores, projeções de edificações e sombras de objetos que estão ao longo da mesma. Neste sentido, técnicas de classificação de imagens podem ser usadas como primeiro passo para detectar as regiões com alto potencial de conter a malha viária e em seguida, essas regiões são usadas em tarefas mais complexas de refinamento ou reconstrução. Com o objetivo de isolar a classe via asfaltada, este trabalho apresenta um estudo comparativo de resultados de classificação com abordagens binária e multiclasse. Na abordagem binária, as classes resultantes da classificação se resumem em vias e não vias, enquanto que na abordagem multiclasse são propostas diferentes combinações de classes (edificações, vegetação etc.) com maior ou menor detalhamento. No método proposto a classe via asfaltada é isolada por meio da classificação supervisionada por Redes Neurais Artificiais (RNA) integrando imagens aéreas de alta resolução e dados de varredura a LASER. Esta integração aproveita da sinergia existente entre esses dados. A imagem aérea fornece alta definição das bordas dos objetos e suas características espectrais, enquanto que os dados de varredura a LASER contribuem em dois aspectos. O primeiro refere-se aos aspectos geométricos, fornecendo informações das alturas dos objetos, o que favorece a discriminação entre os objetos elevados daqueles que estão no nível do terreno, e o segundo está relacionado ao fato de que a superfície asfáltica da malha viária apresenta baixa refletividade em relação ao pulso LASER, de modo que é representada em tonalidade bem escura e de fácil identificação na imagem de intensidade do pulso LASER. Outra característica é que, nesta imagem, a malha viária apresenta-se sem perturbações provocadas por sombras dos objetos ao seu redor. Os experimentos foram realizados usando um conjunto de dados de cena urbana da cidade de Curitiba-PR e os resultados foram avaliados por meio de índices obtidos a partir da matriz de confusão, tais como acurácia global e as acurácias do usuário e do produtor para a classe de via. Palavras chaves: Detecção da malha viária urbana, classificação de imagens, Redes Neurais Artificiais, dados de varredura a LASER. ABSTRACT The automatic urban road network extraction based in high resolution image is a relevant scientific topic, having highlighted also by contributing to the implementation and updating of the Geographic Information Systems (GIS) database. Especially in urban environments, one of the challenges in the road extraction is the fact that the roads suffering obstructions caused by vehicles, treetops, buildings projections and shadows of objects that are along it. In this sense, image classification techniques can be used as an initial step to detect regions with high potential for containing the road network and these regions are used in more complex tasks of refining or reconstruction. In order to isolate the asphalted road class this paper presents a comparative study of results of binary and multiclass classification 1

approaches. In binary approach, the resulting classes of the classification are summarized in road and non-road, whereas in multiclass approach are proposed different combinations of classes (buildings, vegetation etc.) with more or less details. This proposed method, the asphalted road class is isolated by supervised classification using Artificial Neural Networks (ANN) integrating high resolution aerial images and LASER scanner data. This integration takes advantage of the synergy between these data. The aerial image provides high definition of the edges of objects and their spectral characteristics, while the LASER scanner data contributes in two aspects. The first refers to geometric aspects, providing heights information of the objects and favoring the discrimination between aboveground objects and those at ground level. The second is related with the asphaltic surface of the road network that has low reflectivity relative to LASER pulse and it is represented in dark color and easily identifiable on LASER pulse intensity image. Another characteristic is that the road network on image intensity does not present interference from shadows of the objects around it. The experiments were performed using a dataset of urban scene from Curitiba-PR and the results were evaluated by indexes derived from the confusion matrix, such as global accuracy, and user and producer accuracy of road class. Keywords: Urban Road Detection, Image Classification, Artificial Neural Network, LASER Scanner Data. 1. INTRODUÇÃO A extração automática da malha viária baseada em imagens de alta resolução é um relevante tema científico, ganhando destaque também por contribuir com a implementação e atualização de banco de dados de Sistemas de Informação Geográfica (SIG). Em cenas urbanas, o alto detalhamento fornecido por essas imagens ampliam os desafios para as técnicas de processamento de imagens no intuito de extração de informações, uma vez que ocorre grande variação da tonalidade dos pixels que representam um único elemento (TUIA e CAMPS-VALLE, 2011). Além disso, outro desafio consiste no fato de que as vias sofrem obstruções provocadas por veículos, copas de árvores, projeções de edificações e sombras de objetos que estão ao longo da mesma. Neste sentido, técnicas de classificação de imagens podem ser usadas como primeiro passo para detectar regiões com alto potencial de conter a malha viária (SCHACKELFORD e DAVIS, 2003) e em seguida, essas regiões são usadas em tarefas mais complexas de refinamento ou reconstrução (GROTE e ROTTENSTEINER, 2010). Para detectar e isolar a classe via, alguns métodos utilizam de uma abordagem binária, onde o resultado da classificação se resume em vias e não vias. Exemplos são apresentados na sequência. Mokhtarzade e Valadan Zoej (2007) apresentam uma estratégia de detecção de vias em imagens Ikonos e Quickbird por meio de uma classificação por Redes Neurais Artificiais (RNA), com a verificação de influência de vários parâmetros (textura, informações de bordas etc.) como entrada na rede. Em Benkouider et al. (2011) foi desenvolvido um método para separar a classe via em imagens SPOT RGB, com base em suas características espectrais, num processo de classificação por RNA seguido de um pós-processamento morfológico para regularizar as vias previamente classificadas. Das et al. (2011) apresentaram um método de detecção de vias em imagens multiespectrais de alta resolução baseado em dois estágios. No primeiro, regiões candidatas às vias foram detectadas usando uma classificação por SVM (Support Vector Machine) e atributos salientes de vias (propriedades de contraste e de trajetória linear). No segundo, módulos de pósprocessamento foram usados para refinar a malha viária, de modo a conectar segmentos e remover falsos positivos. Visando lidar com a alta variabilidade dos objetos presentes na cena, alguns métodos apresentam a abordagem multiclasse, cuja cena é modelada como um todo por meio de diferentes classes de interesse como resultado da classificação. Gao e Wu (2004) usaram imagens Ikonos numa classificação não-supervisionada na qual os pixels foram agrupados em 20 classes, sendo duas correspondentes à classe via. A classe via isolada passou por processo de remoção de ruídos, conexão de segmentos e esqueletização. Zhang e Wang (2004) aplicaram uma classificação não supervisionada pelo método de k-médias em imagens pan-sharpened QuickBird. A classe correspondente à via foi isolada e falsos positivos foram eliminados baseando-se em critérios de forma e estratégias de filtragem de segmentos. Mancini et al. (2009) integraram dados de varredura a LASER e imagens multiespectrais num processo de classificação baseado no algoritmo de aprendizado de máquina AdaBoost (abreviação de Adaptative Boosting estímulo adaptativo), resultando em 4 classes. Os autores usaram a classe corresponde à via para extrair rotatórias e vias lineares usando, respectivamente, a transformada de Hough e um método de segmentação por crescimento de regiões modificado. Como pode ser verificado nos trabalhos relacionados, alguns métodos têm incorporado informações adicionais no processo de classificação, pelo fato de que a utilização de apenas informação espectral para classificar imagens de cenas urbanas podem não ser suficiente para separar classes com características espectrais semelhantes. Trabalhos que combinam informações proveniente do sistema de varredura a LASER com imagens multiespectrais para melhorar o resultado da classificação podem ser encontrados em Haala e Walter (1999), Zeng et al. (2002), Botelho e Centeno (2005), Alonso e Malpica (2010), Trinder e Salah (2011), Makarau et al. (2011) e Mendes e Dal Poz (2013). Com o objetivo de isolar a classe via asfaltada, este trabalho apresenta um estudo comparativo de resultados de classificação com abordagens binária ou multiclasse. Na abordagem binária as classes resultantes da classificação se 2

resumem em via e não via, enquanto que na abordagem multiclasse são propostas duas combinações de classes de interesse, uma mais detalhada definindo seis classes (via, grama. árvore, edificação de telhado cinza, edificação de telhado vermelho e concreto) e a outra com três classes (via, vegetação e não vegetação). No método proposto a classe via é isolada por meio da classificação supervisionada por RNA integrando imagens aéreas RGB de alta resolução e dados de varredura a LASER, conforme Mendes e Dal Poz (2013). A imagem aérea fornece alta definição das bordas dos objetos e suas características espectrais, enquanto que os dados de varredura a LASER contribuem com informações de altura em dois aspectos. O primeiro refere-se aos aspectos geométricos, fornecendo informações das alturas dos objetos, o que favorece a discriminação entre os objetos elevados daqueles que estão no nível do terreno, e o segundo está relacionado com o fato de que a superfície asfáltica da malha viária apresenta baixa refletividade em relação ao pulso LASER, de modo que é representada em tonalidade bem escura e de fácil identificação na imagem de intensidade do pulso LASER. 2. MATERIAL E MÉTODO 2.1 Material Para o desenvolvimento do trabalho são usados os seguintes softwares: SURFER da Golden Software para a interpolação dos dados de varredura a LASER, HALCON da MVTec Software GmbH para o processamento das imagens resultantes dos dados de varredura a LASER e o software IDRISI Andes, desenvolvido pela Clark University, para a classificação por RNA. Os dados para a realização do presente trabalho correspondem à região de Curitiba-PR, sendo disponível uma imagem aérea RGB de alta resolução, com resolução espacial de aproximadamente 0,3 m e dados de varredura a LASER, que consistem em uma malha irregular de pontos de elevação com coordenadas (E, N, H, I) no sistema de referência WGS 84. O atributo I corresponde ao valor da intensidade do pulso LASER. A Figura 1 mostra um recorte da imagem aérea RGB de alta resolução, que se caracteriza por uma cena complexa urbana, onde as vias apresentam obstruções causadas pelas árvores e projeções das sombras dos objetos em seu redor. Além disso, verifica-se que algumas edificações possuem comportamento espectral semelhante ao das vias. Fig.1 - Recorte da imagem aérea RGB de alta resolução. 2.2 Procedimentos metodológicos O método proposto baseia-se na classificação por RNA integrando imagem aérea RGB de alta resolução e imagens provenientes dos dados de varredura a LASER para isolar a classe via da cena. Para o desenvolvimento do método são necessárias as seguintes etapas: 1) Registro e pré-processamento dos dados; 2) Definição e caracterização das classes de interesse; 3) Classificação supervisionada por RNA; e 4) Avaliação do resultado da classificação. 2.1.1 Registro e pré-processamento dos dados. Os dados de varredura a LASER e a imagem aérea RGB são geometricamente registrados, de modo que todos estejam num sistema de coordenadas comum. O registro dos dados é realizado a partir da projeção dos dados de varredura a LASER na imagem RGB, através da equação de colinearidade, da adição das distorções relacionadas ao sistema de lentes e em seguida, da transformação entre referenciais no espaço imagem. Com a mesma resolução espacial da imagem RGB, o MDSn é gerado a partir da diferença entre o MDS e MDT, resultando numa representação dos objetos em um superfície plana. Maiores detalhes sobre a geração dos MDS e MDT são descritos em Mendes e Dal Poz (2013). Uma simples limiarização do MDSn permite separar objetos no nível do terreno (vias e calçadas) dos objetos elevados (edificações e vegetação) a partir de uma altura mínima. O MDSn limiarizado pode evitar a classificação errada de pixels que representam objetos elevados na classe correspondente às vias. Na Figura 2 tem-se a imagem que representa o MDSn limiarizado. 2

Fig. 2 - MDSn limiarizado. A partir do atributo intensidade (I) que acompanha as coordenadas 3D dos dados de varredura a LASER é gerada uma imagem de intensidade do pulso LASER, com a mesma resolução da imagem aérea. Nesta imagem, as vias são facilmente identificadas uma vez que possuem resposta espectral homogênea e aparecem escuras devido à baixa refletividade do asfalto (em torno de 17%, segundo Wehr e Lohr (1999)) em relação ao pulso LASER. Outra característica importante desta imagem é a ausência de obstruções provocadas por sombras ao longo das vias, conforme pode ser verificado na imagem de intensidade correspondente à área do recorte (Figura 3). Os detalhes identificados por A e B na Figura 3 mostram regiões onde as vias aparecem sem perturbações por sombras na imagem de intensidade e obstruídas na imagem RGB. A A B B Fig. 3 - Imagem de intensidade do pulso LASER e em detalhes, regiões correspondentes à imagem RGB. No entanto, a imagem de intensidade é altamente ruidosa, afetando diretamente o resultado da classificação. Para minimizar esse problema é aplicado o filtro de mediana usando uma máscara de dimensão 5x5. 2.1.2 Definição e caracterização das classes de interesse. Com o objetivo de isolar a classe via, este trabalho é desenvolvido no contexto de classificação e apresenta um estudo comparativo de resultados de classificação com abordagens binária ou multiclasse. Na abordagem binária as classes de interesse resultantes da classificação se resumem em via e não via, enquanto que na abordagem multiclasse são propostas duas diferentes combinações de classes com maior e menor detalhamento. Na primeira abordagem multiclasse, além da classe via, várias outras classes são definidas para possibilitar a modelagem da cena como um todo, uma vez que trata-se de um ambiente urbano complexo, com alta variabilidade dos objetos presentes na cena. Assim, com base na interpretação visual da imagem são definidas as seguintes classes adicionais: grama, árvore, edificação de telhado de vermelho (cerâmica), edificação de telhado cinza e concreto (quadras de esporte cimentada e calçadas de concreto, blocos e pedras). Duas importantes classes não foram consideradas. Uma delas, a classe solo exposto, por não ocorrer na cena. A classe sombra, uma vez que a adição dos dados de varredura a LASER, principalmente da imagem de intensidade, ajuda a diminuir a interferência desse fenômeno no resultado da classificação. Aproveitando-se da característica peculiar das vias na imagem de intensidade e de modo a simplificar as classes de interesse, é proposta uma abordagem com apenas três classes, sendo elas: via, vegetação e não vegetação. Para simplificar, tem-se a abordagem V-V-N. Na classe vegetação incluem-se as áreas gramadas e as árvores, enquanto que na classe não vegetação estão incluídas as edificações e as áreas calçadas. 3

2.1.3 Classificação por RNA Na classificação por RNA, como dados de entrada tem-se a combinação das imagens R, G e B da imagem aérea com as imagens MDSn (Modelo Digital de Superfície normalizado) limiarizado e de intensidade resultantes dos dados de varredura a LASER, conforme descrito em Mendes e Dal Poz (2013). Para fins de comparação, também é proposta a classificação usando somente as imagens R, G e B. Todos os dados de entrada na rede são escalonados entre 0 e 255. O algoritmo Backpropagation é usado para o treinamento da rede e são adotados valores de 0,01 para a taxa de aprendizado e 0,5 para o fator momento e o número de iterações igual a 10000. A taxa de aprendizagem corresponde à proporção do erro que é passado para os neurônios a cada iteração e o fator momento é usado para otimizar a convergência da rede. Para o treinamento da rede é necessário selecionar amostras de treinamento. Estas amostras são coletadas manualmente por meio da definição de polígonos representativos de cada classe de interesse. Primeiramente, as amostras são coletadas para a abordagem multiclasse com maior detalhamento, como pode ser visualizado na Figura 4(a), que representa as amostras superpostas na imagem RGB. A legenda apresenta cada uma das classes consideradas. Para as abordagens V-V-N e binária são considerados os mesmo polígonos amostrais usados na abordagem multiclasse, conforme mostrado nas Figuras 4(b) e (c). Legenda: (a) Legenda: (b) Legenda: (c) Fig. 4 - Amostras de treinamento para as abordagens (a) multiclasse; (b) V-V-N; e (c) binária. Para a abordagem V-V-N, os polígonos representando as classes grama e árvore são atribuídos a uma única classe de vegetação. Da mesma forma ocorre para a classe não vegetação, que agrega os polígonos representativos das 4

classes edificação de telhado cinza, edificação de telhado vermelho e concreto. No caso, a classe via não é alterada. Na abordagem binária, com exceção dos polígonos representativos da classe via, todos os demais são atribuídos à classe não via. A arquitetura da rede é definida testando arquiteturas com uma ou duas camadas ocultas e o número de neurônios dentro dessas camadas. Após o processo de treinamento da rede, foram selecionadas as arquiteturas que apresentaram: 1) menor diferença entre o valor do Erro Médio Quadrático (EMQ) de treinamento e de teste; 2) valor alto para a acurácia atingida; e 3) diminuição das oscilações entre as curvas que representam o EMQ de treinamento e de teste, conforme aumenta o número de iterações. A Tabela 1 apresenta as arquiteturas selecionadas para a combinação que integra as imagens R, G e B e os dados de varredura a LASER. Por exemplo, a arquitetura [5-7-11-6], apresentada como D, indica que a camada de entrada na rede possui 5 neurônios, os quais correspondem ao número de dados de entrada na rede (imagens R,G, B, MDSn limiarizado e intensidade), duas camadas ocultas com 7 e 11 neurônios, respectivamente, na primeira e na segunda camada e a camada de saída que possui 6 neurônios, correspondentes ao número de classes de interesse. TABELA 1 ARQUITETURAS SELECIONADAS PARA AVALIAR A ACURÁCIA Avaliação da acurácia Arquitetura Acurácia AP (%) Kappa global (%) Classe vias A 5-5 - 6 85.31 0.82 94.54 B 5-7 - 6 89.65 0.87 95.21 C 5-11 - 6 89.22 0.87 93.47 D 5-7 - 11-6 91.38 0.89 96.67 E 5-9 - 16-6 89.88 0.88 95.09 F 5-15 - 21-6 89.52 0.87 90.36 H 5-17 - 25-6 90.73 0.89 95.15 I 5-17 - 5-6 85.12 0.82 96.98 J 5-25 - 9-6 85.32 0.82 96.87 L 5-25 - 18-6 90.16 0.88 96.84 Para cada arquitetura selecionada (Tabela 1), o resultado da classificação é avaliado obtendo-se os índices de acurácia, conforme apresenta a subseção a seguir (subseção 2.1.4). A partir da análise desses índices é selecionada a arquitetura que apresenta melhor resultado. Na Tabela 1, verifica-se que a arquitetura D obteve valores maiores para a acurácia global e o índice kappa, além de apresentar um valor alto (96,67%) para a acurácia do produtor (AP) para a classe via. Diante do exposto, a arquitetura que contém duas camadas ocultas, com 7 e 11 neurônios, respectivamente, na primeira e na segunda camada é então utilizada no processo de classificação por RNA. 2.1.4 Avaliação do resultado da classificação A avaliação da classificação é realizada a partir da tabulação cruzada entre dados de referência e o resultado da classificação. Os dados de referência são obtidos a partir da digitalização de novos polígonos sobre áreas correspondentes a cada classe de interesse. Para definir onde são coletadas as amostras utilizou-se a estratégia de amostragem aleatória estratificada com 200 pontos, permitindo a aleatoriedade de coleta de amostras em estratos que cobrem toda a área. Os pontos coincidentes com as amostras de treinamento não são considerados, assim como aqueles que se encontram na região de transição entre duas classes. A Figura 5 apresenta as amostras de referência superpostas na imagem RGB. Na Figura 5(a) têm-se as amostras de referência para a abordagem mais detalhada, ou seja, multiclasse. As amostras para a abordagens V-V-N e binária são, respectivamente, apresentadas nas Figuras 5(b) e 5(c). É importante considerar que os polígonos são os mesmos para todas as abordagens, com diferença somente na atribuição das classes que os mesmos representam. 5

Legenda: (a) Legenda: (b) Legenda: (c) Fig. 5 Amostras de referência para as abordagens (a) multiclasse; (b) V-V-N; e (c) binária. A avaliação da classificação é realizada a partir da tabulação cruzada entre dados de referência e o resultado da classificação. Neste procedimento, cada pixel de referência é comparado com seu correspondente resultante da classificação, gerando uma matriz de confusão. A partir dessa matriz índices de acurácia da classificação são calculados, como por exemplo, o coeficiente kappa, a acurácia global, os valores para as acurácias do usuário (AU) e do produtor (AP). 3. RESULTADOS EXPERIMENTAIS A classificação foi realizada considerando a combinação de dados de entrada que integra as imagens R, G e B e os dados de varredura a LASER (MDSn limiarizado e imagem de intensidade). Para fins de comparação, a classificação usando como dados de entrada somente as imagens R,G e B também foi realizada. A arquitetura da rede usada para cada classificação contém duas camadas ocultas, com 7 e 11 neurônios, respectivamente, na primeira e na segunda camada. O resultado da classificação usando somente as imagens R, G e B é apresentado na Figura 6(a), o qual obteve uma acurácia global de 61%. As classes árvore, concreto e edificação de telhado cinza foram as que apresentaram piores resultados, com valores para a acurácia do produtor inferiores a 50%. Já, a classe edificação de telhado vermelho apresentou melhor resultado, com acurácia do produtor igual a 89%. Como pode ser verificado na Figura 6(a), a classe via, com valor para a acurácia do produtor igual a 79%, apresentou confusão espectral com a classe edificação de telhado cinza, justamente devido à similaridade espectral entre essas classes. Quando a classe via é isolada (Figura 6(b)), verifica-se que muitos pixels, no interior das quadras, foram incorretamente atribuídos a esta classe, além de ser 6

notável que a classe via não foi obtida de forma definida e contínua, apresentando muitas falhas. (a) (b) Fig. 6 - Resultado da classificação usando somente as imagens R, G e B. (a) imagem classificada; e (b) classe via isolada. Ao adicionar os dados de varredura a LASER às imagens R, G e B no processo de classificação e usando a abordagem multiclasse, constata-se o aumento significativo da acurácia global (91%). Em geral, o resultado da classificação melhorou para todas as classes, mas a classe via foi a que apresentou o valor mais alto para a acurácia do produtor (96%). Os resultados podem ser confirmados a partir da análise visual da Figura 7(a), na qual verifica-se que as classes apresentam-se mais homogêneas e melhor definidas. Na Figura 7(b) é possível verificar que a classe via apresenta-se menos falhada, com menos obstruções provocadas por sombras e árvores, e com poucos pixels classificados incorretamente no interior das quadras. (a) (b) Fig. 7 - Resultado da classificação usando a abordagem multiclasse e integrando as imagens R, G, B, MDSn limiarizado e de intensidade. (a) imagem classificada; e (b) classe via isolada. Combinando as imagens R, G e B com os dados de varredura a LASER, a Figura 8(a) apresenta o resultado da classificação tendo apenas três classes de interesse como saída da rede, a abordagem V-V-N (vias, vegetação e não vegetação). Para a acurácia global foi alcançado o valor de 95%. Pela análise visual da Figura 8(b), verifica-se que a classe via apresentou pequena diferença em relação ao resultado anterior para a abordagem multiclasse (Figura 7(b)). Isto pode ser confirmado pela acurácia do produtor, que alcançou o valor de 97%. (a) (b) Fig. 8 - Resultado da classificação usando a abordagem A-V-N e integrando as imagens R, G, B, MDSn limiarizado e de intensidade. (a) imagem classificada; e (b) classe via isolada. 7

Usando a mesma combinação de dados de entrada na rede, tem-se na Figura 9 o resultado da classificação binária, onde a saída da rede apresenta somente as classes via e não via. Neste caso, o valor da acurácia global é de 95%. A classe via apresentou acurácia do produtor igual a 92%, o qual é um pouco inferior em relação aos resultados anteriores. A classe via apresenta-se com algumas falhas em regiões mais complexas, como nas vias situadas na parte inferior direita da imagem. Além disso, é notável um aumento na quantidade de pixels no interior das quadras, os quais foram classificados incorretamente como pertencentes à classe via. Fig. 9 - Resultado da classificação usando a abordagem binária e integrando as imagens R, G, B, MDSn limiarizado e de intensidade. 4. CONSIDERAÇÕES FINAIS Este trabalho apresentou um estudo comparativo do resultado da classificação com abordagens binária e multiclasse visando isolar a classe via da cena por meio da técnica de classificação de imagens. Conforme já constatado por Mendes e Dal Poz (2013), a integração da imagem aérea RGB com os dados de varredura a LASER (MDSn limiarizado e imagem de intensidade) é fundamental para isolar a classe via, uma vez que a esta combinação de dados minimiza os problemas relacionados às respostas espectrais similares. O trabalho surge da necessidade de verificar se o detalhamento das classes que compõe a cena a ser analisada é realmente fundamental para isolar a classe via com sucesso. De acordo com os resultados experimentais, verificou-se, pela análise visual e numérica, que não há diferenças significativas nos resultados para as abordagens propostas. No entanto, é importante ressaltar que na abordagem multiclasse (maior detalhamento) é possível verificar quais classes interferem no resultado para a classe via. Esta informação é importante para compreender as relações espectrais e contextuais existentes entre as classes no ambiente urbano e, caso necessário, usar informações adicionais no processo de classificação para isolar a classe via com maior acurácia. Em contrapartida, as abordagens V-V-N (via, vegetação e não vegetação) e binária (via e não via) permitem acelerar o processo de definição das amostras de treinamento e tempo de processamento da rede. Como trabalho futuro propõe-se verificar os resultados dessas abordagens usando outros conjuntos de dados, referentes a outras cenas urbanas. Além disso, uma vez isolada a classe via da cena, tem-se como perspectivas futuras o estudo e desenvolvimento de técnicas de pós-processamento de imagens para refinar a classe via, de modo a reconstruir a malha viária. AGRADECIMENTOS Ao Programa de Pós-Graduação em Ciências Cartográficas FCT/UNESP, ao CNPq, por concessão de bolsa de doutorado do primeiro autor (Edital MCT/CNPq nº 27/2007) e ao LACTEC pelo fornecimento dos dados de varredura a LASER. REFERÊNCIAS BIBLIOGRÁFICAS ALONSO, M. C.; MALPICA, J. A. Satellite imagery classification with LiDAR data. In: International Archives of the Photogrammetry, Remote Sensing and Spatial Information Science, Volume XXXVIII, Part 8, Japan, p. 730 735, 2010. BENKOUIDER, F.; HAMAMI, L.; ABDELLAOUI, A. Use of the Neural Net for Road Extraction from Satellite Images, Application in the City of Laghouat (Algeria). PIERS ONLINE, v. 7, n. 2, p. 146-150, 2011. 8

BOTELHO, M. F.; CENTENO, J. A. S. Uso integrado de imagem de alta resolução espacial e altura derivada do LASER Scanner na escolha do classificador orientado a região. Boletim de Ciências Geodésicas, Curitiba, v. 11, n. 1, p. 71-87, 2005. DAS, S.; MIRNALINEE, T.T.; VARGHESE, K. Use of Salient Features for the Design of a Multistage Framework to Extract Roads From High-Resolution Multispectral Satellite Images. IEEE Transactions on Geoscience and Remote Sensing, 2011. GAO, J.; WU, L. Automatic Extraction of Road Networks in Urban Areas from Ikonos Imagery Based on Spatial Reasoning. In: The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Science, Istanbul, v.35, Comm. III/3, p. 331 337, 2004. GROTE, A.; ROTTENSTEINER, F. Automatic road network extraction in suburban areas from high resolution aerial images. In: Photogrammetric Computer Vision and Image Analysis, Proceedings, France, 2010. HAALA, N.; WALTER, V. Automatic classification of urban environments for database revision using LiDAR and color aerial imagery. In: International Archives of Photogrammetry and Remote Sensing, Vol. 32, Part 7-4-3 W6, 3-4, Spain, 1999. MAKARAU, A.; PALUBINSKAS, G.; REINARTZ, P. Multi-sensor data fusion for urban area classification. In: Urban Remote Sensing Event 2011, Munique, p. 21-24, 2011. MANCINI, A.; FRONTONI, E.; ZINGARETTI, P. Automatic extraction of urban objects from multi-source aerial data. In: CMRT09. IAPRS, Vol. XXXVIII, Part 3/W4 Paris, p. 13-18, 2009. MENDES, T. S. G.; DAL POZ, A. P. Integração de imagem aérea de alta resolução e dados de varredura a LASER na classificação de cenas urbanas para detectar regiões de vias. Boletim de Ciências Geodésicas, v. 19, n. 2, p. 287 312, Abr-Jun, 2013. MOKHTARZADE, M.; VALADAN ZOEJ, M. J. Road detection from high resolution satellite images using artificial neural networks. International Journal of Applied Earth Observation and Geoinformation, 9(1), p. 32-40, 2007. TRINDER, J. C.; SALAH, M. Support Vector Machines: Optimization and Validation for Land Cover Mapping Using Aerial Images and Lidar Data. In: 34th ISRSE Symposium, Australia, p. 10-15, 2011. TUIA, D.; CAMPS-VALLS, G. Urban Image Classification with Semisupervised Multiscale Cluster Kernels. IEEE Journal of Selected Topics in Applied Earth Observation and Remote Sensing, JSTARS, v. 4, n. 1, pp. 65-75, 2011. WEHR, A.; LOHR, U. Airborne LASERscanning an introduction and overview. ISPRS Journal of Photogrammetry and Remote Sensing. v. (54) 2-3. p. 68-82, 1999. ZENG Y.; ZHANG J.; WANG G.; LIN Z. Urban land-use classification using integrated Airborne Laser Scanning data and high resolution multi-spectral satellite imagery. In: Pecora 15/Land Satellite Information IV/ISPRS Commission I/FIEOS, 2002. ZHANG, Y.; WANG, R. Multi-resolution and multi-espectral image fusion for urban object extraction. In: XXth ISPRS CONGRESS GEO-IMAGERY BRIDGING CONTINENTS, Vol. XXXV, Part B3, Commission 3, Istanbul, p. 960-966, 2004. 9