Presidente Prudente - SP, 24-26 de julho de 2017 p. 226-231 AVALIAÇÃO DO USO DE INFORMAÇÃO DE TEXTURA DOS DADOS LASER NA CLASSIFICAÇÃO DE SUPERFÍCIES IMPERMEÁVEIS 1 TATIANA SUSSEL GONÇALVES MENDES 1 ANDRESSA NALU HERNANDES 2 ALUIR PORFÍRIO DAL POZ Universidade Estadual Paulista - Unesp 1 Instituto de Ciência e Tecnologia - ICT Departamento de Engenharia Ambiental, São José dos Campos - SP 2 Faculdade de Ciências e Tecnologia - FCT Departamento de Cartografia, Presidente Prudente - SP tatiana.mendes@ict.unesp.br, andressa.nalu@yahoo.com, aluir@fct.unesp.br RESUMO - Este trabalho tem como objetivo integrar informação espectral da imagem aérea de alta resolução com informações dos dados LASER (intensidade do pulso LASER e Modelo Digital de Superfície normalizado) e suas respectivas informações de texturas, calculadas a partir da matriz de coocorrência dos níveis de cinza, para classificar superfícies impermeáveis em ambientes urbanos. A classificação por Support Vector Machine foi aplicada em diferentes combinações de dados de entrada e a acurácia é avaliada usando o coeficiente kappa. Os experimentos realizados mostraram que a acurácia aumentou de 0,59 para 0,83 ao adicionar dados do LASER, e para 0,87 ao incluir os dados de textura. Palavras chave: Support Vector Machine, dados de varredura a LASER, Textura. ABSTRACT This work aims to integrate spatial information by high resolution aerial image with LASER data (LASER pulse intensity image and normalized Digital Surface Model) and their respective textures information obtained by grey-level co-occurrence matrix in order to classify impervious surface in urban environments. The classification using Support Vector Machine was applied in different combinations of input data and the accuracy was evaluated using the kappa coefficient. The experiments performed showed that the accuracy increased from 0.59 to 0.83 when adding the LASER data and 0.87 when including the texture data. Key words: Support Vector Machine, LASER Scanner Data, Texture. 1 INTRODUÇÃO Pesquisas relacionadas ao mapeamento de superfícies impermeáveis a partir de dados de Sensoriamento Remoto tem atraído interesse desde 1970. Superfícies impermeáveis são geralmente definidas como objetos antrópicos, tais como, vias e rodovias, edificações, estacionamentos, calçadas etc. No contexto urbano, o estudo de superfícies impermeáveis é altamente relevante, sendo importante para o planejamento urbano e ambiental e para o gerenciamento de recursos (WENG, 2012). O aumento da impermeabilidade do solo por meio da urbanização repercute na capacidade de infiltração das águas (RIBEIRO, 2007), tendo como consequência o aumento do volume de água e da velocidade de escoamento superficial, com maior possibilidade de risco de enchentes durante as tempestades. Dependendo do relevo e da declividade do terreno, a baixa taxa de infiltração também provoca erosões e deslizamentos. Na literatura encontram-se diversas técnicas para o mapeamento dessas superfícies, que utilizam diversos métodos de classificação de imagens. Dentre eles, o Support Vector Machine (SVM) tem recebido grande atenção pelos pesquisadores devido a sua sólida fundamentação teórica e determinadas características atrativas, tais como arquitetura simples, moderada complexidade computacional e excelente capacidade de generalização (BRUZZONE e PERSELLO, 2009), com diversas aplicações envolvendo dados de Sensoriamento Remoto, por exemplo, na extração de rodovias (MATKAN et al., 2014) e de edificações (TURKER e KOC-SAN, 2015), na classificação de uso e cobertura do solo (DIXON e CANDADE, 2008; SONG et al., 2012; SHAO e LUNNETA, 2012), em detecção de mudanças (SRIVASTAVA et al., 2012) e em detecção
de superfícies impermeáveis (SUN et al., 2011; ZHANG et al., 2012). Além da informação espectral, métodos têm incorporado informações adicionais no processo de classificação, como por exemplo, informações de dados de varredura a LASER (HUANG et al., 2008, ALONSO e MALPICA, 2010, GUO et al., 2011 e HUANG et al., 2011) e informações de textura (ZHU e TOUTIN, 2013; FERNÁNDEZ et al., 2014). Este trabalho tem como objetivo integrar dados LASER (intensidade do pulso LASER e Modelo Digital de Superfície normalizado) e, suas respectivas informações de textura, com a imagem de alta resolução para mapear superfícies impermeáveis, avaliando a contribuição da informação de textura na classificação por SVM. 2 MATERIAL E MÉTODO 2.1 Materiais No presente trabalho foi usado o conjunto de dados (imagem aérea e dados LASER) correspondente a uma área urbana da cidade de Curitiba-PR. A Figura 1 mostra o recorte da área. Figura 2 Hiperplano de dados linearmente separáveis (em cinza), vetores de suporte e o hiperplano ótimo (em preto) (Adaptado de Kavzoglu e Colkesen (2009)). A formulação original do método SVM permite apenas a separação entre duas classes, não atendendo a maioria dos problemas reais. Para contornar esta limitação são empregadas estratégias multiclasse, por exemplo, Um-Contra-Todos (One-Against-All - OAA). No problema de separação dos dados em um número de c de classes, são definidos c classificadores binários, onde cada um é responsável pela separação de uma classe específica com relação às demais. 2.3 Estratégia de classificação e avaliação da acurácia Figura 1 Recorte da imagem aérea de alta resolução. Os softwares utilizados foram: LASTools para o processamento dos dados LASER; e ENVI para a classificação por SVM. 2.2 Classificação por SVM O objetivo do SVM para a classificação é determinar um hiperplano ótimo de separação entre duas classes. Tal hiperplano é determinado usando dados de treinamento e sua habilidade de generalização é verificada usando dados de validação (SRIVASTAVA et al., 2012). Para uma classificação n-dimensional, n-1 hiperplanos são produzidos com o SVM. No entanto, somente um hiperplano, considerado ótimo, fornece uma máxima margem entre as duas classes (KAVZOGLU e COLKESEN, 2009), conforme mostra a Figura 2. O método SVM foi empregado na classificação usando diferentes combinações de dados de entrada. Os dados de entrada são: imagem aérea decomposta em R, G e B; imagem de intensidade e Modelo Digital de Superfície normalizado (MDSn) oriundos dos dados LASER; e imagens de textura (contraste, média, segundo momento angular, correlação, dissimilaridade, entropia, homogeneidade e variância) obtidas a partir da matriz de co-ocorrência (HARALICK et al., 1973) usando as imagens provenientes dos dados LASER. As imagens de entrada na classificação foram combinadas de modo a verificar a contribuição dos dados no resultado, avaliando a acurácia atingida e a imagem gerada. A técnica de Transformação por Componentes Principais foi usada como uma das formas de combinar as diferentes informações e reduzir a dimensionalidade dos dados. Uma vez que o SVM é um método supervisionado, amostras de treinamento são necessárias. Na cena, foram coletadas amostras para as seguintes classes: asfalto, grama, árvore, telhado vermelho (cerâmica), telhado cinza, concreto (quadras de esporte cimentadas e calçadas de concreto, blocos e pedras), solo exposto e água (piscinas). Diferentemente da maioria das abordagens para a classificação, a classe sombra não foi incluída, uma vez que a adição dos dados LASER, principalmente da imagem de intensidade, ajuda a diminuir a interferência desse fenômeno no resultado.
Com o objetivo de avaliar os resultados e as diferentes formas de combinar os dados, as acurácias foram avaliadas usando o conjunto de amostras de validação por meio do coeficiente kappa (CONGALTON e GREEN, 2009). 3 EXPERIMENTOS Os dados LASER e a imagem aérea foram integrados num mesmo sistema de referência através do registro rigoroso, que consiste em projetar fotogrametricamente a nuvem de pontos LASER na imagem aérea, seguida da regularização dos pontos projetados segundo uma grade com mesma resolução da imagem aérea, o que permite gerar o MDS e a imagem de intensidade. Por meio do processo de filtragem dos pontos LASER, usando o software LASTools, pontos que representam a superfície topográfica foram obtidos e o MDSn foi gerado. As Figuras 3(a) e 3(b) apresentam, respectivamente, a imagem de intensidade e o MDSn para a área de estudo. (a) (b) Figura 3 - Imagens oriundas dos dados LASER: (a) Imagem de intensidade; e (b) MDSn. Amostras de treinamento e de validação foram obtidas a partir da análise da imagem aérea. O número de pixels de treinamento e de validação para cada classe é apresentado na Tabela 1. Na classificação por SVM, foi adotada a Função Base Radial como função kernel. O parâmetro penalidade foi definido com valor igual a 100. Altos valores para a penalidade resultam em menores índices de erro durante o treinamento, no entanto, pode ocorrer a perda de generalidade do modelo. Tabela 1 Amostras de treinamento e de validação. Classes Treinamento Validação (pixels/polígono) (pixels/polígono) Asfalto 564/17 315/10 Concreto 296/15 143/8 Telhado cinza 413/17 217/12 Telhado vermelho 284/15 160/9 Árvore 309/13 122/5 Grama 206/9 142/6 Água 38/4 21/2 Solo exposto 114/4 69/3 As diferentes combinações de dados de entrada são apresentadas na Tabela 2, juntamente com os valores do coeficiente kappa alcançados na classificação. As imagens de entrada são: RGB: imagens R, G e B; (I): imagem de intensidade; (H): Modelo Digital de Superfície normalizado; T[I]: imagens de textura provenientes da imagem de intensidade; T[H]: imagens de textura provenientes do MDSn; 1CPT[I]: primeira componente principal das imagens de textura da imagem de intensidade; 1CPT[H]: primeira componente principal das imagens de textura do MDSn; T[I][Ent_2Mom_Var]: Imagens de textura (entropia, segundo momento angular e variância) obtidas a partir da imagem de intensidade. T[H][Ent_2Mom_Hom_Diss]: Imagens de textura (entropia, segundo momento angular, homogeneidade e dissimilaridade ) obtidas a partir do MDSn. T[I][Var]: Imagem de textura (variância) obtida a partir da imagem de intensidade. T[H][Diss]: Imagem de textura (dissimilaridade) obtida a partir do MDSn. Tabela 2 Combinações de dados de entrada. Combinação Kappa SVM A RGB 0,59 B RGB + I + H 0,83 C RGB + I + H + T[I] 0,84 D RGB + I + H + T[H] 0,85 E RGB + I + H + T[I] + T[H] 0,83 F RGB + I + H + 1CPT[I] + 1CPT[H] 0,85 G RGB + I +H + T[I][Ent_2Mom_Var] 0,85 H RGB + I + H + T[H][Ent_2Mom_Hom_Diss] 0,85 I RGB + I + H + T[I][Var] + T[H][Diss] 0,87
As duas primeiras combinações (A e B), apresentadas na Tabela 2, são para fins de comparação, uma vez que estas não apresentam informação de textura. As demais combinações usam informação de textura acrescidas na combinação RGB+I+H, sendo que a combinação F usa as primeiras componentes principais das imagens de textura para reduzir a dimensionalidade dos dados. As combinações de G a I usam as imagens de textura, geradas a partir da imagem de intensidade e do MDSn, que mais contribuem para separar as classes. A adição das informações dos dados LASER (imagem de intensidade e MDSn) aumentou consideravelmente o valor do kappa, de 0,59 para 0,83. A inclusão da informação de textura, de uma forma geral, aumentou a acurácia, alcançando o valor do kappa igual a 0,87 quando as imagens de textura (segundo momento angular para a imagem de intensidade e dissimilaridade para o MDSn) foram incluídas na classificação. As imagens resultantes da classificação são apresentadas na Figura 4. Na combinação A, por usar somente as imagens RGB, verifica-se que houve muitos pixels classificados como asfalto e a classe concreto não é representada, ficando evidenciado a confusão entre as classes asfalto, concreto, grama e telhado cinza. Na combinação B, a inclusão da imagem de intensidade melhora o resultado para a classe asfalto, reduz a influência da sombra nesta classe e contribui para o aparecimento da classe concreto (calçadas). O MDSn permite melhor separar os objetos altos dos que estão no nível do terreno, e por isso, melhora o resultado para as classes edificação cinza e asfalto. RGB (A) RGB + I + H (B) RGB + I + H + T[I] (C) RGB + I + H + T[H] (D) RGB + I + H + T[I] + T[H] (E) RGB+I+H+1CPT[I]+1CPT[H] (F) RGB + I +H + T[I][Ent_2Mom_Var] (G) RGB + I + H + T[H][Ent_2Mom_Hom_Diss] (H) RGB + I + H + T[I][Var] + T[H][Diss] (I) Figura 4 - Imagens resultantes da classificação, segundo as combinações de A a I.
Ao incluir separadamente as imagens de textura da imagem de intensidade e do MDSn na classificação (combinações C e D) obteve resultados muitos próximo, visualmente. O que se observa é que a combinação D, que usa a imagem de textura do MDSn diferenciou melhor a vegetação, enquanto que classificou mais pixels erroneamente como classe solo exposto. Já a combinação C, que usa a textura da imagem de intensidade, verificouse um resultado melhor para a classe asfalto e concreto. A integração de todas as informações de textura no processo de classificação (combinação E) reduziu o valor de kappa, e apresentou, conforme Figura 5, um resultado mais ruidoso em comparação com os dois anteriores. A combinação que insere as primeiras componentes principais das imagens de textura (combinação F) apresentou um melhor resultado para a classe grama e concreto, quando comparado com a combinação E. Analisando todas as imagens de textura geradas, verificou-se que as imagens entropia, segundo momento e variância (combinação G) poderiam ajudar na classificação, principalmente em relação às vias e concreto. Da mesma forma o procedimento foi realizado, selecionando as imagens entropia, segundo momento, homogeneidade e dissimilaridade (combinação H), obtidas a partir do MDSn. Entre o resultado das combinações G e H, verificou-se uma ligeira diferença entre as classes grama e concreto, com maior confusão entre elas na combinação H, que inclui informação de textura do MDSn. A combinação I diminuiu a quantidade de imagens que entram no processo de classificação, inserindo somente uma imagem de textura gerada a partir da imagem de intensidade (variância) e uma imagem de textura do MDSn (dissimilaridade). O resultado dessa classificação alcançou o valor de 0,87, com melhor definição das bordas dos objetos e com o aparecimento de mais pixels da classe concreto. A Figura 5 mostra a classificação associando as classes resultantes em duas: superfície impermeável (em branco) e superfície permeável (em preto). Para a superfície impermeável foram consideradas as classes asfalto, concreto, telhado cinza, telhado vermelho e água. Como os corpos d água presentes na área de estudo correspondem somente a piscinas, esta classe foi incluída como impermeável. Para a classe permeável, foram consideradas as classes árvore, grama e solo exposto. Do total da área de estudo, 52% é considerada como superfície impermeável e o restante, 48%, como permeável. É importante considerar que apesar da área possuir muitas edificações, há muitas áreas gramadas, sendo duas delas de grande extensão, as quais contribuem para que a área de estudo apresente aproximadamente 50% de superfície impermeável, conforme o método proposto. Figura 5 Superfícies impermeáveis (em branco) obtidas pela classificação integrando informações espectrais, de dados LASER e de textura. 4 CONCLUSÕES A classificação por SVM usando diferentes combinações de dados de entrada (R, G e B; imagem de intensidade e Modelo Digital de Superfície normalizado (MDSn) oriundas dos dados LASER; e imagens de textura obtidas a partir da matriz de co-ocorrência usando as imagens provenientes dos dados LASER) foi realizada para verificar se o uso da informação de textura contribui para separar as classes de cobertura do solo com o objetivo de mapear superfícies impermeáveis. É fato que a integração dos dados LASER com as imagens RGB melhora o resultado da classificação, como ocorreu neste trabalho, aumentando o valor do kappa de 0,59 para 0,83. As experimentações foram realizadas para verificar se os dados de textura obtidos a partir dos dados LASER, incluídos aos dados espectrais, de intensidade e o MDSn, melhoram os resultados da classificação. No presente trabalho, houve um aumento da acurácia de 0,83 para 0,87 ao integrar as informações de textura (variância da imagem de intensidade e dissimilaridade do MDSn). O aumento da acurácia não foi muito expressivo, uma vez que o resultado está relacionado a diversos fatores, por exemplo, o método de classificação por pixel e a baixa densidade da nuvem de pontos dos dados LASER. Neste sentido, como trabalhos futuros pretendese analisar outras formas de inserir a informação de textura no processo de classificação; propondo também usar um método de classificação orientado a objeto; e realizar os experimentos usando uma nuvem de pontos de dados LASER mais densa, para produzir imagens com menos ruído. AGRADECIMENTOS Os autores agradecem à FAPESP pelo apoio financeiro através da bolsa de Iniciação Científica do segundo autor (Processo 2016/05240-8) e ao LACTEC pelo fornecimento dos dados de varredura a LASER.
REFERÊNCIAS ALONSO, M. C.; MALPICA, J. A. Satellite imagery classification with LiDAR data. In: International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, v. XXXVIII, Part 8, Japan, pp. 730-735, 2010. BRUZZONE, L.; PERSELLO, C. A novel contextsensitive semisupervised SVM classifier robust to mislabeled training samples. IEEE Transactions on Geoscience and Remote Sensing, v. 47, n. 7, pp. 2142-2154, 2009. CONGALTON, R.; GREEN, K. Assessing the Accuracy of Remotely Sensed Data: Principles and Practices. Boca Raton: Lewis Press, 1999. Cap. 3, p. 12-14. DIXON, B; CANDADE, N. Multispectral landuse classification using neural networks and support vector machine: one or the other, or both? International Journal of Remote Sensing, v. 29, n. 4, pp. 1185-1206, 2008. FERNÁNDEZ, I; AGUILAR, F. J.; AGUILAR, M. A.; ÁLVAREZ, M. F. Influence of Data Source and Training Size on Impervious Surface Areas Classification Using VHR Satellite and Aerial Imagery through an Object- Based Approach. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, v. 7, n. 12, pp. 4681-4691, 2014. GUO, L.; CHEHATA, N.; MALLET, C.; BOUKIR, S. Relevance of airborne LiDAR and multispectral image data for urban scene classification using Random Forests, ISPRS Journal of Photogrammetry and Remote Sensing, v. 66, pp. 56-66, 2011. HARALICK, R. M.; SHANMUGAN, K.; DINSTEIN, I. Textural Features for Image Classification. IEEE Transaction on System, man and Cybernetics, New York, v. 3, n. 6, pp. 610-621, 1973. HUANG, M; SHYUE, S.; LEE, L.; KAO, C. A Knowledge-based Approach to Urban Feature Classification Using Aerial Imagery with Lidar Data. Photogrammetric Engineering & Remote Sensing, v. 74, n. 12, pp. 1473-1485, 2008. HUANG, X.; ZHANG, L.; GONG, W. Information fusion of aerial images and LIDAR data in urban areas: vectorstacking, rec-classification and post-processing approaches. International Journal of Remote Sensing, v. 32, n. 1, pp. 69-84, 2011. KAVZOGLU, T.; COLKESEN, I. A kernel functions analysis for support vector machines for land cover classification. International Journal of Applied Earth Observation and Geoinformation, v. 11, pp. 352-359, 2009. MATKAN, A. A.; HAJEB, M.; SADEGHIAN, S. Road extraction from Lidar data using Support Vector Machine classification. Photogrammetric Engineering & Remote Sensing, v. 80, pp. 409-422, 2014. SHAO, Y.; LUNETTA, R.S. Comparison of support vector machine, neural network, and CART algorithms for the land-cover classification using limited training data points. ISPRS Journal of Photogrammetry and Remote Sensing, v. 10, pp. 78-87, 2012. SONG, X.; DUAN, Z.; JIANG, X. Comparison of artificial neural networks and support vector machine classifiers for land cover classification in Northen China using a SPOT-5 HRG image. International Journal of Remote Sensing, v. 33, pp. 3301-3320, 2012. SRIVASTAVA, P.K.; HAN, D.; RICO-RAMIREZ, M.A.; Bray, M.; Islam, T. Selection of classification techniques for landuse/land cover change investigation. Advances in Space Research, v. 50, pp. 1250-1265, 2012. SUN, Z.; GUO, H.; LI, X.; LU, L.; DU, X. Estimating urban impervious surfaces from Landsat-5 TM imagery using multilayer perceptron neural network and support vector machine. Journal of Applied Remote Sensing, v. 5, 2011. TURKER, M.; KOC-SAN, D. Building extraction from high-resolution optical spaceborne images using the integration of support vector machine (SVM) classification, Hough transformation and perceptual grouping. International Journal of Applied Earth Observation and Geoinformation, v. 34, pp. 58-69, 2015. WENG, Q. Remote Sensing of impervious surfaces in the urban areas: Requirements, methods, and trends. Remote Sensing of Environment, v. 117, pp. 34-39, 2012. ZHANG, H.; ZHANG, Y.; LIN, H. A comparison study of impervious surfaces estimation optical and SAR remote sensing images. International Journal of Applied Earth Observation and Geoinformation, v. 18, pp. 148-156, 2012. ZHU, X; TOUTIN, T. Land cover classification using airborne LiDAR products in Beauport, Québec, Canada. International Journal of Image and Data Fusion, v. 4, n. 3, pp. 252-271, 2013.