Mapeamento urbano por classificação hierárquica semi-automática baseada em objetos Francine da Rocha Rossoni 1 Valéria Jardim Pires 1 Daniel Zanotta 1,2 1 Instituto Federal de Educação Ciência e Tecnologia do Rio Grande do Sul - IFRS CEP 96201460 Rio Grande - RS, Brasil francine.rossoni@hotmail.com valeriapiresj@hotmail.com daniel.zanotta@riogrande.ifrs.edu.br 2 Instituto Nacional de Pesquisas Espaciais - INPE Caixa Postal 515-12227-010 Rio Grande - RS Brasil Abstract. This work aims at develop a semi-automatic algorithm to classify an urban area located at Rio Grande - RS. The proposed algorithm is based on a decision tree framework and was developed to work with objects. The final decision tree was manually edited to improve the results. Some aspects related to similar targets were carefully analyzed and the respective nodes were updated to better fit the real aspects found in the field. The results showed the semi-automatic approach can adequately classify the heterogenic region. Palavras-chave: remote sensing, image processing, urban monitoring, sensoriamento remoto, processamento de imagens, monitoramento urbano. 1. Introdução O conhecimento cada vez mais detalhado de áreas urbanas permite o planejamento e acompanhamento do crescimento e desenvolvimento das cidades. A medida que novas imagens provenientes de sensores orbitais com resoluções espaciais compatíveis com estudos urbanos estão sendo lançadas no mercado, técnicas de geoeprocessamento para lidar com esses dados vem sendo cada vez mais aprimoradas. Exemplos disso são as imagens IKONOS, QuickBird, e mais recentemente, Geoeye. O geoprocessamento aplicado a áreas urbanas ainda demanda, na maioria das aplicações, uma carga considerável de serviço manual. Esta demanda causa algumas falhas ou inconsistências no mapeamento de grandes cidades ou cidades em desenvolvimento acelerado. A cidade de Rio Grande, localizada no extremo sul do estado do Rio Grande do Sul possui bairros periféricos que ainda carecem de reconhecimento geográfico detalhado. O contraste existente entre a região central e a região periférica pode ser facilmente explicado pelas necessidades estratégicas do município, mas resulta, de qualquer forma, em defasagem social entre o centro e os bairros. A própria administração municipal perde bastante com a falta de conhecimento espacial de todas as regiões, seja para cálculo de impostos ou pela projeção do crescimento municipal. A vila da Quinta e o bairro Povo Novo são exemplos de regiões localizadas na cidade de Rio Grande que carecem de mapeamento urbano preciso. Metodologias automáticas de mapeamento são propostas para agilizar e proporcionar mapeamento padronizado em vários tipos de ambientes, inclusive o urbano. Neste tipo de mapeamento, a classificação orientada à objeto tem ganhado espaço cada vez mais crescente. Diferentemente da classificação por pixel, a classificação orientada à objeto é tida como mais eficaz quando aplicada em imagens que possuem outras características relevantes, como forma, textura e contexto, além daquelas puramente espectrais (BLASCHKE, 2010). 4346
O objetivo deste trabalho é mostrar que uma classificação hierárquica por árvore de decisão e orientada à objeto pode produzir bons resultados tanto para a área urbana, identificando as parcelas residenciais e as vias internas e vegetação arbórea, quanto para as demais regiões caracterizadas por zonas de cultivo, bosques, campos, corpos d água, etc. Dispõe-se de uma imagem de alta resolução espacial do satélite Geoeye, adquirida no ano de 2009. A partir desta imagem será produzido um mapa de cobertura do solo, utilizando uma ferramenta que fará a classificação automática orientada a objeto. Busca-se delimitar com precisão aceitável para estudos urbanos todas as características importantes para a Prefeitura Municipal do Rio Grande (PMRG). 2. Metodologia de trabalho Para a produção de um mapa temático referente à região do Povo Novo serão efetuados uma série de procedimentos, os quais serão descritos a seguir. A Figura 1 apresenta o recorte da área de estudo selecionada referente ao bairro Povo Novo e seu respectivo detalhe ampliado para posterior comparação com os resultados da classificação. Figura 1. Localização geográfica da área de estudo com detalhe à direita ampliado indicado em amarelo. O bairro, além de parcelas urbanas, possui regiões de cultivo sazonal, campos, corpos d água, solo exposto, bosques, vegetação densa, vias locais e uma rodovia federal (BR 392) cruzando o bairro longitudinalmente. A diversidade das componentes da região torna o processo de classificação uma tarefa bastante complexa. A existência de alvos naturais misturados com a malha urbana dificulta a escolha de um classificador que produza bons resultados ao longo de toda a cena. Classificadores paramétricos produzem bons resultados quando aplicados em cenas naturais, porém, falham ao serem aplicados em zonas urbanas. Os classificadores não paramétricos, como árvores de decisão, possuem maior flexibilidade para lidar com situações adversas (Tso e Mather, 2009). A análise de dados envolve respectivamente correção geométrica da imagem, correção radiométrica, delimitação de alvos de interesse e classificação automática. A imagem Geoeye possui georreferenciamento realizado com erro inferior a 0,5 pixel. 2.1 Segmentação Para a classificação orientada à objeto proposta neste estudo, será realizada a segmentação por crescimento de regiões, executada pelo Software Spring 5.2 (Camara et al., 1996). Esta etapa corresponde à divisão da imagem em vários segmentos, de acordo com parâmetros pré-estabelecidos pelo usuário. Para isso, serão realizados diversos testes com valores diferentes de limiar de similaridade e de área. O limiar de similaridade é definido pela máxima variabilidade de pixels presentes em uma mesma área, ou seja, a diferença máxima 4347
permitida entre a resposta espectral de cada pixel para a formação de uma região. Já a área especifica a área mínima em pixels que pode ser agregada a fim de formar um objeto. 2.2 Treinamento do algoritmo Após calculadas as médias e variâncias de cada uma das regiões formadas pela segmentação da imagem, foi possível extrair amostras destes atributos de cada uma das classes de interesse para o treinamento do algoritmo. As amostras são características específicas de uma classe, que dirão ao algoritmo o que uma região deve ter como requisito para ser encaixada em uma classe. Esta etapa foi realizada com bastante cuidado na tentativa de caracterizar corretamente os elementos da imagem em campo; amostras mal coletadas e com grande variabilidade de valores poderão acarretar em uma excessiva confusão do algoritmo, o qual não rotularia adequadamente as classes nas regiões. Neste trabalho, pretende-se coletar amostras de média e variância dos segmentos nas 4 bandas para cada uma das classes. Nº Cl Localização Fotografia no Local Nº Cl Localização 1 Corpos D água 9 Telhado de barro 2 Vegetação Densa 10 Telhado de Amianto 3 Campo 11 Vias 4 Bosques 5 Solo Infiltrado 6 Regiões de Cultivo Sazonal 4348
7 Solo Exposto 8 Cobertura de Zinco Figura 2. Detalhe das amostras coletadas para o treinamento do classificador. Foram coletadas um total de 10 amostras distintas para cada uma das 11 classes. 2.3 Classificação O processo de classificação ou mapeamento do uso e cobertura do solo pode ser considerado como uma função que constrói uma ligação entre os dados brutos (imagem multispectral) e o conjunto de classes definidas pelo usuário (TSO e MATHER, 2009). Como já foi citada anteriormente, a classificação proposta envolverá a utilização de uma árvore hierárquica de decisão (classificador por árvore de decisão). A qual propõe a desagregação de regras de decisões complexas em um conjunto de regras simples, de maneira que o resultado se mantenha inalterado (BATISTA, 2006). Operando de modo que, se o alvo analisado não se encaixar em uma regra de decisão estabelecida pelo algoritmo, permanecerá em fase de teste até que respeite uma das regras de decisões. Uma árvore de decisão é formada por um conjunto de nós de decisão (perguntas) que permitem a determinação de cada classe. As amostras são inseridas em um software específico que, por sua vez, irá gerar o algoritmo, através de limiares estabelecidos para cada classe de interesse do usuário. Para este estudo optou-se por não utilizar pacotes comerciais de processamento de imagens. O software MATLAB 7.7 foi utilizado para calcular (automaticamente) e montar (manualmente) a árvore de decisão, por este permitir alterações nos nós após a criação da árvore. Estas alterações foram necessárias para a correção dos erros eventualmente encontrados após a análise dos resultados preliminares. A árvore de decisão (Figura 3) gerada a partir das amostras extraídas das regiões, a árvore de decisão (caminho hierárquico tomado pelo classificador) foi produzida e manualmente editada para a classificação. 4349
Figura 3. Árvore de Decisão semi-automática utilizada na classificação da região estudada. 3. Resultados e Discussão Inicialmente com a realização da segmentação obteve-se uma imagem com a delimitação dos alvos corretamente discriminada, ou seja, sem os efeitos de super ou sub-segmentação. Após alguns experimentos foram determinados os seguintes parâmetros: similaridade 35 e área 50. A partir do resultado do processo de segmentação foi possível realizar o cálculo da média e variância da imagem. Tais cálculos geraram como resultado as imagens apresentadas na Figura 4. As imagens de média e variância foram sobrepostas, e dessa resultante foram retiradas dez amostras dos números digitais, em cada banda, de cada um dos onze segmentos previamente definidos pelo algoritmo; o qual possibilitou a construção de uma árvore de decisão com os parâmetros decisivos para a classificação da imagem. (a) (b) 4350
(c) (d) Figura 4. (a) Imagem segmentada, com limiares de similaridade 35 e área 50 e (b) detalhe indicado em amarelo em (a). (c) Imagens da média (3R 2G 1B) e (d) variância (4R 2G 1B). Com o êxito na execução das etapas de segmentação e construção da árvore de decisão, obteve-se como resultado final um mapa temático de uso e cobertura do solo para onze classes distintas. O resultado desta classificação e seu respectivo detalhe ampliado estão representados na Figura 5. Figura 5. (a) Imagem resultante da classificação e (b) detalhe. 4351
4. Conclusões As expectativas iniciais deste trabalho envolviam a utilização de uma imagem de alta resolução espacial para classificar uma área urbana da periferia da cidade do Rio Grande RS através de uma classificação semi-automática orientada à objeto. Os resultados mostram que é possível classificar uma área heterogênea como a área selecionada para o estudo alcançando resultados adequados para o planejamento e gestão municipais. Apesar de alguns erros de classificação persistirem, acredita-se que a agregação de parâmetros como os de forma e contexto possa melhorar substancialmente os resultados. Referências Bibliográficas Alves, D. S.; Moreira, J. C.; Kalil, E. M.; Soares, J. V.; Fernandez, O.; Aalmeida, S.; Ortiz, D. J.; Amaral, S. Mapeamento do Uso da Terra em Rondônia Utilizando Técnicas de Segmentação e Classificação de Imagens TM. INPE, 1996. Batista, M. H. Classificação Hierárquica Orientada A Objeto em Imagens de Alta Resolução Espacial Empregando Atributos Espaciais e Espectrais. UFRGS, 1996. Blaschke, T. Object based image analysis for remote sensing. ISPRS International Journal of Photogrammetry and Remote Sensing, n., vol. 5, p. 2-16. 2010. Tso, B.; Mather, P. M. Classification Methods for Remotely Sensed Data. London and New York: Taylor & Francis, 2009. Camara, G; Souza, RCM; Freitas, UM; Garrido J. SPRING: Integrating remote sensing and GIS by objectoriented data modeling, Computers & Graphics, vol. 20, n. 3, p. 395-403, 1996. 4352