Aplicação de Métodos de Extração e Seleção de Atributos para Classificação de Regiões

Documentos relacionados
Seleção de atributos usando algoritmos genéticos para classificação de regiões

Representação e Descrição de Regiões

3 Algoritmos propostos

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Classificadores Lineares. Luiz Eduardo S. Oliveira, Ph.D.

PUCPR- Pontifícia Universidade Católica Do Paraná PPGIA- Programa de Pós-Graduação Em Informática Aplicada PROF. DR. JACQUES FACON

Estatística II Antonio Roque Aula 18. Regressão Linear

7 Tratamento dos Dados

Classificação de Padrões

Reconhecimento Estatístico de Padrões

Aprendizagem de Máquina

Uso de Algoritmos Genéticos na Seleção de Atributos para Classificação de Regiões

4 Reconhecimento de Padrões

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

5 Implementação Procedimento de segmentação

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto

Prof. Lorí Viali, Dr.

William Robson Schwartz 1 Hélio Pedrini 1. Centro Politécnico Curitiba-PR, Brasil {william,

Cap. 5 Classificação Temática

MINISTÉRIO DA CIÊNCIA E TECNOLOGIA INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS

7 - Distribuição de Freqüências

ANÁLISE DE DESEMPENHO DE FILTROS DE REMOÇÃO DE RUÍDO SPECKLE EM IMAGEM SAR (PALSAR-ALOS) COM BASE EM MEDIDAS DE TEXTURA

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

3 A técnica de computação intensiva Bootstrap

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

6 Modelo Proposto Introdução

DELINEAMENTOS EXPERIMENTAIS

Neste capítulo abordam-se os principais conceitos relacionados com os cálculos de estatísticas, histogramas e correlação entre imagens digitais.

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

Algarismos Significativos Propagação de Erros ou Desvios

Avaliação do tamanho da amostra de segmentos regulares para estimar a área plantada com café na região sul de Minas Gerais

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall

REGRESSÃO NÃO LINEAR 27/06/2017

Prof. Lorí Viali, Dr.

Auto-Fusão da Auto-Face, do Auto-Esboço e da Auto-Pele pelo Misturograma em imagens em nível de cinza

Detecção Remota (MTIG) Detecção Remota Aplicada (MEG)

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

3 Subtração de Fundo Segmentação por Subtração de Fundo

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

4 Critérios para Avaliação dos Cenários

CORRELAÇÃO E REGRESSÃO

Redes Neurais (Inteligência Artificial)

Associação entre duas variáveis quantitativas

MODELOS DE REGRESSÃO PARAMÉTRICOS

DIFERENCIANDO SÉRIES TEMPORAIS CAÓTICAS DE ALEATÓRIAS ATRAVÉS DAS TREND STRIPS

EXPLORANDO O PCA NO RECONHECIMENTO DE FACE

3 Elementos de modelagem para o problema de controle de potência

Estimativa da Matriz de Covariância para Classificadores Bayesianos em Problemas de Amostras Insuficientes utilizando Computação Evolucionária

Estimativa da área de soja no Rio Grande do Sul por meio de amostragem aleatória estratificada de pontos

Estudo quantitativo do processo de tomada de decisão de um projeto de melhoria da qualidade de ensino de graduação.

Prof. Lorí Viali, Dr.

AVALIAÇÃO EXPERIMENTAL DE UM MÉTODO DE MEDIÇÃO DE COORDENADAS IMAGEM COM PRECISÃO SUBPIXEL

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16%

Testes não-paramétricos

2 Metodologia de Medição de Riscos para Projetos

CLUSTERIZAÇÃO AUTOMÁTICA NA REDUÇÃO DA DIMENSIONALIDADE DOS DADOS

Investigação sobre métodos para redução da dimensionalidade dos dados em imagens hiperespectrais. Maciel Zortea Victor Haertel Robin Thomas Clarke

Estudo e Previsão da Demanda de Energia Elétrica. Parte II

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto

Avaliação quantitativa do SegSAR através de medidas de borda e regiões em imagens ópticas sintéticas

Cap. IV Análise estatística de incertezas aleatórias

4.1 Modelagem dos Resultados Considerando Sazonalização

Experiência V (aulas 08 e 09) Curvas características

ÍNDICE DE CONSISTÊNCIA TEMPORAL: UM NOVO MÉTODO PARA AVALIAÇÃO DA ESTABILIDADE TEMPORAL DE ARMAZENAMENTO DE ÁGUA NO SOLO

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

Seleção e Extração de Atributos para Classificação de Regiões

UM NOVO MÉTODO DE SEGMENTAÇÃO DE IMAGEM COM ABORDAGEM BASEADA EM BORDAS E REGIÕES. Rogério Galante Negri 1 Marcus Fabiano Saldanha Silva 1,2

INTRODUÇÃO À PROBABILIDADE. A probabilidade é uma medida da incerteza dos fenômenos. Traduz-se por um número real compreendido de 0 ( zero) e 1 ( um).

UM ALGORITMO GENÉTICO PARA O PROBLEMA DE AGRUPAMENTO

DESEMPENHO DOS MODELOS DE ESTIMATIVA DE PRECIPITAÇÃO POR SATÉLITE NO INVERNO/VERÃO NA AMÉRICA DO SUL

ALTERNATIVA PARA DETERMINAR ACURÁCIA DA PREVISÃO DO MBAR UTILIZANDO ÍNDICE DE BRIER. Reinaldo Bomfim da Silveira 1 Juliana Maria Duarte Mol 1 RESUMO

1.INTRODUÇÃO. na superfície terrestre, sem que seja necessário o contato físico com eles, com o intuito de

1. CORRELAÇÃO E REGRESSÃO LINEAR

2 Reconhecimento Automático de Locutor em Ambientes Ruidosos

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel

Regressão Múltipla. Parte I: Modelo Geral e Estimação

Teoria da Regressão Espacial Aplicada a. Sérgio Alberto Pires da Silva

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

CURSO A DISTÂNCIA DE GEOESTATÍSTICA

2 Incerteza de medição

Reconhecimento de Padrões

INF 1771 Inteligência Artificial

Avaliação do Modelo. Avaliação de Modelos. Métricas para avaliação de desempenho. Métricas para avaliação de desempenho 31/05/2017

METODOLOGIA PARA O CÁLCULO DE VAZÃO DE UMA SEÇÃO TRANSVERSAL A UM CANAL FLUVIAL. Iran Carlos Stalliviere Corrêa RESUMO

Santos Júnior, EP 1 ; Soares, HCC 1 ; Freitas, GP 2 ; Pannain, JLM 3 ; Coelho Junior, LM 4 * 1

Q 1-1,5(Q3-Q1) < X i < Q 3 + 1,5(Q 3 -Q 1 ) Q 3 +1,5(Q 3 -Q 1 ) < X i < Q 3 +3(Q 3 -Q 1 ) Q 1 3(Q 3 -Q 1 ) < X i < Q 1 1,5(Q 3 -Q 1 )

IMPLEMENTAÇÃO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO

PROGRAMA INTERLABORATORIAL PARA ENSAIOS EM CHAPAS DE PAPELÃO ONDULADO CICLO 2013 PROTOCOLO

Estudo comparativo entre redes neurais artificiais e análise de regressão múltipla na avaliação de bens, para pequenas amostragens

Análise da curva de crescimento de ovinos cruzados

Aprendizagem de Máquina

Transcrição:

Aplcação de Métodos de Extração e Seleção de Atrbutos para Classfcação de Regões Joanto de Andrade Olvera Lucano Vera Dutra Camlo Daleles Rennó Insttuto Naconal de Pesqusas Espacas - INPE Caxa Postal 515-12201-970 - São José dos Campos - SP, Brasl. {joanto,dutra,camlo}@dp.npe.br Abstract. Good feature extracton and selecton methods are crucal for an adequate performance of remote sensng data classfcaton methods. When data dmensonalty s very hgh, a search strategy should be used to select the set of features that gves the mnmum classfcaton error or mnmze an alternate cheaper crteron related to the classfcaton error. In ths paper dfferent search strateges are compared for the case where a regon classfer s used. Landsat magery s frst segmented usng standard regon growng technque. Afterwards a large number of features are extracted from regons, and a smaller set of features s selected by means of three types of search strategy. The set of features selected by each crteron s classfed based on mnmum Mahalanobs dstance and classfcaton accuracy s calculated. As there s no determnstc relaton between standard feature selecton methods and classfcaton error, s possble to conclude that all search strateges should be used to narrow the number of choces assessments and tang the fnal decson based on classfcaton error. Keywords: feature extracton, feature selecton, regon classfcaton. 1. Introdução A evolução da tecnologa de computação, em termos de hardware, bem como o desenvolvmento de algortmos mas efcentes para manpulação de magens dgtas, tem permtdo um número crescente de aplcações de reconhecmento de padrões em sensoramento remoto. O desenvolvmento de um sstema de reconhecmento de padrões requer: a defnção do padrão das classes, um ambente de aqusção dos dados, a representação do padrão, a extração e seleção de atrbutos, a análse de agrupamento, o desenvolvmento e aprendzado do classfcador, a seleção das amostras de trenamento e teste, e a avalação do desempenho do classfcador (Jan et al., 2000). Pode-se pensar que quanto maor o número de atrbutos para representar um padrão (classe), maor o poder dscrmnatóro do classfcador. Porém, nem sempre sso é verdade. Na prátca o que acontece é uma degradação na acuráca dos resultados da classfcação com o aumento da dmensonaldade dos dados mantendo-se constante o número de amostras de trenamento. Segundo Jan et al. (2000), exstem duas razões para reduzr esta dmensonaldade: dmnur o custo de processamento e aumentar a acuráca da classfcação. A seleção de atrbutos é uma tarefa de dfícl realzação, pos depende dos dados de entrada, sto é, do domíno da aplcação, assm como do classfcador a ser utlzado, por exemplo: paramétrco, não-paramétrco ou redes neuras (Dutra e Huber, 1999). Essa fase é destnada à escolha dos atrbutos que melhor dstnguem as classes prevamente seleconadas. A maora dos métodos de seleção de atrbutos utlza prncípos estatístcos, ou seja, meddas estatístcas entre os atrbutos para cada conjunto de classes, seleconando os atrbutos que contém nformações relevantes para a separabldade das classes. Este trabalho tem por objetvo aplcar métodos de extração e seleção de atrbutos para classfcação de regões. Atrbutos de texturas são extraídos das regões em estudo e métodos de seleção são aplcados a fm de reduzr a dmensonaldade. 4201

2. Extração de atrbutos Extrar as característcas (atrbutos) mas mportantes numa magem evdenca as dferenças e smlardades entre os objetos. Algumas característcas são defndas por uma aparênca vsual na magem. Essas característcas ncluem: o brlho de uma determnada regão, textura de uma regão, ampltude do hstograma, entre outros (Pratt, 1991). O prncpal objetvo da extração de atrbutos é caracterzar os objetos para serem reconhecdos através de meddas sobre a magem (Duda e Hart, 2001). O processo de extração e seleção de atrbutos fo realzado no sstema Texture (Rennó et al., 1998). Este sstema fo desenvolvdo em IDL/ENVI e está sendo aperfeçoado a fm de agregar os métodos de seleção descrto no tem 3 deste trabalho. 2.1 Atrbutos de Textura As texturas contêm nformações mportantes sobre o arranjo estrutural das superfíces e seus relaconamentos com o ambente ao redor (Haralc et al., 1973). No sstema, podem-se extrar três grupos de atrbutos de textura: dstrbuconal (dst), que se dvd em dos subgrupos: báscos e partculares; co-ocorrênca (cooc); e autocorrelação espacal (auto). Esses atrbutos são descrtos com mas detalhes em Rennó et al. (1998). Os atrbutos dstrbuconas consderam a estatístca local, ou seja, não levam em conta a dstrbução espacal dos níves de cnza. O sstema possu oto atrbutos de textura dstrbuconas báscos: desvo absoluto da méda, assmetra, curtose, coefcente de varação, medana, méda, varânca e desvo padrão; e sete atrbutos dstrbuconas partculares: entropa, energa, méda da log-normal, varânca da log-normal, desvo padrão da lognormal, alpha da -ntensdade, alpha da -ampltude. Haralc et al. (1973) ntroduzu a representação de texturas através da matrz de coocorrênca. Este método explora a dependênca espacal dos níves de cnza da magem para montar uma matrz que representa a nformação textural. A matrz de co-ocorrênca é defnda para uma orentação e uma dstânca entre os pxels da magem. Dezoto atrbutos de coocorrênca estão ncluídos no sstema: contraste, entropa, energa (unformdade), homogenedade, correlação, ch-quadrado, dssmlardade, cluster shade e cluster promnence; méda, entropa, varânca e energa dos vetores de soma e dferença; e contraste do vetor dferença. A autocorrelação espacal ndca a relação espacal exstente entre os pxels de uma magem. Há um valor de autocorrelação para cada relação de vznhança, sendo esta defnda por uma dstânca em lnhas e outra em colunas. Usualmente, estas dstâncas são ctadas como lags. No sstema, esse tpo de atrbuto pode ser defndo para lags entre 4 e 4 em lnhas e colunas. Pode-se também calcular a razão entre os dferentes atrbutos de autocorrelação. 3. Seleção de atrbutos A seleção de atrbutos é um problema de otmzação e busca pelo menor subconjunto com a melhor acuráca no processo de classfcação. O processo de seleção de atrbutos é executado com base em dstâncas estatístcas entre pares de classes. Há váras formas de medr a dstânca entre conjuntos de classes dferentes no espaço de atrbutos. Dentre elas, pode-se ctar (Theodords e Koutroumbas, 1999): dstânca Eucldana, dstânca de Mahalanobs e dstânca de Bhattacharyya. A dstânca de Bhattacharyya é defnda também como medda da smlardade entre duas dstrbuções estatístcas (Bhattacharyya, 1943). Nesse trabalho, utlzou-se a dstânca de Bhattacharyya entre duas classes dada por: + 1 1 t + 1 2 B = ( µ µ ) ( µ µ ) + ln (1) 8 2 2 4202

onde µ e µ são os vetores de méda e Σ e Σ representam as matrzes de covarânca das classes e. Para executar a seleção de atrbutos com base em dstâncas entre classes, é necessáro defnr uma função crtéro que possa avalar a separabldade entre todas as classes de uma manera global. A função crtéro para a maora das dstâncas ctadas acma pode ser efetuada por uma smples operação de soma, méda, desvo padrão e outras característcas estatístcas entre os pares de classes exstentes (Dutra e Huber, 1999). É desejável que a função crtéro seja maor quanto menor for a redundânca entre os atrbutos e quanto maor a facldade de dscrmnar padrões de classes dferentes. Vsando otmzar o conjunto de atrbutos para mnmzar a probabldade de erro na classfcação, deve-se maxmzar a dstânca entre padrões de classes dferentes no espaço de atrbutos. A dstânca Jeffrerys-Matusta (JM) é uma função crtéro muto utlzada, que expressa as meddas estatístcas de separabldade entre duas dstrbuções (Dutra e Huber, 1999). A dstânca JM entre as classes e é dada por: B JM = 2(1 e ), JM [0, 2 ) (2) onde B representa a dstânca de Bhattacharyya entre as classes e. Utlzou-se a maor dstânca méda JM entre pares de classes como função crtéro para seleconar o subconjunto de atrbutos mas representatvo na separabldade das classes. Os algortmos de seleção de atrbutos são dvddos em três grupos: exponencas (busca exaustva), randômcos e seqüencas (Boz, 2002). Os métodos seqüencas de seleção de atrbutos têm sdo estudados em város trabalhos (Bttencourt et al., 2004; Jan e Zonger, 1997). Os dos métodos mas proemnentes da seleção de atrbutos são (Dutra e Huber, 1999): Sequental Forward Feature Selecton (SFS) e Sequental Bacward Feature Selecton (SBS). Implementou-se três algortmos de seleção de atrbutos nesse trabalho: SFS, SBS e um algortmo de escolha fxa do subconjunto de atrbutos. 3.1 Método SFS O algortmo SFS nca com um conjunto vazo (Y 0 = φ) e, conforme o algortmo é executado, o melhor atrbuto x + é nserdo no subconjunto, resultante do máxmo valor da função crtéro J (Y K + x + ), quando combnado com os atrbutos Y K que já tenha sdo seleconado (Fgura 1). Fgura 1 - Algortmo SFS O método SFS tem menor custo computaconal quando se deseja obter conjuntos pequenos em relação ao total de atrbutos (Jan e Zonger, 1997). Uma vez que um atrbuto tenha sdo seleconado, ele não pode ser descartado do subconjunto, o que pode provocar o chamado efeto nestng. Este efeto ocorre quando o subconjunto ótmo não contém elementos do conjunto já seleconado, o que mpossblta que seja obtdo o conjunto de atrbutos ótmo. 3.2 Método SBS O algortmo SBS nca com um conjunto de atrbutos completo (Y 0 = X) e, nas terações do algortmo, remove-se o atrbuto com o mínmo valor da função crtéro J (Y K x - ), onde Y K é o conjunto de atrbutos já seleconado e x - é o atrbuto a ser removdo (Fgura 2). O método 4203

SBS tem menor custo computaconal, quando se deseja obter conjuntos grandes em relação ao total de atrbutos. Uma desvantagem desse método é que uma vez elmnado o atrbuto, ele não retornará ao subconjunto. Fgura 2 - Algortmo SBS 3.3 Método de Escolha Fxa () O método de escolha fxa é uma busca exaustva que extra um subconjunto ótmo do conjunto global de n atrbutos para um número fxo de atrbutos. O número de possbldades do método ótmo cresce exponencalmente, fazendo a busca exaustva pouco utlzada para um número alto de atrbutos. Implementou-se o algortmo NEXKSB (Next - subset of an n-set) para obter as combnações de atrbutos a partr de um conjunto de n atrbutos (Njenhus, 1978). O subconjunto resultante desse método obtém o resultado ótmo na separabldade das classes. 4. Classfcação A classfcação de magens consste em assocar cada pxel ou regão da magem a uma classe ("rótulo") que descreve um objeto real. A tarefa do classfcador é usar o vetor fornecdo pelo processo de extração e seleção de atrbutos para atrbur o objeto a esta classe (Duda e Hart, 2001). A obtenção de uma classfcação deal, que corresponda totalmente a realdade, é quase mpossível, sendo uma tarefa mas geral, estmar a probabldade de que um padrão (objeto) pertença a uma determnada classe, baseando-se nos valores de alguns atrbutos ou em um conjunto de atrbutos. A classfcação de regão analsa a varabldade espacal de uma determnada regão. As regões são extraídas pelo processo de segmentação. O processo de segmentação sgnfca agrupar partes de uma magem em undades homogêneas com relação a uma ou mas característcas (Pratt, 1991). Outra forma de extrar regões de uma magem é através da dgtalzação das regões de nteresse (ROI). O sstema oferece ferramentas para a classfcação de regões de uma magem segmentada ou de regões extraídas através dos ROI usando atrbutos de textura (Rennó et al., 1998). 5. Resultados e Dscussão Para demonstrar a potencaldade dos métodos de extração e seleção de atrbutos propostos para a classfcação por regão fo utlzado uma magem Landsat/TM banda 5 (400x400 pxels) da regão da Floresta Naconal Tapajós, stuada no Estado do Pará (55 03 35 a 55 08 46 WGr, 03 02 07 a 03 07 15 S). A magem Landsat/TM utlzada refere-se à órbta-ponto 227/062, de 02 de agosto de 1999. A fm de testar os métodos de extração e seleção para classfcação de regões, extrau-se 30 atrbutos de texturas do sstema (Tabela 1). Utlzou-se a confguração da matrz de coocorrênca 3x3 para extrar os atrbutos de co-ocorrênca. Com base na magem e no conhecmento de campo, três classes de nteresse foram defndas: floresta prmára (FP), pasto (PT) e água (AG). Para cada classe, foram obtdas 20 regões de trenamento (utlzadas no processo de seleção) e 20 regões de teste (utlzadas para verfcação da acuráca da classfcação). Não se deve empregar o conjunto de trenamento para estmar a probabldade 4204

de erro, pos o classfcador estará ajustado especfcamente para o conjunto de trenamento e a estmatva da probabldade de erro será muto otmsta. F 1 desvo absoluto da méda (dst) F 2 assmetra (dst) F 3 curtose (dst) F 4 coefcente de varação (dst) F 5 medana (dst) F 6 entropa (dst) F 7 energa (dst) F 8 méda (dst) F 9 varânca (dst) F 10 desvo padrão (dst) F 11 méda da log-normal (dst) F 12 varânca da log-normal (dst) F 13 desvo padrão da log-normal (dst) F 14 contraste (cooc) F 15 entropa (cooc) F 16 energa (cooc) F 17 homogenedade (cooc) F 18 correlação (cooc) F 19 dssmlardade (cooc) F 20 ch-quadrado (cooc) Tabela 1. Atrbutos extraídos para o processo de classfcação. F 21 cluster shade (cooc) F 22 cluster promnence (cooc) F 23 méda do vetor soma (cooc) F 24 varânca do vetor soma (cooc) F 25 entropa do vetor soma (cooc) F 26 energa do vetor soma (cooc) F 27 méda do vetor dferença (cooc) F 28 varânca do vetor dferença(cooc) F 29 entropa do vetor dferença (cooc) F 30 energa do vetor dferença (cooc) Uma quantdade alta de atrbutos mutas vezes é confundda com a qualdade das relações exstentes entre os mesmos. Busca-se um espaço de dmensão menor que anda represente a nformação contda nestes dados. Pode-se com um número alto de atrbuto, gerar problemas matemátcos (nversão de matrzes), sendo necessáro escolher os atrbutos mas representatvos, ou seja, que melhor dscrmnam os objetos de nteresse. A partr das regões de trenamento, fez-se a seleção de atrbutos pelos 3 métodos propostos, formando subconjuntos de até 12 atrbutos. Para testar os métodos propostos, realzaram-se dos expermentos: a) classfcação de regões dgtalzadas (ROI) sobre a magem Landsat/TM (regões de teste); b) classfcação de regões de uma magem segmentada a partr da mesma magem Landsat/TM. No prmero expermento, cada subconjunto de atrbutos seleconado pelos três métodos (SFS, SBS e ) fo avalado pela classfcação das regões de teste, através da acuráca total (razão entre o número de regões classfcadas corretamente e número total de regões). Cada regão de teste fo classfcada como pertencente à classe que mnmzou a função crtéro. Utlzou-se nesse expermento o classfcador baseado na dstânca de Mahalanobs. A Fguras 3 apresenta o valor da acuráca total da classfcação das regões de teste para cada subconjunto seleconado pelos métodos propostos. Fgura 3- Valor da acuráca da classfcação utlzando dstânca Mahalanobs. O método de seleção de atrbutos de escolha fxa, por ser um método que busca todas as combnações para um número requerdo de atrbutos no espaço de atrbutos global, fo executado até o subconjunto de 4 atrbutos, devdo ao custo computaconal. Esperava-se que o método obtvesse a melhor acuráca na classfcação, pos esse método extra um subconjunto ótmo do conjunto global de atrbutos, ou seja, o subconjunto que possu a maor méda da dstânca JM. Isso ocorre, pos os métodos de seleção que utlzam dstâncas 4205

estatístcas garantem uma boa separabldade entre as classes, mas uma boa classfcação não depende apenas dos métodos de seleção, mas também do classfcador utlzado. A Tabela 2 apresenta os valores da méda JM e a acuráca total para cada subconjunto de atrbutos seleconados pelos três métodos de seleção propostos neste trabalho. Na escolha de apenas um atrbuto, o atrbuto F5 (medana), seleconado pelos métodos SFS e, obteve a maor méda da dstânca JM, tendo um valor menor na acuráca total do que o atrbuto F8 (méda). Métodos Número de Atrbutos Méda JM Acuráca Total (%) Atrbutos Seleconados SFS 1,4142131 98,33 F5 SBS 1 1,4141301 100 F8 1,4142131 98,33 F5 SFS 1,4129448 98,33 F5 e F16 SBS 2 1,4141301 98,33 F8 e F11 1,4141301 98,33 F8 e F11 SFS 1,4139893 96,66 F5,F16 e F21 SBS 3 1,4142007 98,33 F8,F9 e F11 1,4142110 95,00 F7,F8 e F11 SFS 1,4141941 93,33 F5,F16,F21 2 F24 SBS 4 1,4142134 96,66 F8,F9,F11 e F12 1,4142135 95,00 F7,F8,F11 e F21 SFS 1,4142099 91,66 F5,F16,F21,F23 e F24 SBS 5 1,4142135 93,33 F8,F9,F11,F12 e F18 SFS 1,4142131 98,33 F5,F11,F16,F21,F23 e F24 SBS 6 1,4142136 93,33 F8,F9,F11,F12,F13 e F18 SFS 1,4142136 98,33 F5,F11,F12,F16,F21,F23 e F24 SBS 7 1,4142136 91,66 F6,F8,F9,F11,F12,F13 e F18 SFS 1,4142136 96,66 F5,F8,F11,F12,F16,F21,F23 e F24 SBS 8 1,4142136 91,66 F6,F8,F9,F11,F12,F13,F16 3 F18 SFS 1,4142136 95,00 F5,F8,F9,F11,F12,F16,F21,F23 e F24 SBS 9 1,4142136 91,66 F6,F7,F8,F9,F11,F12,F13,F16 e F18 SFS 1,4142136 95,00 F5,F8,F9,F11,F12,F16,F21,F23,F24 e F30 SBS 10 1,4142136 91,66 F6,F7,F8,F9,F11,F12,F13,F15,F16 e F18 SFS 1,4142136 96,66 F5,F8,F9,F11,F12,F16,F21,F23,F24,F29 e F30 SBS 11 1,4142136 91,66 F6,F7,F8,F9,F11,F12,F13,F15,F16,F17 e F18 SFS 1,4142136 98,33 F5,F8,F9,F11,F12,F16,F21,F23,F24,F28,F29 e F30 SBS 12 1,4142136 91,66 F6,F7,F8,F9,F11,F12,F13,F15,F16,F17,F18 e F19 Tabela 2. Atrbutos seleconados através dos 3 métodos de seleção propostos, com suas respectvas Méda JM e o valor da acuráca total para cada sub-conjunto. Para a classfcação das regões de teste, obteve-se um excelente resultado, alcançando 100% no valor da acuráca total, utlzando-se apenas 1 atrbuto seleconado. A obtenção desse resultado fo possível, pos as classes em estudo são bem separáves, e com apenas a obtenção de estatístca de prmera ordem, como a méda e a medana pode-se obter um bom desempenho na classfcação. No segundo expermento, as regões utlzadas para a classfcação foram extraídas pelo processo de segmentação (Fgura 4a), cuja metodologa usada é descrta em Sousa Junor et al. (2003). Para a segmentação da magem Landsat/TM utlzou-se um lmar de área gual a 20 pxels e a smlardade de 10 níves de cnza. O mapa verdade de campo, utlzado como referênca neste trabalho, fo confecconado através dos dados coletados em campo (Fgura 4b). A metodologa usada para a confecção desse mapa está descrta em Pard Lacruz (2001). Utlzou-se as nformações de campo na avalação da classfcação, analsando-se o desempenho do classfcador, vsualzando não somente os acertos, mas também quas as classes cujas amostras foram erroneamente classfcadas e quas classes ocorreram confusão. O resultado da classfcação da magem segmentada com o subconjunto dos 12 atrbutos, seleconados pelo método SFS é apresentado na Fgura 4c. Para efeto de vsualzação do problema de classfcar uma magem utlzando nformações redundantes (atrbutos correlaconados), é apresentado também a magem classfcada utlzando-se os 30 atrbutos (Fgura 4d). 4206

Observa-se que, na Fgura 4d, há muta confusão, ou seja, o número de regões classfcadas corretamente é menor que na Fgura 4c. Pode-se observar anda que com um número menor de atrbutos, obtvesse-se um melhor resultado na classfcação. Estes resultados mostram que os métodos de seleção propostos ao problema em estudo reduzem a dmensão dos dados aumentando o poder dscrmnatóro. (a) (b) (c) (d) Fgura 4: (a) Imagem da banda 5 TM/Landsat e sua segmentação; (b) Imagem de Temátca (verdade de campo); (c) Imagem classfcada utlzando 12 atrbutos, seleconados pelo método SFS; (d) Imagem classfcada utlzando 30 atrbutos (conjunto global de atrbutos). 6. Conclusões e Recomendações Esse trabalho apresentou métodos de extração e seleção de atrbutos na classfcação de regões. Através desses métodos, fo possível extrar atrbutos de textura dos objetos (regões) na magem segmentada e das regões de teste, seleconando-se os atrbutos mas relevantes na separabldade das classes. No processo de classfcação, uma quantdade alta de atrbutos pode não aumentar a precsão do classfcador. Isso ocorre devdo à redundânca das nformações. Os resultados encontrados mostram a vabldade em se utlzar os métodos de seleção de atrbutos, objetvando a redução da dmensonaldade sem haver perda no poder dscrmnatóro entre as 4207

classes. Não exste nenhuma relação determnístca entre métodos de seleção de atrbutos padrão e erro de classfcação, onde se conclu que todas as estratégas de busca devem ser usadas para dmnur o número de avalações na escolha da decsão fnal baseada no erro da classfcação. Outra forma de aumentar a potencaldade da separabldade das classes é agregar atrbutos de forma no processo de extração de atrbutos, que ntegrados ao sstema, seja possível aumentar a dstnção entre as classes. Além dsso, métrcas de avalação e comparação com outros algortmos de seleção devem ser estudadas e posterormente aplcadas para outras áreas de estudos com dados orundos de város sensores. 7. Referêncas Bhattacharyya, A.. On a measure of dvergence between two statstcal populatons defned by ther probablty dstrbutons. Bulletn of the Calcutta Mathematcs Socety 35, 99 110, 1943. Bttencourt H.R., Clare R.T., Feature Selecton by Usng Classfcaton and Regresson Trees (cart). XX ISPRS Congress, 12-23 July 2004, Istanbul, Turey. Boz, O. Feature Subset Selecton by Usng Sorted Feature Relevance. Proc. of The 2002 Intl. Conf. on Machne Learnng and Applcatons, 2002. Duda R.O., Hart P.E. & Stor D.G.. Pattern Classfcaton. 2 ed. New Yor, Wley, (2001). Dutra, L.V. and Huber, R.. Feature Extracton and Selecton for ERS 1/2 InSAR Classfcaton: Int. J. Remote Sensng, 1999, vol. 20, nº. 5, 993-1016. Haralc, R.M; Shunmugan, K; Dnsten, I. Texture Feature for Image Classfcaton. IEEE Trans. Systems, Man and Cybernetcs, SMC-3(6):6610-621, Nov. 1973. Jan. A. K., Robert P.W. Moa D., Moa. J. Statstcal Pattern Recognton: A Revew. IEEE Trans. On Pattern Analyss And Machne Intellgence, Vol. 22, Nº.1, 2000. Jan, A. K. and Zonger, D. Feature-selecton: Evaluaton, applcaton, and small sample performance. IEEE Trans. on Pattern Analyss and Machne Intellgence, 19(2):153-158, 1997. Njenhus, A., Wlf, H. S. Combnatoral Algorthms for Computers and Calculators. Academc Press, Second Edton,1978. Pard Lacruz, M.S.; Shmabuuro, Y.E.; Wllams, M.; Rennó, C.D.; Herbert, D.A;Rastetter, E.B. Utlzação do sensoramento remoto e dados de campo para amodelagem das atvdades bogeoqumcas na Floresta Naconal de Tapajós. In: X Smpóso Braslero de Sensoramento Remoto. [CD-ROM]. Insttuto Naconal de Pesqusas Espacas. Foz de Iguaçu, Brasl. Abrl, 2001 <dp.npe.br/lse/2001/09.24.10.28>. Pratt, W. K., Dgtal Image Processng, Wley Interscence, 1991. (2nd ed). Rennó, C. D., Fretas, C. C., Frery, A. C. A System for Regon Image Classfcaton Based on Textural Measures. Jornada Latno-Amercana de Sensoramento Remoto por Radar: Técncas de Processamento de Imagens. 2.,Santos, SP, 1998. Sousa Junor, M.A.; Dutra, L. V.; Fretas, C.C.; Desenvolvmento de um Segmentador Incremental Mult-nível (SIM) para Imagens Óptcas e de Radar. In: XI Smpóso Braslero de Sensoramento Remoto. Belo Horzonte. 5 a 10 de abrl de 2003. p. 2293-2300<ltd.npe.br/sbsr/2002/11.17.18.37>. Theodords, S. and Koutroumbas, K. Pattern Recognton. Academc Press, USA, 1st edton, 1999. 4208