AVALIAÇÃO DE CLASSIFICADORES BASEADOS EM APRENDIZADO DE MÁQUINA PARA A CLASSIFICAÇÃO DO USO E COBERTURA DA TERRA NO BIOMA CAATINGA



Documentos relacionados
2 Máquinas de Vetor Suporte 2.1. Introdução

Introdução e Organização de Dados Estatísticos

CENTRO UNIVERSITÁRIO DO LESTE DE MINAS GERAIS - UnilesteMG

Regressão e Correlação Linear

TEORIA DE ERROS * ERRO é a diferença entre um valor obtido ao se medir uma grandeza e o valor real ou correto da mesma.

7. Resolução Numérica de Equações Diferenciais Ordinárias

Sistemas Robóticos. Sumário. Introdução. Introdução. Navegação. Introdução Onde estou? Para onde vou? Como vou lá chegar?

Cálculo do Conceito ENADE

Objetivos da aula. Essa aula objetiva fornecer algumas ferramentas descritivas úteis para

Software para Furação e Rebitagem de Fuselagem de Aeronaves

Controle de qualidade de produto cartográfico aplicado a imagem de alta resolução

Variabilidade Espacial do Teor de Água de um Argissolo sob Plantio Convencional de Feijão Irrigado

UTILIZAÇÃO DO MÉTODO DE TAGUCHI NA REDUÇÃO DOS CUSTOS DE PROJETOS. Uma equação simplificada para se determinar o lucro de uma empresa é:

Metodologia IHFA - Índice de Hedge Funds ANBIMA

NOTA II TABELAS E GRÁFICOS

Estimativa da fração da vegetação a partir de dados AVHRR/NOAA

O migrante de retorno na Região Norte do Brasil: Uma aplicação de Regressão Logística Multinomial

5.1 Seleção dos melhores regressores univariados (modelo de Índice de Difusão univariado)

Lista de Exercícios de Recuperação do 2 Bimestre. Lista de exercícios de Recuperação de Matemática 3º E.M.

Fast Multiresolution Image Querying

Influência dos Procedimentos de Ensaios e Tratamento de Dados em Análise Probabilística de Estrutura de Contenção

Estimativa da Incerteza de Medição da Viscosidade Cinemática pelo Método Manual em Biodiesel

Controlo Metrológico de Contadores de Gás

Modelos estatísticos para previsão de partidas de futebol

UNIVERSIDADE DO ESTADO DA BAHIA - UNEB DEPARTAMENTO DE CIÊNCIAS EXATAS E DA TERRA COLEGIADO DO CURSO DE DESENHO INDUSTRIAL CAMPUS I - SALVADOR

MAPEAMENTO DA VARIABILIDADE ESPACIAL

Sempre que surgir uma dúvida quanto à utilização de um instrumento ou componente, o aluno deverá consultar o professor para esclarecimentos.

Geração de poses de faces utilizando Active Appearance Model Tupã Negreiros 1, Marcos R. P. Barretto 2, Jun Okamoto 3

REGRESSÃO LOGÍSTICA. Seja Y uma variável aleatória dummy definida como:

SUCESU 2005 Tecnologias Inteligência Artificial O estado da arte em métodos para reconhecimento de padrões: Support Vector Machine

3 Algoritmos propostos

Distribuição de Massa Molar

REGULAMENTO GERAL (Modalidades 1, 2, 3 e 4)

2. MATERIAIS E MÉTODOS

O Método de Redes Neurais com Função de Ativação de Base Radial para Classificação em Data Mining

Sinais Luminosos 2- CONCEITOS BÁSICOS PARA DIMENSIONAMENTO DE SINAIS LUMINOSOS.

1 Princípios da entropia e da energia

Apostila de Estatística Curso de Matemática. Volume II Probabilidades, Distribuição Binomial, Distribuição Normal. Prof. Dr. Celso Eduardo Tuna

Escolha do Consumidor sob condições de Risco e de Incerteza

Atribuição Automática de Propagandas a Páginas da Web

SOFTWARE PARA CÁLCULO DO ÍNDICE DE SEVERIDADE DE SECA DE PALMER

Capítulo 1. O plano complexo Introdução. Os números complexos começaram por ser introduzidos para dar sentido à 2

SOM Hierárquico Aplicado à Compressão de Imagens

PROJEÇÕES POPULACIONAIS PARA OS MUNICÍPIOS E DISTRITOS DO CEARÁ

Introdução à Análise de Dados nas medidas de grandezas físicas

MODELAGEM MATEMÁTICA DO PROCESSO DE EVAPORAÇÃO MULTI-EFEITO NA INDÚSTRIA DE PAPEL E CELULOSE

Estimativa dos fluxos turbulentos de calor sensível, calor latente e CO 2, sobre cana-de-açúcar, pelo método do coespectro.

Rastreando Algoritmos

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Classificadores Lineares. Luiz Eduardo S. Oliveira, Ph.D.

PREVISÃO DE PARTIDAS DE FUTEBOL USANDO MODELOS DINÂMICOS

Análise Fatorial F 1 F 2


Controle Estatístico de Qualidade. Capítulo 8 (montgomery)

Suporte Básico para Sistemas de Tempo Real

Termodinâmica e Termoquímica

Ministério da Educação. Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Cálculo do Conceito Preliminar de Cursos de Graduação

Adriana da Costa F. Chaves

Avaliação da Tendência de Precipitação Pluviométrica Anual no Estado de Sergipe. Evaluation of the Annual Rainfall Trend in the State of Sergipe

RESOLUÇÃO Nº 32/2014/CONEPE. O CONSELHO DO ENSINO, DA PESQUISA E DA EXTENSÃO da Universidade Federal de Sergipe, no uso de suas atribuições legais,

As tabelas resumem as informações obtidas da amostra ou da população. Essas tabelas podem ser construídas sem ou com perda de informações.

ANÁLISE DA ESTABILIDADE DE UM BRAÇO ROBÓTICO PARA COLHEITA DE FRUTAS

XX SNPTEE SEMINÁRIO NACIONAL DE PRODUÇÃO E TRANSMISSÃO DE ENERGIA ELÉTRICA NOVO MODELO PARA O CÁLCULO DE CARREGAMENTO DINÂMICO DE TRANSFORMADORES

01. Em porcentagem das emissões totais de gases do efeito estufa, o Brasil é o quarto maior poluidor, conforme a tabela abaixo:

I. Introdução. inatividade. 1 Dividiremos a categoria dos jovens em dois segmentos: os jovens que estão em busca do primeiro emprego, e os jovens que

RESOLUÇÃO NUMÉRICA DE EQUAÇÕES DIFERENCIAIS

Revisão dos Métodos para o Aumento da Confiabilidade em Sistemas Elétricos de Distribuição

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

SCATTER SEARCH APLICADO AO PROBLEMA DE OTIMIZAÇÃO DA ALOCAÇÃO DE SONDAS DE PRODUÇÃO EM POÇOS DE PETRÓLEO

PREVISÃO DO ÍNDICE MERVAL: UMA APLICAÇÃO DE REDES NEURIAS POLINOMIAIS GMDH

Nota Técnica Médias do ENEM 2009 por Escola

PROCESSAMENTO DE VÍDEO PARA ESTIMAÇÃO DA CURVA DE RESFRIAMENTO EM UMA PLANTA DE SINTERIZAÇÃO

ALGORITMOS GENÉTICOS COMO FERRAMENTA AUXILIAR NA TOMADA DE DECISÃO EM ATIVIDADES DE GESTÃO AGROINDUSTRIAL

TRANSPORTE E ESTOCAGEM DE FUMO UM MODELO DE PROGRAMAÇÃO LINEAR USADO NA TOMADA DE DECISÃO

Otimização de Custos de Transporte e Tributários em um Problema de Distribuição Nacional de Gás

Palavras-chave: jovens no mercado de trabalho; modelo de seleção amostral; região Sul do Brasil.

UMA REDE NEURAL ARTIFICIAL HÍBRIDA: MULTI-LAYER PERCEPTRON (MLP) E INTERAC- TIVE ACTIVATION AND COMPETITION (IAC)

Covariância e Correlação Linear

O USO DA INTEGRAL DEFINIDA NO CÁLCULO DA ÁREA ALAGADA DA BARRAGEM DO RIO BONITO

INTRODUÇÃO AO CÁLCULO DE ERROS NAS MEDIDAS DE GRANDEZAS FÍSICAS

PROPOSIÇÃO, VALIDAÇÃO E ANÁLISE DOS MODELOS QUE CORRELACIONAM ESTRUTURA QUÍMICA E ATIVIDADE BIOLÓGICA

PARALLEL ITERATED LOCAL SEARCH APLICADO AO PLANEJAMENTO OPERACIONAL DE LAVRA

Visualização Científica no Contexto de Métodos Meshfree: Aprimoramento de Algoritmos Clássicos

UNIVERSIDADE PRESBITERIANA MACKENZIE CCSA - Centro de Ciências Sociais e Aplicadas Curso de Economia

Análise Econômica da Aplicação de Motores de Alto Rendimento

Problemas Associados a Cones de Segunda Ordem

CAPÍTULO VI Introdução ao Método de Elementos Finitos (MEF)

Exercícios de Física. Prof. Panosso. Fontes de campo magnético

Universidade do Estado do Rio de Janeiro Instituto de Matemática e Estatística Econometria

COMPARATIVO ENTRE MÉTODOS DE CÁLCULO DE PERDAS EM TRANSFORMADORES ALIMENTANDO CARGAS NÃO-LINEARES

CURSO ON-LINE PROFESSOR: VÍTOR MENEZES

PROVA DE MATEMÁTICA DO VESTIBULAR 2013 DA UNICAMP-FASE 1. RESOLUÇÃO: PROFA. MARIA ANTÔNIA C. GOUVEIA

SEQÜENCIAMENTO DE TAREFAS COM MÁQUINAS PARALELAS, PERMITINDO ATRASOS E COM TEMPOS DE PREPARAÇÃO DE MÁQUINA DEPENDENTES DA SEQÜÊNCIA.

BALANÇO HÍDRICO: UMA FERRAMENTA PARA GESTÃO INDUSTRIAL E OTIMIZAÇÃO AMBIENTAL.

ELEMENTOS DE CIRCUITOS

Energia de deformação na flexão

* Economista do Instituto Federal do Sertão Pernambucano na Pró-Reitoria de Desenvolvimento Institucional PRODI.

TEXTO PARA DISCUSSÃO PROPOSTA DE MUDANÇA NO RATEIO DA COTA PARTE DO ICMS ENTRE OS MUNICÍPIOS CEARENSES

Determinantes da adoção da tecnologia de despolpamento na cafeicultura: estudo de uma região produtora da Zona da Mata de Minas Gerais 1

Física. Física Módulo 1 Vetores, escalares e movimento em 2-D

Equipas Educativas Para uma nova organização da escola. João Formosinho Joaquim Machado

Transcrição:

AVALIAÇÃO DE CLASSIFICADORES BASEADOS EM APREDIZADO DE MÁQUIA PARA A CLASSIFICAÇÃO DO USO E COBERTURA DA TERRA O BIOMA CAATIGA Evaluaton of Classfers Based on Machnes Learnng to Land Use and Cover Classfcaton on Caatnga Bome Beatrz Fernandes Smplco Sousa Adunas dos Santos Texera Francsco de Asss Tavares Ferrera da Slva 3 Eunce Maa de Andrade Arthur Plíno de Souza Braga 2 Unversdade Federal do Ceará UFC Departamento de Engenhara Agrícola Caxa Postal 2.68-6002-970 - Fortaleza - CE, Brasl beatrzsmplco@gmal.com adunas@ufc.br eandrade@ufc.br ² Unversdade Federal do Ceará UFC Departamento de Engenhara Elétrca Caxa Postal 600-60450 -760 - Fortaleza- CE, Brasl arthurp@dee.ufc.br 3 Insttuto aconal de Pesqusas Espacas IPE Caxa Postal 2-6760-000 - Eusébo - CE, Brasl tavares@roen.npe.br RESUMO O manejo adequado dos recursos naturas em ambentes fráges, como o da Caatnga, requer o conhecmento de suas propredades e dstrbução espacal. esse contexto, o trabalho tem por objetvo avalar o desempenho de dos algortmos baseados em aprendzado de máquna (Mult Layer Perceptron (MLP) e o Support Vector Machne (SVM)) e do método da Máxma Verossmlhança na classfcação do uso e cobertura da terra no boma Caatnga. Para o expermento, fo utlzada uma magem do satélte LADSAT-5/TM contendo a área de estudo localzada no muncípo de Iguatu-CE e defndas as classes de cobertura da terra, a saber: antropzação por agrcultura (APA), outros tpos de antropzação (OTA), água, caatnga herbácea arbustva (CHA) e caatnga arbórea densa (CAD). O desempenho dos métodos fo analsado através dos coefcentes de Exatdão Global (EG), Exatdão Específca (EE) e Kappa (K) calculados a partr dos dados da matrz de confusão correspondente à verdade terrestre. Os valores do coefcente de EG foram de: 86,03%, 82,4% e 8,2% e K de: 0,77, 0,76 e 0,75 nos métodos SVM, MLP e Máxma Verossmlhança, respectvamente. Os valores de EE foram superores a 70% para todos os classfcadores testados. Os resultados obtdos demonstram que os métodos SVM e MLP estão aptos à classfcação dos padrões propostos, já que apresentaram resultados semelhantes ao método tradconal da Máxma Verossmlhança. Porém, estes classfcadores podem consumr mas tempo na etapa de defnção dos parâmetros da rede e de processamento. Palavras chaves: Intelgênca Artfcal, Sem-árdo, Classfcação de Imagens de Satélte. ABSTRACT Proper management of natural resources n fragle envronments, such as the Caatnga, requres knowledge of ther propertes and spatal dstrbuton. In ths context, the study ams at evaluatng the performance of two algorthms based on machne learnng (Mult Layer Perceptron (MLP) and Support Vector Machne (SVM)) and the Maxmum Revsta Braslera de Cartografa o 62 EDIÇÃO ESPECIAL 2, 200. (ISS 0560-463) 385

Lkelhood method to classfy land use and land cover n the Caatnga bome. For the experment, t was used a satellte mage of LADSAT-5/TM contanng the study area located n the muncpalty of Iguatu-CE, and classes of land cover, namely: anthropzed by agrculture, other types of anthropzed, water, herbaceous shrub savanna (CHA ) and dense arboreal savanna (CAD) were defned. The performance of the methods was analyzed by the coeffcent of Global Accuracy (EG), Accuracy Specfc (EE) and Kappa (K) coeffcent calculated wth data taken from the confuson matrx correspondng to ground truth. The coeffcent of EG were: 86.03%, 82.4% and 8.2% and K: 0.77, 0.76 and 0.75 n the methods SVM, MLP and maxmum lkelhood respectvely. EE values were above 70% for all classfers tested. The results have shown that SVM and MLP methods are suted to the classfcaton of the proposed standards, as t showed smlar results to the tradtonal method of maxmum lkelhood. However, these methods are more tme consumng n the stage of defnng the parameters of the network and may requre more computaton power durng stage of processng. Keywords: Artfcal Intellgence, Sem Ard, Satellte Image Classfcaton.. ITRODUÇÃO O domíno do boma Caatnga abrange uma área de aproxmadamente 900 ml Km 2, o que corresponde a cerca de 0% do terrtóro naconal (ADRADE et al., 2005). Este boma é um dos menos estudados e protegdos do Brasl. Anda segundo Andrade et al. (2005), o sstema agropastorl apresentase como o fator que exerce maor pressão sobre a cobertura vegetal do sem-árdo nordestno. Degradações causadas pelo homem à vegetação natva e aos recursos naturas poderão causar séros danos a este boma, como por exemplo, a desertfcação. o entanto, o conhecmento mas aprofundado da Caatnga por meo de ferramentas como o sensoramento remoto pode dar suporte ao planejamento de exploração sustentável. O mapeamento da cobertura da terra é uma nformação essencal em estudos de gestão ambental, em avalação de bodversdade e como suporte à adoção de polítcas públcas. Esse tpo mapeamento anda pode ser utlzado como dado de entrada para o modelo da equação unversal de perda de solo (EUPS), proposto por Wschmeer & Smth (978), proporconando dentfcar áreas suscetíves ao processo de erosão. A nformação gerada é mportante especalmente em áreas onde o problema se faz presente, como é o caso do sem-árdo. a lteratura técnca é possível encontrar desde métodos tradconas para classfcação de magens de satélte como, por exemplo, o da máxma verossmlhança (QUEIROZ et al., 2004) e o da mínma dstânca (LEDUC et al., 2007) até métodos mas avançados como aqueles que utlzam técncas baseadas em aprendzado de máquna (CARVALHO et al., 2004). Dversos métodos baseados em aprendzado de máquna têm atraído a atenção da comundade de sensoramento remoto (GIGADET et al., 2005). O aprendzado de máquna está nserdo na área de conhecmento denomnada Intelgênca Artfcal (IA) e têm por objetvo desenvolver métodos, técncas e ferramentas para construr máqunas ntelgentes capazes de realzar as mas dversas tarefas. De acordo com Mtchell (997), essas máqunas devem trenar sobre determnado conjunto de amostras e expermentar estratégas mas efcazes para a construção de programas que aprendem a partr da experênca adqurndo conhecmento de forma automátca. Como exemplo de algortmos de aprendzado de máquna pode-se ctar que representam analogas aos sstemas bológcos humanos (Redes euras Artfcas (RAs) e Algortmos Genétcos), sstemas de aprendzado smbólco (Árvores de Decsão) e as teoras estatístcas (Support Vector Machnes (SVMs)) (MITCHELL, 997). De acordo com Haykn (999), uma RA do tpo Mult Layer Perceptron (MLP) possu uma arqutetura consttuída por, pelo menos, três camadas de neurônos artfcas, sendo uma camada de entrada, uma camada de saída e uma ou mas camadas esconddas com neurônos ocultos. Segundo Egmont et al. (2002), uma rede MLP com uma camada escondda é sufcente para aproxmar qualquer função contínua. Os pesqusadores Gelete & Volatão (2007) aplcaram uma rede do tpo MLP na classfcação do uso da terra e obtveram resultados satsfatóros com uma únca camada oculta de neurônos. Já o algortmo SVM constró um hperplano como superfíce de decsão de tal forma que a margem de separação entre exemplos postvos e negatvos seja máxma (HAYKI, 999). As SVMs têm sdo aplcadas e comparadas a dversos métodos na classfcação de dados provenentes do sensoramento remoto, como pode ser vsto nos trabalhos de Pal & Mather (2004); Foody & Mathur (2004); Su et al. (2007). Desta forma, o objetvo do presente trabalho fo avalar o desempenho de dos algortmos baseados em aprendzado de máquna na classfcação do uso e cobertura da terra no boma Caatnga em magens do satélte LADSAT-5/TM. Foram escolhdos os métodos Mult Layer Perceptron (MLP) e Support Vector Machne (SVM). O desempenho destes fo anda comparado ao método tradconal estatístco da Máxma Verossmlhança. 2. CLASSIFICAÇÃO DE IMAGES MULTIESPECTRAIS Revsta Braslera de Cartografa o 62 EDIÇÃO ESPECIAL 2, 200. (ISS 0560-463) 386

Técncas de classfcação de magens mplcam na mplementação de um processo de decsão para que o computador possa atrbur o pxel a uma classe (OVO, 989). Segundo Iwa (2003), são gerados neste processo mapas temátcos correspondentes aos temas de nteresse por meo de técncas de classfcação supervsonadas ou não supervsonadas. os métodos de classfcação supervsonada, as classes são prevamente defndas pelo analsta, sto é, caracterzadas através das amostras de trenamento. Assm, os algortmos realzam o reconhecmento dos padrões espectras na magem com base nestas amostras (MOREIRA, 2005). Para que a classfcação seja bem sucedda, é necessáro que as assnaturas espectras dos alvos estejam bem defndas e dstntas entre s. 2. Classfcação por Máxma Verossmlhança A classfcação por Máxma Verossmlhança rotula os pxels em uma determnada classe conforme a dstânca estatístca entre cada pxel e a méda da resposta espectral da classe (ASSAD & SAO, 998). Uma função de probabldade P(x) defne a que classe pertencerá determnado pxel. O cálculo é feto para as váras classes pré-defndas e o pxel é atrbuído à classe cuja probabldade de pertencer seja maor. É consderado um método paramétrco, pos envolve parâmetros (vetor méda e matrz de covarânca) da dstrbução gaussana multvarada, e é supervsonado, pos estma estes parâmetros através das amostras de trenamento (ERBERT, 200). As classes na magem serão representadas por ω, =,...,M, onde M é o número total de classes. Um pxel X pertencerá à classe ω se a probabldade que assoca este pxel à classe ω for maor do que a probabldade que assoca o pxel a qualquer outra classe (RICHARDS & JIA, 2006): X Є ω, se P(ω X) > P(ω j X), para todo ω ω j () Onde P(ω X) é a probabldade ωde posção X. 2.2 Rede eural Artfcal do tpo MLP ocorrer na Segundo Haykn (999), uma RA pode ser defnda como um processador macçamente paralelo dstrbuído consttuído de undades de processamento smples, que têm a propensão natural para armazenar conhecmento expermental e torná-lo dsponível para uso. As undades báscas das redes neuras, os neurônos artfcas, smulam as funções dos neurônos naturas e processam todas as nformações das RA. A modelagem do neurôno bológco, vsando gerar o modelo do neurôno artfcal, fo ncada por McCuloch e Ptts (943) e seu modelo mas smples está exposto na Fgura. Fg Modelo do neurôno artfcal Fonte: Haykn, 999 Este modelo é consttuído de um conjunto de snapses, sendo cada uma dessas caracterzada por um peso (w); um somador (Σ) para somar os snas de entrada, ponderado pelas respectvas snapses do neurôno; e uma função de atvação (φ) para restrngr a ampltude de saída de um neurôno, ou seja, lmtar o ntervalo permssível de ampltude do snal de saída a um valor fnto (HAYKI, 999). Observando-se a Fgura, tem-se que: x, x2,...,xm são os elementos do vetor de entrada; w, w2,... wkj são os pesos (ou conexões snáptcas); bk: lmar de atvação do neurôno; φ(.) é a função de atvação e yk é o snal de saída do neurôno. Os elementos do vetor de entrada x, x2,...,xm são multplcados pelos pesos w, w2,... wkm. Desta forma, o neurôno k é descrto pelo segunte par de Equações. Assm: e m uk = wkj.x j= j (2) y k = φ(u k + b k ) (3) O campo local nduzdo (v k ) é dado por: v k = u k + b k (4) A função de atvação processa o conjunto de entradas recebdas e o transformar em estado de atvação. Os neurônos podem assumr os seguntes estados de atvação: bnáros (0 e ), bpolares (- e ) e reas. A Equação 5 corresponde à função de atvação do tpo tangente hperbólca. u e ϕ (u) = (5) u + e Uma RA do tpo Mult Layer Perceptron (MLP) possu uma arqutetura consttuída por, pelo menos, três camadas de neurônos artfcas (HAYKI, 999). A prmera é chamada de camada de entrada e tem a função de armazenar os dados de Revsta Braslera de Cartografa o 62 EDIÇÃO ESPECIAL 2, 200. (ISS 0560-463) 387

entrada na rede. As camadas ntermedáras são consderadas extratoras de característcas. E a camada de saída é onde o resultado fnal é concluído e apresentado. O número de neurônos e de camadas é função do problema em questão. a classfcação de magens de satélte, por exemplo, o número de neurônos na camada de entrada poderá corresponder ao número de bandas utlzadas. Desta forma, para cada neurôno é atrbuído o valor da resposta espectral do pxel do conjunto de trenamento da banda correspondente. a camada ntermedára o número de neurônos e de camadas fcará a crtéro do usuáro e na camada de saída, a quantdade de neurônos corresponde ao número de classes para as quas os padrões serão desgnados. A prmera camada de neurônos usa os padrões de entrada da rede e, por meo do cálculo executado pela aplcação da função de transferênca, gera a reposta que almenta a camada segunte, e assm sucessvamente até que a últma camada seja atngda. O trenamento das RAs faz com que esta aprenda por meo de exemplos. Haykn (999) defne aprendzagem como: Um processo pelo qual os parâmetros lvres de uma rede neural são adaptados através de um processo de estmulação pelo ambente na qual a rede está nserda. O tpo de aprendzagem é determnado pela manera como a modfcação dos parâmetros ocorre. Um algortmo de aprendzagem largamente utlzado nas RAs do tpo MLP é o backpropagaton. este algortmo, os vetores de entrada do conjunto de amostras de trenamento são fornecdos à rede. Esta, por sua vez, calcula uma resposta utlzando os valores dos pesos ncas. A resposta obtda será comparada à saída desejada da rede. A ntenção do trenamento é dmnur gradatvamente o valor desse erro. Assm, o valor dos pesos será ajustado a cada nova teração. O processo de aprendzagem contnuará acontecendo enquanto a resposta calculada não for gual à desejada ou até que o número de cclos chegue ao fm (HAYKI, 999). As redes do tpo MLP são utlzadas para a classfcação de padrões não lnearmente separáves, ou seja, padrões que caem em determnadas posções de um hper-espaço nas quas não podem ser separados por um hperplano. Esta capacdade de classfcar dados não lneares a poscona como uma rede adequada a soluconar problemas mas próxmos da realdade, tas como: no processamento de magens (LI, 99), no mapeamento de florestas tropcas (CARVALHO et al., 2004), na classfcação de terras para rrgação por meo da análse dos parâmetros de produtvdade do solo (BUCEE & RODRIGUES, 2004), dentre outros. 2.3 Support Vector Machne (SVM) Uma SVM é bascamente uma máquna lnear, cuja déa prncpal é construr um hperplano como superfíce de decsão de tal forma que a margem de separação entre exemplos postvos e negatvos seja máxma (HAYKI, 999). Este método fo desenvolvdo pelo pesqusador Vladmr Vapnk e colaboradores (BOSER et al., 992; CORTES & VAPIK, 995; VAPIK, 995). O trenamento da SVM envolve a resolução de um problema quadrátco, dependente dos vetores de trenamento e de parâmetros especfcados pelo usuáro. este método, a partr de um espaço de entrada de padrões não-lnearmente separáves é formado um novo espaço de característcas, em dmensão outra, onde os padrões serão lnearmente separáves. Assm, um hperplano de separação ótmo entre os exemplos é construído (VAPIK, 995). Como prncpas vantagens do método podese ctar: possu teora bem estabelecda dentro da matemátca e estatístca; apresenta robustez em dados de grandes dmensões como, por exemplo, magens de satélte; ótma capacdade de generalzação, ou seja, apresenta efcênca para prever dados que não pertençam ao conjunto utlzado no trenamento (SMOLA et al., 2000). De acordo com Vapnk (995), para construr o hperplano ótmo em casos onde os dados não são lnearmente separáves deve-se ntroduzr as varáves de folga { ξ } na defnção do hperplano de = separação e encontrar os valores ótmos do vetor de peso w e do bas b de modo que satsfaçam a restrção: T d (w x + b) ξ (6) ξ 0, =,..., (7) As varáves de folga ξ são responsáves por medr a quantdade de volações das restrções (OSUA et al., 997). O vetor peso w e as varáves de folga ξ devem mnmzar a segunte função: T Φ(w, ξ) = w w + Cξ (8) 2 = Onde C é o parâmetro de penalzação. Sujeto a: T d (w x + b) + ξ 0 (9) ξ 0 =,...,. (0) O prmero termo na Equação 8 tem a função de controlar a capacdade de aprendzagem, enquanto que o segundo termo vsa penalzar as amostras localzadas no lado ncorreto do hperplano. Este termo é vsto como um parâmetro de regularzação e deve ser defndo pelo usuáro. Quanto menor o valor de C mas rígda será a penalzação dos pontos; caso contráro, a Revsta Braslera de Cartografa o 62 EDIÇÃO ESPECIAL 2, 200. (ISS 0560-463) 388

penalzação será menos rígda e a classfcação terá maor quantdade de erros (OSUA et al., 997). O problema de otmzação gerado é quadrátrco, com as restrções lneares apresentadas em 9 e 0. Esse problema de otmzação é resolvdo usando o método dos multplcadores de Lagrange que maxmzem a segunte função: Q ( α ) T = α αα jdd j(x x j) () 2 = = Sujeto às restrções: = α d = j= 0 (2) 0 α C para =,2,..., (3) A função de separação do hperplano é escrta como (VAPIK, 995): f ( x) = sgn + d α ( x x) bo (4) = A SVM é construída projetando o conjunto de trenamento (x) de seu espaço orgnal, referencado como de entradas, através de uma função de mapeamento (Ф), para o espaço de característca de alta dmensonaldade (H). Após essa projeção é construído o hperplano ótmo que separa as classes (VAPIK, 995). O teorema de Cover (965) afrma que um espaço multdmensonal pode ser transformado com alta probabldade em um novo espaço de característcas onde os padrões são lnearmente separáves. Porém, duas condções devem ser satsfetas: A transformação deve ser não lnear e a dmensonaldade do espaço de característcas deve ser sufcentemente alta. Para realzar o mapeamento, aplca-se a função de mapeamento (Φ) aos exemplos presentes no problema de otmzação apresentado na Equação, conforme lustrado a segur: Q( α ) = α j dd j ( Φ( x ) Φ( x j )) 2 α α (5) = = j= Sujeto às restrções apresentadas em (2) e (3). Assm, têm-se a função de separação do hperplano é reescrta como: f ( x) = sgn Φ + d α ( x ) ( x j ) bo (6) = O algortmo de aprendzagem por vetor de suporte pode ser usado para construr dversos tpos de máqunas como, por exemplo: as polnomas, redes de função de base radal e perceptrons de duas camadas. A construção destas dependerá de como os dados são projetados do espaço de entrada para o espaço característco (HAYKI, 999). A função usada para realzar essa projeção é chamada de funções kernel. Em outras palavras, um kernel K é uma função que recebe dos pontos x e x j do espaço de entradas computa o produto escalar desses dados no espaço de característcas (HAYKI, 999). Assm, têm-se a segunte Equação: K(x, x j) = Φ(x ) Φ(x j) (7) este estudo escolheu-se a função kernel do tpo Gaussana (OSUA et al., 997), que tem a representação matemátca apresentada na Equação 8. 2 x x j K(x,x j) = exp 2 (8) 2σ Sendo que σ é nterpretado como a largura da gaussana e deve ser especfcado a pror pelo usuáro. Esta função é uma das mas comumente aplcadas em dados provenentes do sensoramento remoto, como pode ser observado nos trabalhos de Pal & Mather (2004) e Foody & Mathur (2004). De acordo com Chapelle et al. (999), estas funções devem ser escolhdas cudadosamente para evtar desempenhos runs pelo classfcador. O percentual de acertos de uma classfcação pelo método SVM é dependente da magntude do parâmetro C e, quando se faz uso da função kernel do tpo gaussana, do parâmetro σ. As SVMs são orgnalmente classfcadores bnáros, porém, a maora dos dados reas envolve grande quantdade de nformação e pode necesstar ser rotulada em mas de duas classes. Bascamente, duas estratégas são usadas para soluconar este tpo de problema: One-Aganst- One (OAO) e One-Aganst-All (OAA) (WESTO et al., 999). A estratéga OAO constró (-)/2 funções dscrmnantes, em que é o número de classes. Um processo de escolha será aplcado para defnr em que classe o dado x deverá ser classfcado e a decsão será tomada pelo número de vezes que este fo assocado à determnada classe pela função dscrmnante apresentada na Equação 27 (WESTO et al., 999). a estratéga OAA cada SVM exstente resolve um problema de separação entre duas classes. Por exemplo: em um determnado problema de classfcação de padrões com classes, serão crados classfcadores bnáros e cada um desses será trenado para dstngur uma classe das restantes, ou seja, das - classes (WESTO et al. 999). A decsão fnal sobre qual classe o dado pertencerá é dada pela regra o vencedor leva tudo, ou seja, a classe Revsta Braslera de Cartografa o 62 EDIÇÃO ESPECIAL 2, 200. (ISS 0560-463) 389

vencedora é aquela que possu maor valor de função dscrmnante, f (x) (MELGAI, 2004). Maores detalhes sobre a teora das estratégas apresentadas podem ser encontrados nos trabalhos de Weston et al. (999) e Hsu et al. (2002). Gdudu et al. (2004), avalaram o uso de estratégas multclasses na classfcação de magens da regão de Jnja, Uganda. Os dados de entrada corresponderam às 7 bandas do satélte LADSAT e as classes de saída foram água, vegetação e antropzada. Os testes realzados envolveram as estratégas one-aganst-one (OAO) e one-aganst-all (OAA) em quatro tpos de classfcadores SVM, a saber: lnear, quadrátca, polnomal e gaussana. A estratéga ndcada fo a OAO já que a OAA teve maor propensão de gerar pxels não classfcados ou erroneamente classfcados. Para a SVM com classfcador gaussana, por exemplo, foram 03 pxels classfcados erroneamente para a estratéga OAO e 4645 para a OAA. 2.4 Dstânca de Jeffres-Matusta Uma forma de avalar a classfcação se dá por meo de meddas estatístcas. De acordo com Rchards & Ja (2006), a dstânca de Jeffres-Matusta (JM) entre duas classes e j que apresentem dados com dstrbução normal é defnda por: B j JM = 2*( e ) (6) j Em que JM j representa a dstânca entre as classes e j; e B j é a dstânca de Bhattacharyya que é calculada por: B j = (M 8 M ) T j Σ + Σ 2 j ( M M ) j Σ + Σ 2 + 2 Σ Σ j j (7) Sendo M e M j os vetores de méda das classes e j, respectvamente e Σ e Σ j as matrzes de covarânca das classes e j, respectvamente. Quanto maor o valor estmado por B j, maor a separabldade entre classes e j. O valor de JM j entre duas classes poderá varar entre 0 e 2. Valores acma de,8 ndcam que o par de classes obteve boa separabldade. Já valores abaxo de,8 ndcam a possbldade confusão na classfcação entre o par de classes (RICHARDS & JIA, 2006). 2.5 Valdação da exatdão do mapeamento Um mapeamento do uso do terra, apoado em sensoramento remoto, necessta ser realzado com exatdão para que as nformações geradas sejam confáves. Para a avalação da exatdão do mapeamento são usados os coefcentes de concordânca obtdos através de uma matrz de confusão. A matrz de erro ou matrz de confusão é uma matrz quadrada de números que expressam a quantdade de undades amostras, assocada a uma dada categora durante o processo de classfcação efetuado, e à categora real a que pertencem essas undades. (MAGABEIRA, 2003 apud COGALTO 99). A exatdão global (EG) é obtda pela dvsão das somas das entradas que formam a dagonal prncpal da matrz, ou seja, o número de classfcações corretas, pelo número total de amostras utlzadas como mostra a Equação 8 (WATZLAWICK, 2003). EG = r = x 00 (8) sendo: r = número de lnhas da matrz de erro; x = valor da lnha e coluna ; = quantdade total de pontos amostras. A Exatdão Específca (EE) é obtda pela dvsão do número de amostras classfcadas corretamente na classe pelo número total de amostras desta, como apresentada a segur: x EE = 00 (9) n sendo: x = valor na lnha e coluna e n = quantdade total de pontos amostras da classe r. A análse de Kappa, dferentemente da EG, utlza todos os elementos da matrz de confusão para seu cálculo. O coefcente Kappa de concordânca (K) é uma medda da concordânca real (ndcado pelos elementos dagonas da matrz de confusão) menos a concordânca por chance (ndcado pelo produto total da lnha e coluna) (MOREIRA, 2005), conforme segue: r x r (x + + = = r 2 (x+ x + ) = K = (20) Sendo: K = coefcente Kappa de concordânca; = quantdade total de pontos amostras; r = número de lnhas da matrz de erro; x = valor na lnha e coluna ; x + = soma da lnha ; x + = soma da coluna. A Tabela, desenvolvda por Lands & Koch (977), é utlzada como referênca para classfcar mapas resultantes da utlzação de magens de sensoramento remoto. esta, são apresentados níves de desempenho da classfcação para o valor de Kappa obtdo. x ) Revsta Braslera de Cartografa o 62 EDIÇÃO ESPECIAL 2, 200. (ISS 0560-463) 390

TABELA - QUALIDADE DA CLASSIFICAÇÃO ASSOCIADA AOS VALORES DA ESTATÍSTICA KAPPA. Valor de Kappa Qualdade do mapa temátco <0,00 Péssma 0,00-0,20 Rum 0,20-0,40 Razoável 0,40-0,60 Boa 0,60-0,80 Muto boa 0,80-,00 Excelente FOTE: adaptada de Lands & Koch (977). 3. MATERIAL E MÉTODOS 3. Caracterzação da área de estudo A área de estudo está stuada no muncípo de Iguatu, no Estado do Ceará. Este muncípo localza-se entre os paralelos 6º 7 42,33 S e 6º 33 4,04 S e os merdanos 39º 3 55,64 W e 39º 29 28,52 W. Possu extensão terrtoral de 029 km² e, segundo dados do IBGE (2009), a estmatva da população é de 97203 habtantes. Está nserdo em uma regão sem-árda com vegetação típca da Caatnga. O relevo é classfcado como plano, suave ondulado e ondulado (JACOMIE et al., 973). Pela classfcação de Koppen (948), o clma é do tpo BSw'h': quente com chuvas de outono e temperaturas médas superores a 8ºC. Para a realzação do expermento fo feto um recorte de uma área stuada entre os paralelos 6º 9 29,9 S e 6º 32 39,94 S e os merdanos 39º 50,8 W e 39º 24 52,0 W. A área total é de 576 km 2. A Fgura 2 exbe a localzação da área de estudo. 3.2 Abordagem metodológca A área fo extraída de uma cena do satélte LADSAT-5/TM (27/65) referente ao da 20 de agosto de 2008, adqurda por este satélte às 9 horas e cedda pelo Insttuto aconal de Pesqusas Espacas (IPE). Foram consderadas as bandas 2 (0,50-0,60 µm), 3 (0,63-0,69 µm) e 4 (0,76-0,90 µm) que correspondem ao verde, vermelho e nfravermelho próxmo, respectvamente, e gerada, no software EVI 4.3, a composção colorda 432 do espaço RGB. Optou-se por utlzar somente três bandas do satélte por ser esta a quantdade de entrada padrão no software EVI 4.3 que, por sua vez, fo utlzado na classfcação supervsonada. Desta forma, todos os métodos foram testados com a mesma quantdade de bandas. Os pontos referencados em campo por meo do aparelho Leca GPS200 foram utlzados no software EVI 4.3 para reajustar o georreferencamento da magem do satélte LADSAT-5/TM. Para este processo foram coletados pontos conhecdos e faclmente vsualzados na magem, como: cruzamentos de rodovas e paredes de açudes. O fluxograma exbdo na Fgura 3 mostra, esquematcamente, as etapas realzadas no desenvolvmento do expermento. Fg 2 Localzação da área de estudo no Estado do Ceará. Fg 3 Etapas e ordem de execução do expermento. Revsta Braslera de Cartografa o 62 EDIÇÃO ESPECIAL 2, 200. (ISS 0560-463) 39

3.2. Escolha das classes e processo de amostragem a composção colorda foram seleconadas cnco classes genércas: Classe () Antropzação por Agrcultura (APA): engloba áreas modfcadas para planto por dferentes tpos de culturas, sendo caracterzada na magem por polígonos de lados bem defndos; Classe (2) Água: ros, açudes e lagoas; Classe (3) Outros Tpos de Antropzação (OTA): aglomerados urbanos ou áreas desprovdas de cobertura susceptíves ou em processo de degradação ou erosão; Classe (4) Caatnga Herbácea Arbustva (CHA): vegetação herbácea arbustva (porte baxo a médo) aberta a densa; Classe (5) Caatnga Arbórea Densa (CAD): vegetação arbórea densa, de porte mas elevado. Para o trenamento dos algortmos, realzou-se o processo de amostragem das classes no software EVI 4.3. E, para que esses dados também pudessem ser utlzados nos classfcadores baseados em aprendzado de máquna, os valores de RGB das amostras foram exportados para um formato de arquvo legível no MATLAB 7.0 (*.txt). As amostras coletadas, 2000 pxels por cada classe, foram obtdas na mesma cena, mas fora da área de estudo, de forma a testar a capacdade de generalzação dos classfcadores. Os dados a serem classfcados e o número de classes determnam a quantdade de neurônos na camada de entrada e saída, respectvamente. Desta forma, têm-se três neurônos na camada de entrada e cnco na camada de saída. Quanto à camada escondda, como sugerdo por Egmont et al. (2002), optou-se por utlzar uma rede MLP de únca camada. Assm, os testes realzados objetvaram encontrar o número de neurônos nesta camada que proporconassem melhor desempenho na classfcação da magem testando, para sso, 2, 5 e 8 neurônos. A Fgura 4 exemplfca a arqutetura da rede MLP correspondente ao teste com 2 neurônos na camada ntermedára. 3.2.2 Análse da separabldade das amostras de trenamento Após o processo de amostragem, analsou-se a resposta espectral nas bandas 2, 3 e 4 de cada classe e a separabldade entre cada par de classe, por meo do índce de Jeffres-Matusta (JM). Para o cálculo, são necessáros os dados de entrada M e M j correspondentes aos vetores de méda das classes e j, respectvamente e C e C j correspondentes as matrzes de covarânca das classes e j. O software EVI 4.3 dspõe de uma ferramenta que realza o cálculo, restando ao usuáro fornecer as amostras de trenamento utlzadas. 3.2.3 Processo de classfcação 3.2.3. Método da Máxma Verossmlhança Fg 4 Arqutetura da MLP com 2 neurônos na camada ntermedára. O crtéro de convergênca da rede fo estabelecdo por um número máxmo de cclos gual a 3000 ou erro fnal de 0,00. A taxa de aprendzagem (η) fo fxada em 0,005 e a função de atvação escolhda fo do tpo tangente hperbólca (Equação 5) a qual lmta os valores de saída de - à. E A magem correspondente à área de estudo fo transformada para o formato de vetor e submetda ao processo de classfcação. O fluxograma apresentado na Fgura 5 lustra as etapas realzadas neste método. A partr das amostras de trenamento prevamente defndas, fo realzada a classfcação supervsonada pelo método estatístco da máxma verossmlhança no software EVI 4.3. 3.2.3.2 Método Perceptron de Múltplas Camadas (MLP) O método MLP trenado com algortmo backpropagaton e almentação feedfoward, fo mplementado no software MATLAB 7.0, por meo da Toolbox eural etwork (The MathWorks Inc., atck, MA, USA) versão 6.0. Revsta Braslera de Cartografa o 62 EDIÇÃO ESPECIAL 2, 200. (ISS 0560-463) 392

O fluxograma apresentado na Fgura 6 lustra as etapas realzadas neste método. Fg 5 Fluxograma das atvdades relaconadas ao método MLP. 3.2.3.3 Método Máquna de Vetor de Suporte (SVM) Para a mplementação do método SVM no software MATLAB 7.0 fo utlzada a SVM- KMToolbox (SVM and Kernel Methods MATLAB Toolbox) desenvolvda por Canu et al. (2005). Como prncpas referêncas bblográfcas utlzadas no desenvolvmento dessa toolbox têm-se os trabalhos de Vapnk (995) e Osuna et al. (997). Para a classfcação das cnco classes propostas adotou-se a estratéga multclasse oneaganst-one (OAO) tendo como referênca os melhores resultados obtdos nos trabalhos de Gdudu et al. (2004) e Melgan (2004). Os 22 testes foram realzados por meo de combnações do parâmetro de penalzação C nos valores de 0; 50; 00; 500; 000; 300; 400; 500 e 3000 com o parâmetro σ da função gaussana (Equação 8) nos valores de,5;,8; 2,2; 2,0; 2,5; 5 e 0. Os tempos de trenamento e teste foram cronometrados para os métodos baseados em aprendzado de máquna. Vale ressaltar que a contagem do tempo é apenas uma estmatva já que acabam sendo ncluídos os tempos que o Sstema Operaconal usa para que o software MATLAB funcone. Fg 6 Fluxograma das atvdades relaconadas ao método SVM. 3.2.3.4 Valdação da exatdão do mapeamento O processo de valdação fo realzado por meo da construção de uma matrz de confusão. Desta forma, fo-se a campo em busca de referencar pontos amostras correspondentes à verdade de campo das classes de saída. o total, foram referencados 2 pontos com aparelho GPS Garmm entre os das 29 e 3 de julho de 2008, período próxmo à data de aqusção da magem pelo satélte. Foram obtdos 0 pontos para a classe água, 4 para CAD, 27 para CHA, 39 para APA e 22 para OTA. Todos estes pontos estão localzados dentro dos lmtes da área de estudo e não concdem com a localzação das amostras de trenamento, pos, apesar destas estarem contdas na mesma cena (27/65), foram seleconadas fora desta área vsando testar a capacdade de generalzação dos classfcadores. O desenho esquemátco exposto na Fgura 7 exemplfca a localzação das amostras de trenamento e de valdação. Revsta Braslera de Cartografa o 62 EDIÇÃO ESPECIAL 2, 200. (ISS 0560-463) 393

Fg. 8 - Resposta espectral méda das dferentes classes de cobertura da terra das amostras de trenamento. Por meo do gráfco apresentado na Fgura 8 é possível notar que, em geral, as classes possuem respostas espectras dstntas. ota-se anda que, das classes em estudo, as de APA e CAD compõem o par com os valores mas próxmos. A Tabela 2 expõe os valores dos índces de Jeffres-Matushta entre os pares de classes. Fg. 7 Desenho esquemátco da localzação das amostras de trenamento e de valdação. Para a valdação pelo método da Máxma Verossmlhança, os pontos do GPS foram exportados para formato *.shp e sobrepostos à magem classfcada no software ArcGs 9.3. Desta forma, os dados da verdade de campo foram comparados manualmente à classfcação gerada e cada acerto ou erro contablzado na matrz. Já para os métodos baseados em aprendzado de máquna foram obtdos na composção colorda os valores dos pxels correspondentes a cada ponto referencado em campo para as três bandas utlzadas. Esses valores foram dgtados em um arquvo no formato *.txt e submetdos aos algortmos no software MATLAB 7.0 de forma a servrem de dados de teste para estes métodos. A classfcação resultante do processamento fo comparada à verdade de campo e os acertos e erros contablzados na matrz. As matrzes geradas forneceram os dados necessáros para o cálculo dos coefcentes de Exatdão Global, Exatdão Específca e de Kappa através das Equações 4, 5 e 6, respectvamente. 4. RESULTADOS E DISCUSSÃO 4. Análse da separabldade das classes As respostas espectras das amostras de trenamento foram analsadas com o objetvo de avalar a separabldade entre as classes de nteresse e, por conseqüênca, obter um ndcatvo sobre a qualdade da classfcação. A Fgura 8 apresenta a resposta espectral méda das amostras de trenamento das classes água, outros tpos de antropzação (OTA), antropzação por agrcultura (APA), CHA e CAD nas bandas 2, 3 e 4 do satélte LASAT-5. TABELA 2 - ÍDICE DE SEPARABILIDADE ETRE AS CLASSES ESTUDADAS Classes Água OTA APA CHA CAD Água - - - - - OTA. 2,0 - - - - APA 2,0,99 - - - CHA,97,98,99 - - CAD,99 2,0,89,99 - a Tabela 2, nota-se que os pares de classes água e APA, água e OTA e OTA e CAD apresentaram o valor máxmo deste índce sendo, desta forma, os que possuem maor separabldade. ota-se anda que o menor valor de JM obtdo, de,89, ocorreu para o par de classes APA e CAD, confrmando o que fo concluído na Fgura 8. Todos os pares de classes apresentaram valores do índce de Jeffres-Matusta acma do lmar, o que aponta para uma boa separabldade das classes pelo ponto de vsta da análse espectral. 4.2 Classfcação por meo do método Perceptron de Múltplas Camadas (MLP) a fase de trenamento, a convergênca da rede MLP ocorreu por conta do número máxmo de terações estabelecdo. A Tabela 3 mostra os parâmetros fornecdos à rede neural MLP em cada teste realzado, com os respectvos valores de erro fnal, EG, K e o tempo computaconal necessáro. Revsta Braslera de Cartografa o 62 EDIÇÃO ESPECIAL 2, 200. (ISS 0560-463) 394

TABELA 3 - RESULTADOS DOS TESTES PELO MÉTODO MLP Teste úmero de Erro fnal Exatdão Global Kappa (K) Tempo (s) neurônos (%) 2 0,008 82,4 0,76 657,5 2 5 0,007 8,25 0,75 875,9 3 8 0,008 70,53 0,6 03,6 Por meo da Tabela 3 é possível observar que a maor capacdade de mapeamento dos padrões pela rede MLP ocorreu no teste, ou seja, para a arqutetura 3-2-5, já que apresentou maores valores de EG e K, 82,4% e 0,76, respectvamente. O desempenho cau com o aumento do número de neurônos, podendo ter ocorrdo um overfftng. ota-se anda que, além dos maores destes índces, o tempo de processamento fo o mas rápdo quando comparado aos dos testes 2 e 3. De acordo com a classfcação proposta por Lands & Koch (977), o mapa temátco gerado é classfcado como muto bom. Gelete & Volatão (2007), assm como no presente estudo, utlzaram a toolbox eural etwork contda no software MATLAB e obtveram resultados satsfatóros com uma rede MLP com neurônos na camada oculta. 4.3 Classfcação por meo do método Máquna de Vetor de Suporte (SVM) A classfcação por meo do método SVM fo testada por meo da varação do fator de penalzação (C) e da largura da função gaussana (σ). Objetvando analsar o comportamento de σ, foram escolhdos para C os valores de 00, 000 e 500 e, para cada um destes, foram realzados testes varando σ entre,5 e 0 (,5;,8; 2,0; 2,2; 2,5; 5 e 0). A Tabela 4 expõe os valores de EG, K e o custo computaconal de cada teste. TABELA 4 - DESEMPEHO DO CLASSIFICADOR SVM COM A VARIAÇÃO DE Σ Teste Fator C σ EG (%) K Tempo (s) 000,8 82,4 0,766 350.9 2 000 2 86,03 0,778 20.6 3 000 2,2 8,03 0,752 266.9 4 500,5 80,35 0,74 260.8 5 500 2 82,4 0,766 207. 6 500 2,5 8,25 0,755 268.9 7 500 5 80,35 0,742 276.6 8 500 0 79,46 0,73 30.2 9 00,5 80,35 0,74 243.2 0 00 2 86,03 0,778 276.6 00 2,5 8,25 0,756 269.2 2 00 5 78,57 0,79 283.7 3 00 0 78,57 0,79 325.2 Pela análse desta Tabela nota-se que, para as amostras de trenamento utlzadas, os melhores valores de EG e K ocorrem com σ=2. Anda é possível constatar que, para os três valores de C testados, e para valores de σ superores a 2 os coefcentes de EG e K tendem a decrescer, pos com o aumento da largura da função gaussana pode ocorrer maor confusão na classfcação dos dados. A partr deste resultado, os demas testes foram realzados fxando σ no valor 2 e alterando o fator de penalzação C entre 0 e 5000. A Tabela 5 expõe o resultado dos testes com seus respectvos valores de EG, K e o custo computaconal de cada teste com a varação de C. TABELA 5 - DESEMPEHO DO CLASSIFICADOR SVM COM A VARIAÇÃO DO FATOR C Teste Fator C Sgma EG (%) K Tempo (s) 4 0 2 8,25 0,755 25.2 5 50 2 82,4 0,767 202.6 6 00 2 86,03 0,778 276.6 7 500 2 86,03 0,778 206.9 2 000 2 86,03 0,778 20.6 8 300 2 83,03 0,778 337.3 9 400 2 82,4 0,766 294.4 20 500 2 82,4 0,766 207. 2 2000 2 82,4 0,766 274.5 22 3000 2 80,35 0,74 303.2 23 4000 2 80,35 0,74 283.7 24 5000 2 80,35 0,74 327.6 Revsta Braslera de Cartografa o 62 EDIÇÃO ESPECIAL 2, 200. (ISS 0560-463) 395

Pela análse da Tabela 5, nota-se que o valor de K apresentou tendênca de crescmento com C entre 0 e 300. Porém, após estes valores, o coefcente K passou a decrescer. Com valores de C maores do que 000 os coefcentes de EG e K tendem a decrescer, já que a penalzação é menos rígda e a classfcação apresenta maor quantdade de erros. A classfcação realzada pelo método SVM, correspondente ao teste 2, obteve valor de Exatdão Global de 86,03% e coefcente de Kappa gual a 0,77. Segundo Lands & Koch (977), o mapa temátco resultante é rotulado como muto bom. Outro ponto mportante a ser analsado é o custo computaconal envolvdo no processo de classfcação. Para o método SVM, como pode ser observado na Tabela 5, o teste 2 realzou o processo de classfcação em 20,5 segundos. Já para no método MLP, o teste classfcou a magem em 657,5 segundos. Desta forma, pode-se afrmar que o SVM apresentou menor custo computaconal do que o método MLP ratfcando os resultados encontrados por Foody & Mathur (2004). 4.4 Valdação das classfcações As matrzes de confusão, correspondentes ao teste do método MLP e ao teste 2 do método SVM, estão expostas nas Tabelas 6 e 7, respectvamente. A Tabela 8 apresenta a matrz de confusão correspondente ao método da Máxma Verossmlhança. Os números, 2, 3, 4 e 5 representam as classes APA, água, OTA, CHA e CAD, respectvamente. O total de lnhas corresponde à soma dos pontos nas lnhas e o total de colunas à soma dos pontos nas colunas. Classfcação TABELA 6 - MATRIZ DE COFUSÃO PARA O MÉTODO MLP Verdade de Campo Total EE Classes 2 3 4 5 Lnhas (%) 33 4 39 84,6 2 7 2 0 70,0 3 9 2 22 86,4 4 6 2 27 77,8 5 2 2 4 85,7 Total colunas 35 8 29 25 5 2 - TABELA 7 - MATRIZ DE COFUSÃO PARA O MÉTODO SVM Verdade de Campo Total EE Classes 2 3 4 5 Lnhas (%) 30 7 2 39 76,9 Classfcação 2 0 0 00,0 3 2 22 95,5 4 3 4 20 27 74, 5 2 4 85,7 Total colunas 34 0 32 22 4 2 - Classfcação TABELA 8 - MATRIZ DE COFUSÃO PARA O MÉTODO DA MÁXIMA VEROSSIMILHAÇA Verdade de Campo Total EE Classes 2 3 4 5 Lnhas (%) 34 4 39 87,2 2 8 2 0 80,0 3 3 6 3 22 72,7 4 3 23 27 85,2 5 2 2 0 4 7,4 Total colunas 40 8 23 30 2 - Por meo dos dados apresentados na Tabela 8 foram calculados os valores de EG e K para o método da Máxma Verossmlhança. O coefcente de EG permtu constatar que neste método 8,2% dos pxels foram classfcados corretamente, e que o coefcente de K fo 0,75. Assm como nos estudos de Foody & Mathur (2004) e Pal & Mather (2004) é possível observar, por meo dos valores de K, que a SVM obteve desempenho satsfatóro quando comparada aos métodos MLP e da Máxma Verossmlhança. Para melhor avalar o desempenho dos classfcadores em cada classe calculou-se, por meo da Equação 5, o coefcente de Exatdão Específca (EE) para cada método. Os resultados estão sumarzados na Tabela 9. TABELA 9 - EXATIDÃO ESPECÍFICA DAS CLASSES Exatdão Específca (%) Classe Máxma Verossmlhança MLP SVM APA 87,2 84,6 76,9 Água 80,0 70,0 00,0 OTA 72,7 86,4 95,5 CHA 85,2 77,8 74, CAD 7,4 85,7 85,7 Para a classe APA, o maor nível de acuráca fo obtdo no método da Máxma Verossmlhança, com valor de EE de 87,2%. Para as classes água e Revsta Braslera de Cartografa o 62 EDIÇÃO ESPECIAL 2, 200. (ISS 0560-463) 396

antropzada obteve-se valores de 00 e 95,5%, respectvamente, quando classfcadas pelo método SVM sendo este, portanto, o método mas ndcado para a classfcação destas classes. Já para a classe CHA o maor valor de EE obtdo fo de 85,2% pelo método da Máxma Verossmlhança. E para a classe CAD, obteve-se 85,7% de EE para os métodos SVM e MLP. Os resultados expostos apontam para o bom desempenho dos métodos baseados em aprendzado de máquna segundo os crtéros de Lands & Kock (977). Assm como no trabalho de Su et al. (2007), os resultados obtdos permtem afrmar que estes métodos estão aptos à classfcação do uso e cobertura da terra no boma Caatnga, já que apresentaram resultados equvalentes e até superores ao método da Máxma Verossmlhança. 5. COCLUSÕES As amostras de trenamento apresentaram boa separabldade, o que contrbuu para o desempenho satsfatóro dos classfcadores utlzados. os testes realzados, os classfcadores baseados em aprendzado de máquna apresentaram maor acuráca quando comparados ao classfcador tradconal da Máxma Verossmlhança. Os valores dos coefcentes de Exatdão Global (EG), de Exatdão Específca (EE) e de Kappa (K), obtdos a partr da verdade terrestre, revelam o alto potencal dos métodos baseados em aprendzado de máquna na classfcação do uso e cobertura da terra no boma Caatnga. Em comparação ao método da Máxma Verossmlhança, classfcadores baseados em aprendzado de máquna podem consumr maor tempo computaconal além da necessdade do usuáro despender boa parte do tempo na escolha dos parâmetros do método a ser utlzado, o que pode ser extremamente desgastante. Assm, caso o tempo seja um fator lmtante, pode-se utlzar o método da Máxma Verossmlhança. AGRADECIMETOS Às nsttuções que apoaram esta pesqusa: Unversdade Federal do Ceará (UFC), Insttuto aconal de Pesqusas Espacas (IPE) e Conselho aconal de Desenvolvmento Centífco e Tecnológco (CPq) pelo apoo fnancamento desta. Ao Dr. Rakotomamonjy por dsponblzar o pacote de software SVM-KMToolbox para este estudo. Aos Engenheros Agrônomos Clêno Jaro, Alexandre Gomes Costa e Amaury pela colaboração na exaustva coleta dos pontos no campo. REFERECIAS BIBLIOGRÁFICAS ADRADE, L. A.; PEREIRA, I. M. P.; LEITE, U. T.; BARBOSA, M. R. V. Análse da cobertura de duas ftofsonomas de Caatnga, com dferentes hstórcos de uso, no muncípo de São João do Carr, Estado da Paraíba. Cerne, Lavras, v., n. 3, p. 253-262, 2005. ASSAD, E. D.; SAO, E. E. Sstema de nformações geográfcas: aplcações na agrcultura. 2. ed. Brasíla: EMBRAPA-SPI/EMBRAPA-CPAC, 998. BOSER, B.; GUYO, I; VAPIK, V.. A tranng algorthm for optmal margn classfers. Annual Workshop on Computatonal Learnng Theory, 5., 992, Pttsburgh. Proccedngs... SanMateo, CA: Morgan Kayfmann, 992. p. 44-52. Dsponível em: <http://portal.acm.org/ctaton.cfm?d=3040>. Acesso em: 5 dez. 2008. BUCEE, L. C.; RODRIGUES, L. H. A. Utlzação de redes neuras artfcas para avalação de produtvdade do solo, vsando classfcação de terras para rrgação. Revsta Braslera de Engenhara Agrícola e Ambental, v.8, n.2/3, p. 326-329, mao/dez. 2004. CAU, S.; GRADVALET, Y.; GUIGUE, V.; RAKOTOMAMOJY, A. SVM and Kernel Methods MATLAB Toolbox. Percepton Systèmes et Informaton, ISA de Rouen, Rouen, France, 2005. CARVALHO, L. M. T; CLEVERES, J. G. P. W. ; SKIDMORE, A. K.; JOG, S. M. J. Selecton of magery data and classfers for mappng Brazlan semdecduous Atlantc forests. Internatonal Journal of Appled Earth Observaton and Geonformaton, v. 5, n. 5, p. 73 86, 2004. CHAPELLE, O.; HAFFER, P.; VAPIK, V.. Support Vector Machnes for Hstogram-Based Image Classfcaton. IEEE Transactons On eural etworks, v. 0, n. 5, p. 055-064, 999. CORTES, C.; VAPIK, V. Support vector networks. Machne Learnng. v. 20, n. 3, p. 273-297, set. 995 COVER, T. M. Geometrcal and statstcal propertes of systems of lnear nequaltes wth applcatons n pattern recognton. IEEE Transactons on Electronc Computers, v. 25, n. 3, p. 326-334, jun. 965. EGMOT, M. P.; RIDDER, D. de; HADELS, H. Image processng wth neural networks a revew. Pattern Recognton, v. 35, n. 0, p. 2279 230, 2002. ERBERT, M. O Uso da Análse Dscrmnante Regularzada (RDA) no Reconhecmento de Padrões em Imagens Dgtas Hperespectral de Sensoramento Remoto. 200. 8 f. Dssertação (Mestrado em Sensoramento Remoto) - Unversdade Federal do Ro Grande do Sul, Porto Alegre, 200. FOODY, G. M.; MATHUR, A. A Relatve Evaluaton of Multclass Image Classfcaton by Support Vector Revsta Braslera de Cartografa o 62 EDIÇÃO ESPECIAL 2, 200. (ISS 0560-463) 397

Machnes. IEEE Transactons on Geoscence And Remote Sensng, v. 42, n.6, p. 335-343, 2004. GELETE, C.; VOLATÃO, C. F. de S. Análse do potencal de classfcação do uso e cobertura do solo por meo de rede neural. In: SIMPÓSIO BRASILEIRO DE SESORIAMETO REMOTO, 3., 2007. Floranópols. Anas... Floranópols: IPE, 2007. p. 5779-5785. CD-ROM, On-lne. ISB 978-85-7-0003-7. Dsponível em: <http://urlb.net/dp.npe.br/sbsr@80/2006/0.20.3.05 >. Acesso em: 3 out. 2008. GIGADET, X.; CUADRA, M. B.; POITET, A.; CAMMOU, L.; CALOZ, R.; THIRA, J. Regonbased satellte mage classfcaton: method and valdaton. Image Processng, v. 3, n. 4, p. 832-835, Set.2005. HAYKI, S. eural erworks: A Comprehensve Foudaton. 2. ed. ew Jersey, Prentce Hall, 999. 842 p. HSU, C. W.; LI, C. J. A Comparson of Methods for Multclass Support Vector Machnes. IEEE Transactons On eural etworks, v. 3, n. 2, p. 45-425, mar. 2002. IBGE. 2009. Estmatvas populaconas para os muncípos brasleros em 0.07.2009. Ro de Janero: Insttuto Braslero de Geografa e Estatístca (IBGE). Dsponível em:< http://www.bge.gov.br/home/estatstca/populacao/est matva2009/pop2009_dou.pdf>. Acesso em 0 de abrl. 200. IWAI, O. K. Mapeamento do uso do solo urbano no muncípo de São Bernardo do Campo, através de magens de satéltes. 2003. 27 f. Dssertação (Mestrado em Engenhara de Transportes) Escola Poltécnca da Unversdade de São Paulo. São Paulo, 2003. JACOMIE, P. K. T.; ALMEIDA, J. C.; MEDEIROS, L. A. R. Levantamento exploratóro-reconhecmento de solos do estado do Ceará. Recfe, Mnstéro da Agrcultura/ Superntendênca do Desenvolvmento do ordeste, 973, v.. 30p. (Boletm técnco, 28; Sére Pedologa, 6). LADIS, J. R.; KOCH, G. C. The measurement of observer agreement for categorcal data. Bometrcs, v. 33, n., p. 59-74, 977. LEDUC, R.; GRAÇA, P.M.L. de A.; PEIXOTO, J.M.A. Classfcação da cobertura do solo da Reserva Extratvsta do Baxo Juruá/AM.. In: SIMPÓSIO BRASILEIRO DE SESORIAMETO REMOTO, 2007, 3., Floranópols. Anas... Floranópols: IPE, 2007. p. 5329-5336. CD-ROM, On-lne. ISB 978-85- 7-0003-7. Dsponível em: <http://marte.dp.npe.br/col/dp.npe.br/sbsr@80/2006/.6.02.53.0/doc/6787-6789.pdf>. Acesso em: 3 mar. 2009. LI, W. C. A herarchcal multple vew approach to three-dmensonal object recognton. IEEE Transactons On eural etworks, v. 2, n., p. 84-92, jan. 99. MAGABEIRA, J. A. de. C., AZEVEDO, E. C. de, LAMPARELLI, R. A. C. Avalação do levantamento do uso das terras por magens de satélte de alta e méda resolução espacal. Campnas: Embrapa Montoramento por Satélte, 2003. 6 p, (Comuncado Técnco, ). Dsponível em:< http://www.cnpm.embrapa.br/publca/sere.htmlr>. Acesso em: 5 jan. 2008. MELGAI, F. Classfcaton of Hyperspectral Remote Sensng Images Wth Support Vector Machnes. IEEE Transactons on geoscence and remote sensng, v. 42, n. 8, p. 778-790, ago.2004. MITCHELL, T. Machne Learnng. ew York, McGraw Hll, 997. 44p. MOREIRA, M. A. Fundamentos do sensoramento remoto e metodologas de aplcação. 3. ed. Vçosa, UFV, 2005. 320p. OVO, E. M. L. M. Sensoramento Remoto, Prncípos e Aplcações; 2. ed. São Paulo: Edgrad Blucher Ltda., 989. 269 p. OSUA, E.; FREUD, R.; GIROS, F. Support vector machnes: Tranng and applcatons. Massachusetts, M.I.T Artfcal Intellgence Laboratory, 997. 42 p. PAL, M.; MATHER, P. M. Assessment of the effectveness of support vector machnes for hyperspectral data. Future Generaton Computer Systems, v. 20, n. 7, p. 25 225, 2004. QUEIROZ, R. B.; SEVERIO, P. A. R.; RODRIGUES, A. G.; GÓMEZ, A. T. U. Redes euras: Um comparatvo com Máxma Verossmlhança Gaussana na Classfcação de Imagens CBERS. In: WORKSHOP DE TECOLOGIA DA IFORMAÇÃO APLICADA AO MEIO AMBIETE, 2., 2004, Itajaí. Anas... Unversdade Vale do Itajaí: UVI, 2004. p. 746-749. CD-ROM, On-lne. ISB 677-2822. Dsponível em: <www.nee.ufrgs.br/cbcomp/cbcomp2004/html/pdf/w orkshop_ambente/intelg%eanca_artfcal/t7000 5_3.pdf>. Acesso em: 05 nov. 2008. Revsta Braslera de Cartografa o 62 EDIÇÃO ESPECIAL 2, 200. (ISS 0560-463) 398

RICHARDS, J.A. JIA, X. Remote sensng dgtal mage analyss: An ntroducton. 4 ed. ew York, Sprnger, 2006. 476 p. SMOLA, A. J.; BARLETT, P.; SCHÖLKOPF, B.; SCHUURMAS, D. Advances n Large Margn Classfers. Cambrdge: MIT Press, 2000. 423 p. SU, L.; MARK, J. C.; RAGO, A.; MARTOCHIK, J. V.; PETERS, D. P. C. Support vector machnes for recognton of sem-ard vegetaton types usng MISR mult-angle magery. Remote Sensng of Envroment, v. 07, n. p. 299-3, 2007. VAPIK, V.. The ature of Statstcal Learnng Theory. ew York, Sprnger-Verlag, 995. 332 p. WATZLAWICK, L. F.; KIRCHER, F. F.; MADRUGA, P. R de A. Avalacão de classfcação dgtal em magens de vídeo multespectral utlzando matrz confusão. Revsta de Cêncas Exatas e aturas, Guarapuava-PR, v. 5, n., p. 47-57, jul./dez. 2003. WESTO, J.; WATKIS, C. Mult-Class Support Vector Machnes. Mao, 998. Comuncado técnco. WISCHMEIER, W. H. & D. D. SMITH. Predctng ranfall eroson losses: a gude to consevaton plannng. Washngton, D.C, Unted States Department of Agrculture, 978. 58p. (Agrculture handbook, 537) Revsta Braslera de Cartografa o 62 EDIÇÃO ESPECIAL 2, 200. (ISS 0560-463) 399