UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS AGRÁRIAS DEPARTAMENTO DE ENGENHARIA AGRÍCOLA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA AGRÍCOLA

Tamanho: px
Começar a partir da página:

Download "UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS AGRÁRIAS DEPARTAMENTO DE ENGENHARIA AGRÍCOLA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA AGRÍCOLA"

Transcrição

1 UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS AGRÁRIAS DEPARTAMENTO DE ENGENHARIA AGRÍCOLA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA AGRÍCOLA BEATRIZ FERNANDES SIMPLICIO SOUSA APRENDIZADO DE MÁQUINA NA DETECÇÃO DO USO DO SOLO NO BIOMA CAATINGA VIA SENSORIAMENTO REMOTO FORTALEZA 2009

2 BEATRIZ FERNANDES SIMPLICIO SOUSA APRENDIZADO DE MÁQUINA NA DETECÇÃO DO USO DO SOLO NO BIOMA CAATINGA VIA SENSORIAMENTO REMOTO Dssertação submetda à Coordenação do Programa de Pós-graduação em Engenhara Agrícola, da Unversdade Federal do Ceará, como requsto parcal para a obtenção do grau de Mestre em Engenhara Agrícola. Área de concentração: Manejo e Conservação de Bacas Hdrográfcas no Semárdo. Orentador: Professor Adunas dos Santos Texera, Ph.D. Co-orentador: Francsco de Asss Tavares Ferrera da Slva, Dr. FORTALEZA 2009

3 BEATRIZ FERNANDES SIMPLICIO SOUSA APRENDIZADO DE MÁQUINA NA DETECÇÃO DO USO DO SOLO NO BIOMA CAATINGA VIA SENSORIAMENTO REMOTO Dssertação submetda à Coordenação do Programa de Pós-Graduação em Engenhara Agrícola, da Unversdade Federal do Ceará, como requsto parcal para a obtenção do grau de Mestre em Engenhara Agrícola. Área de concentração em Manejo e Conservação de Bacas Hdrográfcas no Semárdo. Aprovado em 06 de março de 2009 BANCA EXAMINADORA Prof o. Adunas dos Santos Texera (Orentador), Ph.D. Unversdade Federal do Ceará - UFC Dr. Francsco de Asss Tavares Ferrera da Slva (Co-Orentador), Dr. Insttuto Naconal de Pesqusas Espacas - INPE Prof o. Arthur Plíno de Souza Braga (Conselhero), Dr. Unversdade Federal do Ceará - UFC Prof a. Eunce Maa de Andrade (Conselhera), Ph.D. Unversdade Federal do Ceará - UFC

4 Dedco à Deus, meu mantenedor.

5 AGRADECIMENTOS Começo agradecendo a quem me concedeu a vda: Deus e àqueles a quem Ele permtu que me educassem com tanta dedcação: Meus pas Ademar e Céla. À mnha famíla pelo apoo oferecdo. Ao meu esposo Thago Handerson. Obrgada por estar ao meu lado, por ter tdo muta pacênca e ter me dado forças em todos os momentos. Ao professor Adunas pela oportundade e orentação proporconada não só no período de mestrado, mas também na graduação. Ao professor Tavares por estar sempre dsposto a me orentar quer fosse pessoalmente ou pela nternet e sempre me anmar para melhorar cada vez mas a pesqusa. Aproveto anda para agradecer também ao Insttuto Naconal de Pesqusas Espacas (INPE), o qual cedeu as magens de satélte gratutamente. Ao amgo Dav. Sua ajuda fo essencal! Obrgada pela parcera. Aos amgos e amgas de mestrado. Meu coração tem um lugarznho para cada um de vocês! Em especal agradeço ao Clemlson e Frmno pela ajuda na programação e também ao Carlos Alexandre, ao Clêno Jaro e ao Amaury pela ajuda na coleta dos pontos em Iguatu. Ao CNPq pelo apoo fnancero e à Unversdade Federal do Ceará. À Professora Eunce Maa do departamento de Engenhara Agrícola e ao Professor Arthur Braga do departamento de Engenhara Elétrca da Unversdade Federal do Ceará. Muto obrgada por contrbur para a melhora do trabalho.

6 O temor do Senhor é o prncípo da sabedora... Provérbos 9:10

7 RESUMO APRENDIZADO DE MÁQUINA NA DETECÇÃO DO USO DO SOLO NO BIOMA CAATINGA VIA SENSORIAMENTO REMOTO O manejo adequado dos recursos naturas em ambentes fráges, como o da Caatnga, requer o conhecmento de suas propredades e dstrbução espacal. Desta forma, o presente trabalho propõe uma abordagem para a classfcação de magens do satélte LANDSAT-5, correspondente a uma regão semárda localzada no muncípo de Iguatu no Estado do Ceará, objetvando detectar o boma da Caatnga por meo de dos tpos de classfcadores baseados em aprendzado de máquna: o método baseado em Perceptrons de Múltplas Camadas-MLP (do nglês Mult Layer Perceptron) e o método Máqunas de Vetores de Suporte-SVM (do nglês Support Vector Machne). O classfcador estatístco da máxma verossmlhança, por ser amplamente utlzado na lteratura, também fo aplcado à área em estudo para que o desempenho dos métodos propostos fosse comparado aos destes. Cnco classes foram defndas para a classfcação, a saber: agrcultura, antropzada, água, caatnga herbácea arbustva (CHA) e caatnga arbórea densa (CAD). Para o método MLP, foram realzados testes varando a quantdade de neurônos na camada ntermedára. Já os testes para o método SVM consstram em varar o parâmetro σ da função gaussana e o parâmetro de penalzação (C). A efcênca dos métodos fo analsada por meo dos coefcentes de Exatdão Global, Exatdão Específca e de Kappa calculados por meo dos dados da matrz de confusão. Esta, por sua vez, fo gerada para cada método a partr da comparação entre a classfcação e os pontos georreferencados com aparelho GPS (correspondentes à verdade terrestre). O método MLP apresentou melhor desempenho para o teste em que 12 neurônos foram atrbuídos à camada ntermedára, com valores de Exatdão Global e de Kappa de 82,14% e 0,76, respectvamente. Já o método SVM apresentou melhor performance para o teste com C=1000 e σ=2 no qual se obteve valores de 86,03% e 0,77 para os coefcentes de Exatdão Global e Kappa, respectvamente. O valor de Exatdão Global para o classfcador estatístco da máxma verossmlhança permtu conclur que 81,2% dos pxels foram classfcados corretamente e o coefcente de Kappa para este método fo de 0,73. Os valores dos coefcentes de Exatdão Específca, que proporconam analsar o desempenho dos métodos em cada classe, foram superores a 70%. A área total classfcada fo de 576 km 2 e, dentre as duas classes consderadas para o boma Caatnga, a predomnante é a do tpo caatnga herbácea arbustva (CHA). Assm, por meo dos resultados expermentas obtdos, pode-se afrmar que os métodos SVM e MLP, baseados em aprendzado de máquna, apresentaram desempenho satsfatóro para a classfcação do boma Caatnga. Palavras-chave: Intelgênca artfcal, semárdo, classfcação de magens de satélte.

8 ABSTRACT REMOTE SENSING AND MACHINE LEARNING APPLIED TO SOIL USE DETECTION IN CAATINGA BIOMA In order to manage adequately natural resources nsde a fragle envronment, just lke Caatnga, one should know ts propertes and spatal dstrbuton. Ths work proposes an approach to classfy LANDSAT-5 satellte mages. These mages, correspondng to a semard envronment located n Iguatu country, Ceara, Brazl, were classfed amng at detectng the Caatnga bome by two type of classfers based on machnery learnng: Mult Layer Perceptron (MLP) and Support Vector Machne (SVM). The statc classfer of Maxmum Lkelhood was also used as comparson to the other two methods. Agrculture, water, anthropcal, herbaceous shrub Caatnga (CHA) and dense hgh Caatnga (CAD) are the fve classes defned for classfyng. MLP method tests were carred out changng neurons quantty n the ntermedate layer. SVM method tests were carred out changng σ, from Gauss functon, and penalzaton parameter (C). Performance of the tests was analyzed by Global Accuracy, Specfc Accuracy and Kappa coeffcent. The last one calculated by confuson matrx, whch has been generated by comparson of classfcaton data and ground control ponts GPS georreferenced (true ponts). MLP method presented best performance for tests n whch 12 neurons have been attrbuted to the ntermedate layer resultng n Global Accuracy and Kappa values of 82.14% and 0.76, respectvely. On the other hand, SVM method presented best performance for tests carred out wth C=1000 and σ=2, resultng n Global Accuracy and Kappa values of 86.03% and 0.77, respectvely. The Maxmum Lkelhood classfer presented 81.2% of ts pxels correctly classfed (Global Accuracy) and K coeffcent value of The values of Specfc Accuracy, whch makes t possble to analyze the performance of each ndvdual class, were above 70% n each class. A total 576 km 2 area was classfed. Between the two types of Caatnga bome consdered, herbaceous shrub Caatnga (CHA) comes to be the most common. Therefore, takng nto account expermental results, t s possble to conclude that both SVM and MLP methods, whch are based on machne learnng, show satsfactory performance for classfyng Caatnga bome. Key-words: artfcal ntellgence, sem-ard, satellte mage classfcaton.

9 LISTA DE FIGURAS Fgura 1 Modelo do neurôno artfcal...21 Fgura 2 Funções de atvação...22 Fgura 3 Topologa de uma RNA...23 Fgura 4 Redes feedforward com uma únca camada...24 Fgura 5 Redes feedforward com únca camada oculta e uma camada de saída...25 Fgura 6 - Desenho esquemátco lustrando o hperplano ótmo, a margem de separação e os vetores de suporte...31 Fgura 7 Ilustração das posções das varáves de folga...33 Fgura 8 Ilustração de mapeamento para o espaço característco...35 Fgura 9 Exemplo de uma matrz de confusão...40 Fgura 10 Localzação da baca hdrográfca do Alto Jaguarbe...43 Fgura 11 Precptação mensal do ano de 2008 para o muncípo de Iguatu-CE...44 Fgura 12 Muncípo de Iguatu e área de estudo representada pela magem do satélte LANDSAT-5 de 20/08/ Fgura 13 Classe água entre a Caatnga...46 Fgura 14 Classe CAD no muncípo de Iguatu-CE...47 Fgura 15 Classe CHA no muncípo de Iguatu-CE...47 Fgura 16 Exemplo de área antropzada...48 Fgura 17 Área de agrcultura no muncípo de Iguatu-CE...48 Fgura 18 Arqutetura da MLP correspondente ao teste Fgura 19 Fluxograma das atvdades relaconadas ao método MLP...52 Fgura 20 Fluxograma das atvdades relaconadas ao método SVM...54 Fgura 21 Georreferencamento de ponto correspondente à verdade terrestre...55 Fgura 22 (A) Pontos georreferencados na magem orgnal; (B) Pontos georreferencados na magem classfcada pelo método da máxma verossmlhança...56 Fgura 23 Valores de RBG em plxal da classe água...56 Fgura 24 Dados de entrada RBG e suas respectvas classes após processamento no MATLAB...56 Fgura 25 Planlha com o teste e a saída desejada...57 Fgura 26 Produção da matrz de confusão...57 Fgura 27 Etapas e ordem de execução...58

10 Fgura 28 Resposta espectral méda das dferentes classes de cobertura do solo das amostras de trenamento...60 Fgura 29 Classfcação pelo método da máxma verossmlhança...62 Fgura 30 Classfcação por meo de uma rede MLP...64 Fgura 31 Comportamento do coefcente de Kappa com C mantdo constante e varando o fator ξ...66 Fgura 32 Comportamento do coefcente de Kappa com ξ mantdo constante e varando o fator C...67 Fgura 33 Classfcação utlzando o método SVM...68 Fgura 34 Área total por cada classe (km 2 )...70

11 LISTA DE TABELAS Tabela 1 Qualdade da classfcação assocada aos valores da estatístca de Kappa...42 Tabela 2 Classes de nteresse na magem do satélte LANDSAT-5 na combnação 432 do espaço RGB...49 Tabela 3 Testes realzados na rede MLP...51 Tabela 4 Índce de separabldade entre as classes...61 Tabela 5 Matrz de confusão para o método da máxma verossmlhança...62 Tabela 6 Resultados dos testes pelo método MLP Tabela 7 Matrz de confusão para o método MLP...64 Tabela 8 Desempenho do classfcador SVM com varação de ξ...65 Tabela 9 Desempenho do classfcador SVM com varação de do fator C...66 Tabela 10 Matrz de confusão para o método SVM...67 Tabela 11 Exatdão específca das classes para cada método...69

12 LISTA DE ABREVIATURAS E SIGLAS IA RNA MLP LANDSAT TM SVM VC ATM MISR OAO OAA AVRIS RBF JM EG EE K CAD CHA IA RNA SVM MLP Intelgênca Artfcal Rede Neural Artfcal Mult Layer Perceptron Land Remote Sensng Satellte Thematc Mapper Support Vector Machne Vapnk-Chervonenks Arborne Thematc Mapper Mult-angle Imagng Spectro-Radometer One-Aganst- One One-Aganst-All Arbone Vsble Infrared Imagng Spectometer Radal Bass Functon Jeffres-Matusta Exatdão Global Exatdão Específca Coefcente de Kappa Caatnga Arbórea Densa Caatnga Herbácea Arbustva Intelgênca Artfcal Rede Neural Artfcal Support Vector Machne Mult Layer Perceptron

13 LISTA DE SÍMBOLOS ω Classe P(ω X) Probabldade de ω ocorrer na posção X; P(ω ) Probabldade da classe ocorrer na magem; P(X ω ) Dstrbução de probabldade de X dado uma classe ω ; P(X) exp ln Probabldade do pxel X ocorrer na magem. Função exponencal Logartmo neperano µ Vetor médo da classe g (X) x m w kj u k y k v k φ(.) d k e k t η δ j α x d w b w o b o ρ α Função dscrmnante da classe Elementos do vetor de entrada da MLP Pesos entre o neurôno j e a entrada Combnador lnear Snal de saída do neurôno Campo local nduzdo Função de atvação Saída desejada Termo de erro do neurôno de saída Iteração da rede MLP Coefcente de aprendzado para o algortmo backpropagaton Gradente local Taxa de momento Objeto, padrão de entrada ou atrbuto da SVM Saída desejada Vetor de peso da SVM Bas Vetor de peso ótmo da SVM Bas ótmo Margem de separação Multplcador de Lagrange f (x) Função de separação do hperplano ξ Ф Magntude do erro de classfcação Hperplano de separação ótmo

14 C Parâmetro de penalzação K(x,x j ) Função kernel σ Largura da gaussana B j M Σ r x N n x + Dstânca de Bhattacharyya Vetor de méda da classe Matrz de covarânca da classe Número de lnhas da matrz de erro Valor da lnha e coluna Quantdade total de pontos amostras Quantdade total de pontos amostras da classe r Soma da lnha x + Soma da coluna.

15 SUMÁRIO 1. INTRODUÇÃO REVISÃO DE LITERATURA O boma Caatnga Sensoramento remoto e classfcação de magens de satélte Classfcação supervsonada Classfcação não-supervsonada Aprendzado de máquna Defnção de Rede Neural Artfcal (RNA) e o modelo do neurôno artfcal Arquteturas das RNA Redes feedforward (únca camada) Redes feedforward (múltplas camada) Trenamento e Teste Máqunas de Vetores de Suporte (SVM) Casos lnearmente separáves Casos não lnearmente separáves Classfcadores bnáros e classfcadores multclasses Dstânca de Jeffres-Matusta Valdação da exatdão do mapeamento Análse da separabldade das classes MATERIAL E MÉTODOS Localzação, aspectos fsográfcos e clmátcos da área de estudo Confguração da máquna Aqusção da magem e georreferencamento Escolha das classes e processo de amostragem Análse da separabldade das amostras de trenamento Classfcação no software ENVI Classfcação no software MATLAB Método Perceptron de Múltplas Camadas (MLP) Método Máquna de Vetor de Suporte Valdação da classfcação Fluxograma Análse da separabldade das classes...59

16 4 RESULTADOS E DISCUSSÃO Análse da separabldade das classes Classfcação pelo método estatístco da máxma verossmlhança Classfcação por meo do método Perceptron de Múltplas Camadas (MLP) Classfcação por meo do método Máquna de Vetor de Suporte (SVM) Avalação dos coefcentes de exatdão específca (EE) Quantfcação das áreas Conclusões Perspectvas...72 REFERÊNCIAS...73 APÊNDICE APÊNDICE

17 14 1. INTRODUÇÃO Ações de degradação à natureza, provocadas pelo homem, fazem com que esta tenha reações que prejudcam ao própro agente causador. O que vem se notando é que o homem está adqurndo novo posconamento com relação aos recursos naturas, passando a apresentar maor preocupação com a questão da degradação ambental (OLIVEIRA et al., 2003) e com prátcas não-sustentáves de uso dos recursos naturas. A Caatnga, um dos mas rcos bomas brasleros, encontra-se ameaçada. O que agrava a stuação é que este boma, que é exclusvamente braslero e ocupa 11% do terrtóro naconal, é um dos menos estudados e protegdos do Brasl (WANDSCHEER, 2008). Rbero et al. (2001), afrmam que após séculos de gestão desastrosa dos recursos naturas, atngmos estágos onde a manutenção do nosso padrão de vda tornou-se ncompatível com o de mutas outras espéces e que uma possbldade de reverter esta stuação talvez esteja no conhecmento sobre a dnâmca dos ecossstemas. Segundo Wandscheer (2008), na Caatnga a maor agressão decorre da extração de lenha. No entanto, o conhecmento mas aprofundado sobre este boma pode tornar possível realzar esta atvdade sem destruí-la, pela adoção de um planejamento da exploração sustentável, de forma que a Caatnga possa se recompor. Assm, a busca pelo conhecmento das característcas de cobertura do solo através de classfcadores de magens de satélte tem sdo objeto de estudo e pesqusa pela comundade centífca (SOUSA et al., 2007). É de extrema mportânca que a classfcação da cobertura do solo seja realzada de forma rápda e exata, ou seja, que exsta uma boa correspondênca entre o mapa e a realdade terrestre. O mapeamento da cobertura do solo é uma nformação essencal em estudos de gestão ambental, em avalações de bodversdade e como apoo para decsões de ações ambentas, socas e polítcas econômcas. Este tpo de mapeamento também pode ser consderado fundamental para realzar análses de erosão por meo de modelagens, já que serve como dado de entrada para dversos modelos utlzados. As modelagens podem gerar nformações mportantes para áreas onde qualdade de água e erosão são problemas, como é o caso de semárdo. Na lteratura é possível encontrar desde métodos tradconas para classfcação de magens de satélte como, por exemplo, o da máxma verossmlhança (QUEIROZ et al., 2004 e SOUSA et al.,2007) e o da mínma dstânca (LEDUC et al., 2007) até métodos mas avançados como, por exemplo, os que utlzam aprendzado de máquna (CARVALHO et al.,

18 ). Dversos métodos contdos no grupo do aprendzado de máquna têm atraído a atenção da comundade de sensoramento remoto (GIGANDET et al., 2005). As Support Vector Machnes, por exemplo, estão presentes na nova geração de sstemas de aprendzado supervsonado baseados na teora de aprendzagem estatístca. Uma SVM é bascamente uma máquna lnear, cuja déa prncpal é construr um hperplano como superfíce de decsão de tal forma que a margem de separação entre exemplos postvos e negatvos seja máxma (HAYKIN, 1999). As SVMs também têm sdo aplcadas em problemas de classfcação de dados provenentes do sensoramento remoto (MERCIER et al., 2003; GONÇALVES et al., 2006) e os resultados mostram que estas podem obter uma melhor performance na classfcação e ter melhor capacdade de generalzação do que classfcadores estatístcos tradconas. Desta forma, o objetvo do presente trabalho fo avalar o desempenho de algortmos baseados em aprendzado de máquna na detecção do uso do solo no boma Caatnga utlzando magens do satélte LANDSAT-5. Foram escolhdos os métodos Perceptrons de Múltplas Camadas (MLP) e Support Vector Machnes (SVM). Os resultados destes foram anda comparados com o método estatístco da máxma verossmlhança. Esta dssertação está organzada em ses capítulos. O corrente capítulo contém uma ntrodução com uma contextualzação sobre a mportânca da classfcação de magens de satélte. No segundo capítulo são apresentadas as fundamentações teórcas sobre o sensoramento remoto, bem como as técncas computaconas tradconas e ntelgentes para classfcação de magens de satélte. Anda neste capítulo é feta uma revsão de trabalhos que abordam a utlzação dos métodos de classfcação propostos. No tercero capítulo estão apresentados os materas e métodos. Já os resultados do expermento são detalhados no quarto capítulo. E, fnalmente, o qunto capítulo apresenta conclusões e o sexto as perspectvas para trabalhos futuros.

19 16 2. REVISÃO DE LITERATURA Na prmera subsecção deste capítulo é apresentada uma breve descrção do boma Caatnga. Em seguda, a base teórca para o processo de classfcação de magens de satélte por meo de métodos tradconas e de métodos baseados em aprendzado de máquna é apresentada. Assm como a fundamentação dos métodos de valdação para classfcações. Anda neste capítulo são apresentados os trabalhos que foram utlzados como referênca ao desenvolvmento deste. 2.1 O boma Caatnga A Caatnga, um dos maores bomas brasleros, ocupa uma área de aproxmadamente km 2, correspondendo à aproxmadamente 54% da regão Nordeste e 11% do terrtóro braslero. Está presente em város Estados como Pauí, Ceará, Ro Grande do Norte, Paraíba, Pernambuco, Alagoas, Sergpe, Baha e Mnas Geras. Trata-se do únco ecossstema exclusvamente braslero, sendo composto por um mosaco de florestas secas e vegetação arbustva. Este boma encontra-se presente no Estado do Ceará com uma área de km 2 o que corresponde a quase 85% da área total. Infelzmente, o Ceará é o Estado nordestno em que a Caatnga encontra-se em maor estado de devastação (MMA, 2002). Segundo Maa (2004), a presença deste boma pode proporconar proteção contra erosão (já que o solo fca protegdo pelas copas da vegetação); conservação da fertldade do solo; conservação da água; conservação do clma (a vegetação amenza os extremos do clma) e proteção natural contra pragas (pos abrga todos os organsmos responsáves pela manutenção do equlíbro natural). O clma da Caatnga se caracterza por ser sem-árdo, quente e apresentar duas estações dstntas: a estação chuvosa, que dura de 3 a 5 meses, e a estação seca, que pode prolongar-se de 7 a 9 meses (MAIA, 2004). A Caatnga é um boma muto rco apresentando fauna e flora com característcas peculares que os permtem vver nestas condções. Já foram regstradas 932 espéces de plantas vasculares, 185 espéces de pexes, 154 réptes e anfíbos, 348 espéces de aves e 148 espéces de mamíferos. A caatnga possu três estratos de formação vegetal: arbóreo (8 a 12 metros), arbustvo (2 a 5 metros) e herbáceo (abaxo de 2 metros) (MMA, 2002).

20 17 Algumas característcas deste boma podem ser ctadas: Alta dversdade e heterogenedade das espéces; proteção do solo; proteção da água; adaptação das espéces às condções sem-árdas (como a perda da folhagem na estação seca). De acordo com LEAL et al. (2005), a pecuára bovna assocada a prátcas agrícolas degradáves, ncadas no processo de colonzação, resultou em um boma empobrecdo, devastado e com alterações nas espéces natvas (como árvores mas baxas, caule mas fno, menor número de espéces). Como exemplo de prátcas degradáves pode-se ctar a retrada de madera para dversos fns, agrcultura tnerante, aumento dos rebanhos e desmatamento de terrenos de alta declvdade (favorecendo a erosão). De acordo com o autor, o desmatamento reduz a dversdade florístca, resultando na quebra do equlíbro entre espéces, exposção do solo e perda do banco de sementes. Prátcas errôneas como estas resultaram em 28 espéces ameaçadas de extnção, naconal ou globalmente. 2.2 Sensoramento remoto e classfcação de magens de satélte Erbert (2001) afrma que o sensoramento remoto tem por objetvo estudar objetos ou regões na superfíce da Terra sem entrar dretamente em contato com os mesmos. Estes objetos de nteresse, como: vegetação, culturas agrícolas, solos, formações rochosas, corpos de água, entre outros, são denomnados de alvos. As nformações sobre os alvos são obtdas bascamente através do estudo da nteração da radação eletromagnétca emtda por fontes naturas (ex: Sol) ou artfcas (ex: Radar) com estes alvos. As magens provenentes do sensoramento remoto vêm servndo como base para estudos e levantamentos geológcos, ambentas, agrícolas, cartográfcos, florestas, urbanos, entre outros. Além dsso, essas magens passaram a representar uma das úncas formas váves para realzar montoramentos ambentas tanto em escalas locas como em globas já que são produzdas com rapdez, efcênca e perodcdade Técncas de classfcação de magens mplcam na mplementação de um processo de decsão para que o computador possa atrbur certo pxel a uma classe (NOVO, 1989). Segundo Iwa (2003), são gerados neste processo, mapas temátcos ou cartas temátcas correspondentes aos temas de nteresse, de acordo com crtéros bem defndos. Cada pxel da magem orgnal é classfcado em alguma das classes ou temas defndos e representado por símbolos gráfcos ou cores. A maora dos classfcadores basea-se exclusvamente na detecção da assnatura espectral (sto é, padrões de respostas espectras) de classes de

21 18 cobertura do solo. Neste caso, para que a classfcação seja bem sucedda, é necessáro que as assnaturas espectras dos alvos sejam bem defndas e dstntas entre s Classfcação supervsonada Nos métodos de classfcação supervsonada, as classes são prevamente defndas pelo analsta, sto é, defndas ou caracterzadas através das amostras de trenamento. Os métodos pertencentes a este tpo de classfcação utlzam algortmos que realzam o reconhecmento dos padrões espectras na magem com base nessas amostras (MOREIRA, 2005). Como exemplo, pode-se ctar alguns métodos estatístcos de classfcação supervsonada: da dstânca mínma, do paralelepípedo e da máxma verossmlhança. O classfcador estatístco da máxma verossmlhança rotula os pxels em uma determnada classe conforme a dstânca estatístca entre cada pxel e a méda da resposta espectral de classe (ASSAD e SANO, 1998). É um dos classfcadores mas aplcados no tratamento de dados provenentes do sensoramento remoto como pode ser vsto nos trabalhos de Queroz et al. (2004) e Sousa et al. (2007). Em comparação aos demas classfcadores supervsonados tradconas, este método vem apresentando resultados superores como mostra os estudos de Oruc et al. (2004), de Slva e Perera (2007) e de Fgueredo e Carvalho (2007). Uma função de probabldade P(x) defne a que classe pertencerá determnado pxel. O cálculo é feto para as váras classes pré-defndas e o pxel é atrbuído à classe cuja probabldade de pertencer a esta seja maor. É consderado um método paramétrco, pos envolve parâmetros (vetor méda e matrz de covarânca) da dstrbução gaussana multvarada, e é supervsonado, pos estma estes parâmetros através das amostras de trenamento (ERBERT, 2001). As classes na magem serão representadas por ω, = 1,...,M, onde M é o número total de classes. Um pxel X pertencerá à classe ω se a probabldade que assoca este pxel à classe ω for maor do que a probabldade que assoca o pxel a qualquer outra classe (RICHARDS, 1993): X Є ω, se P(ω X) > P(ω j X), para todo ω ω j (1) Onde P(ω X) é a probabldade de ω ocorrer na posção X. Para determnar P(ω X) têm-se o teorema de Bayes: P(X ω )P(ω ) P(ω X) = (2) P(X)

22 19 Onde: P (ω ) Probabldade da classe ocorrer na magem; P (X ω ) - Dstrbução de probabldade de X dado uma classe ω ; P (X) - Probabldade do pxel X ocorrer na magem. Aplcando a Equação 2 na condção apresentada em 1, tem-se que: X Є ω, se P(X ω ) P(ω ) > P(X ω j ) P(ωj ), j (3) A probabldade de determnada classe ocorrer na magem, neste exemplo dado por P(ω ) e P(ω j ), é quase sempre neglgencada no processo de classfcação já que se supõe que todas as classes têm gual chance de ocorrênca. Assm: X Є ω, se P(X ω ) > P(X ωj ), j (4) O valor de P (X ω ) é obtdo assumndo-se a dstrbução normal para as classes: P ( X ω ) = ( ) N 1 1 T 1 2π 2 Σ 2 exp ( X µ ) Σ (X µ ) (5) 2 Onde N é o número de bandas; Σ a matrz de covarânca da classe ω para as N bandas; µ vetor que contém o valor médo da resposta espectral da classe ω para as N bandas. O valor médo da resposta espectral (µ ) e a matrz de covarânca (Σ ) estão apresentados a segur: µ 1 K T = (X j µ )(X j µ ) K j= 1 Σ = 1 K X j K 1 j= 1 Onde K é o número de pxels no conjunto de trenamento da classe ω. Aplcando logartmo natural à Equação 5, tem-se: N 1 1 T 1 ln P( X ω ) = ln( 2π) Σ (X µ ) Σ (X µ ) (8) A partr da smplfcação matemátca da Equação 8, a segunte função de dscrmnação é obtda: 1 (6) (7) T g (X) = ln Σ (X µ ) Σ (X µ ) (9) Desta forma, a regra de decsão para este método é dada por: X Є ω, se g (X) > g j(x), j (10)

23 Classfcação não-supervsonada Para realzar este tpo de classfcação, os algortmos deste método devem buscar encontrar as classes na magem por agrupamento, ou seja, procurando agrupar pxels com padrões de reflectânca semelhantes entre s ou separando grupos de pxels dferentes. Neste caso, estes agrupamentos não assumem qualquer conhecmento prévo da dstrbução de densdade de probabldade dos temas, como ocorre nos métodos supervsonados. O resultado deste tpo de método é uma magem sem rótulos, ou seja, não se conhece prevamente a dentfcação das classes resultantes e o própro usuáro deve, ao fnal do processo, rotular essas classes (MOREIRA, 2005). Alguns métodos comuns de cluster são os algortmos Isodata e K-Médas. Fgueredo e Carvalho (2007) realzaram uma análse comparatva entre técncas de classfcação dgtal em magens do satélte LANDSAT para o mapeamento do uso e ocupação do solo em Capxaba, Acre. Por meo do expermento fo possível notar que, para as três magens analsadas, o método supervsonado da máxma verossmlhança apresentou maores valores de Kappa quando comparado ao método não supervsonado Isodata. 2.3 Aprendzado de máquna O aprendzado de máquna está nserdo na área de conhecmento denomnada Intelgênca Artfcal (IA) e têm por objetvo desenvolver métodos, técncas e ferramentas para construr máqunas ntelgentes capazes de realzar as mas dversas tarefas. De acordo com Mtchell (1997), essas máqunas devem trenar sobre determnado conjunto de amostras e adqurr conhecmento de forma automátca. As técncas de aprendzado podem ser classfcadas em supervsonadas (em que os rótulos das classes são prevamente conhecdos e o algortmo de aprendzado recebe um conjunto de exemplos de trenamento para cada classe) e não supervsonadas (em que os rótulos das classes não são conhecdos e o algortmo de aprendzado procura formar agrupamentos ou clusters dos dados de entrada). Como exemplo de algortmos de aprendzado de máquna pode-se ctar os que têm como nspração os sstemas bológcos (Redes Neuras Artfcas (RNAs) e Algortmos Genétcos), o aprendzado smbólco (Árvores de Decsão) e as teoras estatístcas (Support Vector Machnes (SVMs)) (MITCHELL, 1997). Os algortmos RNA e SVM, utlzados nas experêncas prátcas deste trabalho, serão detalhados nesta seção.

24 Defnção de Rede Neural Artfcal (RNA) e o modelo do neurôno artfcal Segundo HAYKIN (1999), uma RNA pode ser defnda como: Um processador macçamente paralelo dstrbuído consttuído de undades de processamento smples, que têm a propensão natural para armazenar conhecmento expermental e torná-lo dsponível para uso. Ela se assemelha ao cérebro em dos aspectos: 1. O conhecmento é adqurdo pela rede a partr de seu ambente através de um processo de aprendzagem. 2. Forças de conexão entre neurônos, conhecdas como pesos snáptcos, são utlzadas para armazenar o conhecmento adqurdo. As undades báscas das redes neuras, os neurônos artfcas, smulam as funções dos neurônos naturas e processam todas as nformações das RNA. A modelagem do neurôno bológco vsando gerar o modelo do neurôno artfcal fo ncada por McCuloch e Ptts (1943) e seu modelo mas smples está exposto na Fgura 1. Fgura 1 Modelo do neurôno artfcal Fonte: Haykn, 1999 Este modelo é consttuído de um conjunto de snapses, sendo cada uma dessas caracterzada por um peso (w); um somador (Σ) para somar os snas de entrada, ponderado pelas respectvas snapses do neurôno; e uma função de atvação (φ) para restrngr a ampltude de saída de um neurôno, ou seja, lmtar o ntervalo permssível de ampltude do snal de saída a um valor fnto (HAYKIN, 1999). Observando-se a Fgura 1, tem-se que: x 1, x 2,...,x m são os elementos do vetor de entrada; w 1, w 2,... w kj são os pesos (ou conexões snáptcas); b k : lmar de atvação do neurôno; φ(.) é a função de atvação e y k é o snal de saída do neurôno. É mportante notar a

25 22 forma como são escrtos os índces do peso snáptco w kj. O índce k se refere ao neurôno em questão e o índce j ao termnal de entrada da snapse à qual o peso se refere. Os elementos do vetor de entrada x 1, x 2,...,x m são multplcados pelos pesos w 1, w 2,... w km. Desta forma, o neurôno k é descrto pelo segunte par de Equações. Assm: m uk = wkj.x j= 1 j (11) e y k = φ(u k + b k ) (12) O campo local nduzdo (v k ) é dado por: v k = u k + b k (13) A função de atvação deve processar o conjunto de entradas recebdas e o transformar em estado de atvação. Os neurônos podem assumr os seguntes estados de atvação: bnáros (0 e 1), bpolares (-1 e 1) e reas. Algumas das funções de atvação mas utlzadas estão lustradas na Fgura 2, que são: função lnear, função tangente hperbólca, função degrau e função sgmodal. Fgura 2 Funções de atvação A Equação 14 corresponde à função de atvação do tpo tangente hperbólca, usada no expermento com rede Perceptron Múltplas Camadas (MLP). u 1 e ϕ (u) = (14) u 1+ e A topologa de uma RNA está lustrada na Fgura 3. Nesta, estão expostas as nomenclaturas das camadas que compõe uma RNA.

26 23 Fgura 3 - Topologa de uma RNA Fonte: Haykn, Camada de Entrada: onde os padrões são apresentados à rede (x 1,...,x ). 2- Camadas Intermedáras ou Esconddas: Através das conexões ponderadas, estas camadas podem ser consderadas como extratoras de característcas. 3- Saída: onde o resultado fnal é concluído e apresentado (y 1,...,y k ). O número de neurônos e camadas em uma dada estrutura é função do problema em questão. Na classfcação de magens de satélte, por exemplo, o número de neurônos na camada de entrada poderá corresponder ao número de bandas utlzadas; na camada ntermedára o número de neurônos e de camadas fcará a crtéro do usuáro e na camada de saída, a quantdade de neurônos corresponde ao número de classes para as quas os padrões poderão ser desgnados. A prmera camada de neurônos usa os padrões de entrada da rede e, por meo do cálculo executado pela aplcação da função de transferênca, gera a reposta que almenta a camada segunte, e assm sucessvamente até que a últma camada seja atngda Arquteturas das RNA As arquteturas de redes se classfcam em função do número de camadas de neurônos e de sua estruturação. Abaxo serão apresentadas as mesmas:

27 Redes feedforward (únca camada) As redes feedforward com únca camada correspondem ao tpo de RNA onde se tem uma camada de entrada e uma únca camada de neurônos que é a própra camada de saída. O Perceptron com uma camada de neurônos fo desenvolvdo por Rosenblatt em 1958 (ROSENBLATT, 1958). Esse tpo de arqutetura é defnda como uma rede lnear que classfca apenas padrões lnearmente separáves. A Fgura 4 apresenta um exemplo deste tpo de arqutetura. Fgura 4 Redes Feedforward com uma únca camada Fonte: Adaptada de Haykn, 1999 Na Fgura 4, apresentou-se um exemplo deste tpo de arqutetura em que uma camada de entrada de nós de fonte que se projeta sobre a camada de saída de neurônos, porém não ocorre o nverso (HAYKIN, 1999). Ou seja, a característca feedforward atrbuída ao Perceptron sgnfca que os snas calculados apenas passam adante na rede e não retornam nunca.

28 Redes feedforward (múltplas camadas) Normalmente, esta extensão do Perceptron de Rosenblatt, possu uma arqutetura consttuída por uma camada de entrada, uma camada de saída e uma ou mas camadas esconddas com neurônos ocultos (Fgura 5). Fgura 5 - Redes Feedforward com únca camada oculta e uma camada de saída FONTE: Adaptada de Haykn, 1999 A função dos neurônos ocultos é ntervr entre a camada externa e a saída da rede extrando as nformações necessáras à classfcação. Os neurônos da camada de entrada da rede fornecem os respectvos elementos do padrão de atvação (vetor de entrada), que consttuem os snas de entrada aplcados aos neurônos da segunda oculta. Na exstênca de mas de uma camada oculta os snas de saída da segunda camada serão utlzados como entrada para esta, e assm por dante. O conjunto de snas de saída dos neurônos da camada de saída (fnal) da rede consttu a resposta global da rede para o padrão de atvação fornecdo pelos nós de fonte da camada de entrada (HAYKIN, 1999). Para o exemplo lustrado na Fgura 5, a rede almentada adante com neurônos na camada de entrada, j neurônos na camada oculta e k neurônos na camada de saída é escrta da segunte forma: -j-k. Por exemplo, uma rede com 3 neurônos na camada de entrada, 8 na ntermedára e 5 na de saída é escrta como:

29 26 Um dos problemas em relação à defnção de uma topologa de uma MLP consste em determnar o número de camadas e a quantdade de neurônos em cada uma. Se o número de camadas e neurônos por camada for muto maor que o necessáro, haverá uma tendênca de sobre-ajuste ( overfttng ), sto é, a rede trenará bem, podendo atngr um valor baxo para o erro, mas apresentará desempenho rum no conjunto de testes. Desta forma, busca-se confgurar uma rede de menor tamanho que cumpra a sua função. Entretanto, se o tamanho da rede for muto pequeno, a mesma poderá ser ncapaz de atngr o desempenho desejado mesmo durante o trenamento. Neste caso ocorre underfttng, ou seja, poucos neurônos para armazenar mutas nformações e com pouca capacdade de realzar um mapeamento nãolnear da rede (VONK, 1997). O Perceptron de Múltplas Camadas é utlzado para a classfcação de padrões não lnearmente separáves, ou seja, padrões que caem em determnadas posções de um hperespaço nas quas não podem ser separados por um hperplano. Esta capacdade de classfcar dados não lneares a poscona como uma rede adequada a soluconar problemas mas próxmos da realdade, tas como: no processamento de magens (LIN, 1991), no mapeamento de florestas tropcas (CARVALHO et al., 2004) e na classfcação de terras para rrgação por meo da análse dos parâmetros de produtvdade do solo (BUCENE e RODRIGUES, 2004), dentre outros Trenamento e Teste O objetvo do trenamento em RNAs é que esta aprenda por meo de exemplos apresentados. Haykn (1999) defne aprendzagem como: Um processo pelo qual os parâmetros lvres de uma rede neural são adaptados através de um processo de estmulação pelo ambente na qual a rede está nserda. O tpo de aprendzagem é determnado pela manera como a modfcação dos parâmetros ocorre. Um algortmo de aprendzagem largamente empregado nas redes neuras artfcas do tpo MLP é o backpropagaton, relatado no trabalho de Rumelhart et al. (1986). Neste mesmo ano fo lançado o lvro Parallel Dstrbuted Processng: Exploratons n the Mcrostructures of Cognaton de Rumelhart e McClelland. O processo de aprendzagem realzado neste algortmo pode ser resumdo nos seguntes passos:

30 Incalzar os pesos (w), bas (b) e parâmetros da rede (número de camadas esconddas, número de neurônos na camada escondda, taxa de aprendzagem, etc); 2 - Apresentar as entradas e saídas desejadas da rede. As entradas serão os vetores x 0, x 1,..,x de valores contínuos e o vetor d 0, d 1... d k serão as saídas desejadas; 3 - Calcular os valores nternos (atvação) dos neurônos j da camada escondda h. m j = =1 u w x + b j 4 - Calcular a saída dos neurônos z das camadas esconddas por meo da função de atvação (φ). y j = φ(u j ) (16) 5 - Calcular os valores nternos (atvação) dos neurônos k da camada de saída. m k = =1 kj m u w y + b 6 - Calcular a saída dos neurônos k da camada de saída por meo da função de atvação (φ). y k = φ(u k ) (18) 7 Calcular os termos de erro para as undades de saída: 8 - Adaptar os pesos por meo da segunte Equação: j e k k j k j k (15) (17) = d y (19) w (t + 1) = w (t) + ηδ y (20) onde w j é o peso do elemento de processamento oculto j no tempo t; y saída produzda pela undade ; η corresponde à taxa de aprendzagem e; δ j corresponde ao gradente local para o elemento de processamento j; Caso j seja um elemento da camada de saída (L) tem-se que: δ j (L) j j ' j (L) ( v ) Caso o elemento j seja um elemento oculto da camada l, então: δ j j j ' = e ϕ (21) ' j (l) (l +1 ) (l +1 ) ( v j ) δk wkj = ϕ (22) Onde k denota todos os elementos acma dos elementos j; os lmares delta dos elementos nternos são ajustados de forma semelhante. A convergênca poderá ser mas rápda pela adção de um termo de momento. Este termo faz com que os pesos sejam alterados de forma mas suave, pela Equação: w (l) j (l) j k (l) (l) (l 1 ) [ w (t 1)) ] + ηδ y (t + 1) = w (t) + α (23) 9 - Repetr retornando para o passo três até que seja satsfeto o crtéro de parada escolhdo. j j

31 28 O momento de parar é uma decsão mportante na etapa de trenamento e o crtéro que utlza o número de terações é bastante utlzado, porém, não garante que o erro desejado tenha sdo obtdo. Por exemplo, se a quantdade de cclos escolhda for pequena o erro poderá estar muto elevado e a rede poderá não classfcar os dados corretamente. Outro crtéro de parada é o que defne o erro médo quadrátco desejado. Ou seja, permte-se que a rede realze o número de cclos necessáros até que o erro ncalmente fxado seja obtdo (GLEZAKOS e TSILIGIRIDIS, 2002). Os classfcadores baseados em aprendzado de máquna, no âmbto da classfcação de magens de satélte, vêm apresentando vantagens em relação aos classfcadores supervsonados baseados em concetos estatístcos, vsto que para a sua aplcação nenhum conhecmento da forma da dstrbução de probabldade dos dados de entrada é exgdo e face à maor flexbldade que esses modelos possuem quanto à entrada de dados para a classfcação (BISCHOF et al., 1992; RIBEIRO et al., 2005; GELETE E VOLATÃO, 2007). Bschof et al. (1992) fzeram uma comparação entre os resultados da classfcação de uma MLP com algortmo backpropagaton e o método da máxma verossmlhança em magens do satélte LANDSAT. O estudo mostrou a capacdade da rede em obter resultado superor ao do classfcador da máxma verossmlhança e que nformações de textura podem ser agregadas possbltando melhora nos resultados. A exatdão global para a classfcação utlzando o método estatístco da máxma verossmlhança, a rede MLP e MLP com textura fo de 84,7, 85,9, e 88,1%, respectvamente. A classfcação vsava gerar um mapa temátco para as classes: antropzada, floresta, água e agrcultura. Rbero et al. (2005), comparou dos tpos de classfcadores tradconas (mínma dstânca, máxma verossmlhança) com uma RNA utlzando como dados de entrada as bandas azul, verde, vermelho e nfravermelho próxmo do satélte IKONOS II. Foram propostas para a classfcação da área de estudo, localzada em uma área do muncípo de Serra do Saltre (MG), qunze classes de uso do solo. Os valores de Kappa apontam para superordade das RNAs, a saber: 0,68, 0,65 e 0,58 para RNA, máxma verossmlhança e mínma dstânca, respectvamente. Gelete e Volatão (2007) usaram a Toolbox Neural Network do software MATLAB (The MathWorks Inc., Natck, MA, USA) para, através de uma rede do tpo MLP, dstngur as classes floresta, solo, água, culturas, nuvens e sombras na magem do satélte LANDSAT (bandas 1 a 7) em uma área no Estado do Pará. A MLP que proporconou melhores resultados possuía 11 neurônos na camada oculta. Os pesqusadores anda compararam com o método

32 29 da máxma verossmlhança e obtveram resultados demonstrando o melhor desempenho da rede MLP. De acordo com Haykn (1999), no aprendzado não-supervsonado somente os padrões de entrada estão dsponíves para a rede, cujo conjunto de trenamento possu pares de entrada e saída. A partr do momento em que a rede estabelece uma harmona com as regulardades estatístcas da entrada de dados, desenvolve-se nela uma habldade de formar representações nternas para codfcar característcas da entrada e crar novas classes ou grupos automatcamente. O modelo de Kohonen, também conhecdo como Rede de Kohonen, é um tpo de rede com aprendzado não supervsonado e também vêm sendo utlzando na classfcação de dados provenentes do sensoramento remoto como mostram os trabalhos de J (2000), Janwen et al. (2005) Support Vector Machnes (SVM) Uma Máquna de Vetor de Suporte (SVM) é bascamente uma máquna lnear, cuja déa prncpal é construr um hperplano como superfíce de decsão de tal forma que a margem de separação entre exemplos postvos e negatvos seja máxma (HAYKIN, 1999). Este método fo desenvolvdo pelo pesqusador Vladmr Vapnk e colaboradores (BOSER, GUYON e VAPNIK, 1992; CORTES e VAPNIK, 1995; VAPNIK, 1995; VAPNIK, 1998) e é baseado na teora de aprendzagem estatístca, por meo do prncípo de mnmzação estrutural de rsco. De acordo com Osuna et al. (1997), a teora de aprendzagem estatístca estabelece condções matemátcas que auxlam na escolha de um classfcador a partr dos dados de trenamento. Essas condções levam em conta o desempenho deste classfcador no conjunto de trenamento e a sua complexdade, vsando adqurr desempenho satsfatóro para novos dados de mesmo domíno. No prncípo da mnmzação estrutural de rsco, o erro de generalzação (R(f )) será lmtado pelo erro de trenamento (R emp (f)) mas um termo que depende da dmensão Vapnk-Chervonenks (VC), desenvolvda por Vapnk e Chervonenks (1971), como mostrado na Equação 24. R( f ) R emp 2n θ h(ln + 1) ln h f = 4 ( ) n Onde, h é a dmensão (VC) da classe de funções F à qual f pertence, n é a quantdade de exemplos no conjunto de trenamento T. (24)

33 30 Esta dmensão é uma medda da capacdade de um conjunto de funções classfcadoras. Desta forma, um conjunto de hperplanos é construído tendo como estratéga a varação da dmensão VC. Assm, o rsco empírco (erro de trenamento) e a dmensão VC serão mnmzados ao mesmo tempo. A mnmzação da dmensão VC ocorre quando é realzada a maxmzação da margem se separação, ou seja, no processo de construção do hperplano ótmo. Maores detalhes deste prncípo podem ser encontrados em OSUNA et al. (1997). O trenamento de uma SVM envolve a resolução de um problema quadrátco, dependente dos vetores de trenamento e de parâmetros especfcados pelo usuáro. Neste método, a partr de um espaço de entrada de padrões não-lnearmente separáves é formado um novo espaço de característcas, em dmensão outra, onde os padrões serão lnearmente separáves. Assm, um hperplano de separação ótmo entre os exemplos é construído (VAPNIK, 1995). Algumas das prncpas vantagens apresentadas pelas SVMs são que estas: Possuem teora bem estabelecda dentro da matemátca e estatístca; apresentam robustez em dados de grandes dmensões, possbltando a aplcação de SVM em vetores de característcas de grandes dmensões como, por exemplo, magens de satélte; apresentam ótma capacdade de generalzação, ou seja, apresentam boa efcênca para prever dados que não pertençam ao conjunto utlzado no trenamento (SMOLA et al., 2000). As SVMs vêm sendo aplcadas nas mas dversas áreas de pesqusa como, por exemplo, no reconhecmento de faces e caracteres, classfcação de mpressões dgtas, classfcação de padrões, dentre outras. Wang e Yang (2006) utlzaram uma toolbox baseada na teora SVM e desenvolvda por Canu et al. (2005) para reconhecmento de olhos em seres humanos e obtveram precsão de 96,8% nos expermentos realzados. O formalsmo do método SVM para o desenvolvmento desta toolbox fo baseado em Vapnk (1995), Osuna et al. (1997) e Crstann e Taylor (2000). Uma breve ntrodução deste formalsmo é apresentado, a segur Casos lnearmente separáves Consdere que os dados de trenamento com k números de amostras são representados por {x,d }, = 1,...,N, onde xє R n está em um espaço n-dmensonal, e que d Є {+1,-1} é a saída desejada. A Equação da superfíce de decsão do hperplano é w T x + b = 0 (25)

34 31 Em que x é um vetor de entrada, w é um vetor peso ajustável e b é um bas. A Equação 25 dvde os dados em duas regões: w + b 0 para d = +1 (26) T x w + b < 0 para d = -1 (27) T x Esses padrões serão consderados lnearmente separáves se um vetor de entrada w o e um bas b o poderem ser defndos de tal forma que satsfaçam as condções: T w x b +1para d = +1 (28) o + o T w x b 1para d = -1 (29) o + o Caso as Equações 28 e 29 sejam satsfetas com snal de gualdade, os pontos (x,d ) serão chamados de vetores de suporte. segunte condção: Desta forma, w e b estmados por meo das Equações 28 e 29 devem satsfazer a d ( w x + b) > 0 (30) O hperplano ótmo é a regão na qual a dstânca do ponto mas próxmo da margem é máxma. O conceto de hperplano ótmo fo proposto pelos pesqusadores Vapnk e Chervonenks em 1974 (VAPNIK e CHERVONENKIS, 1974). Para w e b encontrados, a separação entre o hperplano ótmo e o ponto mas próxmo é denomnada margem de separação (ρ). Os dados de trenamento que se encontram à dstânca ρ do hperplano são chamados vetores de suporte e correspondem aos dados em que as Equações 28 e 29 são satsfetas com snal de gualdade (HAYKIN, 1999). Na Fgura 6, o desenho esquemátco lustra o hperplano ótmo em um espaço b-dmensonal, a margem de separação e os vetores de suporte para a classfcação das classes estrelas e círculos. Fgura 6 Desenho esquemátco lustrando o hperplano ótmo, a margem de separação e os vetores de suporte Fonte: Semoln, 2002

35 32 A margem geométrca entre as duas classes é gual a 2. O conceto de margem w é extremamente mportante em SVM já que mede a capacdade de generalzação (OSUNA et al., 1997). Para encontrar o hperplano de separação ótmo, os valores para o vetor de peso w e bas b devem mnmzar a função de custo: Sujeto a 1 2 w (31) 2 T d ( w x + b) 1 para =1,2,...N (32) O problema de otmzação obtdo é quadrátco e podem ser soluconados com a ntrodução de uma função Lagrangeana, que engloba as restrções à função objetvo, assocadas a parâmetros denomnados multplcadores de Lagrange α (VAPNIK, 1995). O problema de otmzação é resolvdo pela maxmzação da segunte função: Sujeto a: N N N 1 Q( α ) = α α α jdd j ( x x j ) (33) 2 = 1 N = 1 = 1 j= 1 α d = 0 (34) α 0 (35) Após a determnação dos multplcadores de Lagrange ótmos (α o, ), o vetor de peso ótmo (w o ) e o bas ótmo (b o ) são calculados usando as Equações 36 e 37, respectvamente: N w = α d (36) o = 1 o, x bo x T ( s) = 1 o (37) w A função de separação, f (x), que representa o hperplano que separa os dados com maor margem é escrta como: Em que sgn é a função snal. N f ( x) = sgn d α ( x x) + bo (38) = 1

36 Casos não lnearmente separáves De acordo com VAPNIK (1995), para construr o hperplano ótmo em casos onde os dados não são lnearmente separáves deve-se ntroduzr as varáves de folga, { } r = 1 ξ na defnção do hperplano de separação e encontrar os valores ótmos do vetor de peso w e do bas b de modo que satsfaçam a restrção: d w + b) 1 ξ (39) T ( x ξ 0, = 1,...,N (40) As varáves de folga ξ são responsáves por medr a quantdade de volações das restrções (OSUNA et al., 1997). Estas volações podem ocorrer da segunte forma: Para 0 ξ 1, o ponto estará dentro da regão de separação e do lado correto da superfíce de decsão; Para ξ > 1 o ponto estará do lado ncorreto do hperplano separador e para ξ = 0 têm-se os vetores de suporte. A Fgura 7 exemplfca os tpos de volações ctados (HAYKIN, 1999). Fgura 7 Ilustração das posções das varáves de folga Fonte: Semoln, 2002 O vetor peso w e as varáves de folga ξ devem mnmzar a segunte função: Sujeto à: N 1 T Φ ( w, ξ ) = w w + C ξ (41) 2 = 1 T d ( w x b) 1+ ξ 0 (42) + Onde C é o parâmetro de penalzação. ξ 0 =1,...,N. (43)

37 34 O prmero termo em 41 é o mesmo termo exstente nos padrões lnearmente separáves e tem a função de controlar a capacdade de aprendzagem, enquanto que o segundo termo vsa penalzar as amostras localzadas no lado ncorreto do hperplano. Este termo é vsto como um parâmetro de regularzação e deve ser defndo pelo usuáro. Quanto menor o valor de C mas rígda será a penalzação dos pontos; caso contráro, a penalzação será menos rígda e a classfcação terá maor quantdade de erros (OSUNA et al., 1997). Novamente o problema de otmzação gerado é quadrátrco, com as restrções lneares apresentadas em 42 e 43. Esse problema de otmzação é resolvdo usando o método dos multplcadores de Lagrange que maxmzem a segunte função objeto: Sujeto às restrções: N N N 1 T Q( α) = α α α jd d j ( x x j ) (44) 2 = 1 N = 1 = 1 j= 1 α d = 0 (45) 0 α C para = 1,2,...,N (46) A função objetvo Q(α) a ser maxmzada é a mesma para os casos separáves e não-separáves. Porém, este últmo dfere do caso separável pelo fato de que a restrção α 0 é substtuída por uma mas rgorosa 0 α C. Os valores ótmos do vetor peso w e do bas também são obtdos tal como nos casos lnearmente separáves (Equações 36 e 37) (HAYKIN, 1999). A função de separação do hperplano é escrta como (VAPNIK, 1995): N f ( x) = sgn d α ( x x) + bo (47) = 1 Uma máquna de vetor de suporte é construída, no caso de padrões não lnearmente separáves, projetando o conjunto de trenamento (x) de seu espaço orgnal, referencado como de entradas, através de uma função de mapeamento (Ф), para o espaço característco de alta dmensonaldade (H) (Fgura 8). Após essa projeção é construído o hperplano ótmo que separa as classes (VAPNIK, 1995). A Fgura 8 exemplfca um mapeamento não lnear onde os dados de entrada são projetados no espaço característco e separados por um hperplano.

38 35 Fgura 8 Ilustração de mapeamento para o espaço característco Fonte: Semoln, 2002 O teorema de Cover (1965) afrma que um espaço multdmensonal pode ser transformado com alta probabldade em um novo espaço de característcas onde os padrões são lnearmente separáves. Porém, duas condções devem ser satsfetas: A transformação deve ser não lnear e a dmensonaldade do espaço de característcas deve ser sufcentemente alta. Para realzar o mapeamento, aplca-se a função de mapeamento (Φ) aos exemplos presentes no problema de otmzação apresentado na Equação 44, conforme lustrado a segur: N N N 1 Q( α ) = α αα jdd j ( Φ( x ) Φ( x j )) (48) 2 = 1 = 1 Sujeto às restrções apresentadas em (44) e (45). Assm, têm-se a função de separação do hperplano é reescrta como: N f ( x) = sgn d α Φ( x ) ( x j ) + bo (49) = 1 O algortmo de aprendzagem por vetor de suporte pode ser usado para construr dversos tpos de máquna de aprendzagem, como por exemplo: máqunas de aprendzagem polnomal, redes de função de base radal e perceptrons de duas camadas. A construção destas dependerá de como os dados são projetados para o espaço característco (HAYKIN, 1999). As funções usadas para projetar os dados do espaço de entrada para o espaço característco são chamadas de funções kernels. Em outras palavras, um kernel K é uma função que recebe dos pontos x e x j do espaço de entradas computa o produto escalar desses dados no espaço de característcas (HAYKIN, 1999). Assm, têm-se a segunte Equação: K( x, x j ) = Φ( x) Φ( x j ) (50) j = 1

39 36 De acordo com Chapelle et al. (1999), estas funções devem ser escolhdas cudadosamente para evtar desempenhos runs pelo classfcador. Algumas funções kernel comumente utlzadas (OSUNA et al., 1997), são: a função MLP: A função polnomal: K( x, x ) tanh( x x θ ) (51) j = j K ( + ) d x, x j ) = ( x x j 1 (52) Onde o parâmetro d (grau do polnômo) é especfcado a pror pelo usuáro. E a função de base radal: 2 x x j K( x, x j ) = exp 2 2σ (53) Onde σ (nterpretado como a largura da gaussana) é especfcado a pror pelo usuáro. Esta últma função é uma das mas comumente aplcadas em dados provenentes do sensoramento remoto, como pode ser observado nos trabalhos de: Pal e Mather (2004), Melgan (2004), Gonçalves et al. (2006) e Foody e Mathur (2004). Com relação às funções kernel, as referêncas utlzadas por Canu et al. (2005) no desenvolvmento da SVM-KMToolbox estão em Vapnk (1995), Chapelle (1999), Scholkopf e Smola (2001), Rakotomamonjy e Canu (2002) e Canu et al. (2003). O percentual de acertos de uma classfcação pelo método SVM é dependente da magntude do C (Equação 41) e, quando se faz uso da função kernel do tpo gaussana, do parâmetro σ. Um ponto chave no sensoramento remoto é que esta classfcação seja feta a partr de uma determnada amostra de trenamento e que o aprendzado desta possa ser faclmente aplcado em outro conjunto de dados. A capacdade de generalzação do método classfcador escolhdo é de fundamental mportânca, e só será obtda caso os valores destes parâmetros sejam determnados cudadosamente (BELOUSOV et al., 2002). Pal e Mather (2004) testaram o método SVM na classfcação de uma magem do satélte DAIS correspondente a uma regão de La mancha, Espanha. Foram utlzadas duas quantdade de amostras de trenamento dferentes: uma pequena (com 100 pontos) e uma méda (com 500 pontos) para cada uma das 9 classes propostas. Essas amostras foram aplcadas à 13 combnações de número de bandas (de 5 à 65). O método testado teve seu desempenho comparado aos classfcadores: máxma verossmlhança, árvore de decsão e rede neural tpo MLP. Para a SVM, fo utlzada função kernel gaussana, e o melhor

40 37 resultado fo obtdo quando os parâmetros C e σ foram defndos em 5000 e 2, respectvamente. A SVM apresentou resultados superores tanto quando foram utlzados 100 e 500 pxels para todas as combnações de número de bandas propostas. Os autores anda concluíram que, com o ncremento do número de bandas, o classfcador SVM tende a aumentar quase contnuamente o valor da acuráca, o que não ocorreu nos demas classfcadores avalados. Um excelente valor de exatdão global obtdo fo de 93,55%, 85,8%, 88,4% e 81,2% para SVM, máxma verossmlhança, MLP e árvore de decsão, respectvamente, para o teste realzado com 100 amostras e 65 bandas. O método SVM tende a proporconar melhores classfcações do que a rede MLP e o da máxma verossmlhança. De acordo com Pal e Mather (2004), este método resulta em boas performances mesmo quando são apresentadas poucas amostras para realzar aprendzagem. Esta sera uma boa vantagem com relação a outros métodos, vsto que o usuáro não precsa gastar muto tempo defnndo uma grande quantdade de amostras, tal como é necessáro para o método da máxma verossmlhança. Foody e Mathur (2004) classfcaram uma magem do satélte Arborne Thematc Mapper (ATM) correspondente à regão de Feltweel, Inglaterra. Foram testados quatro métodos: um classfcador probablístco, uma árvore de decsão, uma MLP e uma SVM e avalados o efeto do aumento do número de amostras de trenamento na acuráca. A maor exatdão global fo obtda para o método SVM, com 93,75% dos pxels classfcados corretamente. A SVM não fo a mas rápda entre os métodos, porém, mas rápda do que a árvore de decsão e a MLP. Os testes também permtram conclur o aumento do valor de exatdão global com o aumento do número de amostras. Os autores anda concluíram que as SVMs possuem excelente potencal na classfcação de magens de satélte. Su et al. (2007) avalou a classfcação de magens provenentes do MISR (Multangle Imagng Spectro-Radometer) através dos métodos máxma verossmlhança e SVM em uma regão semárda do Novo Méxco, Estados Undos. A exatdão global obtda para o método SVM fo de 76,7% e o de 68,1% para o método da máxma verossmlhança. Os valores do coefcente de Kappa obtdos foram de 0,73 e 0,64 para o método SVM e máxma verossmlhança, respectvamente. Os autores consderam bons os resultados obtdos, já que os 19 tpos de vegetações propostos para a classfcação exbam característcas bastante dversfcadas.

41 Classfcadores bnáros e classfcadores multclasses As SVMs são orgnalmente classfcadores bnáros, porém, a maora dos dados reas envolve grande quantdade de nformação e pode necesstar ser rotulada em mas de duas classes. Bascamente, duas estratégas são usadas para soluconar este tpo de problema: a estratéga OAO (One-Aganst- One) e a estratéga OAA (One-Aganst-All) (WESTON et al., 1999). A estratéga OAO constró N(N-1)/2 funções dscrmnantes, em que N é o número de classes. Um processo de escolha será aplcado para defnr em que classe o dado x deverá ser classfcado e a decsão será tomada pelo número de vezes que este fo assocado à determnada classe pela função dscrmnante apresentada na Equação 27 (WESTON et al., 1999). Na estratéga OAA cada SVM exstente resolve um problema de separação entre duas classes. Por exemplo: em um determnado problema de classfcação de padrões com N classes, serão crados N classfcadores bnáros e cada um desses será trenado para dstngur uma classe das restantes, ou seja, das N-1 classes (WESTON et al. 1999). A decsão fnal sobre qual classe o dado rá pertencer é dada pela regra o vencedor leva tudo, ou seja, a classe vencedora é aquela em que o SVM possu maor saída, ou seja, possu maor valor de função dscrmnante, f (x) (MELGANI, 2004). Maores detalhes sobre a teora das estratégas apresentadas podem ser encontrados nos trabalhos de Weston et al. (1999) e Hsu et al. (2002). Gdudu et al. (2004), avalaram o uso de estratégas multclasses na classfcação de magens da regão de Jnja, Uganda. Os dados de entrada corresponderam às 7 bandas do satélte LANDSAT e as classes de saída foram água, vegetação e antropzada. Os testes realzados envolveram as estratégas one-aganst-one (OAO) e one-aganst-all (OAA) em quatro tpos de classfcadores SVM, a saber: lnear, quadrátca, polnomal e gaussana. A estratéga ndcada fo a OAO já que a OAA teve maor propensão de gerar pxels não classfcados ou erroneamente classfcados. Para a SVM com classfcador gaussana, por exemplo, foram 103 pxels classfcados erroneamente para a estratéga OAO e 4645 para a OAA. Melgan (2004) utlzou uma magem do sensor AVRIS correspondente uma regão da Índa para a classfcação por meo dos métodos SVM lnear, SVM não-lnear (com kernel tpo RBF), mínma dstânca e rede neural tpo Função de Base Radal (RBF). O estudo mostrou que a SVM não-lnear apresentou valor de exatdão global de 92,64%, superando os

42 39 demas métodos. Para o método SVM não-lnear foram realzados testes objetvando comparar as estratégas multclass OAO e OAA. Os resultados apontaram melhor desempenho da estratéga OAO com exatdão global de 93,96% e menor custo computaconal. Já a estratéga OAA obteve valor de exatdão global gual a 93,42%. 2.4 Dstânca de Jeffres-Matusta Uma forma de avalar uma classfcação se dá por meo de meddas estatístcas. De acordo com Rchards (1993), a dstânca de Jeffres-Matusta (JM) entre duas classes e j que apresentem dados com dstrbução normal é defnda por: B JM j = 2 *(1 e ) (54) Onde B é a dstânca de Bhattacharyya (B j ) e calculada como: B j = 1 ( 8 M M j ) T Σ + Σ 2 j 1 ( M M ) j Σ + Σ Σ Σ Onde M e M j correspondem aos vetores de méda das classes e j, respectvamente. Σ e Σ j são as matrzes de covarânca das classes e j, respectvamente. Quanto maor o valor estmado por B, maor a separabldade entre classes. O valor de JM entre duas classes poderá varar entre 0 e 2. Caso o valor obtdo seja gual a 2 sgnfca que ocorreu uma separação completa entre os exemplos. Valores maores que 1,8 ndcam que determnado par de classes obteve boa separabldade. Krasch et al. (2007), fzeram uma avalação temporal do uso e ocupação do solo usando magens do satélte LANDSAT dos anos de 1986, 2000 e 2004 da regão de Itajaí, Santa Catarna. Foram defndas quatro classes: área urbana, floresta, água, campos e não classfcada. A separabldade entre as classes propostas fo analsada por meo do índce de Jeffres-Matusta que, para todas as combnações, fo superor a 1,8. Os autores concluíram que as amostras escolhdas contrbuíram para a efcente estratfcação temátca e acompanhamento do uso e ocupação do solo proposto no estudo. j j (55)

43 Valdação da exatdão do mapeamento Um mapeamento do uso do solo, apoado em sensoramento remoto, necessta ser realzado com exatdão quando se deseja que as nformações obtdas neste sejam confáves. Assm, parâmetros que ndquem que uma classfcação quantfcou determnada área próxma à realdade de seu uso são essencas. A avalação da acuráca pode ser obtda por meo dos coefcentes de concordânca obtdos através de uma matrz de confusão. A matrz de erro ou matrz de confusão é uma matrz quadrada de números que expressam a quantdade de undades amostras, assocada a uma dada categora durante o processo de classfcação efetuado, e à categora real a que pertencem essas undades. (MANGABEIRA, 2003 apud CONGALTON 1991). Um exemplo de uma matrz de confusão está exposto na Fgura 9, em que se observam três classes de uso do solo X, Y e Z, confrontados com seus dados de referênca (ou seja, dados da verdade de campo) e seus dados de classfcação. Classes Dados de referênca Total das X Y Z Lnhas X Classfcação Y Z Total das colunas Fgura 9 - Exemplo de uma matrz de confusão A matrz de confusão restrnge-se às lnhas e colunas referentes às classes X, Y e Z. Os componentes da dagonal prncpal da matrz de confusão fornecem o número de pxels corretamente classfcados para cada classe correspondente. Por exemplo, para a classe Y, nos dados de classfcação foram corretamente classfcados 12 pxels. No entanto, para os 3 pxels dessa mesma classe Y no mapa temátco, analsando os dados de referênca, constatouse que na realdade eles pertencam a classe X. Bem como outros 2 pxels que na realdade são da classe Z. A partr da elaboração da matrz de confusão as seguntes meddas podem ser extraídas: Exatdão Global (EG), Exatdão Específca (EE), coefcente de Kappa, dentre outros.

44 41 A EG é obtda pela dvsão das somas das entradas que formam a dagonal prncpal da matrz, ou seja, o número de classfcações corretas, pelo número total de amostras utlzadas como mostra a Equação 56 (WATZLAWICK, 2003). EG = r = 1 N x 100 (56) Onde, EG = Exatdão Global; r = número de lnhas da matrz de erro; x = Valor da lnha e coluna ; N = Quantdade total de pontos amostras. A EE é obtda pela dvsão no número total de amostras classfcadas corretamente na classe pelo número total de amostras desta. x EE = n 100 (57) Onde, EE = Exatdão Específca; x = valor na lnha e coluna e n = quantdade total de pontos amostras da classe r. A análse de Kappa, dferentemente da EG, utlza todos os elementos da matrz de confusão para seu cálculo. O coefcente Kappa (K) é uma medda da concordânca real (ndcado pelos elementos dagonas da matrz de confusão) menos a concordânca por chance (ndcado pelo produto total da lnha e coluna) (MOREIRA, 2005), conforme segue: K N r x = 1 = 1 = r 2 N = 1 r ( x ( x + + x x + + ) ) (58) Onde, K = coefcente Kappa de concordânca; N = Quantdade total de pontos amostras; r = número de lnhas da matrz de erro; x = valor na lnha e coluna ; x + = soma da lnha ; x + = soma da coluna. A Tabela 1, desenvolvda por Lands e Koch (1977), é utlzada como referênca para classfcar mapas resultantes da utlzação de magens provenentes do sensoramento remoto. Na referda Tabela, são apresentados níves de desempenho da classfcação que ndcam a qualdade do mapa temátco de acordo com o valor de Kappa obtdo.

45 42 Tabela 1 Qualdade da classfcação assocada aos valores da estatístca de Kappa Valor de Kappa Qualdade do mapa temátco <0,00 Péssma 0,00-0,20 Rum 0,20-0,40 Razoável 0,40-0,60 Boa 0,60-0,80 Muto boa 0,80-1,00 Excelente FONTE: adaptada de Lands e Koch (1977) Para realzar a valdação da classfcação dos dados provenentes do sensoramento remoto a maora dos autores utlza o coefcente de Kappa, como pode ser vsto nos estudos de Nshda (1998) e Queroz et al.(2004). 2.6 Comentáros fnas Neste capítulo fo descrta toda a teora de fundamental mportânca para o desenvolvmento deste trabalho. Os métodos relaconados à classfcação de magens de satélte stuam o mesmo no contexto de reconhecmento de padrões. As teoras dos métodos máxma verossmlhança, MLP e SVM fornecem subsídos para os expermentos realzados neste trabalho e descrtos no capítulo 3.

46 43 3. MATERIAL E MÉTODOS Neste capítulo é detalhada a metodologa aplcada na abordagem proposta para classfcação de magens do satélte LANDSAT-5. É apresentada a defnção das classes de nteresse assm como a classfcação pelo método da máxma verossmlhança e os testes realzados para os métodos baseados em aprendzado de máquna. Também são apresentados detalhes sobre o processo de valdação. 3.1 Localzação, aspectos fsográfcos e clmátcos da área de estudo A área de estudo está localzada em maor parte no muncípo de Iguatu-CE. Este, por sua vez, encontra-se nserdo na baca hdrográfca do Alto Jaguarbe. A referda baca hdrográfca sera, ncalmente, a área escolhda para a aplcação dos métodos propostos, porém, optou-se por lmtá-la vsando facltar o andamento dos testes do ponto de vsta de custo computaconal, já que estes demandam grande quantdade de tempo e utlzar esta área sera nvável. A referda baca possu uma área de ,7 km 2 e mportânca sgnfcatva para o Estado do Ceará já que possu uma capacdade de armazenamento de ,000 m 3 de água e dos mportantes açudes: o Orós e o Trussu (COGERH, 2005). Na Fgura 10, o desenho esquemátco expõe todas as bacas do Estado do Ceará destacando, na cor azul, a do Alto Jaguarbe. Na mesma Fgura também está destacado, na cor cnza, o muncípo de Iguatu, local de realzação do expermento. Fgura 10 Localzação da baca hdrográfca do Alto Jaguarbe

47 44 A baca do Alto Jaguarbe possu vegetação típca da caatnga, relevo plano, suave ondulado e ondulado (JACOMINE et al., 1973) e está nserda nas condções de clma semárdo predomnante no Estado do Ceará. Pela classfcação de Koppen (1948), no muncípo de Iguatu, o clma é do tpo BSw'h': clma quente com chuvas de outono e temperaturas médas superores a 18ºC. A precptação mensal no ano de 2008 deste muncípo está apresentada na Fgura 11 tendo, para o referdo ano, precptação acumulada de 1383,5 mm (FUNCEME, 2009). Por meo desta anda é possível constatar que, para o ano em estudo, a maor precptação ocorreu no mês de março com 525,9 mm. 600 Precptação mensal (mm) Meses Fgura 11 Precptação mensal do ano de 2008 para o muncípo de Iguatu-CE. O muncípo de Iguatu está localzado entre os paralelos 6º 17 42,33 S e 6º 33 41,04 S e os merdanos 39º 3 55,64 W e 39º 29 28,52 W. Já a parcela escolhda para teste tem a maor parte de sua área nserda neste muncípo e esta localzada entre os paralelos 6º 19 29,91 S e 6º 25 58,98 S e os merdanos 39º 14 53,29 W e 39º 21 22,89 W e exposta na Fgura 12.

48 45 Fgura 12 Muncípo de Iguatu e área de estudo representada pela magem do satélte LANDSAT-5 de 20/08/ Confguração da máquna O expermento fo realzado com o uso dos seguntes recursos de hardware: processador Intel Pentum Duo, 3 GHz, Placa mãe Intel Corporaton D945GTP (Bus type: Intel NetBurst; bus wdth:64-bt; real clock: 200 MHz; efectve clock: 800 MHz), Memóra RAM de 1 GB, Dsco rígdo de 80 GB e sstema Operaconal Wndows XP. 3.3 Aqusção da magem e georreferencamento A área de estudo fo extraída de uma cena do satélte LANDSAT-5 (217/65) referente ao da 20 de agosto de 2008 às 9 horas. A cena fo cedda gratutamente pelo ste do Insttuto Naconal de Pesqusas Espacas INPE ( O LANDSAT-5 leva a bordo o sensor TM e contrbu para o mapeamento temátco da superfíce terrestre. Este sensor

49 46 possu sete bandas espectras entre 0,45 a 2,35 µm. Optou-se por utlzar a combnação das bandas 2 (0,50-0,60 µm), 3 (0,63-0,69 µm) e 4 (0,76-0,90 µm) que corresponde ao verde, vermelho e nfravermelho, respectvamente. Estas bandas foram apresentadas na combnação 432 do espaço RGB. O satélte funcona a uma alttude de 705 km e possu uma resolução temporal de 16 das. Os pontos georreferencados em campo por meo do aparelho Leca GPS1200 foram utlzados no software ENVI 4.3 para reajustar o georreferencamento da magem do satélte LANDSAT-5. Para este processo foram coletados pontos conhecdos e faclmente vsualzados na magem, como: cruzamentos de rodovas e paredes de açudes. 3.4 Escolha das classes e processo de amostragem A área escolhda para estudo fo classfcada em cnco classes genércas, a saber: 1 - Classe água: Abrange ros, açudes, lagoas, etc. A lustração desta classe está na Fgura 13; Fgura 13 Classe água entre a Caatnga 2 - Classe Caatnga Arbórea Densa (CAD): Engloba a vegetação arbórea densa, de porte mas elevado (8-12m). Nas regões de serra observa-se uma vegetação com característca mas exuberante, onde as condções clmátcas favorecem maor vgor na vegetação. Também está presente nas regões do nteror mas planas e mas secas apresentando uma leve dferença de tonaldade. A Fgura 14 mostra uma regão no muncípo de Iguatu com CAD.

50 47 Fgura 14 Classe CAD no muncípo de Iguatu-CE 3 - Classe Caatnga Herbácea Arbustva (CHA): Esta classe engloba a vegetação herbácea arbustva (porte baxo a médo) aberta a densa. Esta é a classe de maor vulnerabldade à atuação antrópca, e sofrendo este processo pode passar a pertencer à classe antropzada ou agrcultura. A Fgura 15 mostra a classe CHA. Fgura 15 Classe CHA no muncípo de Iguatu-CE 4 - Classe antropzada: abrange as áreas onde não há cobertura vegetal. São exemplos: áreas desmatadas, estradas, aglomerados urbanos e área de expansão urbana, áreas de culturas abandonadas ou desestruturadas, áreas para uso da pecuára, solo exposto, etc. A Fgura 16 mostra uma área apresentando processo de antropzação.

51 48 Fgura 16 Exemplo de área antropzada 5- Classe agrcultura: engloba áreas utlzadas na atvdade agrícola, sendo caracterzada na magem por polígonos de lados bem defndos. A Fgura 17 expõe uma área plantada com arroz rrgado no muncípo de Iguatu-CE. Fgura 17 Área de agrcultura no muncípo de Iguatu-CE As classes escolhdas para classfcação apresentam-se na magem, na composção de bandas escolhda, padrões de cores característcos. A Tabela 2 sntetza as nformações de cor e o padrão que cada classe se apresenta na magem.

52 49 Tabela 2 Classes de nteresse na magem do satélte LANDSAT-5 na combnação 432 do espaço RBG Classe Água Cor (composção colorda) Coloração Preta ao azul escuro. Padrão na magem CAD Coloração vermelho ntenso. CHA Coloração verde claro a escuro. Antropzada Coloração branca amarelada e azulada. Agrcultura Coloração rosa claro. Para o trenamento dos métodos testados (máxma verossmlhança, MLP e SVMs), realzou-se o processo de amostragem no software ENVI 4.3 e posterormente os dados foram exportados para um formato legível do MATLAB 7.0 (*.txt), objetvando utlzálos nos métodos baseados em aprendzado de máquna e, desta forma, evtar tendencosdade nas comparações. Foram seleconadas 2000 amostras para cada classe. É mportante salentar que estas amostras foram obtdas na mesma cena, mas fora da área de estudo, o que possblta testar a capacdade de generalzação dos classfcadores. 3.5 Análse da separabldade das amostras de trenamento Objetvando analsar a resposta espectral pelas bandas 2, 3 e 4 de cada classe e a separabldade entre estas, fo calculado o índce de Jeffres-Matusta pela Equação 54. Para o cálculo deste índce, os dados de entrada necessáros são M e M j correspondem aos vetores de méda das classes e j, respectvamente e C e C j que correspondem as matrzes de covarânca

53 50 das classes e j. O software ENVI 4.3 dspõe de uma ferramenta que calcula este índce, restando ao usuáro fornecer as amostras de trenamento utlzadas na classfcação. O valor 1,8 consderado o lmar entre a separabldade e não separabldade entre as classes. Um detalhamento em português sobre o procedmento deste passo pode ser encontrado em SULSOFT (2009). 3.6 Classfcação no software ENVI 4.3 A partr das amostras de trenamento prevamente defndas, fo realzada a classfcação supervsonada pelo método estatístco da máxma verossmlhança no software ENVI 4.3. Este é um procedmento smples e rápdo, já que o software utlzado apresenta uma nterface amgável ao usuáro. Da mesma forma que o processo para o cálculo do índce de Jeffres-Matusta, um passo a passo do procedmento de classfcação neste software pode ser encontrado em SULSOFT (2009). 3.7 Classfcação no software MATLAB O MATLAB é um sstema teratvo baseado em matrzes, para cálculos centífcos e de engenhara. O nome MATLAB em s é a abrevação de MATrx LABoratory (Laboratóro de Matrzes). Neste expermento, esse software fo utlzado para realzar a classfcação das magens usando os métodos MLP e SVM Método Perceptron de Múltplas Camadas (MLP) A rede Perceptron com uma únca camada escondda e almentação feedfoward, trenada com algortmo backpropagaton, fo mplementada em ambente MATLAB, usando a Toolbox Neural Network (The MathWorks Inc., Natck, MA, USA) versão 6.0. Para defnr o número de neurônos na camada escondda foram realzadas smulações, durante a etapa de trenamento, e posteror análse do desempenho da rede trenada sobre a magem da área de estudo, com a fnaldade de encontrar uma arqutetura de rede que representasse melhor as classes de saídas pré-defndas. Como os dados a serem classfcados (dados de entrada) e as classes de nteresse (saída) foram defndos ncalmente (número de neurônos na camada de entrada gual a 3 e na camada de saída gual a 5), os testes realzados objetvaram encontrar o número de

54 51 neurônos na camada escondda que proporconassem melhor desempenho na classfcação. A Tabela 3 apresenta as arquteturas testadas na rede MLP. Tabela 3 Testes realzados na rede MLP TESTE BANDAS Arqutetura da rede Quanto ao tem arqutetura da rede apresentado na Tabela 3 tem-se que: a quantdade de neurônos na camada de entrada (três) corresponde ao número de bandas consderadas na classfcação vsto que, para cada neurôno de entrada é atrbuído o valor da resposta espectral do pxel, do conjunto de trenamento, em cada banda. Na camada ntermedára foram testados de 12, 15 e 18 neurônos. Já o número de neurônos na camada de saída (cnco) é correspondente ao número de classes defndas. A Fgura 18 exemplfca a arqutetura da rede neural correspondente ao teste 1. Fgura 18 Arqutetura da MLP correspondente ao teste 1 Para a fase de trenamento foram utlzadas 2000 amostras no formato *.txt para cada classe, defndos 3000 cclos, erro fnal desejado de 0,001, taxa de aprendzagem (η) de 0,005 e função de atvação do tpo tangente hperbólca (Equação 14) a qual lmta os valores de saída de -1 à 1. Após a etapa de trenamento, a magem correspondente à área de estudo fo transformada para o vetor e, em seguda, submetda ao processo de classfcação. O fluxograma apresentado na Fgura 19 lustra as etapas realzadas neste método em ordem cronológca e a lstagem do algortmo utlzado para o método MLP está no apêndce 1.

55 52 Carregar as amostras de trenamento (load) Número de neurônos; Funções de atvação; Algortmo de trenamento. Crar a MLP (newff) Número de cclos (epochs); Erro desejado (goal); Taxa de aprendzado (lr). Trenar a MLP (tran) Chamar a magem de teste (Imread) Transformar a magem em vetor Classfcar a magem Caso 1: Sm Agrcultura Break Não Caso 2: Sm Água Break Não Caso 3: Sm Antropzada Break Não Caso 4: Sm CHA Break Não Caso 5: Sm CAD Break Não Não Classfcada Fgura 19 Fluxograma das atvdades relaconadas ao método MLP

56 Método Máquna de Vetor de Suporte (SVM) Para a mplementação da SVM no software MATLAB 7.0 fo utlzada a SVM- KMToolbox (SVM and Kernel Methods MATLAB Toolbox) desenvolvda por Canu et al. (2005). Para a classfcação das cnco classes propostas adotou-se a estratéga multclasse one-aganst-one (OAO) pelos resultados superores desta estratéga obtdos nos estudos de Gdudu et al. (2004) e Melgan (2004) na classfcação de magens de satélte e a função kernel do tpo gaussana (Equação 53). Os 22 testes foram realzados por meo combnações do parâmetro de penalzação C nos valores de 10; 50; 100; 500; 1000; 1300; 1400; 1500 e 3000 com o parâmetro σ da função gaussana nos valores de 1,5; 1,8; 2,2; 2,0; 2,5; 5 e 10. A quantdade de amostras dsponível ao trenamento da rede fo de 2000 pxels para cada classe. Os tempos de trenamento e teste, tanto quando fo realzada a classfcação pelo método MLP como pelo método SVM, foram cronometrados vsando observar o custo computaconal de cada um dos métodos. Utlzou-se o comando tc e toc do MATLAB, o qual permte obter o tempo computaconal gasto em cada cclo. Os resultados estão apresentados nas sessões 4.4 e 4.5. O fluxograma apresentado na Fgura 20 lustra as etapas realzadas neste método em ordem cronológca e a lstagem do algortmo utlzado para o método MLP está no apêndce 2.

57 54 Carregar as amostras de trenamento (load) Número de exemplos por classe (n); Número de classes (nbclasses); Função kernel (kernel); Parâmetro de penalzação (C); Varânca da Gaussana (σ) Trenar a SVM (svmmultclassoneaganstone) Chamar a magem de teste (Imread) Transformar a magem em vetor Testar a SVM (svmmultclassoneaganstone) Classfcar magem Caso 1: Sm Agrcultura Break Não Caso 2: Sm Água Break Não Caso 3: Sm Antropzada Break Não Caso 4: Sm CHA Break Não Caso 5: Sm CAD Break Não Não Classfcada Fgura 20 Fluxograma das atvdades relaconadas ao método SVM

58 Valdação da classfcação Objetvando estabelecer uma análse quanttatva da acuráca obtda pelos métodos utlzados neste expermento, fo realzado o processo de valdação por meo da construção de uma matrz de confusão utlzando-se 112 pontos de testes provenentes do georreferencamento em campo, sendo estes dferentes dos 2000 pontos amostras que foram utlzados para o trenamento da rede. O mesmo pode ser resumdo nos passos a segur: 1) Georreferencamento dos pontos correspondente à verdade terrestre por meo de aparelho GPS Garmm em uma vagem à área de estudo entre os das 29 à 31 de julho de 2008 (Fgura 21). Fgura 21 Georreferencamento de ponto correspondente à verdade terrestre 2) Transferênca dos 112 pontos correspondentes a verdade terrestre e georreferencados com GPS Garmm para o software ArcGs 9.3 (Fgura 22a) e comparação destes à classfcação realzada pelo método da máxma verossmlhança (Fgura 22b).

59 56 Fgura 22 (a) Pontos georreferencados na magem orgnal; (b) Pontos georreferencados na magem classfcada pelo método da máxma verossmlhança 3) Coleta dos valores de RGB, no software ArcGs 9.3, correspondente ao pxel georreferencado em campo e armazenamento destes em formato *.txt. A Fgura 23 mostra os valores de RBG para um pxel da classe água. Fgura 23 Valores de RGB em pxel da classe água 4) Teste dos métodos MLP e SVM no software MATLAB, usando como dado de entrada os valores RGB coletados no passo 3. Na Fgura 24, estão expostos os dados de entrada correspondentes aos valores de RBG e suas saídas após processamento no software MATLAB. Fgura 24 Dados de entrada RGB e suas respectvas classes após processamento no MATLAB

60 57 5) Comparação das saídas resultantes da fase de teste ao resultado desejado, ou seja, a verdade terrestre para os métodos MLP e SVM (Fgura 25). Fgura 25 Planlha com o teste e a saída desejada 6) Quantfcação dos erros e acertos gerados pelo processamento produzndo, desta forma, a matrz de confusão para os métodos máxma verossmlhança, MLP e SVM (Fgura 26). Fgura 26 Produção da matrz de confusão 7) Calcular os coefcentes de exatdão global (EG), exatdão específca (EE) e Kappa (K) através das Equações 54, 55 e 56, respectvamente.

61 Fluxograma A Fgura 27 lustra as prncpas etapas deste expermento com a condção cronológca em que o expermento fo executado. Imagem LANDSAT (Composção RGB) Georreferencamento dos pontos em campo com aparelho GPS Georreferencamento da magem LANDSAT Seleção das amostras de trenamento Avalação das amostras de trenamento (Índce de Jeffres-Matusta) Classfcação da magem (máxma verossmlhança) Trenamento do método MLP Trenamento do método SVM Teste do método MLP Teste do método SVM Classfcação da magem (MLP) Classfcação da magem (SVM) Produção das matrzes de confusão (Máxma verossmlhança, MLP e SVM) Cálculo dos coefcentes (EG, EE e K) Fgura 27 Etapas e ordem de execução Produção dos mapas temátcos

62 Comentáros Fnas Neste capítulo foram apresentados os métodos propostos para a classfcação de magens provenentes do satélte LANDSAT-5, assm como o método proposto para a valdação da classfcação. A valdação da classfcação é de fundamental mportânca, já que aponta para a qualdade do mapa resultante. No capítulo 4 serão expostos e dscutdos os resultados obtdos.

63 60 4. RESULTADOS E DISCUSSÃO Os resultados da metodologa proposta serão abordados neste capítulo, assm como a dscussão destes dante dos objetvos propostos. 4.1 Análse da separabldade das classes A resposta espectral das amostras de trenamento fo analsada objetvando avalar a separabldade entre as classes. A Fgura 28 expõe a resposta espectral méda das amostras de trenamento das classes água, antropzada, agrcultura, Caatnga Herbácea Arbustva (CHA) e Caatnga Arbórea Densa (CAD) nas bandas 2, 3 e 4 do satélte LANSAT ,00 Resposta Espectral 200,00 150,00 100,00 50,00 Agua Antropzada Agrcultura CHA CAD 0, Bandas Fgura 28 Resposta espectral méda das dferentes classes de cobertura do solo das amostras de trenamento Por meo do gráfco apresentado na Fgura 28 é possível notar que, em geral, as classes possuem respostas espectras dstntas, o que pode proporconar melhores resultados na classfcação dos dados. Nota-se anda que as classes agrcultura e CAD formam o par de classes que apresenta valores de resposta espectral méda mas próxmos, o que poderá nterferr na separabldade entre estas. Essa smlardade pode ter ocorrdo devdo aos altos índces de precptação ocorrdos neste ano, como apresentado na sessão 3.1. A partr da dentfcação da assnatura espectral fo calculado a separabldade entre os alvos terrestres. A Tabela 4 mostra as comparações entre os pares de classes e seus respectvos índces de Jeffres-Matushta. O valor de lmar que ndca separabldade ou não das classes é de 1,8.

64 61 Tabela 4 Índce de separabldade entre as classes Água Antropzada Agrcultura CHA CAD Água Antropzada 2, Agrcultura 2,0 1, CHA 1,97 1,98 1, CAD 1,99 2,0 1,89 1,99 - Assm como no trabalho de Krasch et al. (2007), todos pares de classes apresentaram valores do índce de Jeffres-Matusta acma do lmar, o que aponta para uma boa separabldade das classes pelo ponto de vsta da análse espectral (Tabela 4). Os pares de classes água e agrcultura, água e antropzada e antropzada e CAD, apresentaram o máxmo valor deste índce sendo, desta forma, os mas separáves. Nota-se anda que o menor valor de JM obtdo, de 1,89, ocorreu para o par de classes agrcultura e CAD. 4.2 Classfcação pelo método estatístco da máxma verossmlhança A classfcação supervsonada pelo método da máxma verossmlhança fo utlzada como referênca aos métodos MLP e SVM. O mapa resultante com as classes CHA, CAD, água, antropzada e agrcultura está exposto na Fgura 29.

65 62 Fgura 29 Classfcação pelo método da máxma verossmlhança Os 112 pontos de GPS correspondentes à verdade terrestre foram comparados à classfcação e a matrz de confusão fo montada. A Tabela 5 expõe a matrz com as classes: agrcultura, água, antropzada, CHA e CAD. O total de lnhas corresponde à soma dos pontos nas lnhas e o total de colunas à soma dos pontos nas colunas. Os números da dagonal prncpal quantfcam os pxels classfcados corretamente. Por exemplo, para a classe antropzada 16 pxels foram classfcados corretamente. Já os números dspostos fora da dagonal prncpal quantfcam os pxels classfcados ncorretamente. Anda para a classe antropzada, por exemplo, 3 pxels pertencam a classe agrcultura e outros 3 pxels à classe CHA. Tabela 5 Matrz de confusão para o método da máxma verossmlhança Classfcação Verdade de Campo Total Agrcultura Água Antropzada CHA CAD Lnhas Agrcultura Água Antropzada CHA CAD Total colunas

66 63 A Exatdão Global (EG) fo obtda aplcando os dados obtdos na matrz de confusão convenentemente na Equação 56. Desta forma, para este método, a quantdade de pxels classfcados corretamente para fo de 81,2%. Já o coefcente de Kappa (K), obtdo por meo da Equação 58, fo de 0,75. A classfcação proposta por Lands e Koch (1977), exposta na Tabela 1, permte afrmar que a classfcação resultante por meo do método da máxma verossmlhança é muto boa, já que o valor de Kappa encontrado está presente na faxa entre 0,6-0, Classfcação por meo do método Perceptron de Múltplas Camadas (MLP) Pode-se resolver a questão da defnção do número de camadas esconddas por tentatva e erro ou pela experênca préva do operador no domíno de determnado problema de classfcação de padrões. Segundo Egmont et al. (2001), uma rede MLP com uma camada escondda é um mapeador unversal, sto é, pode aproxmar regões de decsão contínua. Desta forma, optou-se por utlzar uma rede MLP de únca camada e realzar testes apenas varando-se bascamente o número de neurônos na camada escondda (12,15 e18). No trenamento da rede, em nenhum dos testes o erro fnal desejado fo alcançado. Desta forma, a parada ocorreu devdo a quantdade de terações pré-estabelecdas (3000) ter chegado ao fm. A Tabela 6 mostra os parâmetros fornecdos à rede neural MLP em cada teste realzado, com os respectvos valores de erro fnal, EG, K e o tempo computaconal. Tabela 6 Resultados dos testes pelo método MLP MLP Teste Número de neurônos Erro fnal EG (%) K Tempo (s) ,008 82,14 0,76 657, ,007 81,25 0,75 875, ,008 70,53 0, ,6 Observando os valores de EG e K na Tabela 6, nota-se que a rede realzou um bom mapeamento dos dados com 12 neurônos na camada escondda (teste 1). A performance, no entanto, cau com o aumento do número de neurônos, podendo ter ocorrdo um overfftng. Gelete e Volatão (2007), assm como no presente estudo, usaram a Toolbox Neural Network contda no software MATLAB (The MathWorks Inc., Natck, MA, USA) e obtveram resultados satsfatóros com uma rede MLP com 11 neurônos na camada oculta. A Fgura 30 expõe a classfcação da área de estudo correspondente ao teste que apresentou melhor desempenho para este método (teste 1).

67 64 Fgura 30 Classfcação por meo de uma rede MLP Os valores de EG e K foram obtdos por meo das Equações 54 e 56 e os dados utlzados no cálculo destes coefcentes estão expostos na matrz de confusão lustrada na Tabela 7. Tabela 7 Matrz de confusão para o método MLP Classfcação Verdade de Campo Total Agrcultura Água Antropzada CHA CAD Lnhas Agrcultura Água Antropzada CHA CAD Total colunas O valor de EG obtdo para a rede MLP (82,14%) é próxmo ao apresentado por Bschof et al. (1992), o que obteve um valor de EG de 85,9%. De acordo com os autores, este percentual pode ser melhorado se nformações de textura forem apresentadas à rede. O coefcente de Kappa (K) calculado fo de 0,76. Assm como no método da máxma verossmlhança, o mapa temátco gerado por este método apresenta-se, segundo Lands e Koch (1977), classfcado como muto bom.

68 Classfcação por meo do método Máquna de Vetor de Suporte (SVM) O método SVM fo testado por meo da varação do fator de penalzação (C) e da largura da função gaussana (σ). Prmeramente, objetvando analsar o comportamento de σ, foram escolhdos para C os valores de 100, 1000 e 1500 e, para cada um destes, foram realzados testes varando σ entre 1,5 e 10 (1,5; 1,8; 2,0; 2,2; 2,5; 10). A Tabela 8 expõe os resultados obtdos de EG, K e o tempo computaconal de cada teste. Tabela 8 Desempenho do classfcador SVM com a varação de σ Teste Fator C σ EG (%) K Tempo (s) Teste ,8 82,14 0, ,98 Teste ,03 0, ,61 Teste ,2 81,03 0, ,95 Teste ,5 80,35 0, ,81 Teste ,14 0, ,12 Teste ,5 81,25 0, ,96 Teste ,35 0, ,60 Teste ,46 0, ,26 Teste ,5 80,35 0, ,26 Teste ,03 0, ,60 Teste ,5 81,25 0, ,21 Teste ,57 0, ,75 Teste ,57 0, ,23 Pela análse da Tabela 8 nota-se que, para as amostras de trenamento utlzadas, os melhores valores de EG e K ocorrem com σ=2. Anda é possível constatar que, para os três valores de C testados, e para valores de σ superores a 2 os coefcentes de EG e K tendem a decrescer, já que com o aumento da largura da gaussana pode ocorrer maor confusão na classfcação dos dados. A Fgura 31 exemplfca este comportamento para o teste em que C está fxado em 100.

69 66 0,790 0,780 Índce de Kappa 0,770 0,760 0,750 0,740 0,730 0,720 0, Sgma Fgura 31 Comportamento do coefcente de Kappa com C mantdo constante e varando o fator σ Os demas testes foram realzados fxando σ no valor 2 e alterando o fator C entre 10 e A Tabela 9 expõe os resultados obtdos de EG, K e o tempo computaconal de cada teste com a varação de C. Tabela 9 Desempenho do classfcador SVM com a varação do fator C Teste Fator C σ EG K Tempo (s) (%) Teste ,25 0, Teste ,14 0, Teste ,03 0, Teste ,03 0, Teste ,03 0, Teste ,03 0, Teste ,14 0, Teste ,14 0, Teste ,14 0, Teste ,35 0, Teste ,35 0, Teste ,35 0, Analsando a Tabela 9 nota-se que K apresentou tendênca de crescmento com C entre 10 e 1300, porém, após este valor o coefcente K passou a decrescer. Com valores de C maores do que 1000 EG e K tendem a decrescer, já que a penalzação é menos rígda e a classfcação apresenta maor quantdade de erros. A Fgura 32 expõe o comportamento de K com a varação do fator C (entre 10 e 5000) e com σ fxado em 2.

70 Índce de Kappa Fator C Fgura 32 Comportamento do coefcente de Kappa com σ mantdo constante e varando o fator C Pela análse da Tabela 9 e da Fgura 32 nota-se que as melhores classfcações, ou seja, aquelas que apresentaram maores valores de Exatdão Global (EG) e Kappa (K) para o método SVM, foram obtdas para valores de C entre 100 e Com valores de C maores do que 1000 os valores dos coefcentes de EG e K tendem a decrescer e a classfcação apresenta maor quantdade de erros. A matrz de confusão correspondente ao teste 6 está exposta na Tabela 10. O total de lnhas corresponde à soma dos pontos nas lnhas e o total de colunas à soma dos pontos nas colunas. Tabela 10 Matrz de confusão para o método SVM Classfcação Verdade de Campo Agrcultura Água Antropzada CHA CAD Total Lnhas Água Antropzada Agrcultura CHA CAD Total colunas O mapa temátco resultante com as classes CHA, CAD, água, antropzada e agrcultura está exposto na Fgura 33.

71 68 Fgura 33 Classfcação utlzando o método SVM A classfcação realzada pelo método SVM, correspondente ao teste 6, obteve coefcente de Kappa gual a 0,77. Segundo Lands e Koch (1977), o mapa temátco resultante é rotulado como muto bom. Assm como nos estudos de Foody e Mathur (2004) e Pal e Mather (2004), a SVM obteve desempenho satsfatóro quando comparado aos métodos MLP e da máxma verossmlhança, os quas apresentaram K de 0,76 e 0,73, respectvamente. Um outro ponto mportante a ser analsado é o custo computaconal envolvdo no processo de classfcação. Para o método SVM, como pode ser observado na Tabela 9, o teste 6 realzou o processo de classfcação em 210,51 segundos. Já para no método MLP, o teste 1 realzou o mesmo processo em 657,5 segundos. Desta forma, pode-se afrmar que o SVM apresentou menor custo computaconal do que o método MLP ratfcando os resultados encontrados por Foody e Mathur (2004), os quas observaram que o método SVM fo mas rápdo quando comparado à rede MLP e a árvore de decsão.

72 Avalação dos coefcentes de exatdão específca (EE) Para avalar o desempenho dos classfcadores em cada classe, o coefcente de EE fo calculado através da Equação 56. A Tabela 11 expõe os valores destes coefcentes para os métodos da máxma verossmlhança, MLP e SVM. Tabela 11 Exatdão específca das classes para cada método Exatdão específca (%) Classe Máxma MLP SVM Verossmlhança Agrcultura 87,2 84,6 76,9 Água 80,0 70,0 100,0 Antropzada 72,7 86,4 95,5 CHA 85,2 77,8 74,1 CAD 71,4 85,7 85,7 A classe agrcultura apresentou nível de acuráca de 87,2% quando classfcada pelo método da máxma verossmlhança, sendo este o maor nível obtdo para esta classe. Da mesma forma, os maores níves de acuráca encontrados para as classes água e antropzada foram de 100 e 95,5%, respectvamente, quando classfcadas pelo método SVM sendo, portanto, este o método mas ndcado para a classfcação destas classes. O valor de EE para a classe Caatnga Herbácea Arbustva (CHA) fo de 85,2, 77,8 e 74,1% para o método da máxma verossmlhança, MLP e SVM, respectvamente. Já para a classe Caatnga Arbórea Densa (CAD) o valor de EE fo de 85,7, para os métodos SVM e MLP e 74,1% para o método da máxma verossmlhança. Os resultados expostos apontam para o bom desempenho dos métodos baseados em aprendzado de máquna. Assm como no trabalho de Su et al. (2007), os resultados obtdos permtem afrmar que estes métodos estão aptos à classfcação do boma em Caatnga, já que apresentaram resultados equvalentes e até superores ao método da máxma verossmlhança. 4.6 Quantfcação das áreas As áreas das classes agrcultura, água, antropzada, CHA e CAD foram quantfcadas para os métodos SVM, MLP e máxma verossmlhança. Os resultados, em km 2, estão expostos na Fgura 34.

73 70 Fgura 34 Área total por cada classe (km 2 ) As classfcações realzadas permtram conclur que, na área de estudo, exste uma parcela sgnfcatva desta ocupada pelo boma Caatnga, varando de 363 a 443 km 2 dependendo do método. A quantfcação anda permte afrmar que, entre os dos tpos de Caatnga, a predomnante é a do tpo herbácea arbustva (CHA) com área varando entre 242 e 327 km 2. Já a do tpo arbórea densa (CAD) apresenta área varando entre 115 e 121 km 2, dependendo do método. A área total de estudo é 576 km 2. Sendo o método SVM o que apresentou melhor desempenho dentre os testados, pode-se utlzar os valores de área resultantes deste como referênca aos demas. Pela Fgura 34, nota-se que método MLP apresentou valores de resultados de área semelhantes ao SVM. Já o da máxma verossmlhança superestmou o valor de área da classe CHA e subestmou o da classe antropzada quando comparados ao SVM e MLP.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Classificadores Lineares. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Classificadores Lineares. Luiz Eduardo S. Oliveira, Ph.D. Unversdade Federal do Paraná Departamento de Informátca Reconhecmento de Padrões Classfcadores Lneares Luz Eduardo S. Olvera, Ph.D. http://lesolvera.net Objetvos Introduzr os o conceto de classfcação lnear.

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 77 Intelgênca Artfcal Aula 8 Redes Neuras Edrle Soares de Lma Formas de Aprendzado Aprendzado Supervsonado Árvores de decsão. K-Nearest Neghbor (KNN). Support Vector Machnes (SVM).

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neuras (Intelgênca Artfcal) Aula 14 Redes Neuras Edrle Soares de Lma Formas de Aprendzado Aprendzado Supervsonado Árvores de Decsão. K-Nearest Neghbor (KNN). Support Vector Machnes

Leia mais

3 Algoritmos propostos

3 Algoritmos propostos Algortmos propostos 3 Algortmos propostos Nesse trabalho foram desenvolvdos dos algortmos que permtem classfcar documentos em categoras de forma automátca, com trenamento feto por usuáros Tas algortmos

Leia mais

Introdução. Introdução. Introdução I - PERCEPTRON. Modelos de Neurônios LABIC. Neurônio:

Introdução. Introdução. Introdução I - PERCEPTRON. Modelos de Neurônios LABIC. Neurônio: Modelos de Neurônos Introdução Característcas Báscas Modelo de Neurôno Estrutura da Rede Neurôno: Cada neurôno é composto por: dendrtos: con de termnas de entrada corpo central Algortmo de Aprendzado axôno:

Leia mais

Redes Neuronais (introdução)

Redes Neuronais (introdução) Redes Neuronas (ntrodução) Vctor Lobo Introdução INÍCIO Programação Imperatva Explcta-se o algortmo Conjunto de nstruções S?? N S N Intelgênca Artfcal Usar o homem e a bologa como nspração Abordagem smbólca

Leia mais

Reconhecimento Estatístico de Padrões

Reconhecimento Estatístico de Padrões Reconhecmento Estatístco de Padrões X 3 O paradgma pode ser sumarzado da segunte forma: Cada padrão é representado por um vector de característcas x = x1 x2 x N (,,, ) x x1 x... x d 2 = X 1 X 2 Espaço

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendzagem de Máquna Alessandro L. Koerch Programa de Pós-Graduação em Informátca Pontfíca Unversdade Católca do Paraná (PUCPR) Máqunas de Vetor de Suporte Introdução Support Vector Machnes SVM Método

Leia mais

Máquinas de Vetores de Suporte Supprot Vector Machine. Aluizio Fausto Ribeiro Araújo Universidade Federal de Pernambuco Centro de Informática

Máquinas de Vetores de Suporte Supprot Vector Machine. Aluizio Fausto Ribeiro Araújo Universidade Federal de Pernambuco Centro de Informática Máqunas de Vetores de Suporte Supprot Vector Machne Aluzo Fausto Rbero Araújo Unversdade Federal de Pernambuco Centro de Informátca Conteúdo. Introdução 2. Classfcadores Bnáros 3. Aprendzagem Estatístca

Leia mais

Universidade Federal do Rio de Janeiro GRADUAÇÃO /2. Modelo MLP. MLP Multi Layers Perceptron

Universidade Federal do Rio de Janeiro GRADUAÇÃO /2. Modelo MLP. MLP Multi Layers Perceptron Unversdade Federal do Ro de Janero GRADUAÇÃO - 8/ Modelo MLP www.labc.nce.ufrj.br Antono G. Thomé thome@nce.ufrj.br Sala - 3 598-368 MLP Mult Laers Perceptron. Redes Neuras RN de múltplas camadas resolvem

Leia mais

Adriana da Costa F. Chaves

Adriana da Costa F. Chaves Máquna de Vetor Suporte (SVM) para Regressão Adrana da Costa F. Chaves Conteúdo da apresentação Introdução Regressão Regressão Lnear Regressão não Lnear Conclusão 2 1 Introdução Sejam {(x,y )}, =1,...,,

Leia mais

5 Implementação Procedimento de segmentação

5 Implementação Procedimento de segmentação 5 Implementação O capítulo segunte apresenta uma batera de expermentos prátcos realzados com o objetvo de valdar o método proposto neste trabalho. O método envolve, contudo, alguns passos que podem ser

Leia mais

PERCEPTRON. Características Básicas Modelo de Neurônio Estrutura da Rede Algoritmo de Aprendizado CARACTERISTICAS BASICAS

PERCEPTRON. Características Básicas Modelo de Neurônio Estrutura da Rede Algoritmo de Aprendizado CARACTERISTICAS BASICAS PERCEPTRON Característcas Báscas Modelo de Neurôno Estrutura da Rede Algortmo de Aprendzado CARACTERISTICAS BASICAS - Regra de propagação net - Função de atvação: Degrau = x w + - Topologa: uma únca camada

Leia mais

Classificação de Padrões

Classificação de Padrões Classfcação de Padrões Introdução Classfcadores Paramétrcos Classfcadores Sem-paramétrcos Redução da Dmensonaldade Teste de Sgnfcânca 6.345 Sstema de Reconhecmento de Voz Teora Acústca da Produção de Voz

Leia mais

Estudo comparativo entre redes neurais artificiais e análise de regressão múltipla na avaliação de bens, para pequenas amostragens

Estudo comparativo entre redes neurais artificiais e análise de regressão múltipla na avaliação de bens, para pequenas amostragens Estudo comparatvo entre redes neuras artfcas e análse de regressão múltpla na avalação de bens, para pequenas amostragens Elane Hasselmann Camardella Schavo (CEFET/RJ) elane@consultora-cca.com.br Márco

Leia mais

Cap. 5 Classificação Temática

Cap. 5 Classificação Temática Prncípos e Aplcações da Deteção Remota Cap. 5 Classfcação Temátca 5.1 O Processo de Classfcação 5. Classfcação de Máxma Verosmlhança (supervsonada paramétrca) 5..1 Classes multvaradas normas 5.. Lmtes

Leia mais

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro UNIVERIDADE DE ÃO PAULO FACULDADE DE ECONOMIA, ADMINITRAÇÃO E CONTABILIDADE DE RIBEIRÃO PRETO DEPARTAMENTO DE ADMINITRAÇÃO RAD1507 Estatístca Aplcada à Admnstração I Prof. Dr. Evandro Marcos adel Rbero

Leia mais

Cap.3 - Redes Neuronais Introdução e MLP V 3.0, V.Lobo, EN/ISEGI, 2005

Cap.3 - Redes Neuronais Introdução e MLP V 3.0, V.Lobo, EN/ISEGI, 2005 Cap.3 - Redes Neuronas Introdução e MLP V 3., V.Lobo, EN/ISEGI, 25 Introdução INÍCIO Redes Neuronas (ntrodução) Programação Imperata Explcta-se o algortmo Conunto de nstruções S? N? N S Vctor Lobo Intelgênca

Leia mais

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência. MODELO DE REGRESSÃO DE COX Os modelos de regressão paramétrcos vstos anterormente exgem que se suponha uma dstrbução estatístca para o tempo de sobrevvênca. Contudo esta suposção, caso não sea adequada,

Leia mais

4 Critérios para Avaliação dos Cenários

4 Critérios para Avaliação dos Cenários Crtéros para Avalação dos Cenáros É desejável que um modelo de geração de séres sntétcas preserve as prncpas característcas da sére hstórca. Isto quer dzer que a utldade de um modelo pode ser verfcada

Leia mais

3 Elementos de modelagem para o problema de controle de potência

3 Elementos de modelagem para o problema de controle de potência 3 Elementos de modelagem para o problema de controle de potênca Neste trabalho assume-se que a rede de comuncações é composta por uma coleção de enlaces consttuídos por um par de undades-rádo ndvdualmente

Leia mais

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo 3 Metodologa de Avalação da Relação entre o Custo Operaconal e o Preço do Óleo Este capítulo tem como objetvo apresentar a metodologa que será empregada nesta pesqusa para avalar a dependênca entre duas

Leia mais

7 Tratamento dos Dados

7 Tratamento dos Dados 7 Tratamento dos Dados 7.. Coefcentes de Troca de Calor O úmero de usselt local é dado por h( r )d u ( r ) (7-) k onde h(r), o coefcente local de troca de calor é h( r ) q''- perdas T q''- perdas (T( r

Leia mais

Avaliação do tamanho da amostra de segmentos regulares para estimar a área plantada com café na região sul de Minas Gerais

Avaliação do tamanho da amostra de segmentos regulares para estimar a área plantada com café na região sul de Minas Gerais Avalação do tamanho da amostra de segmentos regulares para estmar a área plantada com café na regão sul de Mnas Geras Marcos Adam Maurco Alves Morera Bernardo Fredrch Theodor Rudorff Insttuto Naconal de

Leia mais

7 - Distribuição de Freqüências

7 - Distribuição de Freqüências 7 - Dstrbução de Freqüêncas 7.1 Introdução Em mutas áreas há uma grande quantdade de nformações numércas que precsam ser dvulgadas de forma resumda. O método mas comum de resumr estes dados numércos consste

Leia mais

2 Redes Neurais Auto-Organizáveis

2 Redes Neurais Auto-Organizáveis 2 Redes Neuras Auto-Organzáves 2.1 Introdução Problemas de clusterng estão presentes nos mas varados contetos, como por eemplo: classfcação de padrões, mneração de dados e recuperação de nformações de

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Plano de Aula Aprendzagem de Máquna Aprendzagem Baseada em Instâncas Alessandro L. Koerch Introdução Espaço Eucldano Aprendzagem Baseada em Instâncas (ou Modelos Baseados em Dstânca) Regra knn (k vznhos

Leia mais

6 Modelo Proposto Introdução

6 Modelo Proposto Introdução 6 Modelo Proposto 6.1. Introdução Neste capítulo serão apresentados detalhes do modelo proposto nesta dssertação de mestrado, onde será utlzado um modelo híbrdo para se obter prevsão de carga curto prazo

Leia mais

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma Capítulo 8 Dferencação Numérca Quase todos os métodos numércos utlzados atualmente para obtenção de soluções de equações erencas ordnáras e parcas utlzam algum tpo de aproxmação para as dervadas contínuas

Leia mais

REGRESSÃO NÃO LINEAR 27/06/2017

REGRESSÃO NÃO LINEAR 27/06/2017 7/06/07 REGRESSÃO NÃO LINEAR CUIABÁ, MT 07/ Os modelos de regressão não lnear dferencam-se dos modelos lneares, tanto smples como múltplos, pelo fato de suas varáves ndependentes não estarem separados

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca

Leia mais

Primeiras Redes Neurais. Aluizio Fausto Ribeiro Araújo Universidade Federal de Pernambuco Centro de Informática

Primeiras Redes Neurais. Aluizio Fausto Ribeiro Araújo Universidade Federal de Pernambuco Centro de Informática Prmeras Redes Neuras Aluzo Fausto Rbero Araújo Unversdade Federal de Pernambuco Centro de Informátca Conteúdo. Modelo de McCullough and Ptts 2. Teora de Hebb 3. O Perceptron 4. Exemplos 2 Modelo de McCullough

Leia mais

Aula Características dos sistemas de medição

Aula Características dos sistemas de medição Aula - Característcas dos sstemas de medção O comportamento funconal de um sstema de medção é descrto pelas suas característcas (parâmetros) operaconas e metrológcas. Aqu é defnda e analsada uma sére destes

Leia mais

Representação e Descrição de Regiões

Representação e Descrição de Regiões Depos de uma magem ter sdo segmentada em regões é necessáro representar e descrever cada regão para posteror processamento A escolha da representação de uma regão envolve a escolha dos elementos que são

Leia mais

Algarismos Significativos Propagação de Erros ou Desvios

Algarismos Significativos Propagação de Erros ou Desvios Algarsmos Sgnfcatvos Propagação de Erros ou Desvos L1 = 1,35 cm; L = 1,3 cm; L3 = 1,30 cm L4 = 1,4 cm; L5 = 1,7 cm. Qual destas meddas está correta? Qual apresenta algarsmos com sgnfcado? O nstrumento

Leia mais

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

DEFINIÇÃO - MODELO LINEAR GENERALIZADO DEFINIÇÃO - MODELO LINEAR GENERALIZADO 1 Um modelo lnear generalzado é defndo pelos seguntes três componentes: Componente aleatóro; Componente sstemátco; Função de lgação; Componente aleatóro: Um conjunto

Leia mais

CORRELAÇÃO E REGRESSÃO

CORRELAÇÃO E REGRESSÃO CORRELAÇÃO E REGRESSÃO Constata-se, freqüentemente, a estênca de uma relação entre duas (ou mas) varáves. Se tal relação é de natureza quanttatva, a correlação é o nstrumento adequado para descobrr e medr

Leia mais

MINISTÉRIO DA CIÊNCIA E TECNOLOGIA INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS

MINISTÉRIO DA CIÊNCIA E TECNOLOGIA INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS MINISTÉRIO DA CIÊNCIA E TECNOLOGIA INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS AVALIAÇÃO DAS INCERTEZAS NAS CLASSIFICAÇÕES DE MÁXIMA VEROSSIMILHANÇA E CONTEXTUAL DE MODAS CONDICIONAIS ITERATIVAS EM IMAGENS

Leia mais

Psicologia Conexionista Antonio Roque Aula 8 Modelos Conexionistas com tempo contínuo

Psicologia Conexionista Antonio Roque Aula 8 Modelos Conexionistas com tempo contínuo Modelos Conexonstas com tempo contínuo Mutos fenômenos de aprendzado assocatvo podem ser explcados por modelos em que o tempo é uma varável dscreta como nos casos vstos nas aulas anterores. Tas modelos

Leia mais

ÍNDICE DE CONSISTÊNCIA TEMPORAL: UM NOVO MÉTODO PARA AVALIAÇÃO DA ESTABILIDADE TEMPORAL DE ARMAZENAMENTO DE ÁGUA NO SOLO

ÍNDICE DE CONSISTÊNCIA TEMPORAL: UM NOVO MÉTODO PARA AVALIAÇÃO DA ESTABILIDADE TEMPORAL DE ARMAZENAMENTO DE ÁGUA NO SOLO Anas Eletrônco ÍNDICE DE CONSISTÊNCIA TEMPORAL: UM NOVO MÉTODO PARA AVALIAÇÃO DA ESTABILIDADE TEMPORAL DE ARMAZENAMENTO DE ÁGUA NO SOLO Anderson Takash Hara, Heraldo Takao Hashgut, Antôno Carlos Andrade

Leia mais

3 A técnica de computação intensiva Bootstrap

3 A técnica de computação intensiva Bootstrap A técnca de computação ntensva ootstrap O termo ootstrap tem orgem na expressão de língua nglesa lft oneself by pullng hs/her bootstrap, ou seja, alguém levantar-se puxando seu própro cadarço de bota.

Leia mais

Associação entre duas variáveis quantitativas

Associação entre duas variáveis quantitativas Exemplo O departamento de RH de uma empresa deseja avalar a efcáca dos testes aplcados para a seleção de funconáros. Para tanto, fo sorteada uma amostra aleatóra de 50 funconáros que fazem parte da empresa

Leia mais

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) UNDADE V DELNEAMENTO NTERAMENTE CASUALZADO (DC) CUABÁ, MT 015/ PROF.: RÔMULO MÔRA romulomora.webnode.com 1. NTRODUÇÃO Este delneamento apresenta como característca prncpal a necessdade de homogenedade

Leia mais

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu 1 Programação Não Lnear com Restrções Aula 9: Programação Não-Lnear - Funções de Váras Varáves com Restrções Ponto Regular; Introdução aos Multplcadores de Lagrange; Multplcadores de Lagrange e Condções

Leia mais

2 Incerteza de medição

2 Incerteza de medição 2 Incerteza de medção Toda medção envolve ensaos, ajustes, condconamentos e a observação de ndcações em um nstrumento. Este conhecmento é utlzado para obter o valor de uma grandeza (mensurando) a partr

Leia mais

DESENVOLVIMENTO DE UM PRÉ-PROCESSADOR PARA ANÁLISE ISOGEOMÉTRICA

DESENVOLVIMENTO DE UM PRÉ-PROCESSADOR PARA ANÁLISE ISOGEOMÉTRICA DESENVOLVIMENTO DE UM PRÉ-PROCESSADOR PARA ANÁLISE ISOGEOMÉTRICA Pedro Luz Rocha Evandro Parente Junor pedroluzrr04@gmal.com evandroparentejr@gmal.com Laboratóro de Mecânca Computaconal e Vsualzação, Unversdade

Leia mais

Reconhecimento Automático de Modulação Digital de Sinais de Comunicações

Reconhecimento Automático de Modulação Digital de Sinais de Comunicações Reconhecmento Automátco de Modulação Dgtal de Snas de Comuncações Marcelo Corrêa Horewcz, Caro Lúco ascmento Jr. e Waldecr João Perrella Insttuto Tecnológco de Aeronáutca Praça Marechal Eduardo Gomes,

Leia mais

MODELOS DE REGRESSÃO PARAMÉTRICOS

MODELOS DE REGRESSÃO PARAMÉTRICOS MODELOS DE REGRESSÃO PARAMÉTRICOS Às vezes é de nteresse nclur na análse, característcas dos ndvíduos que podem estar relaconadas com o tempo de vda. Estudo de nsufcênca renal: verfcar qual o efeto da

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

XX SNPTEE SEMINÁRIO NACIONAL DE PRODUÇÃO E TRANSMISSÃO DE ENERGIA ELÉTRICA

XX SNPTEE SEMINÁRIO NACIONAL DE PRODUÇÃO E TRANSMISSÃO DE ENERGIA ELÉTRICA XX SNPTEE SEMINÁRIO NACIONAL DE PRODUÇÃO E TRANSMISSÃO DE ENERGIA ELÉTRICA 22 a 25 Novembro de 2009 Recfe - PE GRUPO IV GRUPO DE ESTUDO DE ANÁLISE E TÉCNICAS DE SISTEMAS DE POTÊNCIA CA E CC - GAT DESENVOLVIMENTO

Leia mais

2 Metodologia de Medição de Riscos para Projetos

2 Metodologia de Medição de Riscos para Projetos 2 Metodologa de Medção de Rscos para Projetos Neste capítulo remos aplcar os concetos apresentados na seção 1.1 ao ambente de projetos. Um projeto, por defnção, é um empreendmento com metas de prazo, margem

Leia mais

4.1 Modelagem dos Resultados Considerando Sazonalização

4.1 Modelagem dos Resultados Considerando Sazonalização 30 4 METODOLOGIA 4.1 Modelagem dos Resultados Consderando Sazonalzação A sazonalzação da quantdade de energa assegurada versus a quantdade contratada unforme, em contratos de fornecmento de energa elétrca,

Leia mais

2 Reconhecimento Automático de Locutor em Ambientes Ruidosos

2 Reconhecimento Automático de Locutor em Ambientes Ruidosos 2 Reconhecmento Automátco de Locutor em Ambentes Rudosos Neste capítulo são apresentadas, de forma resumda, as técncas de classfcação e de extração de atrbutos mas usadas recentemente para aplcações de

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ 1 É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

Modelagem do crescimento de clones de Eucalyptus via modelos não lineares

Modelagem do crescimento de clones de Eucalyptus via modelos não lineares Modelagem do crescmento de clones de Eucalyptus va modelos não lneares Joselme Fernandes Gouvea 2 Davd Venanco da Cruz 3 Máco Augusto de Albuquerque 3 José Antôno Alexo da Slva Introdução Os fenômenos

Leia mais

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro. Aplcação Por exemplo, se prepararmos uma área expermental com todo cudado possível e fzermos, manualmente, o planto de 100 sementes seleconadas de um mlho híbrdo, cudando para que as sementes fquem na

Leia mais

IMPLEMENTAÇÃO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO

IMPLEMENTAÇÃO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO IMPLEMENTAÇÃO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO Alne de Paula Sanches 1 ; Adrana Betâna de Paula Molgora 1 Estudante do Curso de Cênca da Computação da UEMS, Undade Unverstára de Dourados;

Leia mais

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EATAS DEPARTAMENTO DE ESTATÍSTICA UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

Leia mais

3 Subtração de Fundo Segmentação por Subtração de Fundo

3 Subtração de Fundo Segmentação por Subtração de Fundo 3 Subtração de Fundo Este capítulo apresenta um estudo sobre algortmos para a detecção de objetos em movmento em uma cena com fundo estátco. Normalmente, estas cenas estão sob a nfluênca de mudanças na

Leia mais

Estatística II Antonio Roque Aula 18. Regressão Linear

Estatística II Antonio Roque Aula 18. Regressão Linear Estatístca II Antono Roque Aula 18 Regressão Lnear Quando se consderam duas varáves aleatóras ao mesmo tempo, X e Y, as técncas estatístcas aplcadas são as de regressão e correlação. As duas técncas estão

Leia mais

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira UNIVERSIDADE DE PERNAMBUCO ESCOLA POLITÉCNICA DE PERNAMBUCO Físca Expermental Prof o José Wlson Vera wlson.vera@upe.br AULA 01: PROCESSOS DE ANÁLISE GRÁFICA E NUMÉRICA MODELO LINEAR Recfe, agosto de 2015

Leia mais

EXERCÍCIO: VIA EXPRESSA CONTROLADA

EXERCÍCIO: VIA EXPRESSA CONTROLADA EXERCÍCIO: VIA EXPRESSA CONTROLADA Engenhara de Tráfego Consdere o segmento de va expressa esquematzado abaxo, que apresenta problemas de congestonamento no pco, e os dados a segur apresentados: Trechos

Leia mais

2 Aproximação por curvas impĺıcitas e partição da unidade

2 Aproximação por curvas impĺıcitas e partição da unidade Aproxmação por curvas mpĺıctas e partção da undade Este capítulo expõe alguns concetos báscos necessáros para o entendmento deste trabalho 1 Curvas Algébrcas Um subconjunto O R é chamado de uma curva mplícta

Leia mais

Máquinas de Vetores Suportes

Máquinas de Vetores Suportes Máqunas de Vetores Suportes SAMUEL BELINI DEFILIPPO Monografa fnal de curso sob orentação do Prof. Raul Fonseca Neto Juz de Fora, MG feverero de 004 Máqunas de Vetores Suportes SAMUEL BELINI DEFILIPPO

Leia mais

Dependência Espacial de espécies nativas em fragmentos. florestais

Dependência Espacial de espécies nativas em fragmentos. florestais Dependênca Espacal de espéces natvas em fragmentos 1 Introdução florestas 1 Mestranda em Engenhara Florestal LEMAF/DCF UFLA. e-mal: cunhadase@yahoo.com.br 2 Mestrando em Engenhara Florestal LEMAF/DCF UFLA.

Leia mais

5 Relação entre Análise Limite e Programação Linear 5.1. Modelo Matemático para Análise Limite

5 Relação entre Análise Limite e Programação Linear 5.1. Modelo Matemático para Análise Limite 5 Relação entre Análse Lmte e Programação Lnear 5.. Modelo Matemátco para Análse Lmte Como fo explcado anterormente, a análse lmte oferece a facldade para o cálculo da carga de ruptura pelo fato de utlzar

Leia mais

UM NOVO MÉTODO KERNEL PARA A ANÁLISE DISCRIMINANTE DE SEQUÊNCIAS BIOLÓGICAS

UM NOVO MÉTODO KERNEL PARA A ANÁLISE DISCRIMINANTE DE SEQUÊNCIAS BIOLÓGICAS UM NOVO MÉTODO KERNEL PARA A ANÁLISE DISCRIMINANTE DE SEQUÊNCIAS BIOLÓGICAS RAUL FONSECA NETO Departamento de Cênca da Computação UFJF raulfonsecaneto@g.com.br VICTOR S. DE A. MENESES Programa de Pós-Graduação

Leia mais

Regressão Múltipla. Parte I: Modelo Geral e Estimação

Regressão Múltipla. Parte I: Modelo Geral e Estimação Regressão Múltpla Parte I: Modelo Geral e Estmação Regressão lnear múltpla Exemplos: Num estudo sobre a produtvdade de trabalhadores ( em aeronave, navos) o pesqusador deseja controlar o número desses

Leia mais

ANÁLISE DAS TENSÕES TÉRMICAS EM MATERIAIS CERÂMICOS. Palavras-chave: Tensões térmicas, Propriedades variáveis, Condução de calor, GITT

ANÁLISE DAS TENSÕES TÉRMICAS EM MATERIAIS CERÂMICOS. Palavras-chave: Tensões térmicas, Propriedades variáveis, Condução de calor, GITT ANÁLISE DAS TENSÕES TÉRMICAS EM MATERIAIS CERÂMICOS Dnz, L.S. Santos, C.A.C. Lma, J.A. Unversdade Federal da Paraíba Laboratóro de Energa Solar LES/DTM/CT/UFPB 5859-9 - João Pessoa - PB, Brasl e-mal: cabral@les.ufpb.br

Leia mais

3 Definição automática de carregamento ótimo

3 Definição automática de carregamento ótimo 3 Defnção automátca de carregamento ótmo A formulação ncal mostrada neste capítulo fo feta por Sérgo Álvares Maffra[11] e parte da mplementação fo feta por Anderson Perera, tendo sofrdo algumas modfcações

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ ANDRÉ LUIZ EMIDIO DE ABREU BOOTSTRAP E MODELOS DE SUPPORT VECTOR MACHINE SVM

UNIVERSIDADE FEDERAL DO PARANÁ ANDRÉ LUIZ EMIDIO DE ABREU BOOTSTRAP E MODELOS DE SUPPORT VECTOR MACHINE SVM UNIVERSIDADE FEDERAL DO PARANÁ ANDRÉ LUIZ EMIDIO DE ABREU BOOTSTRAP E MODELOS DE SUPPORT VECTOR MACHINE SVM CURITIBA 2016 ANDRÉ LUIZ EMIDIO DE ABREU BOOTSTRAP E MODELOS DE SUPPORT VECTOR MACHINE SVM Tese

Leia mais

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA CAPÍTULO DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA. A MÉDIA ARITMÉTICA OU PROMÉDIO Defnção: é gual a soma dos valores do grupo de dados dvdda pelo número de valores. X x Soma dos valores de x número de

Leia mais

Experiência V (aulas 08 e 09) Curvas características

Experiência V (aulas 08 e 09) Curvas características Experênca (aulas 08 e 09) Curvas característcas 1. Objetvos 2. Introdução 3. Procedmento expermental 4. Análse de dados 5. Referêncas 1. Objetvos Como no expermento anteror, remos estudar a adequação de

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. vall@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ Em mutas stuações duas ou mas varáves estão relaconadas e surge então a necessdade de determnar a natureza deste relaconamento. A análse

Leia mais

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES 1 O nosso objetvo é estudar a relação entre duas varáves quanttatvas. Eemplos:. Idade e altura das cranças.. v. Tempo de prátca de esportes e rtmo cardíaco

Leia mais

2 Lógica Fuzzy Introdução

2 Lógica Fuzzy Introdução 2 Lógca Fuzzy 2.. Introdução A lógca fuzzy é uma extensão da lógca booleana, ntroduzda pelo Dr. Loft Zadeh da Unversdade da Calfórna / Berkeley no ano 965. Fo desenvolvda para expressar o conceto de verdade

Leia mais

DELINEAMENTOS EXPERIMENTAIS

DELINEAMENTOS EXPERIMENTAIS SUMÁRIO 1 Delneamentos Expermentas 2 1.1 Delneamento Interamente Casualzado..................... 2 1.2 Delneamento Blocos Casualzados (DBC).................... 3 1.3 Delneamento Quadrado Latno (DQL)......................

Leia mais

4. Sistemas Neuro-Fuzzy

4. Sistemas Neuro-Fuzzy 4. Sstemas Neuro-Fuzzy Neste capítulo será apresentado o sstema híbrdo Neuro-Fuzzy, o qual é a combnação das técncas de fuzzy e redes neuras. Alguns modelos Neuro-Fuzzy já desenvolvdos na lteratura são

Leia mais

3 Método Numérico. 3.1 Discretização da Equação Diferencial

3 Método Numérico. 3.1 Discretização da Equação Diferencial 3 Método Numérco O presente capítulo apresenta a dscretação da equação dferencal para o campo de pressão e a ntegração numérca da expressão obtda anterormente para a Vscosdade Newtonana Equvalente possbltando

Leia mais

2 Análise de Campos Modais em Guias de Onda Arbitrários

2 Análise de Campos Modais em Guias de Onda Arbitrários Análse de Campos Modas em Guas de Onda Arbtráros Neste capítulo serão analsados os campos modas em guas de onda de seção arbtrára. A seção transversal do gua é apromada por um polígono conveo descrto por

Leia mais

Gráficos de Controle para Processos Autocorrelacionados

Gráficos de Controle para Processos Autocorrelacionados Gráfcos de Controle para Processos Autocorrelaconados Gráfco de controle de Shewhart: observações ndependentes e normalmente dstrbuídas. Shewhart ao crar os gráfcos de controle não exgu que os dados fossem

Leia mais

Diferença entre a classificação do PIB per capita e a classificação do IDH

Diferença entre a classificação do PIB per capita e a classificação do IDH Curso Bem Estar Socal Marcelo Ner - www.fgv.br/cps Metas Socas Entre as mutas questões decorrentes da déa de se mplementar uma proposta de metas socas temos: Qual a justfcatva econômca para a exstênca

Leia mais

PUCPR- Pontifícia Universidade Católica Do Paraná PPGIA- Programa de Pós-Graduação Em Informática Aplicada PROF. DR. JACQUES FACON

PUCPR- Pontifícia Universidade Católica Do Paraná PPGIA- Programa de Pós-Graduação Em Informática Aplicada PROF. DR. JACQUES FACON 1 PUCPR- Pontfíca Unversdade Católca Do Paraná PPGIA- Programa de Pós-Graduação Em Informátca Aplcada PROF. DR. JACQUES FACON LIMIARIZAÇÃO ITERATIVA DE LAM E LEUNG Resumo: A proposta para essa sére de

Leia mais

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária.

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária. Modelagem multvarável com varáves quanttatvas e qualtatvas, com resposta bnára. O modelo de regressão não lnear logístco ou modelo logístco é utlzado quando a varável resposta é qualtatva com dos resultados

Leia mais

Análise da curva de crescimento de ovinos cruzados

Análise da curva de crescimento de ovinos cruzados Análse da curva de crescmento de ovnos cruzados Dana Campos de Olvera DEX, UFLA Antôno Polcarpo Souza Carnero DET, UFV Joel Augusto Munz DEX, UFLA Introdução Os ovnos, assm como grande maora dos anmas

Leia mais

Análise Exploratória de Dados

Análise Exploratória de Dados Análse Exploratóra de Dados Objetvos Análse de duas varáves quanttatvas: traçar dagramas de dspersão, para avalar possíves relações entre as duas varáves; calcular o coefcente de correlação entre as duas

Leia mais

2 Principio do Trabalho Virtual (PTV)

2 Principio do Trabalho Virtual (PTV) Prncpo do Trabalho rtual (PT)..Contnuo com mcroestrutura Na teora que leva em consderação a mcroestrutura do materal, cada partícula anda é representada por um ponto P, conforme Fgura. Porém suas propredades

Leia mais

ESTUDO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO

ESTUDO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO ESTUDO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO Alne de Paula Sanches (Bolssta UEMS), Adrana Betâna de Paula Molgora Unversdade Estadual de Mato Grosso do Sul Cdade Unverstára de Dourados, Caxa

Leia mais

IBAPE XII COBREAP CONGRESSO BRASILEIRO DE ENGENHARIA DE AVALIAÇÕES E PERÍCIAS, BELO HORIZONTE/MG

IBAPE XII COBREAP CONGRESSO BRASILEIRO DE ENGENHARIA DE AVALIAÇÕES E PERÍCIAS, BELO HORIZONTE/MG IBAPE XII COBREAP CONGRESSO BRASILEIRO DE ENGENHARIA DE AVALIAÇÕES E PERÍCIAS, BELO HORIZONTE/MG ESTUDO COMPARATIVO ENTRE REDES NEURAIS ARTIFICIAIS E ANÁLISE DE REGRESSÃO MÚLTIPLA NA AVALIAÇÃO DE BENS,

Leia mais

Ângulo de Inclinação (rad) [α min α max ] 1 a Camada [360,0 520,0] 2000 X:[-0,2065 0,2065] Velocidade da Onda P (m/s)

Ângulo de Inclinação (rad) [α min α max ] 1 a Camada [360,0 520,0] 2000 X:[-0,2065 0,2065] Velocidade da Onda P (m/s) 4 Estudo de Caso O estudo de caso, para avalar o método de estmação de parâmetros trdmensonal fo realzado em um modelo de referênca de três camadas, e foram realzados os seguntes passos: Descrção do modelo

Leia mais

DIFERENCIANDO SÉRIES TEMPORAIS CAÓTICAS DE ALEATÓRIAS ATRAVÉS DAS TREND STRIPS

DIFERENCIANDO SÉRIES TEMPORAIS CAÓTICAS DE ALEATÓRIAS ATRAVÉS DAS TREND STRIPS 177 DIFERENCIANDO SÉRIES TEMPORAIS CAÓTICAS DE ALEATÓRIAS ATRAVÉS DAS TREND STRIPS Antôno Carlos da Slva Flho Un-FACEF Introdução Trend Strps (TS) são uma nova técnca de análse da dnâmca de um sstema,

Leia mais

Eletromagnetismo. Distribuição de grandezas físicas: conceitos gerais

Eletromagnetismo. Distribuição de grandezas físicas: conceitos gerais Eletromagnetsmo Dstrbução de grandezas físcas: concetos geras Eletromagnetsmo» Dstrbução de grandezas físcas: concetos geras 1 Introdução Pode-se caracterzar um problema típco do eletromagnetsmo como o

Leia mais

Função de Incidência: uma possível união da Teoria de Metapopulação com a Ecologia da Paisagem?

Função de Incidência: uma possível união da Teoria de Metapopulação com a Ecologia da Paisagem? Função de Incdênca: uma possível unão da Teora de Metapopulação com a Ecologa da Pasagem? Função de Incdênca: uma possível unão da Teora de Metapopulação com a Ecologa da Pasagem? INTRODUÇÃO O que é uma

Leia mais

Modelo de Programação Estocástica

Modelo de Programação Estocástica Modelo de Programação Estocástca 23 2 Modelo de Programação Estocástca 2.. Concetos báscos A programação estocástca (PE) é defnda como um modelo de otmzação que apresenta um ou mas parâmetros estocástcos

Leia mais

2 Fundamentos Teóricos

2 Fundamentos Teóricos Fundamentos Teórcos 2 Fundamentos Teórcos 2. Aprendzado de Máquna Aprendzado de Máquna é uma área de Intelgênca Artfcal cuo obetvo é o desenvolvmento de técncas computaconas sobre o aprendzado bem como

Leia mais