1.INTRODUÇÃO. na superfície terrestre, sem que seja necessário o contato físico com eles, com o intuito de

Tamanho: px
Começar a partir da página:

Download "1.INTRODUÇÃO. na superfície terrestre, sem que seja necessário o contato físico com eles, com o intuito de"

Transcrição

1 1.INTRODUÇÃO 1.1 Concetos Báscos Sensoramento remoto pode ser entenddo como a tecnologa que permte a captação, armazenamento e nterpretação de nformações sobre característcas de objetos na superfíce terrestre, sem que seja necessáro o contato físco com eles, com o ntuto de estudar as nterações entre atmosfera, solo e oceanos.atualmente séres de sensores a bordo de satéltes estão constantemente captando nformações de alvos localzados na superfíce terrestre. Os prncpas produtos do sensoramento remoto são magens multspectras, ou seja, de uma mesma área são obtdas váras magens em dferentes faxas do espectro eletromagnétco. Quando se fala em sensoramento remoto e sstema de sensores, logo se tem em mente a alta tecnologa assocada e a constante evolução dessas tecnologas. As prncpas propredades de um sstema sensor são: resolução espectral, resolução espacal, resolução radométrca e resolução temporal. Essas três propredades servem como crtéros para a escolha de qual sstema sensor melhor se adapta a um determnado tpo de problema e objetvo que se tem no montoramento de áreas.

2 2 Resolução Espectral: O Espectro eletromagnétco é o conjunto dos dferentes tpos de radação eletromagnétca. O espectro eletromagnétco abrange um amplo ntervalo de comprmentos de onda (e conseqüentemente de freqüêncas) ndo desde ondas muto longas, e conseqüentemente baxas freqüêncas (rádo), passando pelas ondas nfravermelho e ondas de luz vsível até chegar a freqüêncas muto altas (o que corresponde a comprmentos de ondas curta) dos raos gama e raos X. Os comprmentos de onda no ntervalo da luz vsíves têm uma cor específca assocada a cada um deles quando eles passam através de um prsma. As freqüêncas mas baxas produzem a cor vermelha enquanto que as freqüêncas mas altas, comprmentos de ondas mas curtas, produzem a cor voleta. Aqueles comprmentos de onda entre estes dos pontos produzem as cores laranja, amarelo, verde, e azul. Em sensoramento remoto é comum defnr ntervalos do espectro eletromagnétco nos quas os sensores são sensíves. Quanto maor for o número de ntervalos e menor a largura deles, mas rca e refnada serão as nformações sobre os alvos mageados e, portanto, maor será a resolução espectral. Essas faxas, em sensoramento remoto são chamadas de bandas espectras.

3 3 Fgura 1- Espectro eletromagnétco Resolução Espacal: A resolução espacal de uma magem dgtal se relacona com o poder de defnção, ou seja, o detalhe de observação passível de detecção. A resolução espacal está atngndo a ordem do metro e tornando possível uma sére de aplcações antes nmagnáves. Resolução Radométrca: A resolução radométrca de um sstema sensor esta baseada na sensbldade de dstngur dos dferentes níves de ntensdade do snal. Quanto maor for a capacdade de dstnção, mas alta será a resolução radométrca, por exemplo, uma resolução de 10 bts (1024 níves) é mas alta do que uma resolução de 8 bts (256 níves). Resolução Temporal: A resolução temporal se refere à freqüênca com que são obtdas magens de um determnado local por um determnado sstema sensor. Quanto

4 4 menor for o espaço de tempo entre o montoramento de uma mesma área, maor será a resolução temporal. Os dferentes sstemas sensores hoje dsponíves apresentam dferentes propredades quanto às resoluções explctadas acma. Dependendo do tpo de problema assocado, um determnado tpo de sstema será adequado. Em mutas stuações não será precso e nem será adequado utlzar aquele sstema que possua melhores resoluções. Os sensores captam, medem e regstram a magntude da radânca eletromagnétca provenente do sol, refletda e/ou emtda por um alvo na superfíce da Terra, em cada faxa do espectro eletromagnétco referente a cada banda, posterormente é realzada a dscretzação da magntude da radânca em níves de contadores dgtas (CD) e em termos espacas a dscretzação se dá na forma de pxel na magem, que se refere a uma determnada undade de área na superfíce terrestre. Uma magem dgtal no formato raster ou matrcal é formada por uma sére de pxels (n), para cada exste um número (p) de atrbutos meddos, no caso os contadores dgtas (CD) que expressam as radâncas observadas e dscretzadas nas dferentes bandas ou faxas do espectro eletromagnétco. A reflectânca de um alvo observada ao longo do espectro eletromagnétco é conhecda como sendo sua assnatura espectral ou curva de resposta espectral. Na prátca dspõe-se somente de uma aproxmação dessa curva, formada pelas respostas obtdas em cada uma das bandas espectras dsponíves. Quanto maor for o número de bandas e por conseqüênca menor a sua largura, mas detalhadas serão as nformações espectras sobre o alvo, aproxmando-se da sua verdadera assnatura espectral.

5 5 Fgura 2- Assnatura espectral característca da água, solo e vegetação, localzação dos canas do sensor LANDSAT-TM. 1.2 Sstemas Sensores Como fo menconado anterormente, exstem dversos sstemas sensores em órbta extrando nformação da superfíce terrestre. Estes sensores apresentam especfcdades própras nas quas se dferencam dos demas. Um dos sstemas sensores mas conhecdos é o LANDSAT. Foram laçados até hoje sete satéltes do programa LANDSAT, desde Atualmente atvos se encontram o LANDSAT 5 e o LANDSAT 7. O LANDSAT 5 também conhecdo como TM (Thematc Mapper) dspõe de um sstema sensor que cobre o espectro eletromagnétco de 0,45 até 12,6 m sendo esta cobertura não contínua, dvda em 7 faxas (bandas), 3 delas na faxa do vsível e 4 na faxa do nfravermelho, a resolução espacal é de 30m exceto para a banda 6 (regão do nfravermelho termal) que é de 120m.

6 6 A faxa de varredura do sstema é de 185 x 185Km e sua resolução radométrca é de 8 bts, o que permte a detecção de 256 níves de ntensdade de radânca, o satélte demora 16 das para dar uma volta completa na órbta terrestre e então novamente captar nformação de uma mesma área. O sstema LANDSAT-TM, bem como város outros em uso, obtém um número pequeno de bandas espectras, não fornecendo desta forma dados em alta resolução espectral. Mas recentemente, com o avanço da tecnologa tornou-se vável a dsponbldade de sstemas sensores de muto alta resolução espectral, sto é, sstemas com um número muto alto de sensores, operando em faxas estretas e contíguas do espectro. Estes sstemas, denomnados de hperspectras abrram novas possbldades em sensoramento remoto. Um dos sstemas hperspectras mas conhecdos, anda do tpo aero-transportado, é o sstema AVIRIS (Arborne Vsble/Infrared Imagng Spectrometer), possundo 224 bandas que cobrem o espectro eletromagnétco de 0,41 a 2,45 m. Este sstema sensor apresenta uma resolução espectral mas alta do que o LANDSAT-TM, pos é composto de bandas mas estretas, o que permte maor aqusção de nformação dos alvos de forma mas detalhada do ponto de vsta espectral. Também possu maor resolução espacal 20m, porém o total de área varrda é de aproxmadamente 11Km de extensão. Sua resolução radométrca atualmente é de 12 bts. Portanto, o sensor AVIRIS é classfcado como hperspectral, enquanto que o LANDSAT é multspectral. Outra dferença essencal entre esses dos sstemas sensores é

7 7 que o AVIRIS utlza como plataforma uma aeronave enquanto que o LANDSAT é nstalado em um satélte a 705 Km de alttude. Destacam-se anda os sensores da sére SPOT (Satellte Pour l'observaton de la Terre) que apresenta atualmente resolução espacal de 2,5 m e que se encontra na sua versão de número 5, outro sstema mportante e muto recente é chamado IKONOS, a bordo de um satélte a uma alttude de aproxmadamente 680Km, é capaz de adqurr magens com resolução espacal de até 1m no pancromátco e 4m nas bandas multspectras. No que se refere à resolução espectral é correto afrmar que quando um sstema sensor apresenta faxas espectras consderavelmente largas, estamos perdendo ou dexando de captar uma sére de nformações relevantes sobre o alvo. Os valores observados em faxas largas, são na verdade uma aproxmação da méda da radânca na faxa do espectro correspondente a banda. Em reconhecmento de padrões, por exemplo, mutas vezes trabalhamos com duas ou mas classes que possuem comportamentos espectras muto semelhantes, nesse caso, é pratcamente mpossível uma classfcação satsfatóra quando utlzamos poucas bandas que cobrem faxas largas do espectro eletromagnétco, como LANDSAT-TM; Para esses casos é necessára a utlzação de dados provenentes dos sensores hperspectras, como AVIRIS. Como podemos observar na fgura 3, os dados provenentes do sensor AVIRIS (hperspectral) fornecem uma quantdade maor de nformação sobre o alvo mageado do

8 Radânca 8 que os dados obtdos pelo sensor LANDSAT (multspectral), devdo à quantdade de bandas exstentes em cada sstema sensor AVIRIS LANDSAT ,00 0,50 1,00 1,50 2,00 2,50 comprmento de onda (um) Fgura 3 - Comparação entre a nformação espectral obtda nos sensores AVIRIS e LANDSAT A nformação espectral de uma cena pode ser representada em cada banda ndvdualmente por uma magem em níves de cnza, onde a posção do pxel é dada pelas coordenadas x e y (lnha e coluna respectvamente) juntamente com a varável z que representa a magntude da radânca refletda e/ou emtda dscretzada em contadores dgtas, pela correspondente porção no terreno. No caso de magens multspectras, a varável z aumenta sua dmensonaldade, assumndo a forma de um vetor, no qual cada componente está assocado a uma determnada faxa do espectro eletromagnétco em partcular. A representação gráfca ao longo dos dferentes ntervalos de comprmento de onda (bandas) pode ser entendda como uma aproxmação da curva de assnatura espectral do pxel, cada alvo em partcular apresenta uma curva própra de assnatura espectral.

9 9 Fgura 4- A técnca dos sensores hperspectras. Através da análse da assnatura espectral é possível dscrmnar do ponto de vsta espectral alvos dstntos, segundo o comportamento dos fenômenos de absortânca, reflectânca e transmtânca na nteração do alvo com a radação eletromagnétca. Do ponto de vsta estatístco podemos entender cada pxel em uma magem como sendo uma observação de uma determnada área localzada na superfíce terrestre. As radâncas meddas nas dferentes bandas do espectro eletromagnétco são entenddas como sendo as varáves aleatóras que foram observadas e mensuradas nas correspondentes áreas (pxels). Os sensores regstram a quantdade de fótons refletdos e emtdos por uma área na determnada faxa do espectro eletromagnétco que se refere à banda. Essas quantdades

10 10 expressam uma estmatva da radânca méda da área para a determnada faxa do espectro eletromagnétco. Temos que salentar que os valores observados pelos sensores devem ser nterpretados como uma estmatva da radânca verdadera, e não como a própra. Os valores observados pelos sensores são nfluencados por uma sére de fatores aleatóros como vento, umdade, tpo de solo, provocando assm uma dspersão nos valores assocados à pxels de uma mesma classe. Sendo assm, podemos evdencar que exstem componentes aleatóros assocados a esses valores, surgndo a necessdade da utlzação de uma abordagem estatístca na nterpretação e análse dessas magens. 1.3 Objetvos do Trabalho O nosso trabalho se encontra nserdo dentro de uma grande área denomnada reconhecmento de padrões em magens dgtas. Mas precsamente, estaremos utlzando técncas envolvdas na abordagem estatístca. Nosso problema prncpal é a classfcação de pxels em uma magem hperespectral. Iremos sugerr a utlzação de técncas e ferramentas da geoestatístca como um possível redutor da dmensonaldade de problemas quando não é possível a utlzação das técncas já exstentes ou quando estas não trazem resultados satsfatóros. O problema da redução da dmensonaldade dos dados pode ser abordado de duas formas dstntas: seleção de feções e extração de feções. No prmero caso é explorada a alta correlação exstente entre as bandas espectras e empregam-se crtéros que seleconam as bandas que mas contrbuem para a separabldade entre as classes. O segundo caso, mplementa métodos para combnação (lnear ou não) entre as bandas, crando desta forma componenetes sntétcas. Este processo permte então a utlzação de um número mas

11 11 reduzdo de varáves com perda mínma de nformação.o nosso trabalho estará nserdo dentro do segundo caso, extração de feções. Enumeraremos os prncpas objetvos do nosso trabalho através de uma sére de questões prelmnares: 1) É possível utlzar ferramentas da geoestatstca com o ntuto de reduzr a dmensonaldade em dados provenentes do sensor AVIRIS? 2) Os parâmetros obtdos através da modelagem de semvarogramas teórcos são efcazes para dscrmnar classes com comportamento espectral semelhantes? 3) Se os parâmetros do semvarograma calculados para cada pxel se mostrarem regdos por uma dstrbução conhecda, é possível utlzar algum classfcador já consagrado e obter resultados satsfatóros? 4) Qual modelo de semvarograma se ajusta melhor aos dados de contadores dgtas observados pelas bandas do sensor AVIRIS?

12 2. MÉTODOS EM RECONHECIMENTO DE PADRÕES 2.1 Tpologa em Reconhecmento de Padrões De forma geral, podemos entender o reconhecmento de padrões como um conjunto de técncas capazes de dentfcar e classfcar característcas em categoras a partr de nformações. Categoras podem ser entenddas como entdades ou padrões de nformações que apresentam smlardades (classes). Exstem dferentes tpos de abordagens em reconhecmento de padrões, segundo Jan et. al.,2000, os dferentes problemas envolvdos em reconhecmento de padrões podem ser classfcados em: Template Matchng; Abordagem Sntátca; Redes Neuras; Métodos que utlzam Lógca Nebulosa e Abordagem Estatístca. Este trabalho está compreenddo uncamente dentro da abordagem estatístca, mesmo assm optamos por defnr as outras abordagens e métodos de uma forma geral, explctando os dferentes tpos de problemas e de aplcações envolvdos em cada uma dessas outras abordagens Template Matchng A mas antga das abordagens em reconhecmento de padrões, e dessa forma também a mas smples. É baseado em modelos de protótpos que contenham os padrões a serem reconhecdos, dspõe-se de padrões que são submetdos a uma operação genérca, e então é medda a smlardade entre os padrões e os protótpos.

13 13 O padrão a ser reconhecdo é comparado contra um modelo armazenado, sendo consderado na smlardade qualquer tpo de varação possível na estrutura do padrão, seja de rotação, translação ou até dferença de escala e deformação. A medda de smlardade, normalmente relaconada à déa de correlação, deve ser otmzada com base no conjunto de trenamento. A maor desvantagem de template matchng está em seu alto custo computaconal. No caso do uso de templates rígdos, ocorrem falhas ao reconhecer padrões dstorcdos ou com grande varação ntra-classe. Os modelos de templates deformáves podem ser usados quando as deformações não podem ser modeladas dretamente Abordagem Sntátca Trata-se de uma abordagem em que os padrões são tratados sob uma perspectva herárquca, ou seja, um padrão é composto por sub-padrões mas smples, os quas também são compostos por outros mas smples. Os sub-padrões elementares são chamados de prmtvas, e um dado padrão complexo é representado em termos de nterrelações entre essas prmtvas. Uma analoga formal pode ser traçada com a sntaxe de uma lnguagem em que se pode ver os padrões como sentenças pertencentes a uma lnguagem, as prmtvas como seu alfabeto, e as sentenças são geradas de acordo com a respectva gramátca. A gramátca para cada classe de padrões deve ser nferda a partr dos exemplos de trenamento. Uma vantagem de reconhecmento estrutural de padrões está no fato de que, além de fazer a classfcação, essa abordagem também provém uma descrção de como os

14 14 padrões são gerados a partr de prmtvas que podem ser repetdas ou obedecerem determnadas ordens no snal. Um exemplo de modelo de classfcação sntátca dependente do contexto em que se observa uma ascensão recente é o de Hddem Markov Models (HMM). Trata-se de um processo estocástco fnto que é composto por uma cadea de observações, sto é, a seqüênca de vetores observados. Uma HMM consste de um número fnto de estados, e a cadea observada é produzda como o resultado de sucessvas transções de um estado para outro, cada transção ocorre com uma certa probabldade, que é determnada na fase de trenamento. O problema é que nem sempre dspomos de nformação sufcente sobre os estados e com sso surge dfculdade na determnação do número de estados a pror. Este tpo de abordagem é prncpalmente utlzado na área de reconhecmento de vozes, mas também tem aplcação mportante em reconhecmento de caracteres, e de eventos temporas em vídeo, como gestos e expressões. As desvantagens da abordagem sntátca estão na necessdade de, ncalmente, segmentar os padrões de ruídos para detectar prmtvas, e na nferênca de gramátca dos dados de trenamento, pos essa abordagem pode permtr um grande número de elementos combnatóros, das possbldades a serem nvestgadas, o que demandara um grande esforço computaconal Redes Neuras Segundo Campos (2001), uma rede neural artfcal pode ser entendda como um modelo de grafo orentado dsposto em uma rede em que os nós representam neurônos artfcas e as arestas orentadas são as conexões entre as entradas e saídas dos neurônos. Redes neuras podem ser vstos como máqunas paralelas com mutos processadores smples e mutas nterconexões.

15 15 As redes neuras podem ser hábes a aprender relações entre entradas e saídas complexas e não lneares. Dentre suas característcas, nclu-se a possbldade de usar procedmentos seqüencas de trenamento, e o poder de adaptação aos dados. Destacamos dentre as váras famílas de redes neuras, a feed-forward network, que nclu perceptron multcamadas e redes funções de bases radas (radal-bass functon - RBF). Essas redes são organzadas em camadas, possundo conexões undreconas entre uma camada e outra. Outra classe popular de redes é a dos mapas auto organzáves (self-organzng maps - SOM), ou redes de Kohonen, as quas são usadas prncpalmente para agrupamento de dados (clusterng) e em mapeamento de característcas. O processo de aprendzado envolve atualzação da arqutetura da rede e dos pesos das conexões, de forma que a rede possa efetuar tarefas específcas de classfcação e análse de agrupamentos (clusterng). A populardade de redes neuras cresceu devdo ao fato que, elas tem uma baxa dependênca a um específco domíno, de forma que o mesmo tpo de rede pode ser aplcado em város problemas, o que não ocorre com as abordagens baseadas em modelos ou em regras. Além dsso, exstem mutos algortmos efcentes de aprendzado com redes neuras. As redes neuras dsponblzam um novo conjunto de algortmos não lneares para extração de característcas (usando camadas esconddas) e classfcação (p. ex. mult-layer perceptrons). Além dsso, algortmos de extração de característcas podem ser mapeados em arquteturas de redes neuras para mplementação efcente em hardware. Apesar de possuírem aparentemente prncípos dferentes, a maora dos modelos de redes neuras são mplctamente equvalentes ou smlares a métodos clásscos de reconhecmento estatístco

16 16 de padrões. Entretanto, redes neuras oferecem váras vantagens, para extração e classfcação, e procedmentos flexíves para encontrar soluções não lneares Métodos que utlzam Lógca Nebulosa A lógca nebulosa fo crada com nspração no comportamento humano, que se basea na nterpretação do mundo sem precsão e na descrção desse por atrbutos lngüístcos. A partr de conjuntos não-nebulosos, é possível construr uma técnca de decsão objetva baseada em crtéros subjetvos que é aproprada para reproduzr decsões tomadas por ndvíduos nas mas extensas áreas da atvdade humana. A partr dos crtéros crsp é possível defnr crtéros de decsão em concetos como quente, fro, escuro, claro, etc. Esses são concetos subjetvos que estão relaconados a estados físcoambentas em que os sentdos humanos são capazes apenas de atrbur um valor qualtatvo. Estes conjuntos de técncas são popularmente conhecdos como fuzzyfcação. Através da determnação do grau de pertnênca de cada um desses elementos aos conjuntos são geradas funções de pertnênca que são baseadas na relação entre cada elemento e o(s) suporte(s) dos conjuntos. Essa relação pode ser, por exemplo, nversamente proporconal à dstânca entre os elementos e os suportes. Um suporte pode ser determnado, pelo centróde do conjunto de trenamento, entre outros. A classfcação em s utlzando lógca nebulosa normalmente é feta através de regras nebulosas e métodos de defuzzfcação. As regras nebulosas normalmente são regras de nferênca que utlzam delmtadores dos valores de pertnênca de cada padrão aos conjuntos. Uma maor explcação sobre a lógca fuzzy e suas númeras aplcações podem ser vstos em Dder (1997).

17 Abordagem Estatístca em Reconhecmento de Padrões Segundo Duda and Hart (1973), um sstema de reconhecmento estatístco de padrões pode ser composto bascamente pelas seguntes partes: um sstema de aqusção de dados (por exemplo: sensores ou câmeras); um sstema de pré-processamento, para elmnar ruídos ou dstorções; um extrator de característcas (ou atrbutos), que cra um vetor de característcas com dados extraídos dos objetos adqurdos, e um seletor de característcas, que analsa o conjunto e elmna as mas redundantes; além de um classfcador, que analsa um padrão obtdo para tomar uma certa decsão. Na abordagem estatístca, cada padrão é representado em termos de d feções (features) ou característcas, sendo vsto como um ponto em um espaço d-dmensonal. O objetvo é que tal espaço seja gerado de forma que suas característcas permtam que vetores de padrões pertencentes a categoras dferentes fquem dspostos de manera que o processo de classfcação seja smples. É desejável que estes vetores ocupem regões compactas e dsjuntas em um espaço de d dmensões. Cada padrão é uma observação obtda aleatoramente segundo uma certa probabldade condconal a uma determnada classe. Dado um conjunto de trenamento contendo amostras de todas as classes, o objetvo é estabelecer fronteras de decsão no espaço das característcas que separem os padrões de classes dferentes. Na teora de decsão estatístca, a frontera de decsão é determnada para cada classe, que pode ser especfcada (aprendzado supervsonado) ou aprendda (aprendzado não-supervsonado).

18 18 Nos métodos de classfcação supervsonada, o prmero passo acontece no sentdo de escolher a forma geral da função decsão, que pode ser da forma determnístca ou probablístca. Após o analsta especfcar as classes exstentes na magem são seleconadas amostras de trenamento representatvas de cada classe, que servrão para estmar os coefcentes dos parâmetros envolvdos na forma geral escolhda. Fukunaga (1990) destaca que no processo supervsonado, nem sempre se sabe exatamente o número de classes envolvdas em uma cena, daí a necessdade da utlzação do threshold, que permte a não classfcação de alguns pxels a nenhuma classe. Os métodos não-supervsonados são utlzados quando prevamente não temos nformação relevante e sufcente sobre a natureza do problema, seja a defnção do número de dferentes classes exstentes em uma magem, seja a localzação de amostras representatvas das classes. No processo não-supervsonado, anda exste a componente heurístca, entre outras determnações, o analsta precsa fornecer o número de classes exstentes (ex: K-Means) e outros parâmetros (ex: ISODATA). Nesse tpo de stuação como não podemos dentfcar amostras de trenamento, o classfcador ou algortmo tem a tarefa de dentfcar, por s só, as classes exstentes em uma magem, estes algortmos se baseam prncpalmente em uma técnca estatístca multvarada conhecda como análse de agrupamento (cluster analyss). Os métodos de classfcação em reconhecmento estatístco de padrões, também podem ser dvddos em dos grandes grupos: métodos paramétrcos e métodos nãoparamétrcos.

19 19 Os métodos paramétrcos exgem um determnado conhecmento à pror sobre a dstrbução subjacente dos dados das dferentes classes exstentes em uma magem. É necessáro conhecer de forma geral a dstrbução probablístca que melhor se ajusta aos dados em que se está trabalhando. A partr de amostras de trenamento são estmados os parâmetros do modelo para cada classe, e assm de posse da dstrbução supostamente conhecda e dos parâmetros estmados para cada classe, temos uma aproxmação da verdadera função dstrbução de probabldade que rege cada classe. Quando não temos conhecmento sobre a verdadera dstrbução dos dados e não podemos supor um modelo que represente bem aos mesmos, é mas prudente e razoável utlzarmos técncas estatístcas não paramétrcas, pos estas são robustas e, portanto não necesstam de premssas a cerca da verdadera dstrbução de dados, podendo ser utlzadas para dferentes tpos de dstrbuções de forma ndscrmnada. Por exemplo, método de Parzen e método dos k-vznhos mas próxmos. Na abordagem estatístca em reconhecmento de padrões exste um conjunto de técncas de classfcação já consagradas, que podem ser utlzadas conforme a stuação do problema de pesqusa. Para técncas de classfcação supervsonada com métodos paramétrcos podemos destacar a grande mportânca do classfcador Bayesano que apresenta soluções ótmas em mutos casos. A estratéga deste classfcador é que supor que são conhecdas as dstrbuções dentro de cada classe p(x/w) e que dspomos de nformação sobre a probabldade a pror de cada classe.com base nesses conhecmentos é possível utlzar o teorema de Bayes para estabelecer a probabldade à posteror de um certo padrão x pertencer a classe W.

20 20 P( w ). P( x / w ) Teorema de Bayes P( w / x), j (1, K) K P( w ). P( x / w ) j1 j j Onde, P ( w ) é a probabldade a pror de um padrão pertencer a classe w ; P ( x / w ) é a função densdade de probabldade da classe w ; P( w / x) é a probabldade a posteror do padrão x pertencer a classe w e K é o número de classes dstntas. Os classfcadores supervsonados nos métodos paramétrcos utlzam amostras de trenamento, que são regões seleconadas, onde já são conhecdas as verdaderas classes a que pertencem os pxels da determnada regão. A partr das amostras de trenamento de cada classe são estmados os parâmetros de posção e de varabldade para cada uma das classes, no espaço de feções. Com base nesses parâmetros (vetor méda e matrz de covarâncas) além da suposção de os dados serem regdos pela dstrbução gaussana, é possível estmar a função dstrbução de probabldade subjacente ou populaconal de cada classe da seleconada. A partr da função dstrbução de probabldade observada na amostra para cada classe, é perfetamente possível estabelecer uma sére de fronteras de decsões entre cada classe, prvlegando a classfcação de cada novo pxel naquela classe onde a função de verossmlhança for maxmzada. Quanto maor for a quantdade de atrbutos (número de varáves, no caso de magens dgtas, as bandas) meddos e contdos em cada padrão, maor será a dmensonaldade do problema e, por consegunte o número de parâmetros a serem

21 21 estmados. Os parâmetros a serem estmados na matrz de covarâncas se tornam o maor problema quando trabalhamos com problemas de alta dmensonaldade, sendo necessáro então uma grande quantdade de amostras de trenamento. Esse se torna um dos maores problemas no uso de técncas estatístcas paramétrcas tanto em reconhecmento de padrões como em qualquer outra área de conhecmento em que se faça necessára a utlzação da estatístca nferencal, pos em mutos casos exste uma dfculdade muto grande de dspomos de um tamanho de amostra sufcente grande e representatva para obtermos estmatvas confáves para um grande número de parâmetros envolvdos no trabalho, sendo necessára à busca de uma smplfcação do conjunto de dados a partr de uma dmnução na dmensonaldade do problema. É verdadero dzer que a alta dmensonaldade dos dados em mutos casos se torna smultaneamente tanto em benefco quanto em problema. Essa matéra tem sdo objeto de mutas pesqusas por parte da comundade centfca nternaconal, com o ntuto de mnmzar os problemas relaconados e decorrentes do grande número de parâmetros a serem estmados quando dspomos de dados de alta dmensonaldade. Cabe ressaltar que o aumento da dmensonaldade dos dados resulta em melhora no entendmento do problema e esperamos, por consegunte, uma melhora nos ndcadores de acuráca do classfcador, porém sto não ocorre de forma lnear e crescente, sempre exste um determnado ponto, onde o aumento da dmensonaldade já não traz mas ganho de nformação e sm um confundmento devdo ao crescente aumento de parâmetros a serem estmados a medda que aumenta o número de varáves assocadas em

22 22 um estudo, resultando numa dmnução na acuráca do classfcador. Esse efeto é conhecdo como fenômeno de Hughes ou maldção da dmensonaldade. A dmnução da dmensonaldade se torna em recurso únco mutas vezes. É necessáro sabermos que sempre que necesstamos reduzr a dmensonaldade de um problema, estamos por certo perdendo nformação, o que devemos nos preocupar é que essa "perda" seja mínma. Ao seleconamos apenas um conjunto de atrbutos de uma totaldade, devemos optar sempre por aqueles que explquem e mantenham quase toda a varabldade do conjunto de dados orgnal, ou seja, é desejável que os dados resultantes de uma smplfcação devdo a algum procedmento de dmnução da dmensonaldade sejam representatvos e fés ao conjunto de dados orgnal. Uma técnca estatístca muto utlzada com o ntuto de reduzr a dmensonaldade de problemas é a ACP (Análse de Componentes Prncpas) que é reconhecda e utlzada nas mas dversas áreas do conhecmento, esta técnca trabalha com a ortogonalzação do conjunto de dados, crando componentes que preservam muto da varabldade do conjunto de dados orgnal já nas prmeras componentes, obtendo-se um ganho extremamente precoso com a redução da dmensonaldade sem que haja perda sgnfcatva de nformação com essa redução. Mas adante, será melhor explcada a técnca de Análse de Componentes Prncpas, seus fundamentos e os prncpas problemas verfcados na utlzação desta em reconhecmento de padrões em magens dgtas.

23 23 Os objetvos do nosso trabalho se referem ao problema da redução da dmensonaldade e busca evdencar novas formas de redução. As magens do sensor AVIRIS apresentam 224 bandas, e neste caso é nevtável buscarmos uma forma de redução na dmensonaldade do problema, devdo à dfculdade em estmar os dos prmeros momentos (vetor méda e matrz de varâncas e covarâncas), prncpalmente pelo fato do segundo momento apresentar um número muto grande de parâmetros assocados. Com sso surge a necessdade de buscarmos métodos capazes de reduzr a quantdade de parâmetros a serem estmados. Nosso trabalho pretende sugerr uma técnca envolvendo modelos teórcos de semvarogarama que descreva as característcas correlaconas da sére de bandas das determnadas classes exstentes na magem. A partr da função correlaconal será possível reduzr o número de varáves e ao mesmo tempo o número de parâmetros a serem estmados nos dos prmeros momentos a partr do conjunto de dados. Podemos dzer que objetvo prncpal do trabalho é averguar se tal técnca proposta é capaz de trazer resultados satsfatóros na classfcação de padrões, quando trabalhamos com dados do sensor AVIRIS e seleconamos classes dstntas na magem, mas com comportamento espectras semelhantes. Mas adante detalharemos a metodologa proposta e o conjunto de dferentes técncas e áreas do conhecmento envolvdas neste trabalho. 2.3 Análse de Componentes Prncpas como Redutor de Dmensonaldade A análse de componentes prncpas PCA (do nglês Prncpal Component Analyss), é um método capaz de decompor uma matrz de dados X de posto r como uma

24 24 soma de matrzes de posto gual a um, onde o posto é o número que expressa a dmensão de uma matrz. O procedmento consste na ortogonalzação da matrz de dados orgnal, tendo partda na matrz de varâncas e covarâncas ou na matrz de correlação. Quando as varáves do conjunto de dados não são mensuradas sob uma mesma undade de medda é recomendável utlzarmos somente a matrz de correlação para extração das componentes prncpas. Com a ortogonalzação da matrz de dados orgnas, estamos crando novas varáves que são chamadas de componentes que não apresentam correlação entre s. Teorcamente o número de Componentes é sempre gual ao número de varáves orgnas, Entretanto um número mas restrto de componentes é responsável por grande parte da explcação total. Os componentes são extraídos na ordem do mas explcatvo para o menos explcatvo, sendo que o prmero componente explca o máxmo possível da varação do conjunto de dados orgnal, e cada sucessvo componente explca o máxmo possível da varação restante não explcada pelos componentes anterores. Os componentes prncpas são entenddos como combnações lneares das varáves do conjunto de dados orgnal. As projeções da amostra na dreção da componente prncpal são conhecdas como scores.

25 25 Os autovetores são os coefcentes de cada um dos componentes prncpas (funções lneares) e os autovalores representam a quantdade da varânca que é explcada pelas respectvas componentes prncpas. A análse de componentes prncpas pode ser resumda na segunte equação matrcal: L V' V Onde é a matrz de covarâncas também podera ser a matrz de correlação, V é a matrz dos autovetores (egenvectors) e L a matrz dos autovalores (egenvalues). Os autovalores são as raízes não-magnáras da equação polnomal defnda por I 0, onde é o autovalor e I é uma matrz dentdade. Seja o conjunto de dados X [ X, X,..., X ] com uma matrz de varâncas e ' 1 2 p covarâncas,sendo 1, 2,..., p os autovalores dessa matrz, com,..., p Como os componentes prncpas nada mas são do que combnações lneares das varáves do conjunto de dados orgnal, podemos representa-las da segunte forma, segundo a notação utlzada por Johnson and Wchern (1982).

26 26 Y1 l' 1 X l11x 1 l12 X 2... l1p X p Y2 l' 2 X l21x 1 l22 X 2... l2 p X p... Y p l... l ' p X l p1 X 1 l p2 X 2 pp X p Sendo assm, Var ( Y ) l' l, para =1,2,..p Cov ( Y, Y ) l' l, para k k k Como é desejável maxmzar Var Y ), chegamos a uma ndetermnação, pos ( 1 quanto maor for l1 maor será Var ( Y1 ), portanto é necessáro mpor a restrção l ' 1 l1 =1, fazendo com que os autovetores sejam úncos e normalzados. Então surge que: Var( Y ) l 1 2 l' 1 1, sendo que ' 1 l1 Var( Y ) l l =1 l' 2 2, sendo que ' 2 l2 l =1 C ov( Y1, Y2 ) Cov( l' 1 X, l' 2 X) 0 Os autovalores possuem as seguntes propredades: p tr( ), para =1,2,..,p 1 p p

27 27 Ou seja, o traço da matrz de covarâncas, que é a soma da dagonal prncpal é gual a soma dos autovalores, assm como o determnante da matrz é gual ao produtóro dos autovalores. Para encontrarmos os autovetores correspondentes a cada autovalor, será necessára a resolução da segunte equação matrcal: a a, onde a é o autovetor normalzado Seja a, a a a ,..., 1p o autovetor assocado ao 1º autovalor, então a 1ª componente prncpal será dada pela segunte combnação lnear: Y1 a11x 1 a12 X 2... a1p X p O resultado da combnação lnear Y 1 para o conjunto total da amostra é conhecdo como os scores da 1ª componente prncpal, o resultado da combnação Y 2, que utlza como coefcentes o autovetor assocado ao 2º autovalor é conhecdo como scores da 2ª componente prncpal. A proporção da varabldade explcada por cada componente prncpal em relação ao conjunto orgnal de dados, é dado pela segunte forma: Varabld ade explcada pela 1ª componente n 1 1

28 28 Varabld ade explcada k - esma componente até a k 1 n 1 Como dto anterormente, a Análse de Componentes Prncpas tem o objetvo de dmnur a dmensonaldade dos problemas sem que haja perda sgnfcatva de nformação em relação ao conjunto de dados orgnal. A Análse de Componentes Prncpas não envolve suposções a cerca da dstrbução dos dados, ou seja, não se basea em premssas acerca do conjunto de dados, mas as propredades de normaldade multvarada e lneardade podem contrbur para um melhor resultado nesse tpo de análse. Quasquer fatores que afetem negatvamente coefcentes de correlação como outlers e tamanho pequeno de amostra são ndesejáves, uma vez que a ACP se basea em mutas vezes na matrz de correlação. Quando possuímos número pequeno de amostras é possível anda assm utlzarmos uma técnca estatístca de smulação denomnada de bootstrap. A déa básca desta smulação é consderar a amostra de tamanho n dsponível como sendo toda a população exstente. A partr dsso selecona-se K amostras de tamanho n (tamanho orgnal da amostra), porém utlzando amostragem com reposção. Para um número K consderavelmente grande de smulações realzadas, será possível efetuar testes de hpóteses e até mesmo construr ntervalos de confança, mesmo contando com um número reduzdo de amostras. A análse de componentes prncpas é uma técnca consagrada dentro da estatístca multvarada, em mutos casos ela traz resultados muto satsfatóros com o uso de poucas

29 29 componentes. No entanto sabe-se que a ACP deve ser realzada sob todo o conjunto de dados. Em reconhecmento de padrões de magens dgtas sso não é desejável, e nem sempre trará resultados satsfatóros, por dos motvos: 1) O custo computaconal é muto alto, a ortogonalzação do conjunto de dados consderando o grande número de pxels exstentes em uma magem ntera pode ser problemátca. 2) A técnca sendo aplcada a todos os pxels de uma magem, necessaramente não leva em conta a nformação sobre a verdadera classe que pertence os pxels. Dferenças entre classes observáves no conjunto de dados orgnal poderam ser pulverzadas em dferentes componentes da ACP, dfcultando a correta classfcação. Em um captulo posteror ctaremos outros problemas que podem surgr quando utlzamos a técnca de análse de componentes prncpas em dados de magens dgtas, quando temos o ntuto de dmnur dmensonaldade para realzarmos posterormente uma classfcação através da abordagem estatístca em reconhecmento de padrões. Como ctamos anterormente, ressaltamos que o prncpal objetvo desse trabalho é propor uma metodologa para a redução de dmensonaldade nos dados do sensor AVIRIS, de uma forma alternatva a Análse de Componentes Prncpas, que é a técnca mas utlzada quando se necessta reduzr dmensonaldade. Para tanto utlzaremos técncas de geoestatístca, mas precsamente dos modelos teórcos de semvarograma, com o ntuto de aprmorar uma técnca de extração de parâmetros através dos modelos teórcos de semvarograma e desejamos que os parâmetros obtdos sejam efcazes como dscrmnador de classes dstntas quando posterormente utlzarmos estes parâmetros para classfcação,

30 30 utlzando classfcadores tradconas já consagrados em reconhecmento estatístco de padrões. 2.4 Classfcadores na Abordagem Estatístca Na abordagem estatístca, a classfcação é feta através de partções do espaço de feções, com a cração de volumes de espaços conhecdos como regões de decsão. Todos os vetores de característcas stuados no nteror de uma mesma regão de decsão são classfcados e atrbuídos a uma mesma categora. Na maora dos casos essas regões de decsão são conexas, ou seja, contíguas, mas dependo das dstrbuções subjacentes de cada categora, essas regões podem ser caracterzadas por soma de duas regões não conexas. 1,4 R1 1,2 R2 1 R3 0,8 0,6 0,4 W1 W2 W3 0,2 0 0,00 1,00 2,00 3,00 4,00 5,00 6,00 Fgura 5 Dstrbução subjacente de 3 classes dstntas Exemplo undmensonal de regões de decsão conexas.

31 31 Fgura 6 Exemplo smulado de 3 classes normalmente dstrbuídas. Fgura 7 Regões de decsão para o exemplo das 3 classes normalmente dstrbuídas A qualdade de um classfcador pode ser medda através de sua acuráca, que é nterpretada como sendo a probabldade de um padrão qualquer ser classfcado

32 32 corretamente, sso quando conhecemos a verdade de cada padrão. Devemos sempre persegur a maxmzação da probabldade de acerto, e por conseqüênca a mnmzação da probabldade de erro. Normalmente não se utlza o total de pxels conhecdos de cada classe na amostra de trenamento, é necessáro desgnar metade deles para campo de teste. Estes pxels serão utlzados para verfcar a acuráca do classfcador, após serem conhecdos os parâmetros de cada classe obtdos através da amostra de trenamento. O percentual de acerto total verfcado no campo de teste é uma estmatva para acuráca que se atngrá no conjunto total de dados de uma magem. Quanto mas próxmas forem as classes dstntas de um determnado estudo quanto às característcas estudadas, mas dfícl será tarefa de atngr um nível alto de classfcação correta. Podemos dzer que a smlardade das classes é o prncpal fator no confundmento ou erro de classfcação, é ele que estabelece o patamar da probabldade de erro na classfcação. Com o ntuto de otmzar o conjunto de feções para mnmzar a probabldade de erro de um classfcador qualquer, é desejável maxmzar a dstânca entre os padrões de dferentes classes no espaço de feções. É possível com base em amostras de trenamento de váras classes, estmar a dstânca entre estas dstntas classes. Exstem dferentes tpos e formas de medr as dstâncas entre classes, dentre elas podemos destacar: Dstânca de Mahalanobs; Dstânca de Bhattacharyya; Dstânca entre vznhos mas próxmos; Dstânca entre os centros.

33 Análse de Dados Espacas (Estatístca Espacal) Mutos dos recentes desenvolvmentos metodológcos da estatístca, e conseqüentemente do ensno da Estatístca tem sdo nfluencados pelos avanços na área computaconal e pelo uso de pacotes computaconas nteratvos, os quas permtem, além de análses de dados rotneras, a utlzação de gráfcos cratvos, smulações e transformação de dados de forma fácl e rápda. Ambentes computaconas, gráfcos, dnâmcos e avanços nas áreas de mapeamento dgtal, cartografa computaconal e Sstema de Informações Geográfcas (Geographcal Informaton System-GIS), potencalzam desenvolvmentos paralelos de ambentes computaconas, permtndo vsualzar dados espacas, explorar padrões espacas e relações entre fenômenos de forma nteratva. Análse de Dados Espacas ou Estatístca Espacal pode ser entenddo como smplesmente uma aplcação dentro das mutas análses que podem ser desenvolvdas, em relação ao espaço, e que tem por objetvo a vsualzação e exploração através de mapas mostrando fenômenos no espaço. A análse de Dados Espacas tem também como objetvo a detecção e reconhecmento de padrões de uma forma mas sofstcada a modelagem dos dados, também em relação ao espaço e em certos casos em relação ao tempo. Segundo a defnção dada por Baley e Gatrell (1995), Análse de Dados Espacas trata das análses onde dados observáves são obtdos a partr de algum processo operando no espaço e para os quas utlzam-se métodos para descrever ou explcar o comportamento deste processo e sua possível relação com outros fenômenos espacas. Desta forma o objetvo da Análse de Dados Espacas é aumentar a compreensão básca do processo, buscar evdêncas em relação às hpóteses estabelecdas ou anda predzer valores em áreas onde as observações não foram fetas.

34 34 Exstem dferentes classes de problemas espacas e tpos de dados espacas. A Análse de Dados Espacas é dvdda em quatro grandes subconjuntos: Análse de Padrões de Pontos, Análse de Dados no Espaço Contínuo, Análse de Dados de Área e Análse de Dados de Interação Espacal. Explcaremos brevemente as dferenças entres estes tópcos e os tpos de problemas a que estão relaconados. Análse de Padrões de Pontos refere-se a pontos dscretos no espaço, onde foram observados a ocorrênca de eventos e o objetvo é, em geral, ver se exste uma nteração espaço-tempo entre os fenômenos ou se eles ocorrem de forma unforme e aleatóra em relação ao espaço. A classe de exemplos aqu trabalhada envolve, por exemplo, a ocorrênca de uma determnada doença rara em determnada regão. Neste exemplo, verfcamos se os casos da doença ocorreram de forma aleatóra em relação ao espaço e tempo ou se há uma dependênca nos eventos conforme a proxmdade de locas no espaço ou no tempo. Análse de Dados no Espaço Contínuo refere-se a pontos fxos como no caso de padrões de ponto, porém o problema é entender como o processo vara no espaço através dos pontos estudados e fazer predções para os demas pontos não estudados, esta parte da estatístca espacal é também conhecda como Geoestatístca. Um exemplo de fácl compreensão sera relaconado ao meo ambente, como o estudo de polução do ar. Sabemos que a cada ponto no espaço contínuo do ar, há uma taxa de polução assocada, no caso montoramos alguns pontos e os resultados seram generalzados para os demas pontos onde não foram coletadas nformações. Este tópco da análse de dados espacas concentra a maor parcela de estudos na análse de dados espacas, além dsso é a abordagem mas antga e portanto a mas conhecda, os estudos utlzando técncas nessa

35 35 abordagem são números, onde podemos destacar, sem dúvda a mportânca das áreas da Geologa e Agronoma. Análse de Dados de Área tem como undade de pesqusa áreas fxas, normalmente dvddas segundo lmtes geográfcos e polítcos, tas como países, estados e muncípos, ou até mesmo, regões regulares como quadrados chamados de lattce ou pxels, utlzados em processamento de magens de satélte e sensoramento remoto. Os objetvos prncpas são examnar padrões nos atrbutos estudados em relação ao espaço, assm como verfcação de relações entre as varáves estudadas. Problemas envolvendo Dados de Interação Espacal tratam de dados sobre fluxos que lgam um conjunto de localzações que podem ser pontos ou áreas e o objetvo é compreender o padrão de fluxos, construr modelos de tas fluxos e anda, se possível, usar esta nformação para fazer predções sobre como fluxos podem mudar sob certos cenáros. Exemplos destes tpos de dados são os seguntes: fluxos de pessoas, bens ou servços entre orgens e destnos. Nestes exemplos o objetvo é modelar o padrão de fluxos em termos da acessbldade geográfca dos destnos em relação às orgens e em termos da demanda das orgens e da atratvdade dos destnos. Tas análses são relevantes, em estudos de servços de saúde, planejamento de centros comercas, planejamento de transporte, entre outros Geoestatístca (Análse de Dados no Espaço Contínuo) A varabldade espacal de característcas do solo vem sendo uma das preocupações de pesqusadores pratcamente desde o níco do século. Smth (1910) estudou a dsposção de parcelas no campo em expermentos de rendmento de varedades

36 36 de mlho. Montgomery (1913), preocupado com o efeto do ntrogêno no rendmento do trgo, fez um expermento em mas de 200 parcelas, medndo o rendmento dos grãos. Os procedmentos usados nestes trabalhos baseavam-se smplesmente na estatístca clássca e utlzavam grandes quantdades de dados amostras, vsando caracterzar a dstrbução espacal das determnadas característcas em estudo, utlzando parâmetros como méda e desvo padrão para representar um fenômeno e se baseando na hpótese de que as varações de um determnado local para outro são aleatóras. Krge (1951), desenvolveu um estudo com dados de concentração de ouro e concluu que somente a nformação dada pela varânca sera nsufcente para explcar o fenômeno em estudo. Surgu então a necessdade de levar em consderação a dstânca entre as observações realzadas no estudo. A partr daí surge o conceto da geoestatístca, que leva em consderação a localzação geográfca e a dependênca espacal. Um conceto muto mportante desenvolvdo na geoestatístca, sem dúvda é o conceto de varáves regonalzadas que foram estudadas e desenvolvdas por Matheron a partr de observações de Krge. Segundo Blas e Carler (1968), uma varável regonalzada é uma função numérca com dstrbução espacal aparentemente contínua, mas cujas varações não podem ser representadas por uma função matemátca smples. A teora das varáves regonalzadas pressupõe que a varação de uma característca medda ao longo de uma regão é expressa de forma adtva por três componentes:

37 37 1) componente estrutural: assocada a um valor médo constante ou a uma tendênca constante ao longo da regão. 2) Componente aleatóra espacal: Os valores de determnada característca estão correlaconados com a posção espacal na regão. 3) Erro resdual: componente aleatóra resdual, que não pode ser explcada pelo modelo. Se x representa uma posção em uma, duas ou três dmensões, então o valor da varável Z, em x, é dada por (Burrough, 1987): onde: Z(x) = m(x) + (x) + m(x) é uma função determnístca que descreve a componente estrutural de Z em x; (x) é um termo estocástco, que vara localmente e depende espacalmente de m(x); é um ruído aleatóro não correlaconado, com dstrbução normal de méda zero e varânca Krgeagem Podemos defnr krgeagem como uma técnca de estmação por nterpolação que permte estmar valores em locas onde observações não foram extraídas, a estmação é realzada com base no conjunto de pontos onde os atrbutos foram meddos. Dferente dos métodos convenconas de estmação, a krgeagem está fundamentada na teora das varáves regonalzadas. O prmero passo na krgeagem é defnr uma função aproprada para a componente determnístca m(x). Para tanto, algumas hpóteses são

38 38 necessáras, dentre elas podemos destacar a chamada estaconardade de 2ª ordem que se basea em duas condções (Burrough, 1987 e Davd, 1977): A componente determnístca m(x) é constante, não há tendênca na regão. A varânca das dferenças entre duas amostras depende somente da dstânca h entre elas, ou seja : Var[Z(x) - Z(x+h)] = E{[Z(x)-Z(x+h)] 2 } = 2 (h) Onde: E é o operador esperança matemátca; Var é o operador varânca; -varânca. O termo krgeagem é dervado do nome Danel G. Krge, que fo o ponero a ntroduzr o uso de médas móves para evtar a superestmação sstemátca de reservas de mneração (Delfner e Delhomme, 1975). Incalmente, o método de krgeagem fo desenvolvdo para soluconar problemas de mapeamentos geológcos, mas seu uso expandu-se com sucesso no mapeamento de solos (Burgess e Webster, 1980), mapeamento hdrológco (Ktands e Vomvors, 1983), mapeamento atmosférco (Lajaune, 1984) e outros campos correlatos. A dferença entre a krgeagem e os outros métodos de nterpolação são as maneras como os pesos são atrbuídos às dferentes amostras. No caso de nterpolação lnear smples, por exemplo, os pesos são todos guas a 1/N ; na nterpolação baseada no nverso do quadrado das dstâncas, os pesos são defndos como o nverso do quadrado da

39 39 dstânca que separa o valor nterpolado dos valores observados. Na krgeagem, o procedmento é semelhante ao de nterpolação por méda móvel ponderada, exceto que aqu os pesos são determnados a partr de uma análse espacal, baseada no semvarograma expermental que leva em conta a dstânca dos pontos observados, do ponto a ser nterpolado. Além dsso, a krgeagem fornece, em méda, estmatvas não tendencosas e com varânca mínma Semvarograma e Varograma Ferramentas da Krgeagem O semvarograma ((h)) é uma função utlzada para determnar os pesos que cada amostra coletada na regão terá na estmação dos demas pontos onde não foram coletadas nformações. De forma ntutva podemos magnar que pontos que se encontrem mas próxmos dos pontos a serem estmados possuam um peso maor do que amostras mas espaçadas do ponto que se deseja estmar. Varograma (2(h)) é uma função equvalente ao semvarograma, e portanto também é uma ferramenta básca de suporte as técncas de Krgeagem, que permte representar quanttatvamente a varação de um fenômeno regonalzado no espaço (Hujbregts, 1975). A função do varograma é medr o nível de dependênca da varável atrbuto a partr de mensurações realzadas em pontos num determnado espaço. Um exemplo de fácl entendmento do uso das técncas de krgeagem sera medr o teor de znco no solo em alguns pontos espalhados na regão de nteresse. Com a utlzação do varograma sera possível medr a varabldade do teor de znco na regão de estudo, e a

40 40 partr dsso construr um modelo capaz de estmar o valor esperado do teor de znco em qualquer ponto da regão de estudo onde não foram coletadas nformações. O varograma ( 2 ( h) ) pode ser defndo como a esperança matemátca do quadrado da dferença entre os valores de pontos no espaço separados pelo vetor h. Z ( x) Z( x ) 2 2 ( h) E h Através de uma amostra x,..., 1, x2 xn, o varograma pode ser estmado da segunte forma: 2 ˆ( h) N 1 ( h) N ( h) Z ( x ) Z( x h) 1 2 Onde: N(h)= nº de pares de amostras separados por um vetor de dstânca h. Z( x ) e Z( x h) são os valores observados da varável atrbuto meddos nos pontos x e x h, separados pelo vetor h. A medda de dependênca espacal mas conhecda e utlzada é o semvarograma ( ( h) ), que é equvalente ao varograma e pode ser estmado por: ˆ( h) 1 2N( h) N ( h) Z ( x ) Z( x h) 1 2

41 Norte 41 A fórmula acma possblta o cálculo do semvarograma expermental para um conjunto de dferentes vetores h. A dstânca h que separa espacalmente as observações também é conhecda como lag. Calculando os semvarogramas para dferentes dreções, será possível avalar a estrutura do comportamento dos dados em estudo, verfcando a forma de comportamento da varabldade que pode ser estrutura sotrópca ou ansotrópca. Isotropa A dependênca espacal na varável atrbuto é consderada gual para todas as dreções. Ansotropa A dependênca espacal na varável atrbuto é dferente para as dversas dreções espacas em que se calcula o semvarograma. Ou seja, a varável medda em determnados pontos apresenta uma estrutura de varabldade dferente conforme a dreção que é pré-determnada. Exemplo: Consdere duas varáves regonalzadas X e Y em uma Regão R, sendo X leste, e Y norte Leste R Fgura 8 Representação espacal das coordenadas x e y. Os valores ndcam as coordenadas na regão dos pontos onde foram coletadas nformações, sobre uma determnada varável atrbuto.

42 42 Consderando o semvarograma para a dreção de 90º, os pares utlzados para o cálculo serão: Lag1 [(00,10);(10,20);(20,30);(30,40);(40,50);(01,11) ;(11,21);...;(43,53)] Lag2 [(00,20);(10,30);(20,40);(30,50);(01,21);(11,31);...;(33,53)] Lag3 [(00,30);(10,40);(20,50);(01,31);(11,41);...;(23,53)] Lag4 [(00,40);(10,50);(01,41);(11,51);...;(13,53)] Lag5 [(00,50);(01,51);...;(03,53)] Para a dreção de 0º, os pares serão: Lag1 [(00,01);(01,02);(02,03);(10,11);(11,12);...;(52,53)] Lag2 [(00,02);(01,03);(10,12);(11,13);...;(51,53)] Lag3 [(00,03);(10,13);...;(50,53)] Prncpas Modelos Teórcos e Forma Geral do Semvarograma O padrão normal de um semvarograma, se apresenta de forma ntutva ao que esperamos de dados de campo, sto é, normalmente as observações mas próxmas geografcamente, apresentam comportamento mas semelhantes entre s do que observações separadas por undades de dstâncas maores. Portanto esperamos valores pequenos para (h), quando h é pequeno, e um acréscmo em (h) a medda que h cresce. Exstem dferentes modelos de semvarogramas que podem ser utlzados convenentemente, conforme o melhor ajuste aos valores observados no semvarograma expermental. Os prncpas modelos são o exponencal, o lnear, o gaussano e o esférco;

43 43 a forma desses modelos assm como os parâmetros envolvdos em cada um deles poderão ser observados na fgura 9. A nterpretação prátca dos parâmetros envolvdos no semvarograma pode ser feta da segunte forma: Range - Alcance (a): Dstânca dentro da qual as amostras apresentam-se correlaconadas espacalmente. Nugget Efeto Pepta (C 0 ): Por defnção ( 0) 0. Entretanto a medda que h tende a zero, (h) se aproxma de um valor postvo, esse valor revela a descontnudade do semvarograma para dstâncas menores do que a menor dstânca entre as amostras. Structural Varance - Contrbução (C): é a dferença entre o patamar e o efeto pepta. Sll Patamar (C 0 +C): Valor do semvarograma correspondente ao seu alcance Fgura 9- Prncpas modelos de semvarogarama, com respectvos parâmetros. 1. Modelo Exponencal ( h ) C0 C[1- exp(-h/a)]

44 44 2. Modelo Esférco (h) C0 C[1.5(h/a) - 0.5(h/a)^3] para h a (h) C0 C para h a 3.Modelo Gaussano (h) C 0 C[1- exp(-h 2 /A 2 )] 4.Modelo Lnear (h) C 0 [h(c/a)] Exstem outros modelos de semvarogramas menos utlzados, assm como outros mas complexos, que normalmente são combnações de dos modelos smples, nosso trabalho não pretende se estender a esses modelos mas sofstcados.

45 3. METODOLOGIA PROPOSTA Nesta altura do trabalho podemos evdencar a quantdade de dferentes áreas do conhecmento que estão desencadeadas neste trabalho. Nesta seção temos a ntenção de evdencar o trabalho como um todo, assm como ctar as dferentes técncas e metodologas envolvdas conjuntamente nesse trabalho. 3.1 Posconamento do trabalho quanto às dversas áreas do conhecmento Em sensoramento remoto, que se basea na obtenção de nformação sobre alvos sem que seja necessáro o contato físco, nosso trabalho se encontra dentro de uma área chamada reconhecmento de padrões. A aplcação de reconhecmento de padrões não é uncamente desenvolvda para sensoramento remoto, e sm também para outros tpos de problemas onde não estão envolvdas magens de satélte. Exstem dferentes tpos de abordagem em reconhecmento de padrões, o nosso trabalho está localzado smplesmente dentro da abordagem estatístca. Dentro da abordagem estatístca em reconhecmento de padrões exstem os classfcadores supervsonados e os não supervsonados, além dessa subdvsão nos classfcadores, anda podemos dvd-los nos que utlzam métodos paramétrcos e nos que utlzam métodos não-paramétrcos. Nosso trabalho pretende sugerr um novo processo

46 46 para redução da dmensonaldade dos dados, para posteror utlzação de classfcadores supervsonados tradconas e consagrados. A abordagem estatístca em reconhecmento de padrões utlza mutos precetos da análse estatístca multvarada, que concentra uma grande sorte de técncas dferentes que podem ser utlzadas apropradamente conforme o tpo de problema de pesqusa. A análse estatístca multvarada, como o própro nome sugere, fo desenvolvda para ser utlzada em problemas onde possuímos mas de duas varáves. Em reconhecmento de padrões, exstem gamas de trabalhos que apontam dfculdades de se consegur uma classfcação satsfatóra devdo a dfculdade de se estmar os componentes da matrz de covarâncas, prncpalmente por falta de amostra. Este problema resulta na necessdade de se buscar uma forma de reduzr a dmensonaldade do problema. É muto provável que nenhum estudo até hoje tenha sdo efetuado utlzando técncas de análse de dados espacas como a geoestatístca e mas precsamente com modelos de semvarograma para reduzr a dmensonaldade de dados, sendo assm consderamos que o nosso trabalho surge como uma alternatva novadora na busca de uma nova forma de se reduzr dmensonaldades. 3.2 Problemas na Utlzação de Dados com Alta Dmensonaldade A alta dmensonaldade de dados é um problema muto comum em mutas áreas do conhecmento que utlzam a estatístca multvarada. É verdadero dzer que quanto maor for o número de varáves (maor dmensonaldade), maor terá que ser a amostra para que se possa estmar os parâmetros envolvdos com determnada confança nas estmatvas. Quando não se tem amostra sufcente para estmar tantos parâmetros de forma confável, surge a necessdade de dmnurmos a dmensonaldade do problema. A Análse de Componentes Prncpas é uma técnca capaz de dmnur a dmensonaldade do

47 47 problema, preservando muto da varabldade do conjunto de dados, sem que haja perda sgnfcatva na varabldade do conjunto de dados. O procedmento na análse de componentes prncpas se basea na ortogonalzação da matrz de dados orgnas a partr da matrz de covarâncas ou de correlação, assm como a cração de componentes (novas varáves) em número menor do que as varáves orgnas. A análse de componentes prncpas permte também quantfcar o percentual de perda na nformação com a dmnução de dmensonaldade adotada. A Análse de Componentes Prncpas traz resultados muto satsfatóros em mutos casos, é muto comum consegur uma grande dmnução na dmensonaldade e mesmo assm preservar quase a totaldade da varabldade do conjunto de dados orgnal. Em reconhecmento de padrões na abordagem estatístca se utlza a técnca de análse de componentes prncpas para a dmnução da dmensonaldade, exstem até softwares comercas com esta técnca já mplementada. O prncpal problema observado nessa técnca quando se utlza em reconhecmento de padrões é que a ACP tem que ser realzada sobre o total dos dados, não sendo possível ela ser realzada para cada classe separadamente. Além dsso, a ACP tem o ntuto de crar componentes através dos autovalores no sentdo da maor explcação aos dados, sso nem sempre será razoável para dscrmnar classes dstntas em reconhecmento de padrões. Esta stuação pode ser faclmente observada na fgura 10 que apresenta dados que resultam em uma prmera componente que não é efcaz para gerar escores sufcentemente dstntos para as duas classes, por outro lado a segunda componente apresenta escores bem dstntos para cada classe.

48 48 3 PC1 2,5 2 W1 W2 1,5 1 0,5 PC ,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 Fgura 10- Smulação de um problema da Análse de Componentes Prncpas na dscrmnação de classes. Em nosso trabalho pretendemos utlzar magens obtdas pelo sensor AVIRIS que possu 224 bandas, ou seja, serão mas de 180 varáves exclundo aquelas bandas de absorção da água. Será necessáro reduzr a dmensonaldade desse problema, e com sso pretendemos desenvolver uma técnca que seja capaz de reduzr, mas que possa fazer sso para cada classe de forma separada Utlzando ferramentas da estatístca espacal para reduzr dmensonaldade Na estatístca mas recente exste um grupo de técncas que foram desenvolvdas para utlzação em dados espacas. A análse de dados espacas apesar de recente apresenta mutas obras de grande relevânca dentro da estatístca. A análse de dados espacas como dto anterormente pode ser dvda em quatro tpos de abordagens. Em nosso trabalho remos utlzar os parâmetros do semvarograma, que é uma ferramenta das técncas de krgeagem que por sua vez se encontra dentro de uma das abordagens da análse de dados espacas, a geoestatístca.

49 49 Bascamente o semvarograma funconará como um redutor de dmensonaldade. Seleconaremos amostras de trenamento das dferentes classes e estmaremos o semvarograma expermental para a amostra de cada classe subdvndo o espaço das mas de 200 bandas em partções de bandas consecutvas, quanto maor for o número de partções, maor será a nformação sobre a varação espectral de cada classe, porém maor será o número de parâmetros a serem estmados, portanto não podemos propor um número muto grande de partções porque voltaríamos ao problema orgnal de alta dmensonaldade. Calculados os semvarogramas expermentas para a totaldade das classes exstentes em uma magem, buscaremos evdencar qual modelo teórco se ajusta melhor aos dados observados no semvarograma expermental de cada classe. Um cenáro desejável sera que dferentes classes exstentes em uma magem se ajustassem a dferentes modelos teórcos de semvarograma. Nesse caso a smples dentfcação do modelo que melhor se ajusta a um pxel sera sufcente para determnação da classe a que pertence o determnado pxel. Por exemplo: consdere que em uma magem se apresentem três classes dferentes (w 1, w 2 e w 3 ), extraímos amostras de trenamento de tamanho 200 pxels para cada classe e calculamos os semvarograma expermental médo para cada classe. Ao observarmos os valores do semvarogarama expermental para w 1, chegamos a conclusão de que o modelo lnear se ajusta melhor aos dados, para w 2 o melhor ajuste se dá com o modelo exponencal e para w 3 o ajuste melhor é obtdo com o modelo gaussano. Sendo assm, a posteror poderíamos seleconar um pxel qualquer e calcular o semvarograma expermental para ele, observando qual modelo se ajusta melhor aos dados poderíamos classfcar o pxel em uma das três classes.é claro que a classfcação somente será satsfatóra se cada classe realmente apresentar melhor ajuste a

50 50 um determnado modelo do que os demas de forma sgnfcatva, no caso de exstr um confundmento, ou um modelo se ajustar aos dados, somente um pouco melhor do que os demas, possvelmente a acuráca não será consderavelmente alta. Porém, mesmo que duas ou mas classes dstntas tenham melhor ajuste a um mesmo modelo de semvarograma, sso não sgnfca que essas duas classes sejam de dfícl dscrmnação, podemos dentfcar a classe através dos parâmetros do modelo. Por exemplo, os semvarogramas para as classes w1 e w2 se ajustam melhor ao modelo lnear que possu dos parâmetros: pepta e patamar, porém a classe w1 apresenta valores de parâmetros bem dstntos dos valores obtdos para a classe w2. Portanto os parâmetros do modelo lnear serão efcentes para tentar dscrmnar os pxels pertencentes à classe w1 e w2. O sstema sensor AVIRIS devdo a grande quantdade de bandas exstentes é útl prncpalmente para dscrmnar classes que apresentam comportamento espectral muto semelhante. Em nosso estudo remos utlzar classes que apresentam comportamento espectral semelhantes, para estudos onde o comportamento espectral das classes é bem dstnto, não há necessdade de utlzar dados provenentes de um sensor hperspectral com mas de 200 bandas, nesses casos o uso de dados do sensor LANDSAT-TM que contém sete bandas, possvelmente serão sufcentes para realzar uma boa classfcação. Quanto aos resultados a serem obtdos, sera desejável que pxels orundos de uma mesma classe possuam uma grande homogenedade nterna quanto aos parâmetros do semvarograma calculados, ou seja, apresentem pequena varabldade, ao mesmo tempo em que possua heterogenedade com os valores dos parâmetros do semvarograma calculados para as demas classes exstentes na magem.

51 51 Como dto anterormente o semvarograma é calculado ao longo de uma dreção espacal, em nosso trabalho o semvarograma será calculado ao longo das das bandas espectras do sensor AVIRIS. O semvarograma como utlzado na geoestatístca apresenta a varabldade espacal de determnado fenômeno, através das dferentes varáves que podem ser meddas no espaço. Em nosso trabalho o semvarograma representará a varação espectral das dferentes classes através das radâncas observadas em níves de contadores dgtas em cada uma das bandas do sstema AVIRIS. Desejamos que os parâmetros obtdos através dos modelos teórcos que melhor se ajustem aos resultados sejam efcentes para dscrmnar os pxels das dferentes classes exstentes. A déa ncal do expermento é seleconar pelo menos dos campos de trenamento não contíguos para cada classe que estará representada no estudo. Prefermos seleconar amostras de dferentes locas para uma mesma classe para evtar que o fator espacal de determnada regão nfluence demasadamente nos resultados de uma respectva classe, ao mesmo tempo em que seleconamos amostras de locas dferentes de uma mesma classe podemos avalar a homogenedade dos valores médos dos parâmetros do semvarograma para cada uma delas. O semvarograma expermental será calculado para cada pxel de cada classe, temos o ntuto de subdvdr o transecto de 224 (número esse anda, sem desconsderar as bandas que necesstam ser descartadas, pos contém comprmentos de onda que são de

52 52 absorção da água e, portanto não devem ser utlzadas) de forma consecutva, em no mnímo quatro e no máxmo dez partes. A déa de partconar o espaço de bandas em determnados ntervalos para o cálculo do semvarograma surge por duas premssas: 1) Se calcularmos o semvarograma expermental para um pxel e logo após analsar o modelo teórco de semvarograma que melhor se ajusta aos dados, dependendo do modelo, teríamos apenas dos ou três parâmetros que representara o pxel. Como temos o ntuto de trabalhar com classes que apresentem comportamento espectral muto semelhante, uma redução da dmensonaldade da ordem de 200 varáves para apenas três, sem dúvda não trara resultados satsfatóros para a dscrmnação dessas classes com comportamento parecdo. 2) A reflectânca de um determnado alvo é determnada pela faxa de comprmento de onda que se refere à banda, é comum, dependendo do alvo que uma pequena varação no comprmento de onda da banda faça com que a reflectânca cresça ou dmnua sgnfcatvamente. Como o semvarograma representa a varabldade ao longo de um transecto, se este for muto grande, exstrá mutos componentes no cálculo de cada lag, prncpalmente dos prmeros. Os resultados obtdos serão na verdade uma méda grossera da varabldade espectral observada nas bandas. Ao passo que ao partconarmos o transecto de bandas, estaremos observando a varação espectral de cada pxel em faxas restrtas de comprmento onda, ou seja, teremos um maor refnamento das nformações de cada pxel nas referentes subdvsões do espectro eletromagnétco, além de aumentarmos o número de parâmetros que representarão cada pxel.

53 53 Para facltar o entendmento da técnca proposta neste trabalho e os procedmentos a serem executados, realzaremos um exemplo básco de forma clara utlzando um número menor de classes, para que se possa entender a fnaldade do estudo. 3.4 Exemplo de aplcação da metodologa proposta Possuímos uma magem provenente do sstema AVIRIS cobrndo uma determnada regão, ou seja, temos a nformação espectral ao longo das 224 bandas, pxel a pxel ao longo de toda a magem. Em uma outra magem temos a nformação da realdade terrestre através de uma magem temátca, esta não necessaramente precsa ter dados sobre toda a regão, pode exstr algumas regões ou pontos, onde não se tenha nformação, pos pode ocorrer que a regão não tenha sdo totalmente varrda para verfcação da realdade terrestre. A partr da magem temátca que nos nforma a realdade terrestre da regão, podemos seleconar duas amostras de cada uma das duas classes que estudaremos, por exemplo, mlho e trgo. Então, a partr da localzação das amostras observadas na magem temátca, seleconaremos os dados da radânca, expressos em níves de contadores dgtas exatamente para os determnados pxels que pertencerão às amostras de trenamento. A extração das nformações da magem raster pode ser feta através de rotnas já desenvolvdas no Departamento de Engenhara da Unversdade PURDUE,USA denomnadas de loadmage e loadrow, que através do MATLAB, que captura as nformações dos pxels que são nformados ao algortmo e para as bandas desejadas, também nformadas ao algortmo. A únca restrção do se dá pelo fato de somente ser

54 Mlho Trgo Campo 1 Campo 2 Campo 1 Campo 2 54 possível de se capturar nformações em uma únca vez de pxels que formem uma regão retangular. Suponha que seleconamos duas amostras de 400 pxels cada (20X20) de mlho, e duas amostras de mesmo tamanho de trgo e buscamos as nformações desses 1600 pxels em todas as 224 bandas exstentes nas magens provenentes do sensor AVIRIS. A estrutura de dados deste exemplo é mostrada na tabela 1. Tabela 1- Matrz de dados orgnal para 1600 pxels nas 224 bandas do sensor AVIRIS. Bandas Espectras (Transecto para cálculo do semvarograma) Pxel Com a estrutura observada na tabela 1, é possível calcular o semvarogarama expermental para os 1600 pxels, a déa ncal é calcular a semvarânca de lag 1 até o 20. O número 20 fo escolhdo de forma arbtrára, por entendermos que até esse lag sera sufcente para podermos evdencar qual modelo melhor se ajustara ao semvarograma

55 55 expermental. A segunte fórmula nos possblta o cálculo do semvarograma pxel a pxel: ˆ( h) 1 2N( h) N ( h) Z ( x ) Z( x h) 1 2 Onde h vara de 1 a 20; Z( x ) e Z( x h) são os valores da radânca observados nas bandas e h ; x x N(h) é o número de pares de bandas separados por uma dstânca h. Se fossemos calcular um semvarograma únco para cada pxel, o número de pares sera o segunte: N(1)=223; N(2)=222 N(3)=221;..; N(20)=204. Consdere que em um prmero momento subdvdíssemos o transecto de 224 bandas em quatro faxas: Faxa 1 Banda 1 até 56; Faxa 2 Banda 57 até 112; Faxa 3 Banda 113 até 168; Faxa 4 Banda 169 até 224; Neste caso para cada faxa, N(1)=55; N(2)=54; N(20)=36. E após calcularmos o semvarogarama até lag 20 para as quatro faxas e 1600 pxels, teríamos a estrutura de dados conforme a tabela 2.

56 Mlho Trgo Campo 1 Campo 2 Campo 1 Campo 2 56 Depos de calcularmos a semvarânca até lag 20 em cada faxa para os 1600 pxels da amostra, devemos verfcar qual modelo teórco de semvarograma se ajusta melhor aos dados observados no semvarograma expermental para cada faxa. Tabela 2- Matrz de dados contendo as semvarâncas até lag 20 para 1600 pxels em uma Pxel subdvsão de 4 faxas de bandas do sensor AVIRIS. Faxa 1 (B 1-56) Faxa 2 (B ) Faxa 3 (B ) Faxa 4 (B ) Em estudos prelmnares já executados em momento anteror para confecção deste trabalho, foram utlzados cnco classes, algumas com comportamento espectral semelhante e outras com comportamento bem dferencado, em todas as classes e faxas o modelo lnear fo o que apresentou melhor ajuste aos dados, é verdade que em algumas faxas para determnadas classes, outros modelos também tveram bom ajuste, mesmo assm um pouco abaxo do modelo lnear. Ao consderarmos que o modelo lnear é o mas

57 Mlho Trgo Campo 1 Campo 2 Campo 1 Campo 2 57 parcmonoso dos modelos teórcos de semvarograma, uma vez que apresenta dos parâmetros, enquanto os demas apresentam três, e também fo o que apresentou melhor ajuste em estudos prelmnares, optamos por modelar os dados do semvarograma expermental dretamente com o modelo de semvarograma lnear, mesmo assm sstematcamente estaremos verfcando a qualdade dos ajustes a cada classe e número de partções adotadas. Consderando que o melhor ajuste se dê com o modelo lnear que é formado por dos úncos parâmetros, nossa estrutura matrcal estara representada na forma da tabela 3. Tabela 3- Matrz de dados contendo os parâmetros do modelo de semvarograma lnear em cada uma das quatro faxas de bandas para os 1600 pxels da amostra de trenamento. Faxa 1 (B 1-56) Faxa 2 (B ) Faxa 3 (B ) Faxa 4 (B ) Pxel C 0 C C 0 C C 0 C C 0 C

58 58 Neste estágo, temos oto parâmetros calculados para cada pxel substtundo as 224 varáves exstentes orgnalmente. É desejável que esses oto parâmetros formem um espaço de dmensão oto com boa separabldade entre os pxels de mlho e trgo, pos assm, ao utlzarmos um classfcador já consagrado, como por exemplo, o classfcador pela máxma verossmlhança gaussana, provavelmente alcançará uma excelente acuráca, desde que a dstrbução desses parâmetros se aproxme da dstrbução normal. Com a redução dessa ordem (de 224 para 8), sera possível utlzar o classfcador pela máxma verossmlhança gaussana para classfcar os demas pxels da magem, caso fosse confrmada a normaldade dos parâmetros do semvarograma, pos faclmente teríamos tamanho de amostra sufcente para estmar a matrz de covarânca para cada classe, o que não sera fácl com a dmensonaldade da ordem anteror. Para representar a posção e a dspersão dos parâmetros em cada uma das classes, estmaríamos o vetor méda e a matrz de covarâncas para cada classe, o que será utlzado no classfcador máxma verossmlhança gaussana para representar a dstrbução dos dados em cada classe e para servr de crtéro na classfcação dos outros pxels (campo de teste). Sendo representado da segunte forma: Vetor Méda para mlho Vetor Méda para trgo = = M C M, C M, C M, C M, C M, C M C M T M C , 4, C , 4 T, C T, C T, C T, C T, C T, C T C T Matrz de covarâncas para Mlho:

59 59 M σˆ C 01M Cov(C 01M, C1M ) Cov(C 01M, C02M )... Cov(C 01M, C4M ) Cov(C 01M, C1M ) σˆ C1M Cov(C 1M, C02M )... Cov(C 1M, C4M ) Cov(C, ) Cov(C, ) σˆ C M... Cov(C, ) 01M C02M 1M C02M 02 02M C4M Cov(C 01M, C 4M) Cov(C 1M, C 4M) Cov(C 02M, C4M )... σˆ C 4M) Matrz de covarâncas para Trgo: T σˆ C 01T Cov(C 01T, C1T ) Cov(C 01T, C02T)... Cov(C 01M, C4T ) Cov(C 01T, C1T ) σˆ C1T Cov(C 1T, C02T)... Cov(C 1T, C4T ) Cov(C, ) Cov(C, ) σˆ C T... Cov(C, ) 01T C02T 1T C02T 02 02T C4T Cov(C 01T, C 4T) Cov(C 1T, C 4T) Cov(C 02T, C4T )... σˆ C 4T) A dstrbução normal multvarada que contém dos parâmetros (vetor méda e matrz de covarâncas) é representada da segunte forma: p( 1 1 exp ( x ) 2 ( x ) 1 x / w ) p / 2 1/ 2 para =1,2,..,k (2 ) Onde e são respectvamente os parâmetros vetor méda e matrz de covarânca assocados a classe w. Para estabelecer a regra de decsão Bayesana sera necessáro multplcar a função dstrbução de cada classe com a probabldade da referente classe (pror), surgndo assm a dstrbução à posteror, da segunte forma:

60 60 ) ( ) ( 2 1 exp ) (2 1 ). ( ) / ( 1 2 1/ 2 / p w p x w p x x O termo 2 / ) (2 p é constante para todas as classes e portanto pode ser desconsderado, para smplfcação dos cálculos sem que haja prejuízo na regra de classfcação. ) ( ) ( 2 1 exp 1 ). ( ) / ( 1 2 / 1 w p x w p x x No sentdo de tornarmos a função de decsão mas smplfcada para a dscrmnação da máxma verossmlhança gaussana é possível extrarmos o logartmo natural. ) ( ) ( 2 1 ln 2 1 ) ( ln ) / ( ln 1 w p x w p x x Para smplfcar a notação, será consderado ) / ( ln ) ( x w p x G. Assm, a expressão toma a segunte forma: ) ( ) ( 2 1 ln 2 1 ) ( ln ) ( 1 w p x G x x A partr das funções ) (x G é possível estabelecer as regras de decsões e portanto as regões de decsão para cada classe. A regra de classfcação para um padrão x qualquer será a segunte:

61 61 x w se G ( x) G ( x) j j Em mutos é possível que não tenhamos nformações à pror sobre as probabldades de cada classe em uma magem. Mesmo assm podemos utlzar o classfcador Bayesano optando pela pror não-nformatva consderando que todas as classes tenham a mesma probabldade, ou seja, consderando P( w ) 1/ k, para todas as k classes. Nesses casos as funções de decsão se tornam mas smples e assume a segunte forma: 1 G ( x) ln ( x ) ( x ), sendo possível a smplfcação pelo 2 termo ½. G ( x) ln ( x ) 1 ( x ) Em casos onde for comprovada a homogenedade de varâncas, ou seja, onde podemos assumr que a matrz de covarâncas sejam guas para todas as classes w as funções de decsão tomam a forma da conhecda dstânca de Mahalanobs. G ( x) ( x ) 1 ( x ) Porém é precso ter muto cudado com este tpo de suposção, é necessáro ter evdêncas muto fortes sobre a verdadera matrz de covarâncas para assumr que elas sejam dêntcas para todas as classes. A suposção feta de forma errônea pode trazer uma sére de problemas no momento da classfcação.

62 62 No exemplo que estamos trabalhando não temos evdêncas sobre a gualdade na matrz de covarâncas para os parâmetros do semvarograma para as classes mlho e trgo, ao mesmo tempo em que não temos nformação a pror sobre as probabldades de cada uma dessas classes. Neste caso é mas aproprado utlzarmos a pror não nformatva que assume probabldade ½ para cada classe.assm sendo, a regra de decsão para dscrmnação das classes mlho e trgo para os pxels dos campos de teste será a segunte: G M 1 ( x) ln 2 1 GT ( x) ln 2 T M 1 ( x 2 M ) 1 ( x T ) 2 1 T 1 M ( x M ( x ) T ) x mlho se G ( x) G ( x) ; e x trgo se G ( x) G ( x) M T M T Sendo M, T, M, T as respectvas estmatvas para os parâmetros verdaderos, vetor méda e matrz de covarâncas para as classes mlho e trgo, onde as componentes já foram detalhadas anterormente. Como ctamos anterormente desejamos utlzar a técnca proposta para tentar classfcar/dscrmnar classes com comportamentos espectras muto semelhantes, neste trabalho utlzaremos ses classes dstntas, três da cultura de mlho e três da cultura de soja, onde se dstnguem essencalmente pela forma do planto e, portanto realmente apresentam um comportamento espectral muto semelhante. A magem coletada pelo sensor AVIRIS, que contém os dados que serão estudados, possu um grande número de classes, é uma magem de 1992 de uma área que cobre uma regão agrícola do estado de Indana nos Estados Undos e pode ser observada na fgura 11.

63 63 A cena mostrada na fgura 11 se refere à magem do sensor AVIRIS da regão de nteresse, juntamente com a magem temátca contendo a verdade terrestre. A magem fo obtda no níco da época de crescmento, ocorrendo por sto grande quantdade de solo exposto, o que trará maor dfculdade anda na dscrmnação de classes com comportamentos tão semelhantes. Fgura 11 (a) Imagem do sensor AVIRIS bandas 17,27 e 50 (b) Imagem temátca da verdade terrestre

64 4. ESTUDO DE CASO - APLICAÇÃO EM DADOS REAIS DO SENSOR AVIRIS 4.1 Seleção de Bandas espectras Como etapa ncal para seleção de amostras das classes, é necessáro realzar uma análse prelmnar na magem, com o ntuto de trabalharmos somente com os dados que tragam nformações essencalmente relevantes sobre as classes. Em dados de magens dgtas provenentes de sensores hperspectras é comum descartarmos algumas bandas de comprmentos de onda que estejam sendo afetadas pelo efeto de absorção, ocasonadas pelos consttuntes como vapor d agua, por exemplo, que causam um nível muto alto de ruído em algumas bandas. Como resultado desta análse prelmnar resultou na utlzação de 190 bandas, sendo descartadas as demas. Para efeto de cálculo dos semvarogramas serão consderadas gualmente espaçadas as bandas que serão utlzadas no estudo, sso permtrá que não haja defcêncas em alguns lags devdo a retrada de algumas bandas de absorção. Para facltação no entendmento, deste ponto em dante, a banda 30, por exemplo, será reconhecda como 30ª banda aceta e não como a banda 30 ncalmente rotulada no sstema AVIRIS. 4.2 Defnção do número de partções e crtéros dos locas de partções Serão realzados estudos utlzando uma sére de partções dferentes. Alguns crtéros foram adotados para estabelecer o número de partções a serem smuladas. Estabeleceu-se que cada partção terá o mesmo número de bandas, sso favorece que os lags comuns calculados em cada partção tenham o mesmo número de componentes

65 65 amostras e, portanto, a confança nas estmatvas será aproxmadamente a mesma no que se refere ao método, sendo nfluencadora na confança apenas a varabldade ntrínseca dos dados. Adotou-se também que cada lag calculado para qualquer partção seja provenente de pelo menos de uma amostra de 5 pares de bandas, um número menor que este pode trazer estmatvas com erros muto grandes. Por fm, estabeleceu-se que o número de partções sera de no mínmo 4, pos um número menor que este provavelmente sera nsatsfatóro para dscrmnar classes tão semelhantes, uma vez que reduzra o número de parâmetros de 190 para 6. As tabelas 4 e 5 mostram com detalhe as partções que serão realzadas no estudo. Tabela 4- Número de partções adotadas no estudo e característcas de cada partção. Nº de partções Número de bandas em cada partção Lag máxmo a ser atngdo em cada partção Tabela 5- Transecto de bandas por número de partções. 4 Partções 6 Partções 8 Partções 10 Partções B(1-48) B(1-32) B(1-24) B(1-19) B(49-96) B(33-64) B(25-48) B(20-38) B(97-144) B(65-96) B(49-72) B(39-57) B( ) B(97-128) B(73-96) B(58-76) B( ) B(97-120) B(77-95) B( ) B( ) B(96-114) B( ) B( ) B( ) B( ) B( ) B( )

66 Descrção das classes Foram seleconadas ses classes para fazerem parte do estudo, são classes que apresentam um comportamento espectral muto semelhante. Para as ses classes seleconadas, foram extraídos todos os pxels da magem AVIRIS através de uma varredura na magem temátca, onde se observa a verdade terrestre do local. As classes seleconadas foram: corn (mlho planto lavrado tradconal), corn mn (mlho planto ntermedáro), corn notll (mlho planto dreto), soy clean (soja planto lavrado tradconal), soy mn (soja planto ntermedáro), soy notll (soja planto dreto). Os pxels referentes a cada classe foram dvddos em duas partes, pxel a pxel, um pertencendo ao grupo de amostras de trenamento e outro subseqüente pertencendo a amostras de campo de teste, processo este de forma sucessva. Para lustrarmos a semelhança no comportamento espectral dessas classes, construímos um gráfco contendo as médas observadas nas amostras de trenamento em cada uma das 190 bandas para cada classe, que pode ser observada na fgura 12. Tabela 6-Quantdade de pxels por classe em amostra de trenamento e teste Classe Total de Pxels Amostra de Trenamento Amostra de Teste Corn Corn Mn Soy Clean Corn Notll Soy Mn Soy Notll

67 CD , , ,00 Corn Corn Mn Soy Clean Corn Notll Soy Mn Soy Notll 0,00 Bandas Fgura 12- Méda amostral espectral para as dferentes classes 4.4 Resultados dos Expermentos e Análse Para realzarmos os procedmentos necessáros para a mplementação da técnca proposta neste trabalho, foram desenvolvdas mutas rotnas no software MATLAB. Essas rotnas foram desenvolvdas para poderem partconar o transecto de 190 bandas em quantdades dferentes; calcular os semvarogramas expermentas para cada partção, até o número de lag desejado; calcular os parâmetros do semvarograma ajustado; e por fm a classfcação dos pxels de teste segundo regra bayesana, através do crtéro da máxma verossmlhança gaussana. Além dsso, foram cradas algumas rotnas para verfcar o ajuste dos dados do semvarogramas expermental em relação ao semvarograma lnear ajustado conforme os parâmetros calculados, e verfcação da normaldade dos parâmetros calculados para cada classe. Realzaremos dferentes tpos de expermentos. Em um deles será efetuada a classfcação utlzando todas as combnações de classes duas a duas, para as partções 4, 6, 8 e 10, em outro será feto um expermento utlzando as três classes da mesma cultura, ou

68 68 seja um expermento será realzado com as três classes de soja e o outro com as três classes de mlho, utlzando as partções 4,6,8 e 10, por fm, será realzado o expermento utlzando as 6 classes do estudo para as mesmas partções. Para todos estes expermentos anda remos realzar estudos comparando os resultados obtdos com a suposção de matrz de covarâncas dêntcas, com os resultados assumndo matrz de varâncas heterogêneas Expermentos utlzando duas classes Neste expermento remos utlzar as ses classes combnando elas duas a duas, e procederemos a classfcação a partr dos parâmetros do semvarograma lnear calculados para cada partção do transecto de 190 bandas. A partr destes resultados poderá ser possível detectar que par de classes tem a classfcação correta mas dfícl, além dsso, poderemos observar se a acuráca aumenta à medda que aumentamos o número de partções e, portanto aumentamos o número de parâmetros. A ordem na realzação das etapas dos procedmentos da técnca fo a segunte: 1) Partconou-se o transecto de 190 bandas em quatro partes; 2) Calculou-se as semvarâncas até lag 20 para cada pxel de todas as amostras de trenamento para as 4 partções; 3) A partr de cada semvarânca até lag 20 foram calculados os parâmetros do semvarograma lnear para cada pxel na 1ª partção; depos se repete para as outras três partções; sstematcamente é verfcado o ajuste dos dados ao semvarograma lnear; 4) Organzou-se para cada pxel os oto parâmetros obtdos (dos para cada partção, coefcente lnear ou efeto pepta e coefcente angular ou contrbução);

69 69 5) Observou-se através de hstogramas, se os parâmetros podem ser assumdos como sendo regdos por uma dstrbução gaussana para cada classe; 6) Estma-se o vetor méda e a matrz de covarâncas para cada classe com respeto aos oto parâmetros; 7) Conhecdos os dos prmeros momentos estmados, esta estmada a função dstrbução de probabldade de cada classe e, portanto é possível realzar a classfcação, conforme o crtéro da máxma verossmlhança gaussana; 8) Realza-se a classfcação dos pxels de teste utlzando os parâmetros das 2 classes na combnação de estudo, classfcou-se o pxel naquela classe onde a função verossmlhança é maxmzada, se repete esta etapa para as outras catorze combnações de classes duas a duas; 9) Verfcou-se a acuráca para cada par de classes analsadas; 10) Repete os tens de 1 a 9, para a partção de tamanho 6, depos para 8 e 10, consderando as dferenças nos números devdo a cada partção Resultados utlzando matrz de covarâncas dstntas para cada classe Os resultados obtdos a partr da classfcação pela máxma verossmlhança gaussana utlzando os parâmetros do semvarograma ajustado, para cada combnação de par de classes podem ser observados na tabela 7. Os valores mostrados na tabela 7 se referem ao percentual de pxels de teste da classe que foram classfcados corretamente em uma determnada partção. Por exemplo, na combnação 1 (corn e corn mn) na partção 6, 68,20% dos pxels de corn foram classfcados corretamente e 91,48% dos pxels de corn mn foram classfcados corretamente, portanto acuráca geral ponderada para a combnação 1 em 6 partções fo de 77,54% como pode ser observado na tabela 8.

70 70 Tabela 7- Acuráca obtda na classfcação por classe em cada combnação por partção (em%) Combnação de par de classes Classes Número de Partções (Número de Parâmetros) 4 (8) 6 (12) 8 (16) 10 (20) Combnação 1 Combnação 2 Combnação 3 Combnação 4 Combnação 5 Combnação 6 Combnação 7 Combnação 8 Combnação 9 Combnação 10 Combnação 11 Combnação 12 Combnação 13 Combnação 14 Combnação 15 corn 64,52 68,20 65,02 63,04 corn mn 92,38 91,48 92,55 94,51 corn mn 92,87 92,05 94,18 96,40 corn notll 50,23 67,21 66,16 56,04 corn 80,12 80,28 82,70 85,94 corn notll 85,00 89,88 92,32 86,74 soy clean 82,34 78,73 81,35 83,15 soy mn 87,27 89,98 87,63 87,93 soy clean 97,63 98,41 97,80 97,76 soy notll 84,01 84,98 91,07 90,99 soy mn 96,70 96,62 96,38 95,78 soy notll 48,58 57,68 58,83 63,52 corn 63,43 64,80 63,21 64,85 soy clean 89,17 92,31 94,54 93,77 corn 49,26 64,42 56,62 58,54 soy mn 94,36 95,43 95,59 96,58 corn 96,43 95,06 93,41 92,59 soy notll 62,90 73,85 82,77 84,72 corn mn 92,55 93,53 95,99 96,40 soy clean 90,29 94,07 90,72 92,39 corn mn 85,50 86,40 88,62 90,00 soy mn 71,97 84,45 74,99 80,07 corn mn 97,62 98,12 97,46 97,62 soy notll 37,90 49,29 52,47 59,27 corn notll 91,28 94,42 95,58 92,33 soy clean 96,82 97,94 97,89 97,81 corn notll 59,88 73,84 78,14 67,33 soy mn 89,18 91,18 88,99 92,84 corn notll 96,74 91,86 92,79 81,98 soy notll 42,40 64,66 68,37 85,07

71 71 Tabela 8- Acuráca ponderada observada em cada combnação por partção (em %) Combnação de par de classes Número de Partções (Número de Parâmetros) 4 (8) 6 (12) 8 (16) 10 (20) Combnação 1 75,70 77,54 76,07 75,67 Combnação 2 75,25 81,78 82,60 79,72 Combnação 3 81,69 83,36 85,79 86,20 Combnação 4 84,90 84,57 84,61 85,63 Combnação 5 93,17 94,01 95,60 95,54 Combnação 6 81,76 84,53 84,72 85,77 Combnação 7 77,87 80,23 80,79 81,07 Combnação 8 75,42 82,41 79,22 80,60 Combnação 9 83,58 86,93 89,33 89,57 Combnação 10 91,07 93,88 92,53 93,77 Combnação 11 76,39 85,09 79,44 83,32 Combnação 12 68,89 74,63 75,82 79,17 Combnação 13 95,33 96,99 97,27 96,33 Combnação 14 81,71 86,76 86,23 86,34 Combnação 15 65,86 76,40 78,91 83,74 % de acerto 81,32 85,06 84,79 85,68 Tabela 9- Acuráca méda observada em cada classe ndependente da combnação, conforme número de partções (em %) Classes Número de Partções (Número de Parâmetros) 4 (8) 6 (12) 8 (16) 10 (20) corn 70,75 74,55 72,19 72,99 corn mn 92,18 92,32 93,76 94,99 soy clean 91,25 92,29 92,46 92,98 corn notll 76,63 83,44 85,00 76,88 soy mn 87,90 91,53 88,72 90,64 soy notll 55,16 66,09 70,70 76, Resultados assumndo matrz de covarâncas guas para todas as classes Os resultados obtdos a partr da classfcação pela máxma verossmlhança gaussana utlzando os parâmetros do semvarograma ajustado, supondo homogenedade de varâncas, ou seja, utlzando matrz de covarâncas guas para cada combnação de par de classes pode ser observada na tabela 10.

72 72 Tabela 10- Acuráca obtda na classfcação por classe em cada combnação por partção, supondo homogenedade de varâncas (em %) Combnação de par de classes Classes Número de Partções (Número de Parâmetros) 4 (8) 6 (12) 8 (16) 10 (20) Combnação 1 Combnação 2 Combnação 3 Combnação 4 Combnação 5 Combnação 6 Combnação 7 Combnação 8 Combnação 9 Combnação 10 Combnação 11 Combnação 12 Combnação 13 Combnação 14 Combnação 15 corn 77,76 81,11 81,82 79,41 corn mn 71,66 74,20 74,44 74,53 corn mn 83,46 85,67 87,71 88,21 corn notll 75,58 78,84 81,16 81,40 corn 74,19 77,48 78,36 76,44 corn notll 85,00 83,14 87,79 85,70 soy clean 81,82 83,54 83,20 83,03 soy mn 80,44 85,29 80,83 80,04 soy clean 94,28 94,80 95,02 96,09 soy notll 91,61 87,20 92,93 92,14 soy mn 85,33 85,77 85,29 85,85 soy notll 71,38 68,46 71,73 74,82 corn 70,90 74,74 71,99 73,04 soy clean 75,16 77,87 73,61 74,82 corn 70,62 75,34 74,14 78,25 soy mn 82,5 88,51 81,87 84,45 corn 81,60 86,38 85,06 88,85 soy notll 80,04 80,48 81,45 84,36 corn mn 81,08 83,13 82,15 83,78 soy clean 88,23 92,52 91,58 91,41 corn mn 70,92 73,63 75,92 78,71 soy mn 69,98 77,73 74,03 80,68 corn mn 76,90 85,91 85,01 86,49 soy notll 70,76 76,59 78,89 83,22 corn notll 93,26 94,07 95,58 95,12 soy clean 94,97 97,38 97,29 96,86 corn notll 80,93 82,44 85,23 82,56 soy mn 78,21 88,51 87,71 88,55 corn notll 77,56 79,3 76,98 79,65 soy notll 83,30 85,25 85,69 87,54

73 73 Tabela 11- Acuráca ponderada observada em cada combnação por partção, supondo homogenedade de varâncas (em %) Combnação de par de classes Número de Partções (Número de Parâmetros) 4 (8) 6 (12) 8 (16) 10 (20) Combnação 1 75,31 78,34 78,86 77,45 Combnação 2 80,20 82,85 85,00 85,40 Combnação 3 77,66 79,30 81,38 79,41 Combnação 4 81,10 84,45 81,97 81,48 Combnação 5 93,41 92,31 94,34 94,80 Combnação 6 81,00 80,40 81,08 82,43 Combnação 7 73,29 76,50 72,90 74,04 Combnação 8 77,51 82,98 78,62 81,85 Combnação 9 81,00 84,12 83,68 87,13 Combnação 10 85,77 89,29 88,33 88,78 Combnação 11 70,29 76,39 74,65 80,04 Combnação 12 73,95 81,43 82,07 84,92 Combnação 13 94,51 96,49 96,83 96,39 Combnação 14 78,90 86,96 87,08 87,02 Combnação 15 80,82 82,68 81,93 84,13 % de acerto 80,28 83,63 82,94 84,06 Tabela 12- Acuráca méda observada em cada classe ndependente da combnação, conforme número de partções, supondo matrz de covarâncas guas (em %) Classes Número de Partções (Número de Parâmetros) 4 (8) 6 (12) 8 (16) 10 (20) corn 75,01 79,01 78,27 79,20 corn mn 76,80 80,51 81,05 82,34 soy clean 86,89 89,22 88,14 88,44 corn notll 82,47 83,56 85,35 84,89 soy mn 79,29 85,16 81,95 83,91 soy notll 79,42 79,60 82,14 84, Análse dos resultados de classfcação utlzando duas classes Em prmero momento, só estava prevsta a classfcação utlzando matrz de covarâncas dferentes para cada classe. Acontece que fo constatada em algumas combnações, uma grande dferença entre a acuráca observada em uma classe em comparação a outra, quando utlzamos matrz de covarancas dstntas. Esse problema

74 74 pode ser vsto nas combnações 1,2,6,7,8,12 e 14, e também é possível observar que em todas essas combnações, as classes que apresentam acuráca baxa sempre são as classes corn, corn notll e soy notll. Esse resultado ndca que há uma dfculdade em classfcar novos pxels nestas classes quando são confrontadas com as classes corn mn e soy mn. Observando a função verossmlhança gaussana 1 1 1/ 2 1 exp ( x ) ( x ), 2 surgu a déa de que o termo (determnante da matrz de covarâncas) podera estar nfluencando na classfcação, se algumas classes apresentassem grandes dferenças neste termo. Isto podera nfluencar dretamente nos casos onde as classes apresentassem muta smlardade nos parâmetros de posção (prmero momento), por sso optamos por também smular a classfcação utlzando matrz de covarâncas guas para as classes de cada combnação, a fm de observar se há uma melhora na acuráca em algumas combnações, uma vez que tornaríamos o termo determnante da matrz de covarâncas gual para cada classe em cada uma das combnações. Comparando os resultados da tabela 7 classfcação utlzando (matrz de covarâncas dstntas) com a tabela 10 podemos observar que a acuráca melhorou consderavelmente nas classes que apresentavam uma acuráca reduzda nas combnações 1,2,6,7,8,12 e 14, porém é comum também observar nestas mesmas combnações, uma redução na acuráca da outra classe que apresentava uma acuráca maor, o que é perfetamente prevsível. Comparando anda estas tabelas fca evdente que os valores de acuráca de cada classe/combnação apresentam menor varabldade quando utlzamos a classfcação consderando matrzes de covarâncas guas, por exemplo, o valor mas baxo que observamos na tabela de acurácas consderando matrz de covarâncas guas é 68,46%, valor este da acuráca para os pxels da classe soy notll na combnação 6, ou seja, quando é confrontada com a classe soy mn sendo utlzada a partção 6. Na tabela 7

75 75 podemos observar exatamente 30 valores de acuráca menores que 68,46%. Em contrapartda há escassez de valores altos, consderando somente valores acma de 93%, somente são observados para a classe soy clean na combnações 6 e 13 e para a classe corn notll na combnação 13, enquanto quando utlzamos matrz de covarâncas dstntas este percentual é faclmente atngdo em váras combnações. Verfcando a acuráca geral para cada combnação para os dos métodos nas tabelas 8 e 11, observamos que houve aumento de acuráca nas combnações 1 e 14 nas partções 6, 8 e 10; nas combnações 2 e 12 em todas as partções e na combnação 8 nas partções 4, 6 e 10; não houve aumento nas combnações 6 e 7 onde se magnara que sera possível obter algum aumento. Nas demas combnações, onde não se esperara melhora alguma, os resultados se confrmaram, somente na combnação 5 para a partção 4 houve um pequeno aumento. Ao observarmos os valores médos de acuráca em cada partção, nos dos métodos podemos constatar que a classfcação fo mas adequada quando não supomos matrz de covarâncas guas, a melhor acuráca méda fo observada na partção 10, onde fo atngdo um índce de 85,68%, o por resultado fo observado na partção 4 quando utlzamos matrz de covarâncas guas, neste o índce fo de 80,28%. A classe corn mn fo a que apresentou maor percentual de acerto ndependentemente da combnação chegando quase a 95%, ao consderarmos a partção 10 com matrz de covarâncas dstntas que fo a partção e método que maxmzou a acuráca, já a classe corn fo a que apresentou menor acuráca, o percentual para esta classe fcou em 72,99%.

76 76 Através destes resultados podemos observar que realmente o fato de a matrz de covarâncas ser dstnta para as classes, faz com que as classes que apresentem maor varânca (entenda por sso apresentar maor valor para o termo ) apresentem uma probabldade de erro relatvamente grande em consderação com aquelas classes que apresentam menor varânca. A tabela 13 nos mostra somente o termo para cada classe observada nas 4 partções trabalhadas. Tabela 13- Valores observados para o determnante da matrz de covarâncas para cada classe em cada partção Classes Número de Partções (Número de Parâmetros) 4 (8) 6 (12) 8 (16) 10 (20) corn 7,05E+64 3,02E+89 2,54E+111 5,33E+132 corn mn 5,82E+63 1,16E+88 2,25E+109 7,51E+130 soy clean 2,45E+64 4,30E+88 3,27E+110 7,26E+131 corn notll 4,10E+64 6,20E+88 2,06E+110 4,29E+132 soy mn 1,03E+64 1,10E+88 5,11E+109 1,11E+131 soy notll 5,50E+65 3,90E+89 9,55E+110 1,76E+132 Tabela 14-Número de vezes que o termo determnante da matrz de covarâncas para cada classe é maor em relação à classe corn mn Classes Número de Partções (Número de Parâmetros) 4 (8) 6 (12) 8 (16) 10 (20) corn 12,11 25,93 113,08 70,93 corn mn 1,00 1,00 1,00 1,00 soy clean 4,21 3,70 14,53 9,67 corn notll 7,05 5,33 9,17 57,15 soy mn 1,78 0,94 2,27 1,47 soy notll 94,47 33,56 42,43 23,40 Se compararmos os resultados observados na tabela 11 com os resultados das tabelas 13 e 14, podemos observar que a é confrmada a suposção ncal de que o termo determnante da matrz de covarâncas podera estar nfluencando demasadamente na acuráca de cada classe. Note que as classes que apresentam menor percentual de pxels

77 77 classfcados corretamente foram corn, soy notll e corn notll, e estas são as classes que apresentam maores valores para o termo determnante da matrz de covarânca, termo este, que se encontra no denomnador da função de verossmlhança gaussana, ou seja, altos valores para este termo, fazem com que a função assuma menores valores, dfcultando a maxmzação da função verossmlhança nesta classe em relação a outras classes que apresentam menores valores para o determnante da matrz de covarâncas. Para facltar o entendmento de como a varabldade nfluenca na classfcação, ou seja, no percentual que cada classe atngrá de acertos, remos smular através de um exemplo unvarado. Suponha duas classes que apresentaram meddas centras parecdas, porém uma delas apresentará uma varânca maor. Deseja-se mostrar com este exemplo, que aquelas classes que apresentem maor varabldade tendem a apresentar um menor percentual de acerto, ou seja, uma maor probabldade de erro, assm como fo vsto nos resultados reas analsados anterormente. Suponha que exstam duas classes normalmente dstrbuídas com médas próxmas, mas com varâncas consderavelmente dferentes, como pode ser observado na Fgura 13. A classe W 2 apresenta maor varabldade que a classe W 1, ao utlzarmos o classfcador Bayesano através do crtéro da máxma verossmlhança gaussana, a probabldade de erro esperada, ou seja, a probabldade de classfcarmos uma undade ncorretamente será maor para a classe W 2.

78 78 0,9 0,8 0,7 0,6 0,5 W1~N(2;0,5) W2~N(2,3;1) 0,4 0,3 0,2 0, ,5 1 1,5 2 2,5 3 3,5 4 4,5 5 Fgura 13- Função dstrbução de probabldade para duas classes A classe W 1 apresenta méda 2 e desvo padrão 0,5; enquanto a classe W 2 apresenta méda 2,3 e desvo padrão 1. Podemos observar que as duas dstrbuções tem seu centro aproxmado, sendo a curva da classe W 2 mas alargada, devdo a sua maor varabldade. Consderando os parâmetros de cada dstrbução, a classfcação sera realzada da segunte forma: G 1 0,5 1 ( x 2) exp ,5 1 2 G ( x 2,3) exp x W1 se G1 G2 x W1 se1,19141 x 2,60859 x W2 se G1 G2 x W2 se x 1,19141ou x 2,60859 P ( x class W2 / W2 ) F2 (1,19141) (1 F2 (2,60859)) 0,1338 0,3788 0,5126 P ( x class W1 / W1 ) F1 (2,60859) F1 (1,19141) 0,8353

79 79 Sendo assm, esperamos classfcar corretamente 83,53% dos padrões da classe W 1, enquanto que da classe W 2 esperamos classfcar corretamente apenas 51,26% dos padrões corretamente. Prncpal razão para esta dferença se dá pelo fato da classe W 2 apresentar uma varabldade sgnfcatvamente maor que a classe W 1. Outros resultados que merecem destaque são os comportamentos semelhantes da tendênca de melhora na acuráca à medda que aumentamos o número de partções nas classfcações utlzando matrz de covarâncas dstntas e na classfcação supondo homogenedade de varâncas. A méda da acuráca na partção 10 fo a melhor nas duas formas, a únca exceção se deu devdo a partção 6 ter apresentado um resultado levemente superor ao encontrado na partção 8. Ao observarmos a acuráca méda de cada classe quando utlzamos matrz de covarâncas dstntas na tabela 9, é possível verfcar que a classe corn notll apresenta um comportamento bem dstnto das demas classes. Esta classe apresenta uma pora relatvamente grande na partção 10 em relação a partção 8, note que utlzando 8 partções a classe atngu uma acuráca de 85% enquanto que quando fo trabalhada com 10 partções, este índce recuou para menos de 77%. Este resultado pode ser explcado por esta classe apresentar o menor tamanho de amostra dsponível (860 pxels) entre as classes, e quando passamos de 8 partções para 10, estamos aumentando a dmensonaldade de 16 para 20 e com sso o número de componentes a serem estmados na matrz de covarâncas aumenta de 136 para 210; sto pode ser a causa para a grande dmnução observada na acuráca desta classe.

80 80 Através da tabela 7 nas combnações 2,3,13,14 e 15, que são as combnações que contém a classe corn notll podemos observar que sempre há um decréscmo na acuráca desta classe quando aumentamos o número de partções de 8 para Expermentos utlzando três classes Neste expermento remos utlzar as ses classes separando-as em dos grupos conforme sua cultura, ou seja, no prmero grupo farão parte as classes corn, corn mn e corn notll, e no segundo, as classes soy clean, soy mn e soy notll. Procederemos a classfcação a partr dos parâmetros do semvarograma lnear calculados para cada partção do transecto de 190 bandas. A partr destes resultados poderá ser possível detectar em qual grupo de cultura a classfcação correta é mas dfícl, além dsso, poderemos observar como se comporta o nível de acuráca à medda que alteramos o número de partções no transecto Resultados utlzando matrz de covarâncas dstntas para cada classe Os resultados obtdos a partr da classfcação pela máxma verossmlhança gaussana utlzando os parâmetros do semvarograma ajustado para cada conjunto de cultura pode ser observado na tabela 15 e 16. Os valores mostrados na tabela 15 se referem ao número de pxels de teste de cada classe de soja cuja verdade terrestre é conhecda que foram classfcados em cada uma das três classes possíves de soja. Os valores da dagonal prncpal são os pxels que foram classfcados corretamente, os valores fora da dagonal prncpal se referem ao número de pxels que foram classfcados erroneamente. Por exemplo, na partção 8, 1886 dos 2327 pxels da classe soy clean foram classfcados corretamente, portanto 441 foram classfcados de forma errada, destes 417 foram classfcados em soy mn e 24 em soy

81 81 notll, perfazendo então uma acuráca de 81,5% para a classe soy clean, somando a estes resultados, os achados nas outras classes, fo possível classfcar 78,19% dos pxels corretamente na partção 8. Na partção 10 este percentual se elevou para 79,53. Tabela 15-Matrz de confusão para as três classes de soja e acurácas por partção. Número de Partções Classes verdaderas Classfcação Resultados Total soy clean soy mn soy notll Acuráca Ac. Geral soy clean ,74 soy mn ,09 soy notll ,70 soy clean ,08 soy mn ,16 soy notll ,06 soy clean ,05 soy mn ,77 soy notll ,69 soy clean ,81 soy mn ,37 soy notll ,01 76,70 77,35 78,19 79,53 Tabela 16- Matrz de confusão para as três classes de mlho e acurácas por partção. Número de Partções Classes verdaderas Classfcação Resultados Total corn corn mn corn notll Acuráca Ac. Geral corn ,43 corn mn ,21 corn notll ,93 corn ,01 corn mn ,90 corn notll ,79 corn ,87 corn mn ,43 corn notll ,19 corn ,44 corn mn ,96 corn notll ,07 64,99 69,50 69,61 67, Resultados assumndo matrz de covarâncas guas para todas as classes Os resultados obtdos a partr da classfcação pela máxma verossmlhança gaussana utlzando os parâmetros do semvarograma ajustado para cada conjunto de

82 82 cultura, supondo homogenedade de varâncas entre os parâmetros dentro de cada cultura pode ser observado na tabela 17 e 18. Tabela 17- Matrz de confusão para as três classes de soja e acurácas por partção, supondo matrz de covarâncas guas Número de Partções Classes verdaderas Classfcação Resultados Total soy clean soy mn soy notll Acuráca Ac. Geral soy clean ,30 soy mn ,85 soy notll ,98 soy clean ,51 soy mn ,13 soy notll ,25 soy clean ,56 soy mn ,30 soy notll ,96 soy clean ,36 soy mn ,06 soy notll ,22 71,69 72,36 72,31 72,97 Tabela 18- Matrz de confusão para as três classes de mlho e acurácas por partção, supondo matrz de covarâncas guas Número de Partções Classes verdaderas Classfcação Resultados Total corn corn mn corn notll Acuráca Ac. Geral corn ,91 corn mn ,24 corn notll ,21 corn ,25 corn mn ,52 corn notll ,02 corn ,67 corn mn ,85 corn notll ,70 corn ,26 corn mn ,67 corn notll ,05 64,58 65,48 67,30 66,04

83 Análse dos resultados de classfcação utlzando três classes Ao realzarmos a classfcação utlzando as três classes de soja fo observada uma acuráca acma do patamar de 75%, a tabela 17 mostra a matrz de confusão para as 4 dferentes partções utlzadas. A classe que apresentou maor percentual de pxels classfcados corretamente fo soy mn e a que mostrou por acuráca fo a classes soy notll. O percentual de pxels classfcados corretamente apresentou relatvo aumento a medda em que se aumentava o número de partções, começando em 76,70% para 4 partções, atngndo 79,53% quando trabalhamos com 10 partções. Para as três classes de mlho não fo possível atngr o mesmo percentual de pxels classfcados corretamente observados nas classes de soja. A acuráca não ultrapassou a faxa dos 70% em nenhuma das partções. A classe corn mn fo a que atngu maor acuráca, as classes corn e corn notll alternaram o menor aprovetamento, conforme o número de partções utlzadas. Dferentemente do que se esperava o percentual de acerto não aumentou a medda que se aumentava o número de partções e portanto de varáves aleatóras, a partção 10 mostrou resultados menos satsfatóros do que os resultados encontrados nas partções 6 e 8. A classe corn notll assm como na análse utlzando duas classes, contnuou a apresentar queda na acuráca quando utlzada classfcação com base em 10 partções, este resultado pode ser observado na tabela 16. Os resultados de classfcação melhores para as três classes de soja podem ter sdo obtdos devdo ao maor número de pxels de trenamento exstentes nestas classes em relação as classes de mlho. São 5974 pxels de trenamento para soja contra 3902 pxels de trenamento de mlho.

84 84 Consderando os resultados utlzando suposção de matrz de covarâncas guas para cada conjunto de classes de mesma cultura fo possível observar que: a) Assm como na análse anteror, utlzando matrz de covarâncas dstntas para cada classe, o melhor resultado de classfcação fo observado quando se trabalha com as classes de soja; b) Da mesma forma com o observado nos expermentos utlzando 2 classes, os resultados em geral são mas satsfatóros quando não supomos matrz de covarâncas guas, ndependentemente do número de partções utlzadas no estudo. c) Manteve-se a tendênca de que classes que apresentam percentuas de acerto maores dmnuam quando se utlza matrz de covarâncas guas, da mesma forma, que tende a aumentar a acuráca quando se utlza matrz de covarâncas guas naquelas classes que apresentam menores percentuas de classfcação correta, sto pode ser observado com maor facldade nas classes de mlho. d) A tendênca normal de aumento no percentual de pxels classfcados corretamente com o aumento do número de partções, não ocorreu em nenhum dos grupos de cultura. e) Observando a matrz de confusão para as classes de mlho e soja quando utlzamos matrzes de covarâncas dstntas, os percentuas de acerto de cada classe apresentam maores dferenças entre s. Por exemplo, é muto mas

85 85 provável classfcarmos um pxel de corn em corn mn do que o nverso, sto tende a fazer com que o número de pxels classfcados em corn mn seja superestmado em relação ao número verdadero e, por consegunte o número de pxels classfcados em corn seja subestmado Expermentos utlzando ses classes Para estes expermentos serão estudadas todas as ses ( três de soja e três de mlho) classes smultaneamente. Estes expermentos tendem a apresentar uma acuráca menor em relação aos demas expermentos, uma vez que há uma possbldade de classfcar um pxel corretamente, contra cnco de classfcar de forma errada Resultados utlzando matrz de covarâncas dstntas para cada classe Os resultados obtdos a partr da classfcação pela máxma verossmlhança gaussana utlzando os parâmetros do semvarograma ajustado para cada dferente tpo de partção pode ser observado na tabela 19.

86 86 Tabela 19- Matrz de confusão para as ses classes estudadas e acurácas por partção Número de Partções Classes verdaderas corn corn mn Classfcação soy corn clean notll soy mn soy notll Total Resultados Ac. Acuráca Geral corn ,13 corn mn ,20 soy clean ,79 corn notll ,70 soy mn ,26 soy notll ,51 corn ,82 corn mn ,51 soy clean ,97 corn notll ,91 soy mn ,34 soy notll ,54 corn ,52 corn mn ,39 soy clean ,87 corn notll ,02 soy mn ,85 soy notll ,13 corn ,40 corn mn ,01 soy clean ,49 corn notll ,77 soy mn ,41 soy notll ,43 52,08 58,16 56,32 58, Resultados utlzando matrz de covarâncas guas para todas as classes Os resultados obtdos a partr da classfcação pela máxma verossmlhança gaussana utlzando os parâmetros do semvarograma ajustado para cada dferente tpo de partção, consderando as ses classes dstntas com mesma matrz de covarâncas, pode ser observado na tabela 20.

87 87 Tabela 20- Matrz de confusão para as ses classes estudadas e acurácas por partção, supondo matrz de covarâncas guas Número de Partções Classes verdaderas corn corn mn Classfcação soy corn clean notll soy mn soy notll Total Resultados Ac. Acuráca Geral corn ,98 corn mn ,72 soy clean ,87 corn notll ,56 soy mn ,30 soy notll ,74 corn ,03 corn mn ,66 soy clean ,72 corn notll ,49 soy mn ,93 soy notll ,01 corn ,12 corn mn ,94 soy clean ,46 corn notll ,56 soy mn ,78 soy notll ,78 corn ,20 corn mn ,86 soy clean ,36 corn notll ,63 soy mn ,28 soy notll ,05 46,79 51,19 48,18 50, Análse dos resultados de classfcação utlzando ses classes Ao realzarmos o expermento utlzando as ses classes fo observada uma acuráca acma de 50%. Em uma prmera vsta este patamar pode ser consderado baxo, mas se avalarmos que estamos trabalhando com ses classes com comportamento espectral muto semelhante, e que para cada pxel a ser classfcado temos uma chance de acertar contra cnco de errar, podemos admtr que este percentual de acerto é bsatante razoável.

88 88 A partção que apresentou melhores resultados fo a partção 10, nela 58,64% dos pxels foram classfcados corretamente. Dentre as classes destaca-se o percentual de acertos atngdo nos pxels de corn mn 85,01%, a classe corn fo a que apresentou por aprovetamento, sua acuráca não ultrapassou os 30%. Quando utlzamos a suposção de matrz de covarâncas guas para todas as classes, os resultados encontrados se assemelham aos resultados encontrados quando trabalhávamos com 2 ou 3 classes. A acuráca quando supomos matrz de covarâncas guas apresenta menor acuráca ndependentemente do número de partções utlzadas; eleva-se o percentual de acerto nas classes que apresentavam menor acuráca, porém dmnu o percentual de acerto nas classes em que se obteve resultados mas satsfatóros; o número de pxels classfcados em cada classe se aproxma mas do verdero número de pxels exstentes em cada classe. A partção 6 apresentou maor acuráca, soy clean fo a classe que apresentou maor percentual de pxels classfcados corretamente 64,72%, enquanto soy notll fo a que apresentou por acuráca 40,03%.

89 5.CONCLUSÕES E RECOMENDAÇÕES A capacdade de rqueza de nformação obtda pelos sensores hperespectras está sendo capaz de dscrmnar classes com comportamentos espectras muto semelhantes, sto não era possível até então com o uso de magens multspectras. Ao mesmo tempo em que se torna mas comum a dsponblzação de magens hperespectras, surge o problema na utlzação de dados com alta dmensonaldade. Com o aumento da dmensonaldade, é necessáro se estmar um número muto grande de parâmetros e para sso é necessáro contar com um tamanho de amostra consderavelmente grande para que estas estmatvas sejam confáves. Em stuações reas dfclmente contamos com amostras abundantes, normalmente o tamanho de amostra é nsufcente para estmarmos com precsão prncpalmente o segundo momento (matrz de covarâncas). Este fato resulta normalmente numa performance nsatsfatóra dos classfcadores, uma vez que os parâmetros utlzados foram estmados com base em amostras nsufcentes. Este problema vem sendo fruto de muto estudo entre a comundade centífca nternaconal. Em nosso trabalho, estamos sugerndo a utlzação de técncas da geoestatstca, mas precsamente da ferramenta semvarograma, com o ntuto de reduzr a dmensonaldade do problema sem que haja perda sgnfcatva de nformação, supondo que os parâmetros calculados para cada partção do transecto de bandas do sensor AVIRIS sejam efcazes para uma boa dscrmnação de classes que apresentem comportamento espectras muto semelhantes.

90 90 A déa ncal do uso do semvarograma como redutor de dmensonaldade, se deveu ao fato de que cada banda pode ser autocorrelaconada com suas bandas anterores, e que esta autocorrelação pode acontecer em níves dferentes mesmo para classes semelhantes. Se tal fato fosse verdadero, poderíamos consderar que os parâmetros do semvarograma traduzem uma déa de autocorrelação e, portanto, estes parâmetros muto provavelmente seram efcentes para dscrmnação de classes. Além dsso, com a redução da dmensonaldade poderíamos utlzar um classfcador tradconal conforme a dstrbução observada nestes parâmetros. Os resultados encontrados em nosso estudo ndcaram que o modelo de semvarograma lnear se ajusta melhor aos dados observáves do semvarograma expermental calculados para as partções de bandas do sensor AVIRIS. O nível de classfcação correta atngndo pelo método proposto pode ser consderado satsfatóro. Quando utlzamos duas classes obtvemos uma acuráca méda levemente superor a 85% com um pco de 97,27% quando trabalhamos com a separação das classes mlho planto dreto (corn notll) e soja planto lavrado (soy clean). Os resultados ao trabalharmos com três classes de mesma cultura se revelaram em patamares dferentes para a cultura de soja e mlho. A classfcação utlzando três classes de soja chegou próxma a 80%, enquanto que a acuráca para as culturas de mlho teve seu em pco em 69,50%. Uma possível explcação para esta dferença no nível de acuráca podera ser o tamanho de amostra mas reduzdo nas classes de mlho em relação às classes de soja. Se trabalhássemos com tamanho de amostras guas para cada classe talvez a acuráca nestas duas culturas fossem mas próxmas. Ao utlzarmos as ses classes de estudo, fo possível obter uma acuráca de 58,64%; evdencando que a técnca trouxe acréscmo, mas que carece de mas nvestgações e estudos, com a possbldade de se atngr níves maores de acuráca. Ressaltamos que as ses classes trabalhadas apresentam um comportamento espectral muto

91 91 semelhante o que torna nvável, por exemplo, a utlzação de dados de sensores multspectras como LANDSAT que apresenta apenas 6 bandas. Os resultados de classfcação apontaram para um nível de acuráca mas alto naquelas classes que apresentavam menor varabldade, também fo possível verfcar que a classe corn notll apresentava uma tendênca de decréscmo na acuráca quando se aumentava o número de partções e, portanto, de parâmetros, por esta contar com um menor tamanho de amostra dsponível. A utlzação do classfcador pela máxma verosmlhança gaussano é plausível, uma vez que a smples análse de hstograma dos parâmetros calculados para cada classe evdenca um comportamento muto smlar a dstrbução normal. A déa de utlzar matrz de covarâncas guas para comparar os resultados, apesar de trazer resultados nteressantes (aumenta a acuráca de classes com maor varabldade e dmnu a acuráca das classes com menor varabldade) e podem ser satsfatóros dependendo do tpo de abordagem que se quera dar, pos aproxma os valores de acuráca para cada classe analsada, fo utlzada neste trabalho, mas carece de um embasamento maor, não pretendemos sugerr que esta metodologa traga resultados satsfatóros, uma vez que não esta comprovada sua efcáca nos demas casos. Como sugestões para trabalhos futuros, podemos ctar os seguntes aspectos: 1) Estudos adconas da técnca, como observação do comportamento de acuráca segundo dferentes tpos de dstrbução dos dados, através de smulações.

92 92 2) Buscar a cração de um crtéro para subdvsão do transecto de bandas do sensor AVIRIS, tal que seja mnmzada a probabldade de erro e, portanto sejam crados ntervalos de bandas, não necessaramente com o mesmo tamanho como neste trabalho, e que sejam capazes de trazer melhores resultados. 3) Utlzação de outros parâmetros que sejam efcazes para dscrmnar classes com comportamento espectral semelhante, juntando-se aos parâmetros do semvarograma que se mostraram efcentes na classfcação.

93 6. BIBLIOGRAFIA BAILEY, T.C. and GATRELL, A. C. (1995) Interactve Spatal Data Analyss. London: Longman. BITTENCOURT, H.R. (2001). Comparação da dscrmnação logístca com o método da máxma verossmlhança gaussana na classfcação de magens dgtas. CEPSRM,UFRGS, Porto Alegre. BLAIS, R.A. and CARLIER,P.A. (1967). Applcatons of geostatstcs n ore evaluaton, n Ore Reserve Estmaton and Grade Control. Canadan Insttute for Mnng & Metallurgy Specal Publcaton 9, BURGESS, T. M. and WEBSTER, R. (1980) Optmal nterpolaton and sarthmc mappng of sol propertes. The sem-varogram and punctual Krgng. Journal of Sol Scence. p BURROUGH, P.A.(1987) Prncples of geographcal nformaton systems for land resources assessment. Oxford.Clarendon Press. CAMPOS, T. E. (2001). Técncas de Seleção de Característcas com Aplcações em Reconhecmento de Faces.

94 94 CRESSSIE, N. (1991). Statstcs for Spatal Data, John Wley.Chnchester. CURRAN, P. J. (1988).The Semvarogram n Remote Sensng: An Introducton. Remote Sensng of Envronment, vol. 24, p DAVID, M (1977). Geoestatstcal ore reserve estmaton. New York, Elsever Scentfc. DELFINER P. and. Delhomme, J.P (1975) Optmum nterpolaton by krgng. In: J.D.Davs and M.J.McCullagh (eds), Dsplay and Analyss of Spatal Data. New York. John Wley and Sons. p DIDIER,D. (1997).Fuzzy Informaton Engneerng. Wley Computer Publshng,USA. DUDA,R.O. and HART,P.E. (1973).Pattern Classfcaton and Scene Analyss. Wley- Interscence, USA. EFRON,B. and TIBSHIRANI,R. (1993) An Introducton to the Bootstrap. Chapman and Hall. ERBERT, M. (2001). Uso da Análse dscrmnante regularzada no reconhecmento de padrões em magens dgtas hperespectral de sensoramento remoto. CEPSRM,UFRGS, Porto Alegre FUKUNAGA, K. (1990). Statstcal Pattern Recongton. 2ª ed. Academc Press.

95 95 HUIJBREGTS, C. (1975). Regonalzed varables and quanttatve analyss of spatal data', n Dsplay and analyss of spatal data. Ed. J.C.Davs and M.J.McCullagh, J.Wley and Sons, London, ISAAKS, E. H. and SRIVASTAVA, R. M. (1989). An Introducton to Appled Geostatstcs. Oxford Unversty Press. Oxford. JAIN, A. K. and ROBERT, P. W. Statstcal Pattern Recognton: A Revew. IEEE Transactons on Pattern Analyss and machne Intellgence, vol. 22, p. 4-34, JOHNSON, R. A. and WICHERN, D. W. (1982) Appled Multvarate Statstcal Analyss. Prentce Hall.New Jersey. KITANIDIS, P.K. and VOMVORIS, E.G.(1983). A geoestatstcal approach to the nverse problem n groundwater modellng and one dmensonal smulatons. Water Resources Research. p KRIGE, D.G (1951) A statstcal approach to some basc mne evaluaton problems on the Wtwatersrand. Johanesburg Chemstry Metallurgy Mnng Socety South Afrcan. p LAJAUNIE,C. (1984) In: Geostatstcs for Natural Resources Characterzaton, ed. A.G. Journel.p LILLESAND, T. and KIEFER, P. (1987). Remote Sensng and Image Interpretaton. 3ª ed. Wley. Chnchester.

96 96 MARDIA, K. V. and KENT, J. T. (1979). Multvarate Analyss. Academc Press. London. NOVO, E. (1992), Sensoramento Remoto, Prncípos e aplcações. 2ª ed. São Paulo: Edgar Blücher. RICHARDS, J. (1993). Remote Sensng Dgtal Image Analyss. 2ª ed. Sprnger-Verlag. RIPLEY, B. D. (1981). Spatal Statstcs. John Wley. Chnchester. STEFFEN, C. A. MORAES, E. C. e GAMA, F. (1996) Radometra Óptca espectral. VIII Smpóso Naconal de Sensoramento Remoto. Salvador. THERRIEN, C. (1989). Decson Estmaton and Classfcaton. John Wley.

97 97 Referêncas Eletrôncas (Internet): INPE- Insttuto de Pesqusas Espacas Manual do SPRING, dsponível em: JPL Jet Propulson Laboratory NASA What s AVIRIS? Dsponível em:

98 7. ANEXOS Hstograma classe corn 4 partções 2ª partção parâmetro contrbução Hstograma classe corn mn 4 partções 3ª partção parâmetro contrbução

99 99 Hstograma classe soy clean 4 partções 4ª partção parâmetro pepta Hstograma classe corn notll 4 partções 3ª partção parâmetro pepta

100 100 Hstograma classe soy mn 4 partções 3ª partção parâmetro contrbução Hstograma classe soy notll 4 partções 1ª partção parâmetro pepta

4 Critérios para Avaliação dos Cenários

4 Critérios para Avaliação dos Cenários Crtéros para Avalação dos Cenáros É desejável que um modelo de geração de séres sntétcas preserve as prncpas característcas da sére hstórca. Isto quer dzer que a utldade de um modelo pode ser verfcada

Leia mais

Reconhecimento Estatístico de Padrões

Reconhecimento Estatístico de Padrões Reconhecmento Estatístco de Padrões X 3 O paradgma pode ser sumarzado da segunte forma: Cada padrão é representado por um vector de característcas x = x1 x2 x N (,,, ) x x1 x... x d 2 = X 1 X 2 Espaço

Leia mais

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo 3 Metodologa de Avalação da Relação entre o Custo Operaconal e o Preço do Óleo Este capítulo tem como objetvo apresentar a metodologa que será empregada nesta pesqusa para avalar a dependênca entre duas

Leia mais

5 Implementação Procedimento de segmentação

5 Implementação Procedimento de segmentação 5 Implementação O capítulo segunte apresenta uma batera de expermentos prátcos realzados com o objetvo de valdar o método proposto neste trabalho. O método envolve, contudo, alguns passos que podem ser

Leia mais

3 A técnica de computação intensiva Bootstrap

3 A técnica de computação intensiva Bootstrap A técnca de computação ntensva ootstrap O termo ootstrap tem orgem na expressão de língua nglesa lft oneself by pullng hs/her bootstrap, ou seja, alguém levantar-se puxando seu própro cadarço de bota.

Leia mais

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) UNDADE V DELNEAMENTO NTERAMENTE CASUALZADO (DC) CUABÁ, MT 015/ PROF.: RÔMULO MÔRA romulomora.webnode.com 1. NTRODUÇÃO Este delneamento apresenta como característca prncpal a necessdade de homogenedade

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca

Leia mais

7 - Distribuição de Freqüências

7 - Distribuição de Freqüências 7 - Dstrbução de Freqüêncas 7.1 Introdução Em mutas áreas há uma grande quantdade de nformações numércas que precsam ser dvulgadas de forma resumda. O método mas comum de resumr estes dados numércos consste

Leia mais

Representação e Descrição de Regiões

Representação e Descrição de Regiões Depos de uma magem ter sdo segmentada em regões é necessáro representar e descrever cada regão para posteror processamento A escolha da representação de uma regão envolve a escolha dos elementos que são

Leia mais

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro. Aplcação Por exemplo, se prepararmos uma área expermental com todo cudado possível e fzermos, manualmente, o planto de 100 sementes seleconadas de um mlho híbrdo, cudando para que as sementes fquem na

Leia mais

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall Sstemas Intelgentes Aplcados Carlos Hall Programa do Curso Lmpeza/Integração de Dados Transformação de Dados Dscretzação de Varáves Contínuas Transformação de Varáves Dscretas em Contínuas Transformação

Leia mais

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência. MODELO DE REGRESSÃO DE COX Os modelos de regressão paramétrcos vstos anterormente exgem que se suponha uma dstrbução estatístca para o tempo de sobrevvênca. Contudo esta suposção, caso não sea adequada,

Leia mais

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma Capítulo 8 Dferencação Numérca Quase todos os métodos numércos utlzados atualmente para obtenção de soluções de equações erencas ordnáras e parcas utlzam algum tpo de aproxmação para as dervadas contínuas

Leia mais

6 Modelo Proposto Introdução

6 Modelo Proposto Introdução 6 Modelo Proposto 6.1. Introdução Neste capítulo serão apresentados detalhes do modelo proposto nesta dssertação de mestrado, onde será utlzado um modelo híbrdo para se obter prevsão de carga curto prazo

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ 1 É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS 1 A análse de dagnóstco (ou dagnóstco do ajuste) confgura uma etapa fundamental no ajuste de modelos de regressão. O objetvo prncpal da análse de dagnóstco

Leia mais

CURSO A DISTÂNCIA DE GEOESTATÍSTICA

CURSO A DISTÂNCIA DE GEOESTATÍSTICA CURSO A DISTÂNCIA DE GEOESTATÍSTICA Aula 6: Estaconardade e Semvarânca: Estaconardade de a. ordem, Hpótese ntríseca, Hpótese de krgagem unversal, Crtéros para escolha, Verfcação, Representatvdade espacal,

Leia mais

3 Algoritmos propostos

3 Algoritmos propostos Algortmos propostos 3 Algortmos propostos Nesse trabalho foram desenvolvdos dos algortmos que permtem classfcar documentos em categoras de forma automátca, com trenamento feto por usuáros Tas algortmos

Leia mais

CORRELAÇÃO E REGRESSÃO

CORRELAÇÃO E REGRESSÃO CORRELAÇÃO E REGRESSÃO Constata-se, freqüentemente, a estênca de uma relação entre duas (ou mas) varáves. Se tal relação é de natureza quanttatva, a correlação é o nstrumento adequado para descobrr e medr

Leia mais

Regressão Múltipla. Parte I: Modelo Geral e Estimação

Regressão Múltipla. Parte I: Modelo Geral e Estimação Regressão Múltpla Parte I: Modelo Geral e Estmação Regressão lnear múltpla Exemplos: Num estudo sobre a produtvdade de trabalhadores ( em aeronave, navos) o pesqusador deseja controlar o número desses

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Classificadores Lineares. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Classificadores Lineares. Luiz Eduardo S. Oliveira, Ph.D. Unversdade Federal do Paraná Departamento de Informátca Reconhecmento de Padrões Classfcadores Lneares Luz Eduardo S. Olvera, Ph.D. http://lesolvera.net Objetvos Introduzr os o conceto de classfcação lnear.

Leia mais

2 Incerteza de medição

2 Incerteza de medição 2 Incerteza de medção Toda medção envolve ensaos, ajustes, condconamentos e a observação de ndcações em um nstrumento. Este conhecmento é utlzado para obter o valor de uma grandeza (mensurando) a partr

Leia mais

Associação entre duas variáveis quantitativas

Associação entre duas variáveis quantitativas Exemplo O departamento de RH de uma empresa deseja avalar a efcáca dos testes aplcados para a seleção de funconáros. Para tanto, fo sorteada uma amostra aleatóra de 50 funconáros que fazem parte da empresa

Leia mais

7 Tratamento dos Dados

7 Tratamento dos Dados 7 Tratamento dos Dados 7.. Coefcentes de Troca de Calor O úmero de usselt local é dado por h( r )d u ( r ) (7-) k onde h(r), o coefcente local de troca de calor é h( r ) q''- perdas T q''- perdas (T( r

Leia mais

DELINEAMENTOS EXPERIMENTAIS

DELINEAMENTOS EXPERIMENTAIS SUMÁRIO 1 Delneamentos Expermentas 2 1.1 Delneamento Interamente Casualzado..................... 2 1.2 Delneamento Blocos Casualzados (DBC).................... 3 1.3 Delneamento Quadrado Latno (DQL)......................

Leia mais

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados Modelo lnear clássco com erros heterocedástcos O método de mínmos quadrados ponderados 1 Varâncas homogêneas Varâncas heterogêneas y y x x Fgura 1 Ilustração da dstrbução de uma varável aleatóra y (condconal

Leia mais

Algarismos Significativos Propagação de Erros ou Desvios

Algarismos Significativos Propagação de Erros ou Desvios Algarsmos Sgnfcatvos Propagação de Erros ou Desvos L1 = 1,35 cm; L = 1,3 cm; L3 = 1,30 cm L4 = 1,4 cm; L5 = 1,7 cm. Qual destas meddas está correta? Qual apresenta algarsmos com sgnfcado? O nstrumento

Leia mais

3 Elementos de modelagem para o problema de controle de potência

3 Elementos de modelagem para o problema de controle de potência 3 Elementos de modelagem para o problema de controle de potênca Neste trabalho assume-se que a rede de comuncações é composta por uma coleção de enlaces consttuídos por um par de undades-rádo ndvdualmente

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

MODELOS DE REGRESSÃO PARAMÉTRICOS

MODELOS DE REGRESSÃO PARAMÉTRICOS MODELOS DE REGRESSÃO PARAMÉTRICOS Às vezes é de nteresse nclur na análse, característcas dos ndvíduos que podem estar relaconadas com o tempo de vda. Estudo de nsufcênca renal: verfcar qual o efeto da

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro UNIVERIDADE DE ÃO PAULO FACULDADE DE ECONOMIA, ADMINITRAÇÃO E CONTABILIDADE DE RIBEIRÃO PRETO DEPARTAMENTO DE ADMINITRAÇÃO RAD1507 Estatístca Aplcada à Admnstração I Prof. Dr. Evandro Marcos adel Rbero

Leia mais

EXERCÍCIO: VIA EXPRESSA CONTROLADA

EXERCÍCIO: VIA EXPRESSA CONTROLADA EXERCÍCIO: VIA EXPRESSA CONTROLADA Engenhara de Tráfego Consdere o segmento de va expressa esquematzado abaxo, que apresenta problemas de congestonamento no pco, e os dados a segur apresentados: Trechos

Leia mais

ÍNDICE DE CONSISTÊNCIA TEMPORAL: UM NOVO MÉTODO PARA AVALIAÇÃO DA ESTABILIDADE TEMPORAL DE ARMAZENAMENTO DE ÁGUA NO SOLO

ÍNDICE DE CONSISTÊNCIA TEMPORAL: UM NOVO MÉTODO PARA AVALIAÇÃO DA ESTABILIDADE TEMPORAL DE ARMAZENAMENTO DE ÁGUA NO SOLO Anas Eletrônco ÍNDICE DE CONSISTÊNCIA TEMPORAL: UM NOVO MÉTODO PARA AVALIAÇÃO DA ESTABILIDADE TEMPORAL DE ARMAZENAMENTO DE ÁGUA NO SOLO Anderson Takash Hara, Heraldo Takao Hashgut, Antôno Carlos Andrade

Leia mais

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados Modelo lnear normal com erros heterocedástcos O método de mínmos quadrados ponderados Varâncas homogêneas Varâncas heterogêneas y y x x Fgura 1 Ilustração da dstrbução de uma varável aleatóra y (condconal

Leia mais

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16%

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16% Análse de Rsco 1 RISCO Rsco possbldade de perda. Quanto maor a possbldade, maor o rsco. Exemplo: Empresa X va receber $ 1.000 de uros em 30 das com títulos do governo. A empresa Y pode receber entre $

Leia mais

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

DEFINIÇÃO - MODELO LINEAR GENERALIZADO DEFINIÇÃO - MODELO LINEAR GENERALIZADO 1 Um modelo lnear generalzado é defndo pelos seguntes três componentes: Componente aleatóro; Componente sstemátco; Função de lgação; Componente aleatóro: Um conjunto

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. vall@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ Em mutas stuações duas ou mas varáves estão relaconadas e surge então a necessdade de determnar a natureza deste relaconamento. A análse

Leia mais

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos Curso de extensão, MMQ IFUSP, feverero/4 Alguns exercíco báscos I Exercícos (MMQ) Uma grandeza cujo valor verdadero x é desconhecdo, fo medda três vezes, com procedmentos expermentas dêntcos e, portanto,

Leia mais

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 014 Estatístca Descrtva e Análse Exploratóra Etapas ncas. Utlzadas para descrever e resumr os dados. A dsponbldade de uma grande quantdade de dados e de

Leia mais

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto Processamento de Imagem Prof. MSc. André Yoshm Kusumoto andrekusumoto.unp@gmal.com Operações pontuas globas em magens Uma operação pontual global em uma magem dgtal r é a função f(r) aplcada a todo pxel

Leia mais

1. CORRELAÇÃO E REGRESSÃO LINEAR

1. CORRELAÇÃO E REGRESSÃO LINEAR 1 CORRELAÇÃO E REGREÃO LINEAR Quando deseja-se estudar se exste relação entre duas varáves quanttatvas, pode-se utlzar a ferramenta estatístca da Correlação Lnear mples de Pearson Quando essa correlação

Leia mais

Estudo e Previsão da Demanda de Energia Elétrica. Parte II

Estudo e Previsão da Demanda de Energia Elétrica. Parte II Unversdade Federal de Paraná Setor de Tecnologa Departamento de Engenhara Elétrca Estudo e Prevsão da Demanda de Energa Elétrca Parte II Prof: Clodomro Unshuay-Vla Etapas de um Modelo de Prevsão Objetvo

Leia mais

REGRESSÃO NÃO LINEAR 27/06/2017

REGRESSÃO NÃO LINEAR 27/06/2017 7/06/07 REGRESSÃO NÃO LINEAR CUIABÁ, MT 07/ Os modelos de regressão não lnear dferencam-se dos modelos lneares, tanto smples como múltplos, pelo fato de suas varáves ndependentes não estarem separados

Leia mais

Gráficos de Controle para Processos Autocorrelacionados

Gráficos de Controle para Processos Autocorrelacionados Gráfcos de Controle para Processos Autocorrelaconados Gráfco de controle de Shewhart: observações ndependentes e normalmente dstrbuídas. Shewhart ao crar os gráfcos de controle não exgu que os dados fossem

Leia mais

Testes não-paramétricos

Testes não-paramétricos Testes não-paramétrcos Prof. Lorí Val, Dr. http://www.mat.ufrgs.br/val/ val@mat.ufrgs.br Um teste não paramétrco testa outras stuações que não parâmetros populaconas. Estas stuações podem ser relaconamentos,

Leia mais

Capítulo 2. APROXIMAÇÕES NUMÉRICAS 1D EM MALHAS UNIFORMES

Capítulo 2. APROXIMAÇÕES NUMÉRICAS 1D EM MALHAS UNIFORMES Capítulo. Aproxmações numércas 1D em malhas unformes 9 Capítulo. AROXIMAÇÕS NUMÉRICAS 1D M MALHAS UNIFORMS O prncípo fundamental do método das dferenças fntas (MDF é aproxmar através de expressões algébrcas

Leia mais

Análise de Variância. Comparação de duas ou mais médias

Análise de Variância. Comparação de duas ou mais médias Análse de Varânca Comparação de duas ou mas médas Análse de varânca com um fator Exemplo Um expermento fo realzado para se estudar dabetes gestaconal. Desejava-se avalar o comportamento da hemoglobna (HbA)

Leia mais

Cap. IV Análise estatística de incertezas aleatórias

Cap. IV Análise estatística de incertezas aleatórias TLF 010/11 Cap. IV Análse estatístca de ncertezas aleatóras Capítulo IV Análse estatístca de ncertezas aleatóras 4.1. Méda 43 4.. Desvo padrão 44 4.3. Sgnfcado do desvo padrão 46 4.4. Desvo padrão da méda

Leia mais

Cálculo Numérico BCC760 Interpolação Polinomial

Cálculo Numérico BCC760 Interpolação Polinomial Cálculo Numérco BCC76 Interpolação Polnomal Departamento de Computação Págna da dscplna http://www.decom.ufop.br/bcc76/ 1 Interpolação Polnomal Conteúdo 1. Introdução 2. Objetvo 3. Estênca e uncdade 4.

Leia mais

CONTROLADORES FUZZY. Um sistema de controle típico é representado pelo diagrama de blocos abaixo:

CONTROLADORES FUZZY. Um sistema de controle típico é representado pelo diagrama de blocos abaixo: CONTROLADORES FUZZY Um sstema de controle típco é representado pelo dagrama de blocos abaxo: entrada ou referênca - erro CONTROLADOR snal de controle PLANTA saída A entrada ou referênca expressa a saída

Leia mais

2 Redes Neurais Auto-Organizáveis

2 Redes Neurais Auto-Organizáveis 2 Redes Neuras Auto-Organzáves 2.1 Introdução Problemas de clusterng estão presentes nos mas varados contetos, como por eemplo: classfcação de padrões, mneração de dados e recuperação de nformações de

Leia mais

Classificação de Padrões

Classificação de Padrões Classfcação de Padrões Introdução Classfcadores Paramétrcos Classfcadores Sem-paramétrcos Redução da Dmensonaldade Teste de Sgnfcânca 6.345 Sstema de Reconhecmento de Voz Teora Acústca da Produção de Voz

Leia mais

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EATAS DEPARTAMENTO DE ESTATÍSTICA UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

Leia mais

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral. DEFINIÇÕES ADICIONAIS: PROBABILIDADE Espaço amostral (Ω) é o conjunto de todos os possíves resultados de um expermento. Evento é qualquer subconjunto do espaço amostral. Evento combnado: Possu duas ou

Leia mais

Estatística II Antonio Roque Aula 18. Regressão Linear

Estatística II Antonio Roque Aula 18. Regressão Linear Estatístca II Antono Roque Aula 18 Regressão Lnear Quando se consderam duas varáves aleatóras ao mesmo tempo, X e Y, as técncas estatístcas aplcadas são as de regressão e correlação. As duas técncas estão

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Plano de Aula Aprendzagem de Máquna Aprendzagem Baseada em Instâncas Alessandro L. Koerch Introdução Espaço Eucldano Aprendzagem Baseada em Instâncas (ou Modelos Baseados em Dstânca) Regra knn (k vznhos

Leia mais

Cap. 5 Classificação Temática

Cap. 5 Classificação Temática Prncípos e Aplcações da Deteção Remota Cap. 5 Classfcação Temátca 5.1 O Processo de Classfcação 5. Classfcação de Máxma Verosmlhança (supervsonada paramétrca) 5..1 Classes multvaradas normas 5.. Lmtes

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-14 PROJETO e ANÁLISE de EPERIMENTOS Professor: Rodrgo A. Scarpel rodrgo@ta.br www.mec.ta.br/~rodrgo Prncípos de cração de modelos empírcos: Modelos (matemátcos, lógcos, ) são comumente utlzados na

Leia mais

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES 1 O nosso objetvo é estudar a relação entre duas varáves quanttatvas. Eemplos:. Idade e altura das cranças.. v. Tempo de prátca de esportes e rtmo cardíaco

Leia mais

3. Estatística descritiva bidimensional

3. Estatística descritiva bidimensional 3. Estatístca descrtva bdmensonal (Tabelas, Gráfcos e números) Análse bvarada (ou bdmensonal): avala o comportamento de uma varável em função da outra, por exemplo: Quantas TV Phlps são venddas na regão

Leia mais

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas 3.6. Análse descrtva com dados agrupados Em algumas stuações, os dados podem ser apresentados dretamente nas tabelas de frequêncas. Netas stuações devemos utlzar estratégas específcas para obter as meddas

Leia mais

2 Aproximação por curvas impĺıcitas e partição da unidade

2 Aproximação por curvas impĺıcitas e partição da unidade Aproxmação por curvas mpĺıctas e partção da undade Este capítulo expõe alguns concetos báscos necessáros para o entendmento deste trabalho 1 Curvas Algébrcas Um subconjunto O R é chamado de uma curva mplícta

Leia mais

Experiência V (aulas 08 e 09) Curvas características

Experiência V (aulas 08 e 09) Curvas características Experênca (aulas 08 e 09) Curvas característcas 1. Objetvos 2. Introdução 3. Procedmento expermental 4. Análse de dados 5. Referêncas 1. Objetvos Como no expermento anteror, remos estudar a adequação de

Leia mais

INTRODUÇÃO À PROBABILIDADE. A probabilidade é uma medida da incerteza dos fenômenos. Traduz-se por um número real compreendido de 0 ( zero) e 1 ( um).

INTRODUÇÃO À PROBABILIDADE. A probabilidade é uma medida da incerteza dos fenômenos. Traduz-se por um número real compreendido de 0 ( zero) e 1 ( um). INTRODUÇÃO À PROILIDDE teora das probabldade nada mas é do que o bom senso transformado em cálculo probabldade é o suporte para os estudos de estatístca e expermentação. Exemplos: O problema da concdênca

Leia mais

Contabilometria. Aula 8 Regressão Linear Simples

Contabilometria. Aula 8 Regressão Linear Simples Contalometra Aula 8 Regressão Lnear Smples Orgem hstórca do termo Regressão Le da Regressão Unversal de Galton 1885 Galton verfcou que, apesar da tendênca de que pas altos tvessem flhos altos e pas axos

Leia mais

4.1 Modelagem dos Resultados Considerando Sazonalização

4.1 Modelagem dos Resultados Considerando Sazonalização 30 4 METODOLOGIA 4.1 Modelagem dos Resultados Consderando Sazonalzação A sazonalzação da quantdade de energa assegurada versus a quantdade contratada unforme, em contratos de fornecmento de energa elétrca,

Leia mais

2 Lógica Fuzzy Introdução

2 Lógica Fuzzy Introdução 2 Lógca Fuzzy 2.. Introdução A lógca fuzzy é uma extensão da lógca booleana, ntroduzda pelo Dr. Loft Zadeh da Unversdade da Calfórna / Berkeley no ano 965. Fo desenvolvda para expressar o conceto de verdade

Leia mais

ANÁLISE DA VARIÂNCIA DA REGRESSÃO

ANÁLISE DA VARIÂNCIA DA REGRESSÃO ANÁLISE DA VARIÂNCIA DA REGRESSÃO PROCEDIMENTO GERAL DE REGRESSÃO Em um modelo de análse de varânca, como no DIA, o fator em estudo pode ser quanttatvo ou qualtatvo. FATOR QUANTITATIVO: é aquele cujos

Leia mais

Teoria da Regressão Espacial Aplicada a. Sérgio Alberto Pires da Silva

Teoria da Regressão Espacial Aplicada a. Sérgio Alberto Pires da Silva Teora da Regressão Espacal Aplcada a Modelos Genércos Sérgo Alberto Pres da Slva ITENS DE RELACIONAMENTOS Tópcos Báscos da Regressão Espacal; Banco de Dados Geo-Referencados; Modelos Genércos Robustos;

Leia mais

O íon lantanídeo no acoplamento Russell-Saunders e a classificação de seus estados segundo os subgrupos do grupo GL(4

O íon lantanídeo no acoplamento Russell-Saunders e a classificação de seus estados segundo os subgrupos do grupo GL(4 O íon lantanídeo no acoplamento Russell-aunders e a classfcação de seus estados segundo os subgrupos do grupo G(4 ) O hamltonano, H, dos íons lantanídeos contém uma parte que corresponde ao campo central,

Leia mais

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha) Estatístca p/ Admnstração II - Profª Ana Cláuda Melo Undade : Probabldade Aula: 3 Varável Aleatóra. Varáves Aleatóras Ao descrever um espaço amostral de um expermento, não especfcamos que um resultado

Leia mais

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental. Prof. Lorí Val, Dr. vall@mat.ufrgs.br http://www.mat.ufrgs.br/~vall/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal http://www.mat.ufrgs.br/~vall/ ou expermental. Numa relação

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 77 Intelgênca Artfcal Aula 8 Redes Neuras Edrle Soares de Lma Formas de Aprendzado Aprendzado Supervsonado Árvores de decsão. K-Nearest Neghbor (KNN). Support Vector Machnes (SVM).

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendzagem de Máquna Aprendzado baseado em nstâncas Aprendzado não-paramétrco Quando as suposções fetas por métodos paramétrcos não são váldas para todo o espaço de entrada, provocando erros predtvos

Leia mais

u a mesma área, na escala de 1: , tomadas a cada intervalo de 18 dias.

u a mesma área, na escala de 1: , tomadas a cada intervalo de 18 dias. QUANTFCAÇÃO E SENSORAMENTO REMOTO NA NVESTGAÇÃO GEOGRÁFCA A evolução recente da cênca tem colocado, com certa frequênca, o nvestgador em stuação crítca face à massa de nformações, dados e meos para sua

Leia mais

Introdução às Medidas em Física a Aula

Introdução às Medidas em Física a Aula Introdução às Meddas em Físca 4300152 8 a Aula Objetvos: Experênca Curvas Característcas Meddas de grandezas elétrcas: Estudar curvas característcas de elementos resstvos Utlzação de um multímetro Influênca

Leia mais

DIFERENCIANDO SÉRIES TEMPORAIS CAÓTICAS DE ALEATÓRIAS ATRAVÉS DAS TREND STRIPS

DIFERENCIANDO SÉRIES TEMPORAIS CAÓTICAS DE ALEATÓRIAS ATRAVÉS DAS TREND STRIPS 177 DIFERENCIANDO SÉRIES TEMPORAIS CAÓTICAS DE ALEATÓRIAS ATRAVÉS DAS TREND STRIPS Antôno Carlos da Slva Flho Un-FACEF Introdução Trend Strps (TS) são uma nova técnca de análse da dnâmca de um sstema,

Leia mais

Estatística Espacial: Dados de Área

Estatística Espacial: Dados de Área Estatístca Espacal: Dados de Área Dstrbução do número observado de eventos Padronzação e SMR Mapas de Probabldades Mapas com taxas empírcas bayesanas Padronzação Para permtr comparações entre dferentes

Leia mais

Métodos Avançados em Epidemiologia

Métodos Avançados em Epidemiologia Unversdade Federal de Mnas Geras Insttuto de Cêncas Exatas Departamento de Estatístca Métodos Avançados em Epdemologa Aula 5-1 Regressão Lnear Smples: Estmação e Interpretação da Reta Tabela ANOVA e R

Leia mais

Gabarito da Lista de Exercícios de Econometria I

Gabarito da Lista de Exercícios de Econometria I Gabarto da sta de Exercícos de Econometra I Professor: Rogéro lva Mattos Montor: eonardo enrque A. lva Questão Y X y x xy x ŷ ˆ ˆ y ŷ (Y - Y ) (X - X ) (Ŷ - Y ) 360 00-76 -00 35.00 40.000 36-4 30.976 3076

Leia mais

2 Metodologia de Medição de Riscos para Projetos

2 Metodologia de Medição de Riscos para Projetos 2 Metodologa de Medção de Rscos para Projetos Neste capítulo remos aplcar os concetos apresentados na seção 1.1 ao ambente de projetos. Um projeto, por defnção, é um empreendmento com metas de prazo, margem

Leia mais

Aula Características dos sistemas de medição

Aula Características dos sistemas de medição Aula - Característcas dos sstemas de medção O comportamento funconal de um sstema de medção é descrto pelas suas característcas (parâmetros) operaconas e metrológcas. Aqu é defnda e analsada uma sére destes

Leia mais

3 Subtração de Fundo Segmentação por Subtração de Fundo

3 Subtração de Fundo Segmentação por Subtração de Fundo 3 Subtração de Fundo Este capítulo apresenta um estudo sobre algortmos para a detecção de objetos em movmento em uma cena com fundo estátco. Normalmente, estas cenas estão sob a nfluênca de mudanças na

Leia mais

Avaliação do tamanho da amostra de segmentos regulares para estimar a área plantada com café na região sul de Minas Gerais

Avaliação do tamanho da amostra de segmentos regulares para estimar a área plantada com café na região sul de Minas Gerais Avalação do tamanho da amostra de segmentos regulares para estmar a área plantada com café na regão sul de Mnas Geras Marcos Adam Maurco Alves Morera Bernardo Fredrch Theodor Rudorff Insttuto Naconal de

Leia mais

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA APLICAÇÃO NO CONTROLE DE QUALIDADE DE FÁRMACOS Prof. Dr. Marcelo Martns de Sena MÓDULO 04 Undade Unverstára de Cêncas Eatas e Tecnológcas UnUCET Anápols 1 MÓDULO 04

Leia mais

4 Reconhecimento de Padrões

4 Reconhecimento de Padrões 46 4 Reconhecmento de Padrões Este capítulo apresenta de forma lustrada os concetos báscos do Reconhecmento de Padrões e vsa mostrar o potencal desta ferramenta em dversas aplcações. Trata-se de um texto

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Capítulo 2 Reconhecmento de Padrões 2.1 O que é reconhecmento de padrões? Há duas maneras de se reconhecer e/ou classfcar um padrão [CONNEL, S. D. & JAIN, A. K. (2001)]: () classfcação supervsonada: o

Leia mais

2 Principio do Trabalho Virtual (PTV)

2 Principio do Trabalho Virtual (PTV) Prncpo do Trabalho rtual (PT)..Contnuo com mcroestrutura Na teora que leva em consderação a mcroestrutura do materal, cada partícula anda é representada por um ponto P, conforme Fgura. Porém suas propredades

Leia mais

Análise Exploratória de Dados

Análise Exploratória de Dados Análse Exploratóra de Dados Objetvos Análse de duas varáves quanttatvas: obter uma reta que se ajuste aos dados segundo o crtéro de mínmos quadrados; apresentar outros crtéros para a determnação de uma

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neuras (Intelgênca Artfcal) Aula 14 Redes Neuras Edrle Soares de Lma Formas de Aprendzado Aprendzado Supervsonado Árvores de Decsão. K-Nearest Neghbor (KNN). Support Vector Machnes

Leia mais

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média. Estatístca Dscplna de Estatístca 0/ Curso de Admnstração em Gestão Públca Profª. Me. Valéra Espíndola Lessa e-mal: lessavalera@gmal.com Meddas de Dspersão Indcam se os dados estão, ou não, prómos uns dos

Leia mais

Modelagem do crescimento de clones de Eucalyptus via modelos não lineares

Modelagem do crescimento de clones de Eucalyptus via modelos não lineares Modelagem do crescmento de clones de Eucalyptus va modelos não lneares Joselme Fernandes Gouvea 2 Davd Venanco da Cruz 3 Máco Augusto de Albuquerque 3 José Antôno Alexo da Slva Introdução Os fenômenos

Leia mais

SELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP., NO PÓLO GESSEIRO DO ARARIPE

SELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP., NO PÓLO GESSEIRO DO ARARIPE SELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP, NO PÓLO GESSEIRO DO ARARIPE Jáder da Slva Jale Joselme Fernandes Gouvea Alne Santos de Melo Denns Marnho O R Souza Kléber Napoleão Nunes de

Leia mais

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média. Estatístca Dscplna de Estatístca 0/ Curso Superor de tecnólogo em Gestão Ambental Profª. Me. Valéra Espíndola Lessa e-mal: lessavalera@gmal.com Meddas de Dspersão Indcam se os dados estão, ou não, prómos

Leia mais

Figura 3: Diagrama de blocos do sistema de inferência da qualidade.

Figura 3: Diagrama de blocos do sistema de inferência da qualidade. 4 Solução Proposta A metodologa proposta nesta dssertação pode ser dvdda em quatro etapas complementares que estão representadas no dagrama de blocos na Fgura 3. Cada uma delas está descrta através do

Leia mais