DESCOBERTA DE CONHECIMENTO SOBRE DADOS GEOESPACIAIS CENSITÁRIOS COM O AUXILIO DE MAPAS AUTO-ORGANIZÁVEIS LEITE, A. Y. C. M. 1 ; MATOS, L. N. 2 ; SILVA, M. A. S. DA 3 Resumo: O objetivo este trabalho é escobrir conhecimento sobre aos os municípios o estao e Sergipe extraíos o censo agropecuário realizao em 1996 feito pelo IBGE (Instituto Brasileiro e Geografia e Estatística) utilizano Mapas Auto-Organizáveis, um tipo e ree neural artificial (RNA), para auxiliar na ientificação e agrupamentos espaciais e correlação entre as iversas variáveis, visto que os Mapas Auto-Organizáveis tem sio amplamente utilizaos para análise e conjuntos complexos e aos, como aos censitários multivariaos. O resultao obtio através os Planos e Componentes mostrou que caa grupo e municípios e Sergipe utiliza suas terras preominantemente e uma maneira, ou seja, ou para pastagens ou lavoura etc. Palavras-Chave: Mapas Auto-Organizáveis, Daos Geoespaciais, Descoberta e Conhecimento DISCOVERY OF KNOWLEDGE ABOUT CENSUAL GEOESPATIAL DATA USING SELF-ORGANIZING MAPS Abstract: The purpose of this paper it s to iscover knowlege about the ata relate to the cities of the state of Sergipe an extracte from the farming census mae in 1996 by the IBGE (Brazilian Institute of Geography an Statistics) using Self-Organizing Maps, a kin of artificial neural network (ANR), in orer to help the ientification of spatial groupings an correlation between the ifferent variables, since the Self-Organizing Maps have been wiely use for analysis of complex sets of ata, such as multi-varie censual ata. The result accomplishe using Plans of Components showe that each group of cities of Sergipe utilizes its lans mainly in only one way, that is., either for pastures or farming etc. Keywors: Self-Organizing Maps; Geospatial Data; Knowlege Discovery. Introução: Atualmente o volume e aos prouzios é muito grane, o que tornou complexa a análise os mesmos. Para viabilizar a análise exploratória estes aos são utilizaos métoos 1 Alan Yves C. Martins Leite, Grauano em Ciência Da Computação, Universiae Feeral e Sergipe - UFS, alanyves@yahoo.com.br. 2 Drº Leonaro Nogueira Matos, Cientista a Computação, Universiae Feeral e Sergipe - UFS.
estatísticos (análise e fator, k-méias, análise e componentes principais) e métoos e áreas emergentes como Inteligência Artificial, Rees Neurais Artificiais etc. O foco este trabalho é apresentar como uma RNA, mais especificamente os Mapas Auto- Organizáveis e Kohonen (Kohonen s Self-Organizing Map ou simplesmente SOM), auxiliam na análise exploratória e aos complexos, como aos geoespaciais censitários. A partir a visualização e Planos e Componentes é possível e maneira eficiente verificar correlações entre iversas variáveis. O objetivo é ientificar como quatro variáveis censitárias se correlacionam, se existe ou não municípios com comportamentos atípicos, e se há grupos e municípios com características semelhantes (homogêneos). Material e Métoos: O SOM é uma RNA competitiva, com uma camaa e entraa e outra e saía, one caa neurônio a camaa e saía é associao a um vetor a camaa e entraa e uma e suas principais aplicações é a escoberta e agrupamentos e aos. Figura 1 - Topologia a Ree SOM Os Planos e Componentes possibilitam visualizar as correlações entre os atributos e entraa o mapa. Para caa atributo é gerao um Plano e Componente, que é uma representação gráfica (coificação e cores) os valores e caa variável no vetor e pesos. Neurônios com cores similares representam características (ínices) similares. Foi utilizaa uma escala e cores o azul para o vermelho, one quanto mais escuro o tom e azul significa ínices mais baixos e quanto mais escuro o tom e vermelho significa ínices mais altos. Os aos referentes aos municípios e Sergipe, obtios o censo agropecuário 1995/1996 realizao pelo IBGE, foram selecionaos e paronizaos gerano as entraas utilizaas no SOM. Ao total foram quatro variáveis que correspone ao fator Utilização a Terra. Foi utilizao um pacote e funções que implementam os algoritmos a ree SOM para o Matlab chamao SOM Toolbox para visualização os Planos e Componentes. 3 Marcos Aurélio Santos a Silva, Cientista a Computação Embrapa Tabuleiros Costeiros.
Depois e iniciar e apresentar os aos às rees SOM, proceemos à fase e escoberta e conhecimento através a análise os Planos e Componentes, e rotulano os neurônios com os nomes os municípios, o que possibilitou ientificar correlações entre os atributos e entraa. Para geração e um mapa geográfico e Sergipe, colorio e acoro com os resultaos obtios os Planos e Componentes, foi utilizao o SIG (Sistema e Informações Geográfica) Terraview o INPE (Instituto Nacional e Pesquisas Espaciais). Resultaos e Discussão: Através os planos e componentes foi possível extrair conhecimento importante acerca os aos censitários, revelaos pela existência e correlação entre as variáveis envolvias, o que não seria possível fazer pela inspeção os aos em estao bruto. O uso e planos e componentes facilita a realização e cruzamento e informação, aina que e moo subjetivo, por um analista humano. Os mapas geraos não quantificam o grau e similariae entre atributos, mas apresentam visualmente as relações existentes entre eles. Logo abaixo se encontra os Planos e Componentes relacionaos com atributos relativos à utilização a terra: Lavouras_perm_temp Pastagens_nat_art 1.28-1.05 3.61 1.28-1.05-0.897-3.03 1.24-0.897-3.03 Matas_nat_plantaas Lavouras_escanso_proutivas_nao_utilizaas -1.2 2.8 0.799-1.2 SOM 27-Dec-2005 0 2.9 0.949 0 2.9 0.949 0 Figura 2 - Plano e Componentes
Poe-se observar que as variáveis se complementam, one há altos ínices e pastagens, as outras variáveis (lavouras_perm_temp, matas_nat_plantaas e lavouras escanso_proutivas_não_utiliza) apresentam ínices baixos, e que grane parte os municípios utiliza as terras para pastagens. Boquim Perinhas labels Macambira CampoBrito SantaRosaDeLima Cumbe CeroDeSãoJoão MalhaaBois SimãoDias Telha SãoFrancisco Aquiaba Malhaor FeiraNova Divina]Pastora RosáriooCatete SãoMiguelAleixo PeraMole Itabaianinha MonteAlegre Lagarto Dores NossaSenhoraAparecia MoitaBonita RiachaoDantas FreiPaulo Loures AreiaBranca Umbaúba Iniaroba Riachuelo Arauá SaoDomingos Itabaiana Cristinápolis Propriá Carmópolis Socorro Maruim AmparoDeSãoFrancisco Pinhão Capela Carira Siriri Ribeirópolis Muribeca Canhoba TobiasBarreto TomarDoGeru GrachoCaroso Japoatã Glória Itabi Laranjeiras GeneralMaynar ItaporangaDAjua Pacatuba PoçoVere SãoCristóvão SantaLuziaDoItanhy PortoDaFolha IlhaDasFlores SantoAmaroDasBrotas Neópolis Salgao Estância Caniné Aracaju BarraosCoqueiros BrejoGrane Japaratuba SantanaDoSãoFrancisco Pirambu Gararu PoçoReono SOM 27-Dec-2005 Figura 3 - Grae com os rótulos (nomes os municípios)
Figura 4 Mapa e Sergipe Gerao no TerraView Através os rótulos é possível ientificar a relação entre os atributos e os municípios. Seno assim poemos observar que os municípios que utilizam suas terras para lavouras são Aracaju, Barra os Coqueiros, Ilha as Flores, Pacatuba; os que mais apresentam áreas com Matas Naturais são Caniné, Poço Reono, Gararu,Estância; a maioria os municípios utiliza suas terras para pastagens, sejam naturais ou artificiais, estes os que apresentam os mais altos ínices são Malhaa os Bois, Macambira, São Francisco, Aquiabã, Divina Pastora; e os municípios que utilizam suas terras para lavoura, seno que estas estavam em escanso foram Brejo Grane, Salgao, Japaratuba e Santana o São Francisco. Em breve eve ser realizao um novo censo agropecuário no Brasil, seria interessante realizar o mesmo processo e comparar os resultaos obtios com este para escobrir se houve muanças significativas nos municípios e Sergipe. Conclusões: Os aspectos positivos na utilização a ree SOM para análises e aos complexos são a faciliae e interpretar os Planos e Componentes e obter informações a partir eles, e que apesar o empirismo envolvio na geração e uma ree SOM, como imensão a ree e número e épocas não há granes variações e resultaos para pequenas variações os parâmetros. Outro fator que eve ser ressaltao é a importância a interação a computação com outras áreas, geografia, economia, entre outras, otimizano suas tarefas, no caso este trabalho a e analisar um
conjunto e aos complexos, é importante ifunir como essas tecnologias poem ser empregaas para resolver certos problemas, como análise e um conjunto e aos complexo. Algo que facilitaria o trabalho seria a integração o TerraView com o Matlab, se os ois ambientes fossem integraos o mapa geográfico estaria ligao à ree SOM, existino uma funcionaliae nessa integração o mapa poeria ser colorio automaticamente e acoro com o resultao obtio a ree. Referências Bibliográficas: - Disponível em: <http://www.pi.inpe.br>. Acesso em 11/08/2005. - HEWITSON, B.; CRANE, R. Neural Nets: applications in geography. Kluwer, p. 53-70, 1994. - KOHONEN, T. Self-Organizing Maps. Springer, 2001. Thir Eition. - KOUA, E. L. Using Self-Organization Maps for Information Visualization an Knowlege Discovery in Complex Geospatial Datasets. Proceeings of the 21 st International Cartographic Conference (ICC), Durban, África o Sul, 2003, p. 1694-1701. - OPENSHAW, Stan; OPENSHAW, Christine. Artificial intelligence in geography. Jhon Wiley, p. 179-197, 1997. - SILVA, Marcos Aurélio Santos ; Mapas Auto-Organizáveis na Análise Exploratória e Daos Geoespaciais Multivariaos. 2004. Teste (Mestrao) INPE. - VESANTO, J.; HIMBERG, J.; ALHONIEMI, E.; PARHANKANGAS, J. Self-Organization Map in Matlab: the SOM Toolbox. Proceeings of the Matlab DSP Conference, 1999, p. 35-40.