ESTIMAÇÃO DE POPULAÇÕES HUMANAS VIA IMAGENS DE SATÉLITE: COMPARANDO ABORDAGENS E MODELOS Renzo Joel Flores Ortiz e Ilka Afonso Reis Laboratório de Estatística Espacial (LESTE) Departamento de Estatística Universidade Federal de Minas Gerais O tamanho da população humana de uma região é um dado importante para a realização de estudos em diversas áreas do conhecimento. No Brasil, as contagens populacionais são realizadas em períodos em intervalos de cinco anos. No entanto, a população de uma região pode ser uma característica bastante dinâmica. Por exemplo, em regiões de acelerada ocupação imobiliária, o tamanho da população experimenta mudanças significativas em intervalos de tempo menores do que cinco anos. Deste modo, surge a necessidade da estimação de populações em intervalos menores e utilizando metodologia mais barata e rápida do que um recenseamento populacional. De algumas décadas até hoje, o desenvolvimento tecnológico e científico na área de Sensoriamento Remoto trouxe uma alternativa para a solução do problema de estimação de populações humanas: usar imagens de satélite em modelos de regressão. Esta alternativa é mais viável e barata do que uma contagem populacional em intervalos de tempo menores, já que imagens de satélite são rotineiramente adquiridas para diversos outros fins. As primeiras propostas de estimação de população através de Sensoriamento Remoto utilizaram fotografias aéreas e espaciais (Ogrosky, 1975). Iisaka e Hegedus (1982) estimaram a população de pequenas áreas numa região residencial de Tóquio, Japão, utilizando imagens do sensor MSS, a bordo do satélite americano LANDSAT. Com o auxílio de imagens
do sensor HRV, a bordo do satélite francês SPOT, Lo (1995) estimou a população e o número de residências em uma parte da região metropolitana de Hong Kong. Em 2002, Harvey utilizou imagens do sensor TM, a bordo do satélite americano LANDSAT5, para estimar a população dos CD (Collect District) de duas regiões situadas na Austrália, empregando duas abordagens distintas apresentadas em (Harvey, 2002a) e (Harvey, 2002b). Seguindo os passos de Harvey, Reis (2005) trabalhou com a estimação da população dos setores censitários do município de Belo Horizonte (MG), melhorando os resultados conseguidos por Harvey em seus dois trabalhos. Em Silva et al (2009), os autores examinaram vários modelos de regressão para estimar a população dos setores censitários de Belo Horizonte no ano de 2000, baseando-se em dados da contagem populacional anterior (1996) e nas imagens do sensor TM. Foram encontrados resultados que superaram os resultados encontrados em Reis (2005). A abordagem comum a todos os trabalhos citados é utilizar modelos de regressão múltipla nos quais a variável dependente é a contagem (ou densidade) populacional e as variáveis explicativas estão relacionadas aos parâmetros da imagem, como por exemplo, os valores médios de reflectância (proporção de energia refletida por um alvo) associados aos pixels da imagem nas várias bandas de um sensor. Em 2006, Lu et al. utilizaram imagens do sensor ETM+, a bordo do satélite americano LANDSAT7, para criar uma imagem das superfícies impermeáveis, que foi usada para estimar a população residencial de um condado nos Estados Unidos. Essa imagem é o resultado de um processamento relativamente complexo das imagens originais de um sensor, envolvendo o modelo de mistura espectral (Smith et al. 1990). Essa única imagem é utilizada como a variável explicativa de um modelo de regressão linear simples. O objetivo deste trabalho é comparar as abordagens utilizadas por Lu et al (2006) e Silva et al (2009). No primeiro trabalho, os autores utilizam um modelo de regressão simples com uma variável explicativa que é o resultado de um processamento das imagens originais. No segundo
trabalho, os autores utilizam um modelo de regressão múltipla cujas variáveis explicativas são as imagens originais e a contagem populacional do período anterior ao período cuja a população será estimada. Como os dois trabalhos utilizaram-se de estratégias diferentes para selecionar e avaliar seus modelos, é necessário refazer o trabalho de Silva et al. (2009) para que seus resultados possam ser comparados aos de Lu et al. (2006). 1 - Materiais e Métodos Os dados utilizados neste trabalho estão no banco de dados geográficos que contém as populações nos setores censitários de Belo Horizonte para os anos de 2000 e 1996 e também as imagens do sensor TM para o ano de 2000. Seguindo a estratégia de Lu et al. (2006), o conjunto dos 2525 setores censitários são separados aleatoriamente em dois sub-conjuntos: 75% dos setores é utilizado no ajuste dos modelos de regressão e o restante é reservado para avaliar este ajuste. A avaliação do ajuste é feita utilizando-se o valor da mediana dos valores absolutos dos erros relativos de cada setor (ERM), abordagem que é comum a ambos os trabalhos. Em Silva et al. (2009), os setores são divididos em grupos homogêneos quanto à densidade populacional de 1996, já que a densidade populacional do ano de 2000 está correlacionada com a densidade populacional de 1996. Isto melhora as predições do modelo de regressão por meio da redução na variabilidade da resposta. Em adição a essa estratégia de modelagem, este trabalho pretende encontrar grupos ainda mais homogêneos. Esta é uma tentativa de identificar grupos de setores para os quais as estimativas populacionais via imagens orbitais tenham erros mais aceitáveis.
2 - Resultados Esperados O modelo em Lu et al. (2006) conseguiu predições com erro relativo mediano de 23%. Utilizando uma estratégia diferente, o melhor modelo de Silva et al. (2009) conseguiu predições com um erro relativo mediano de 12%. Neste trabalho, espera-se manter ou até mesmo melhorar os erros de predição conseguidos com a estratégia de modelagem de Silva et al. (2009). 3 - Agradecimentos Os autores agradecem à Fundação de Amparo à Pesquisa do Estado de Minas Gerais (FAPEMIG) pelo apoio na participação do SINAPE 2010. 4 - Referências Bibliográficas Harvey, J. T. (2002a) Estimating census district populations from satellite imagery: some approaches and limitations. International Journal of Remote Sensing, vol. 23, n. 10, p. 2071-2095.. (2002b) Population estimation models based on Individuals TM Pixels. Photogrammetric Engineering and Remote Sensing, vol. 68, n. 11, p. 1181-1192. Iisaka J.; Hegedus, E. (1982) Population estimation from Landsat Imagery. Remote Sensing of Environment, vol. 12, p. 259-272. Lo, C. P. (1995) Automated population and dwelling unit estimation from high-resolution satellite images: a GIS approach. International Journal of Remote Sensing, vol. 16, n.1, p. 2071-2095.
Lu, D., Weng, Q. Li, G. (2006) Residential population estimation using a remote sensing derived impervious surface approach, International Journal of Remote Sensing, 27, No. 16, 20 August 2006, 3553 3570. Ogrosky, C. E. (1975) Population estimates from satellite imagery. Photogrammetric Engineering and Remote Sensing, vol. 41, p. 707-712. R Development Core Team (2009). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL: <http://www.r-project.org>. Reis, I. A. (2005) Estimação da população dos setores censitários de Belo Horizonte usando imagens de satélite. In: XII Simpósio Brasileiro de Sensoriamento Remoto, 2005, Goiânia. Anais do XII Simpósio Brasileiro de Sensoriamento Remoto, v. 1. p. 2741-2748. Silva, V. L., Reis, I.A., Reis, E.A. (2009) Modelos de Regressão para Estimação de Populações via Imagens de Satélite. Relatório Técnico do Departamento de Estatística da Universidade Federal de Minas Gerais (RPT 03/2009). Disponível em: <http://www.est.ufmg.br/portal/arquivos/rts/relatorio_tecnico_est_publica do.pdf> Smith, M.O., Ustin, S.L., Adams, J.B. And Gillespie, A.R. (1990) Vegetation in Deserts: A regional measure of abundance from multispectral images. Remote Sensing of Environment, 31, pp. 1 26.