2 ANÁLISE ESPACIAL DE EVENTOS



Documentos relacionados
Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

NOTA II TABELAS E GRÁFICOS

Variabilidade Espacial do Teor de Água de um Argissolo sob Plantio Convencional de Feijão Irrigado

5.1 Seleção dos melhores regressores univariados (modelo de Índice de Difusão univariado)

Professor Mauricio Lutz CORRELAÇÃO

TEORIA DE ERROS * ERRO é a diferença entre um valor obtido ao se medir uma grandeza e o valor real ou correto da mesma.

Introdução e Organização de Dados Estatísticos

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

Probabilidade e Estatística. Correlação e Regressão Linear

Introdução à Análise de Dados nas medidas de grandezas físicas

REGRESSÃO LOGÍSTICA. Seja Y uma variável aleatória dummy definida como:

Regressão e Correlação Linear

Covariância e Correlação Linear

PARTE Apresente as equações que descrevem o comportamento do preço de venda dos imóveis.

Objetivos da aula. Essa aula objetiva fornecer algumas ferramentas descritivas úteis para

Y X Baixo Alto Total Baixo 1 (0,025) 7 (0,175) 8 (0,20) Alto 19 (0,475) 13 (0,325) 32 (0,80) Total 20 (0,50) 20 (0,50) 40 (1,00)

MAPEAMENTO DA VARIABILIDADE ESPACIAL

ESTATÍSTICA MULTIVARIADA 2º SEMESTRE 2010 / 11. EXERCÍCIOS PRÁTICOS - CADERNO 1 Revisões de Estatística

CENTRO UNIVERSITÁRIO DO LESTE DE MINAS GERAIS - UnilesteMG


Ministério da Educação. Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Cálculo do Conceito Preliminar de Cursos de Graduação

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

1. CORRELAÇÃO E REGRESSÃO LINEAR

Controle Estatístico de Qualidade. Capítulo 8 (montgomery)

Despacho Econômico de. Sistemas Termoelétricos e. Hidrotérmicos

Sistemas de Filas: Aula 5. Amedeo R. Odoni 22 de outubro de 2001

MODELOS DE REGRESSÃO PARAMÉTRICOS

O problema da superdispersão na análise de dados de contagens

Sistemas Robóticos. Sumário. Introdução. Introdução. Navegação. Introdução Onde estou? Para onde vou? Como vou lá chegar?

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

Cálculo do Conceito ENADE

Universidade Salvador UNIFACS Cursos de Engenharia Cálculo IV Profa: Ilka Rebouças Freire. Integrais Múltiplas

Estatística stica Descritiva

Regressão Múltipla. Parte I: Modelo Geral e Estimação

Influência dos Procedimentos de Ensaios e Tratamento de Dados em Análise Probabilística de Estrutura de Contenção

IV - Descrição e Apresentação dos Dados. Prof. Herondino

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

PROJEÇÕES POPULACIONAIS PARA OS MUNICÍPIOS E DISTRITOS DO CEARÁ

Associação entre duas variáveis quantitativas

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Prof. Lorí Viali, Dr.

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA CE 071 ANÁLISE DE REGRESSÃO LINEAR. Cesar Augusto Taconeli

3ª AULA: ESTATÍSTICA DESCRITIVA Medidas Numéricas

Avaliação da Tendência de Precipitação Pluviométrica Anual no Estado de Sergipe. Evaluation of the Annual Rainfall Trend in the State of Sergipe

Contabilometria. Aula 8 Regressão Linear Simples

Testes não-paramétricos

Capítulo 1. Exercício 5. Capítulo 2 Exercício

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16%

7 - Distribuição de Freqüências

7. Resolução Numérica de Equações Diferenciais Ordinárias

Distribuição de Massa Molar

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

CORRELAÇÃO E REGRESSÃO

Apostila de Estatística Curso de Matemática. Volume II Probabilidades, Distribuição Binomial, Distribuição Normal. Prof. Dr. Celso Eduardo Tuna

Estatística II Antonio Roque Aula 18. Regressão Linear

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

Nota Técnica Médias do ENEM 2009 por Escola

ROGÉRIO ALVES SANTANA. AVALIAÇÃO DE TÉCNICAS GEOESTATÍSTICAS NO INVENTÁRIO DE POVOAMENTOS DE Tectona grandis L.f.

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

Estatística Espacial: Dados de Área

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

LQA - LEFQ - EQ -Química Analítica Complemantos Teóricos 04-05

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

Fast Multiresolution Image Querying

CAPÍTULO VI Introdução ao Método de Elementos Finitos (MEF)

Aplicando o método de mínimos quadrados ordinários, você encontrou o seguinte resultado: 1,2

Elaboração: Fevereiro/2008

ESPELHOS E LENTES ESPELHOS PLANOS

As tabelas resumem as informações obtidas da amostra ou da população. Essas tabelas podem ser construídas sem ou com perda de informações.

Aplicações de Estimadores Bayesianos Empíricos para Análise Espacial de Taxas de Mortalidade

Análise de Regressão

Expressão da Incerteza de Medição para a Grandeza Energia Elétrica

O migrante de retorno na Região Norte do Brasil: Uma aplicação de Regressão Logística Multinomial

Modelo Multi-Estado de Markov em Cartões de Crédito. Daniel Evangelista Régis Rinaldo Artes

PLANILHAS EXCEL/VBA PARA PROBLEMAS ENVOLVENDO EQUILÍBRIO LÍQUIDO-VAPOR EM SISTEMAS BINÁRIOS

CQ110 : Princípios de FQ

METROLOGIA E ENSAIOS

2 Máquinas de Vetor Suporte 2.1. Introdução

INTRODUÇÃO AO CÁLCULO DE ERROS NAS MEDIDAS DE GRANDEZAS FÍSICAS

TESTE DO QUI-QUADRADO - Ajustamento

Transcrição:

ANÁLISE ESPACIAL DE EVENTOS Glberto Câmara Marla Sá Carvalho.1 INTRODUÇÃO Neste capítulo serão estudados os fenômenos expressos através de ocorrêncas dentfcadas como pontos localzados no espaço, denomnados processos pontuas. São exemplos: localzação de crmes, ocorrêncas de doenças, e localzação de espéces vegetas. O objetvo destas análses é estudar a dstrbução espacal destes pontos, testando hpóteses sobre o padrão observado: se é aleatóro, se apresentase em aglomerados ou se os pontos estão regularmente dstrbuídos. O objeto de nteresse é a própra localzação espacal dos eventos em estudo. O tpo de dado nestes estudos consste em uma sére de coordenadas de pontos (p 1, p,...) dos eventos de nteresse dentro da área de estudo. O termo evento refere-se a qualquer tpo de fenômeno localzável no espaço que, dentro de nossa escala de nvestgação, possa estar assocado a uma representação pontual. Exemplos ncluem: Epdemologa: resdênca de casos de doenças Socologa: local de ocorrênca de ofensas crmnas Demografa: localzação de cdades Bologa: localzação de espéces vegetas de nteresse Para lustrar estes concetos, consdere a fgura.1, que apresenta a dstrbução de 99 óbtos de menores de um ano, regstrados no ano de 1998, de cranças nascdas no mesmo ano na cdade de Porto Alegre, Ro Grande do Sul, dvddos em neonatas (menores de 8 das de nascdos) e posneonatas (entre 8 das e um ano). A análse de padrões neste tpo de dado pode ser utlzada como uma forma de dentfcação de possíves áreas com maor concentração de mortes nfants, de comparação entre os óbtos nos dos grupos de dade, e de dentfcação de fatores de rsco assocados a esta ocorrênca. Os dados de dstrbuções pontuas têm as seguntes característcas: A área dos eventos não é uma medda válda apesar de em mutos casos ocuparem espaço. Mesmo na análse do padrão de dstrbução de cdades estas são consderadas como um ponto no espaço do estudo.

Os pontos em geral não estão assocados a valores, mas apenas à ocorrênca dos eventos consderados. Em alguns estudos os pontos podem estar assocados a atrbutos de dentfcação, como no exemplo acma, em óbtos neonatas e posneonatas. Quando este atrbuto é elemento do estudo, através da comparação da dstrbução espacal destes atrbutos, denomna-se processo pontual marcado. Fgura -1 - Dstrbução espacal de mortaldade nfantl neonatal e posneonatal - em Porto Alegre em 1998. Nosso nteresse prmáro ao analsar padrões de dstrbução de pontos é determnar se os eventos observados exbem algum padrão sstemátco, em oposção à uma dstrbução aleatóra. Busca-se detectar a exstênca de padrão de conglomerados espacas (cluster), através da constatação de um número acma do esperado de casos excessvamente próxmos, consderando uma dstrbução estocástca, usualmente um processo de Posson. Se um padrão de eventos pontuas apresentar desvos sgnfcatvos do comportamento esperado para uma dstrbução de Posson, sto ndca a exstênca de uma dstrbução espacal dferente da completa aleatoredade, que merece ser objeto de maor análse. Análse Espacal de Dados Geográfcos -

. CARACTERIZAÇÃO DE DISTRIBUIÇÕES DE PONTOS Numa vsão estatístca, processos pontuas são defndos como um conjunto de pontos rregularmente dstrbuídos em um terreno, cuja localzação fo gerada por um mecansmo estocástco. Para sua caracterzação, este processo estocástco pode ser descrto em termos dos efetos de prmera ordem e efetos de segunda ordem. Os efetos de prmera ordem, consderados globas ou de larga escala, correspondem a varações no valor médo do processo no espaço. Neste caso, estamos nteressados na ntensdade do processo, sto é, no número de eventos por undade de área. Efetos de segunda ordem, denomnados locas ou de pequena escala, representam a dependênca espacal no processo, provenente da estrutura de correlação espacal. Para medr a dependênca espacal, procuramos estmar o relaconamento entre pares de eventos (por undade de área) no espaço, o que corresponde a uma aproxmação do cálculo da covarânca entre as varáves aleatóras que representam cada evento 1. Consdera-se um conjunto de pontos ( u,,... ) 1 u numa determnada regão A onde ocorreram eventos. O processo pontual é modelado consderando subregões C N S, N, onde E e a covarânca [ ( ) ( )] S em A através de sua esperança [ N( S )] S j N ( S ) denota o número de eventos em S. Sendo o objetvo da análse estmar as localzações prováves de ocorrênca de determnados eventos, essas estatístcas devem ser nferdas consderando o valor lmte da quantdade de eventos por área. N S para uma pequena regão Este valor lmte corresponde à esperança de ( ) du em torno do ponto u, quando essa tende a zero. Essa esperança é denomnada ntensdade (propredade de prmera ordem), sendo defnda como [ N( du) ] E λ ( u) = lm, (.1) du 0 du Propredades de segunda ordem podem ser defndas da mesma forma, λ u, entre duas regões nfntesmas consderando a ntensdade conjunta ( ) e du j que contém os pontos u e u j. u j [ N( du ), N( du )] du C j λ ( d( u ), d( u j ) = lm (.) du, du j 0 du, du j Quando o processo é estaconáro, ( u) também é sotrópco, ( ) u u j λ, se reduz à λ ( h ) λ é uma constante, ou λ ( ) = λ, sendo h a dstânca entre os dos pontos. Quando o processo é não estaconáro, ou seja, a ntensdade méda vara u ; se 1 Vale relembrar a dscussão do seção 1, onde caracterzamos os eventos no espaço por um processo estocástco, onde cada ocorrênca é uma realzação de uma varável aleatóra dstnta. Análse Espacal de Dados Geográfcos -3

na regão A, a modelagem da estrutura de dependênca ( u, ) λ deve ncorporar a varação de λ ( u). A maor parte das técncas de análse de dstrbução de pontos supõe, explícta ou mplctamente, um comportamento estaconáro e sotrópco do processo aleatóro subjacente aos eventos analsados. No exemplo acma da mortaldade nfantl, a ocorrênca dos óbtos está condconada pela dstrbução dos nascmentos. Além dsso, característcas ndvduas da crança, tas como prematurdade e peso, são mportantes condconantes do óbto. É possível, entretanto, modelar estes eventos e detectar áreas de sobre-rsco, consderando smultaneamente o padrão de dstrbução dos nascmentos e óbtos, e verfcando a varação da ntensdade do evento na regão e a estrutura de correlação local. A análse estatístca dos padrões de dstrbuções de pontos requer um modelo teórco de referênca, base para o desenvolvmento de métodos formas que checam a sgnfcânca dos resultados exploratóros. O modelo teórco mas smples (e bastante aplcado na prátca) é conhecdo como aleatoredade espacal completa ( complete spatal randomness - CSR ). Este modelo dvde a regão de estudo A em subáreas S e modela a dstrbução de eventos pontuas como um processo aleatóro { Z ( u ), u ε S : 1,..., n} (.3) = Neste caso, consderamos Z (u ) como o número de eventos que ocorrem na sub-área S. No modelo CSR, consderamos que as ocorrêncas em cada sub-área são não-correlaconadas e homogêneas, e estão assocadas à mesma dstrbução de probabldade de Posson. Numa vsão ntutva, pode-se consderar que a posção dos eventos é ndependente e de que os eventos tem gual probabldade de ocorrênca em toda a regão A. Esta formulação nos permte estabelecer uma base de comparação entre uma dstrbução completamente aleatóra (que sera gerada por um processo de Posson) e os dados coletados em campo. O procedmento mas usual para estmar a probabldade assocada ao padrão encontrado será produzr uma smulação do processo aleatóro na regão de estudo. Dado um número fxo de eventos meddos em campo (denotado por n), determnamos o retângulo envolvente da regão A (seja {(x,y) : x 1 x x, y 1 y y } ). Os eventos são gerados a partr de abscssas x, obtdas de uma dstrbução unforme em (x 1,x ) e de ordenadas y, obtdas de uma dstrbução unforme em (y 1,y ). Pontos que caem fora da regão são rejetados. Este processo é repetdo até que n eventos tenham sdo obtdos na regão. Podemos gerar um conjunto de smulações, para que possamos obter uma base de comparação entre o comportamento de um processo aleatóro e a dstrbução dos eventos meddos. Os concetos de CSR são utlzados para u j Análse Espacal de Dados Geográfcos -4

caracterzar os efetos de segunda ordem em dstrbução de pontos, utlzando os métodos do vznho mas próxmo e da função K, descrtos a segur. São também utlzados para avalação em város métodos de detecção de aglomerados (clusters)..3 ESTIMADOR DE INTENSIDADE ("KERNEL ESTIMATION") Uma alternatva smples para analsar o comportamento de padrões de pontos é a estmar a ntensdade pontual do processo em toda a regão de estudo. Para sto, pode-se ajustar uma função b-dmensonal sobre os eventos consderados, compondo uma superfíce cujo valor será proporconal à ntensdade de amostras por undade de área. Esta função realza uma contagem de todos os pontos dentro de uma regão de nfluênca, ponderando-os pela dstânca de cada um à localzação de nteresse, como mostrado na Fgura -. Kernel k() Largura Fgura - - Estmador de ntensdade de dstrbução de pontos. A partr dos concetos apresentados, suponha e u 1,...,u n são localzações de n eventos observados em uma regão A e que u represente uma localzação genérca cujo valor queremos estmar. O estmador de ntensdade é computado a partr dos m eventos {u,...u +m-1 } contdos num rao de tamanho τ em torno de u e da dstânca d entre a posção e a -ésma amostra, a partr de funções cuja forma geral é: n ˆ 1 d( u, u) ( u) = k( ), d ( u, u) τ (.4) τ τ λ τ = 1 Este estmador é chamado kernel estmator e seus parâmetros báscos são: (a) um rao de nfluênca (τ 0) que defne a vznhança do ponto a ser nterpolado e controla o "alsamento" da superfíce gerada; (b) uma função de estmação com propredades de suavzação do fenômeno. O rao de nfluênca defne a área centrada no ponto de estmação u que ndca quantos eventos u contrbuem para a estmatva da função ntensdade λ. Um rao muto pequeno rá gerar uma superfíce muto descontínua; se for grande demas, a superfíce poderá fcar muto amacada. No caso da função de nterpolação k(), é comum usar funções de tercera ou quarta ordem, como Análse Espacal de Dados Geográfcos -5

3 k( h) = (1 h ) (.5) π ou o kernel gaussano 1 h k ( h) = exp (.6) πτ τ Nestes estmadores, h representa a dstânca entre a localzação em que desejamos calcular a função e o evento observado. Com o uso desta função de quarta ordem (equação.5), o estmador de ntensdade pode ser expresso como: ˆ 3 h λ ( ) 1 τ u = (.7) h τ πτ τ O estmador de ntensdade é muto útl para nos fornecer uma vsão geral da dstrbução de prmera ordem dos eventos. Trata-se de um ndcador de fácl uso e nterpretação. A fgura.3 lustra a aplcação do estmador de ntensdade para o caso de mortaldade por causas externas em Porto Alegre, com os dados de 1996. A localzação dos homcídos (vermelho), acdentes de trânsto (amarelo) e sucídos (azul) esta mostrada na fgura.3 à esquerda e o estmador de ntensdade dos homcídos é apresentado na fgura.3. A superfíce nterpolada mostra um padrão de dstrbução de pontos com uma forte concentração no centro da cdade e decrescendo em dreção aos barros mas afastados. Fgura.3: Dstrbução de casos de mortaldade por causas externas em Porto Alegre em 1996 e estmador de ntensdade. Análse Espacal de Dados Geográfcos -6

.4 ESTIMADORES DE DEPENDÊNCIA ESPACIAL Para a estmação de propredades de segunda ordem do processo pontual, as técncas mas utlzadas são o vznho mas próxmo e a função K, descrtos a segur. Método do Vznho Mas Próxmo O método do vznho mas próxmo estma a função de dstrbução cumulatva G ˆ ( h ) baseado nas dstâncas h entre eventos em uma regão de análse. Esta função de dstrbução pode ser estmada emprcamente da segunte forma: d u u h Gˆ #( (, j ) ) ( h) = (.8) n onde o valor normalzado acumulado para uma dstânca h corresponde à soma dos vznhos mas próxmos de cada evento cuja dstânca é menor ou gual a h, dvddo pelo número de eventos na regão. A plotagem dos resultados desta função de dstrbução cumulatva empírca G ˆ ( h ) pode ser usada como um método exploratóro para se verfcar se exste evdênca de nteração entre os eventos. Se esta plotagem apresentar um crescmento rápdo para pequenos valores de dstânca, esta stuação aponta para nteração entre os eventos caracterzando agrupamentos nestas escalas. Se esta plotagem apresentar valores pequenos no seu níco, e só crescer rapdamente para valores maores de dstânca, esta stuação aponta para uma dstrbução mas regular. A Fgura -4 mostra a função G ˆ ( h ) para os dados de mortaldade nfantl de Porto Alegre (fgura.1), com dstânca mínma de 0 km e dstânca máxma de 1 km. Verfca-se que a curva mostra um crescmento acentuado para dstâncas até 500 m para depos se establzar, o que caracterza agrupamento nesta faxa de dstâncas. Fgura -4 Função vznho-mas-próxmo para mortaldade nfantl neonatal em Porto Alegre. Análse Espacal de Dados Geográfcos -7

A análse de vznhança pode ser usada como método formal para se comparar estatístcamente a dstrbução dos eventos observados com o que se esperara na hpótese da aleatoredade espacal completa (CSR). Esta metodologa consste em se crar envelopes de smulação para a dstrbução CSR, a fm de se acessar a sgnfcânca dos desvos. Na hpótese de CSR, a função de dstrbução G(w) sera dada por um processo de Posson G( h) = 1 e λπh h 0 (.9) A estmação smulada para a dstrbução G(w) assumndo-se CSR é calculada como k Gˆ ( h) G ( h) = (.10) k onde Gˆ ( h), =1,..,k são funções de dstrbução empírcas, estmadas a partr de k smulações ndependentes dos n eventos, na hpótese de CSR (n eventos ndependentes e unformente dstrbuídos). Para verfcar a condção de aleatoredade, calculamos anda os envelopes de smulação superor e nferor, defndos como se segue: U ( h) L( h) = max{ Gˆ ( h)}, = mn { Gˆ ( h)}, = 1,..., k = 1,..., k (.11) A plotagem da dstrbução estmada G ˆ( h ) versus a dstrbução smulada G (h), com a adção dos envelopes nferor e superor, permte medr a sgnfcânca dos desvos relatvo a aleatoredade. Se a condção CSR for válda para os dados observados, o gráfco da curva de G ˆ( h ) versus G (h) deve ser pratcamente lnear com um ângulo de 45 graus. Se o dado apresenta tendêncas para agrupamentos, os traçados no gráfco estarão acma da lnha de 45 graus, ao passo que para padrões de regulardade os traçados fcarão abaxo da lnha de 45 graus. A Fgura -5 mostra um exemplo de gráfco mostrando o posconamento da dstrbução e dos envelopes com relação a lnha de 45 graus, para os dados referentes mortaldade nfantl neonatal em Porto Alegre. Neste caso percebe-se a posção dos envelopes e da dstrbução acma da lnha de 45 graus, o que caracterza agrupamento para as dstâncas em análse. Análse Espacal de Dados Geográfcos -8

Fgura -5 Gráfco de G ˆ( h ) (estmado) versus G (h) (CSR), com envelopes superor e nferor, para os dados de mortaldade neonatal em Porto Alegre Embora o método do vznho mas próxmo forneça uma ndcação ncal da dstrbução espacal, ele consdera apenas escalas pequenas. Para se ter nformação mas efetva para o padrão espacal em escalas maores, o melhor método a ser utlzado é o da função K. Função K A função K, também denomnada medda de momento de segunda ordem reduzdo, é defnda para o processo unvarado como: λk(h) = E(# eventos contdos a uma dstânca h de um evento arbtráro) (.1) onde # está assocado ao número de eventos, E() é o operador de estmatva, e λ é a ntensdade ou número médo de eventos por undade de área, assumda constante na regão. Uma estmatva de K(h) é: n n A I h dj K ˆ ( ) ( h) = n w (.13) j, j j onde A é a área da regão, n é o número de eventos observados, I h (d j ) é uma função ndcatrz cujo valor é 1 se (d j ) <= h e 0 em caso contráro, e w j é a proporcão da crcunferênca do círculo centrado no evento que está dentro da regão (correção devdo ao efeto de borda). A função K é usada como ferramenta exploratóra na comparação entre estmatva empírca K ˆ ( h ) e a resultante de um processo de padrão de pontos espacal aleatóro K (h). Para um processo aleatóro K(h) sera πh. Portanto, uma forma de comparar a estmatva K de um conjunto de dados observados com πh sera plotar a função L ˆ( h ) defnda como: Análse Espacal de Dados Geográfcos -9

K h L ˆ ˆ ( ) ( h) = h π (.14) O gráfco de L ˆ( h ) em função da dstânca h ndca atração espacal entre eventos ou agrupamentos para valores postvos, sendo o agrupamento mas forte em pcos postvos, e ndca repulsão espacal ou regulardade em pontos de valores negatvos. Uma abordagem smlar à do vznho mas próxmo pode ser feta para se estmar a sgnfcânca dos desvos da dstrbução L ˆ( h ) em relação à condção de aleatoredade (CSR). Os envelopes nferor e superor são construídos a partr de k smulações ndependentes de n eventos na regão A. Na análse do gráfco com a dstrbução e os envelopes, pcos postvos na função estmada L ˆ( h ) que estão acma do envelope superor evdencam ocorrênca de agrupamento na escala consderada, portanto, se todos os valores da função L ˆ( h ) estverem acma do envelope superor e com valores postvos, teremos agrupamentos em todas as escalas. Depressões negatvas na função estmada L ˆ( h ) que estverem abaxo do envelope nferor, evdencam regulardade nessa escala, portanto, se todos os valores de L ˆ( h ) estverem abaxo do envelope nferor e com valores negatvos, tem-se regulardade em todas as escalas. A Fgura -6 mostra o gráfco da função L ˆ( h ) e dos envelopes de smulação para o dado de Porto Alegre (Fgura -1). Verfca-se valores postvos para a função L, estando os mesmos acma dos envelopes, o que caracterza agrupamento em todas as escalas de dstânca. Fgura -6 Função K com smulação para os dados de mortaldade neonatal em Porto Alegre. Análse Espacal de Dados Geográfcos -10

.5 PROCESSO PONTUAL MARCADO Um das stuações mas mportantes na análse espacal de pontos é a possbldade de comparação entre dos processos espacas. Tpcamente, um dos processos representa os casos em estudo, e o outro os casos de um processo pontual que representa um conjunto de casos de controle. Por exemplo, num estudo realzado por Peter Dggle na Inglaterra sobre câncer de larnge, fo utlzado dados de câncer de pulmão como ndcadores da dstrbução espacal da população. Esta stuação pode ser generalzada supondo dos processos pontuas, o prmero cujos casos localzam-se em (u 1,u,...,u 1 ) e o segundo cujos casos estão nos pontos (u n+1,u n+,...,u n+m ). Cada tpo de evento pode ser modelado como uma dstrbução de Posson, I e II, com ntensdades λ 1 (u) e λ (u). Defne-se o rsco na localdade u como uma função da razão entre λ 1 e λ. O objetvo da análse é nvestgar a varação espacal desta razão na regão. Se estmarmos a ntensdade de cada processo através de uma função kernel, a razão entre as duas funções será a ntensdade do rsco. E cada uma das funções estudadas anterormente pode ser adaptada para verfcar a relação entre os pontos do processo I com os pontos do processo II. Por exemplo, vsando estudar a dspersão de duas espéces vegetas pode-se verfcar a relação de cada ponto com o vznho mas próxmo da outra espéce..6 ESTUDOS CASO-CONTROLE Consdere-se um tpo de estudo onde temos dos tpos de eventos, por exemplo recém-natos que morrem antes de completar um ano e os que sobrevvem a esta dade. Sendo esta varável do tpo bnomal a resposta do estudo, dependente de dversas covaráves tas como prematurdade, exstênca de doenças na gravdez, escolardade da mãe, e nclundo sua localzação no espaço, pode-se modelar o processo utlzando o método clássco de regressão logístca, própro para este tpo de dstrbução. O que partcularza o contexto espacal é a forma de se nclur a localzação dos pontos no modelo. Dversas formas de estmar este rsco em cada localdade são possíves, entre as quas utlzar o mesmo kernel da razão como um dos termos da regressão, que toma uma forma sem-paramétrca abaxo: onde: logt y ) = βx g( s ), (.15) ( + y é a varável resposta, e tem a forma sm/não, zero/um (óbtos/nascmentos), a função de lgação da regressão é o logt, como usual para dados bnomas, x é o vetor de covaráves, Análse Espacal de Dados Geográfcos -11

β é o vetor de parâmetros estmado pelo modelo, que no caso da regressão logístca é a razão de chances (odds rato) relaconada a cada covarável, g(s ) é a razão do estmador de ntensdade kernel de casos e controles. O ganho deste tpo de modelagem é possbltar a estmatva da varação espacal do rsco, controlando pelos fatores conhecdos de varação de rsco. Os procedmentos de estmação dos parâmetros destes modelos basea-se em métodos teratvos usuas de modelos adtvos generalzados, onde se estma os parâmetros da regressão, e sobre os resíduos estma-se a função kernel, e assm sucessvamente até que as estmatvas não mas se alterem. O método permte dentfcar áreas de sobre ou sub rsco sgnfcatvamente dferente da méda global. A largura de banda a ser utlzada é mportante, e pode ser defnda através de métodos automátcos ou seleconada pelo pesqusdor vsando ajustar a uma conhecda estrutura espacal. No estudo da mortaldade nfantl em Porto Alegre (fgura -1) os dados foram analsados segundo esta proposta, nclundo como fatores de rsco ndvduas: (a) peso ao nascer, (b) semanas gestaconas, (c) sexo da crança, (d) (e) dade da mãe, (f) grau de nstrução da mãe, (g) tpo de gravdez e (h) tpo de parto, numa regressão logístca cuja expressão é: p( s, x) log = β 0 + β 1 sexo + β peso +β 3 dade +β 4 nst +β 5 ges +β 6 grav +β 7 parto + g(s). 1 p( s, x) (.16) A nterpretação dos resultados é razoavelmente dreta: os parâmetros β ndcam a razão de chances estmada pelo modelo (Quadro -1), da forma usual da regressão logístca, e no mapa são apresentadas as áreas onde a probabldade de obter o valor do kernel estmado está sgnfcatvamente dferente da ntensdade méda do processo. O algortmo para estmar a largura de banda ótma para os dados utlza valdação cruzada de mínmos ponderados para o passo de regressão nãoparamétrca. No passo de suavzamento (Eq..15) escolhe-se o valor de h que mnmza: CV( h ) n = = 1 w 1 { z ĝ ( s )} n, (.17) 1 onde ĝ ( s ) é a estmatva de g( s ) construída com o valor de banda h usando todos os dados com exceção do par (s, z ). Testa-se dferentes valores de h, sendo escolhdo o que mnmza o somatóro. Análse Espacal de Dados Geográfcos -1

Quadro 1: Estmatvas dos efetos de covaráves utlzando o valor da banda obtdo por valdação cruzada Fator Estmatva Erro padrão P-valor Intercepto 4,0717 0,9487 0,0000 Sexo -0,3674 0,713 0,1761 Peso ao nascer -0,0018 0,000 0,0000 Idade da mãe -0,0131 0,0197 0,5059 Instrução da mãe 0,0718 0,753 0,794 Duração da gestação 1,1685 0,3737 0,0018 Tpo de gravdez -0,006 0,6558 0,7598 Tpo de parto -0,530 0,838 0,0613 A fgura -7 mostra os mapas de rsco para a mortaldade nfantl após, ncluídas as co-varáves ndvduas da crança e da mãe. É nteressante observar que no centro da cdade de Porto Alegre exste uma regão onde o rsco da mortaldade é sgnfcatvamente menor e outra onde é maor. Quanto às varáves ndvduas, somente foram sgnfcatvas o peso ao nascer, que é reconhecdamente a varável mas assocada à mortaldade neo-natal, e a duração da gestação, ndcatvo de prematurdade. Além de mapeamento do rsco, é mportante avalar se a superfíce estmada vara sgnfcatvamente na regão, ou seja, se exstem evdêncas estatístcas sufcentes para rejetar a hpótese nula de rsco constante na regão, tendo-se controlado os fatores ndvduas de rsco. Em termos do modelo, sso equvale ao teste da hpótese H 0 : g(s)=0. Também é de nteresse a construção de contornos de tolerânca que auxlam na dentfcação de áreas onde o rsco é sgnfcatvamente superor (ou nferor) à méda global. Ou seja, reconhecendo o papel de um dado fator como um predtor mportante da mortaldade nfantl e controlando-o, deseja-se dentfcar áreas onde o rsco é sgnfcatvamente mas elevado, buscando orentar a ntervenção. Análse Espacal de Dados Geográfcos -13

Fgura -7. Mapas de rsco para a mortaldade nfantl, controlando para fatores ndvduas, com a largura de banda estmada por valdação cruzada, Porto Alegre, 1998 O teste global do rsco e a dentfcação de áreas de baxo e alto rsco podem ser fetos utlzando o método de smulação Monte Carlo, segundo os passos do algortmo abaxo: 1. Ajustando-se um modelo de regressão logístca convenconal, para cada evento caso ou controle estma-se a probabldade ajustada pˆ. Ou seja, dadas as covaráves daquele regstro, qual é a probabldade ser um caso.. Fxando-se as localzações de cada ponto, amostra-se m dos n ndvíduos (sem reposção) com probabldade proporconal a pˆ e estes são rotulados como casos e os n-m restantes como controles. 3. Calcula-se uma nova estmatva de g(s), ( s ), a estmatva centralzada em torno da méda n ( g ~ ( s ) 1 t = n ). 1 1 = 1 4. Repete-se os passos 1 e m vezes. 1 1 1 ĝ 1 g ~ n 1 ( s ) = ĝ ( s ) g, onde g = n ĝ ( s e a estatístca ) 1 1 = 1 5. Constró-se uma superfíce de p-valores que para cada s fornece a proporção dos valores de g ~ ( s ), j=1,,m, menores do que a estmatva orgnal, j dgamos g ~ ( s ). 0 Análse Espacal de Dados Geográfcos -14

6. Adcona-se os contornos de 0.05 e 0.95 da superfíce de p-valores ao mapa de g ~ ( s ) como contornos de 90% de confança para ndcar áreas de alto/baxo 0 rsco. 7. Para o teste de hpótese, defne-se k o número de t j >t 0 (obtda a partr de g ~ ( s ) ) e o nível de sgnfcânca correspondente por p = ( k + 1) ( m + 1). 0.7 REFERÊNCIAS A referênca das técncas mas báscas apresentadas neste capítulo é o lvro de Trevor Baley, Spatal Data Analyss by Example (Baley and Gattrel, 1995). As técncas de caso-controle espacal foram desenvolvdas por Peter Dggle e colaboradores, e a maor parte das rotnas e algortmos está dsponível na págna da do Departamento de Matemátca e Estatístca da Unversdade de Lancaster (http://www.maths.lancs.ac.uk). O relatóro técnco An S+ lbrary on rsk estmaton and cluster detecton n case-control studes, de Jarner, M. F. and Dggle, P. J., mostra as funções desenvolvdas e como usá-las. Está dsponível em http://www.maths.lancs.ac.uk/dept/stats/techabstracts0.html. Os modelos adtvos generalzados, que servem de base para a extensão espacal podem ser melhor estudados em HASTIE, T. J.; TIBSHIRANI, R. J., 1990, Generalzed Addtve Models. London:Chapman and Hall. Um excelente lvro para estudar modelos de regressão é o HOSMER, D. W.; LEMESHOW, S., 1989, Appled Logstc Regresson. New York:Wley. Os trabalho sobre mortaldade nfantl em Porto Alegre fo publcado no número especal dos Cadernos de Saúde Públca sobre o tema de estatístcas espacas em saúde (volume 17(5), outubro-novembro 001, 151-161), dsponível na Internet (www.scelo.br). 1. DIGGLE, P. J., 199. Pont process modellng n envronmental epdemology. Relatóro Técnco MA9/70, Lancaster: Department of Mathematcs and Statstcs, Lancaster Unversty.. KELSALL, J. E.; DIGGLE, P. J., 1995b. Non-parametrc estmaton of spatal varaton n relatve rsk. Statstcs n Medcne, 14:335-34. 3. KELSALL, J. E.; DIGGLE, P. J., 1998. Spatal varaton n rsk of dsease: a nonparametrc bnary regresson approach. Appled Statstcs, 47:559-573. Análse Espacal de Dados Geográfcos -15