Estatístca Espacal: Dados de Área Dstrbução do número observado de eventos Padronzação e SMR Mapas de Probabldades Mapas com taxas empírcas bayesanas
Padronzação Para permtr comparações entre dferentes populações no espaço ou no tempo, varáves devem ser padronzadas. Padronzar as população de rsco por tamanho, estrutura etára e sexo é o mas comum. Padronzação pode ser também por área, por tempo de exposção, etc.
Padronzando os tamanhos de população O3 Pop3 O1 Pop1 O2 Pop2 O4 Pop4 = índce das áreas Em cada área : O = número de eventos em Pop = pop sob rsco em r = O / Pop = taxa em Às vezes, usa-se t = 100000 * r, taxa por 100 ml em
Taxa de Morbdade Padronzada Termnologa: regão é composta de áreas É comum trabalhar com meddas de rsco relatvo. Mas relatvo a quê??? Relatvo ao padrão global da regão Em nglês: standardzed mortalty rato (SMR) Em cada área, calcular o número esperado de eventos caso rsco na área seja gual ao rsco na regão total E = Pop * r onde r = Σ O / Σ Pop Isto é, r = número total de eventos na regão dvddo pela população total na regão Compare o número observado de eventos em com o número esperado: SMR = O / E É comum SMR ser multplcada por 100
Aleatoredade da contagem de eventos Número observado O de eventos na área é varável aleatóra Isto mplca que O possu dstrbução de probabldade, valor esperado, varânca, etc. Hpótese comum: O Posson( λ ) λ = número esperado na área Se rsco é constante na regão, então λ = E onde E = r * Pop
Função de Probabldade da Posson λ=0,3 λ=1 λ=5 λ=10 λ=25 λ=60
Padronzar a estrutura etára/sexo das populações Quando rsco vara com dade ou sexo, não é sufcente apenas a padronzação do tamanho da população Exemplos: Mortes volentas, câncer, doenças cardíacas, AIDS, etc = índce da área j = índce da classe de dade-sexo j=1 ndca MASC de 0 a 4 anos de dade j=2 ndca MASC de 5 a 9 anos de dade, etc...
Número esperado de eventos na área e classe j Fxar atenção numa classe j. Por exemplo, j=5 que sgnfca homens de 20 a 24 anos de dade Oj = número de eventos que ocorreram entre pessoas da classe j na área A taxa global na classe de dade-sexo j é dada por r j = O j Pop j = total de eventos na classe população total na classe j j Então Ej = Popj * rj = número esperado se rsco na classe j fosse constante no espaço
SMR padronzada por dade/sexo Número esperado na área se rsco é constante no espaço é E dado por = E j = soma dos números esperados nas j classes de dade-sexo O Comparar número observado com o esperado: SMR = E Hpótese comum sobre a dstrbução de probabldade dos valores observados: O Posson( λ ) Hpótese adconal de rsco constante no espaço em cada classe de dade-sexo λ = E onde E como acma O Posson( E ) hpótese de rsco constante por ndvíduo
Mapas de SMR Vantagens: escala de rsco RELATIVO permte comparar dferentes varáves se adotamos uma escala escala únca em város mapas. Por exemplo, taxas de morbdade de doenças com ncdênca muto dferentes. Padronzação dreta pode ser usada (com população mundal como padrão) quando queremos oferecer o estudo para possíves comparações nternaconas. Estas taxas tendem a ter mas varânca.
Problemas de Estmação em Áreas Pequenas Valores extremos ocorrem nas áreas com pequenas populações O que mas chama a atenção num mapa (os valores extremos), é o menos confável! As maores osclações não estarão, em geral, assocadas com varações no rsco subjacente; serão apenas flutuação aleatóra casual.
Mortaldade Infantl em MG Taxas muncpas em Mnas Geras em 1994. Exstam 756 muncípos em MG. RMP varam de 0 a 600! Observe a forma de funl. razão de mortaldade padronzada 600 500 400 300 200 100 0 0 5 logartmo nascdos vvos 10
EFEITO DA INSTABILIDADE Exemplo de mortaldade nfantl por muncípo em MG 15 muncípos com: 0 mortes e < 30 nascdos vvos. Se uma únca morte é regstrada, taxas passam de 0 para valores entre 116 e 1048!!! O valor extremo anteror era 608.9
Como resolver? Agregar áreas para formar áreas maores. Desvantagem é perder nformação localzada. Mapas de probabldade (a segur) Estmar melhor o rsco localzado de uma área. Pode-se obter grande redução do problema abordagens bayesanas. Abordagens bayesanas: empírca: fácl de mplementar puramente bayesana: preferível mas requer mas esforço computaconal. Só veremos abordagem bayesana empírca
Mapas de probabldade Choynowsk (JASA, 1959) propôs fazer mapas com P-valores: Suponha O com dstrbução Posson(E ) (rsco constante no espaço). Defna então: ρ = P( X O ) se O E P( X O ) se O < E onde X tem dstrbução Posson(E ). ρ 0 ndca taxa muto alta ou muto baxa.
Mapa de probabldades com mortaldade nfantl em Auckland, NZ
Problemas P-valores muto próxmos de zero se N é muto grande (mas a segur). Não levam em conta smlardade espacal. Não são meddas fáces de nterpretar.
P-valor é nfluencado por E P-valor é nfluencado ao revés pelo tamanho da população de rsco! Pequenas dferenças entre O e E terão ρ próxmo de zero se E é grande. Exemplo: Com E = 1000, se O > 1052 então ρ < 0.05. No entanto, a dferença entre esses valores é de apenas 5,2% do valor esperado. Explcação mas técnca: Suponha que O - E = 1.05 E. Usando Teorema Central do Lmte, 1.05 ( ) X E O E E P X > O = > (0,1) > P P N = P N E E E quando E ( (0,1) > 1.05 E ) 0
Como usar o P-valor? O melhor é NÃO fazer mapas de probabldades baseadas nos ρ Um procedmento possível em duas etapas: Taxa é alta (ou baxa) ou pode ser consderada típca? Típca Nada a fazer Alta P-valor é próxmo de 0? Não Nada a fazer Sm Taxa alta e confável Áreas de rsco elevado
Voltando ao exemplo da NZ Medana = 2.4 (por 1000) percentl 75% = 3.6 percentl 80% = 4.0 Taxa alta é > 4.0 Destas áreas, quas possuem p-valor < 0.05?
Abordagem Bayesana Empírca Hstórco em atlas: Manton, Tsutakawa, etc. Assumr que rscos das dferentes áreas não são totalmente desconectados e assm pedr uma força pros vznhos (to borrow strength from the neghbors) Idéa: contrar taxa em dreção à méda global. Fator de contração depende da população da área.
Exemplo Clássco: Efron Dados de 18 batedores de baseball: n o de vezes no taco e n o de acertos Dados até a metade do campeonato. Qual a melhor predção para o desempenho fnal de cada batedor? Smplesmente a proporção de acertos, certo? Ou não? Usar todos os outros jogadores para estmar um dado jogador. Mas como jogador A pode ajudar a prever o desempenho do jogador B??
Estmação e resultado fnal Meo Fnal Bayes
Proposta de Marshall (1991) Fácl de ser mplementada (pode usar excel) e produz resultados smlares ao de métodos mas sofstcados Idéa: cada área possu um taxa subjacente (por 1) θ desconhecda. Embora dferentes, estas taxas possuem certa estrutura. Se pudéssemos fazer um hstograma desses rscos subjacentes, deveríamos observar algo semelhante a quê? 70 60 frequênca 50 40 30 20 10 0 0 50 100 150 200 250 300 350 rsco relatvo teta * 100
Objetvo: recuperar θ Numa área, observa-se um número aleatóro O de casos. NÃO assummos rsco constante: O tem dstrbução de Posson com número esperado de casos gual a Pop θ Assume-se que as taxas θ possuem dstrbução com méda m e varânca V. Qual é a melhor estmatva possível dos θ? Melhor θˆ em que sentdo? Melhor no sentdo de mnmzar a soma dos erros de estmação de todas as áreas: ˆ ( ) 2 θ θ
Smplfcar o problema Buscar estmatva ótma APENAS DENTRE as estmatvas que podem ser escrtas como médas ponderadas de m e da taxa observada na área Solução: θˆ = w r + (1 w ) m Problema: V e m não são conhecdos. onde Bayes empírco estma estes valores a partr dos dados (daí vem o nome empírco) w = V V m + Pop
Estmando m e V m = O Pop = taxa global V = Pop ( r m) Pop 2 m Pop méda
Taxas usuas (por 1000)
Taxas Bayesanas Empírcas
Estmatva contra em dreção à méda regonal Mortaldade nfantl em MG 600 estmatva bayesana 500 400 300 200 100 0 0 100 200 300 400 500 600 razão de mortaldade padronzada
Efeto de contração é maor nos muncípos menores 400 RMP - Bayes 300 200 100 0-100 0 5 logartmo de nascdos vvos 10
Estmatva Bayesana Empírca Espacal Fazer estmatva bayesana localmente: contrar em dreção a uma méda local e não, a uma méda global Basta aplcar o método anteror em cada área consderando como regão a sua vznhança Isto é equvalente a supor que as taxas da vznhança da área possuem méda m e varânca V