Estatística Espacial: Dados de Área

Documentos relacionados
Capítulo 1. Exercício 5. Capítulo 2 Exercício

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

O problema da superdispersão na análise de dados de contagens

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

x Ex: A tabela abaixo refere-se às notas finais de três turmas de estudantes. Calcular a média de cada turma:

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

MODELOS DE REGRESSÃO PARAMÉTRICOS

7 - Distribuição de Freqüências

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

Estatística II Antonio Roque Aula 18. Regressão Linear

Associação entre duas variáveis quantitativas

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16%

Regressão Múltipla. Parte I: Modelo Geral e Estimação

1. CORRELAÇÃO E REGRESSÃO LINEAR

Inferência Estatística e Aplicações II. Edson Zangiacomi Martinez Departamento de Medicina Social FMRP/USP

2 Incerteza de medição

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

Probabilidade e Estatística I Antonio Roque Aula 4. Resumos Numéricos de Distribuições

Algarismos Significativos Propagação de Erros ou Desvios

Testes não-paramétricos

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

CAPÍTULO 2 - Estatística Descritiva

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

Análise de Regressão

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

Análise Exploratória de Dados

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

Prof. Lorí Viali, Dr.

Aplicações de Estimadores Bayesianos Empíricos para Análise Espacial de Taxas de Mortalidade

Medidas de Tendência Central. Prof.: Ademilson Teixeira

Análise de Regressão Linear Múltipla VII

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

CONCEITOS INICIAIS DE ESTATÍSTICA MÓDULO 2 DISTRIBUIÇÃO DE FREQÜÊNCIA - ELEMENTOS Prof. Rogério Rodrigues

MEDIDAS DE TENDÊNCIA CENTRAL

Análise de Incertezas I.B De Paula

PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 4

AULA EXTRA Análise de Regressão Logística

AEP FISCAL ESTATÍSTICA

Teoria Elementar da Probabilidade

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 3

MEDIDAS DE POSIÇÃO: X = soma dos valores observados. Onde: i 72 X = 12

SELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP., NO PÓLO GESSEIRO DO ARARIPE

2. VARIÁVEIS ALEATÓRIAS

Transcrição:

Estatístca Espacal: Dados de Área Dstrbução do número observado de eventos Padronzação e SMR Mapas de Probabldades Mapas com taxas empírcas bayesanas

Padronzação Para permtr comparações entre dferentes populações no espaço ou no tempo, varáves devem ser padronzadas. Padronzar as população de rsco por tamanho, estrutura etára e sexo é o mas comum. Padronzação pode ser também por área, por tempo de exposção, etc.

Padronzando os tamanhos de população O3 Pop3 O1 Pop1 O2 Pop2 O4 Pop4 = índce das áreas Em cada área : O = número de eventos em Pop = pop sob rsco em r = O / Pop = taxa em Às vezes, usa-se t = 100000 * r, taxa por 100 ml em

Taxa de Morbdade Padronzada Termnologa: regão é composta de áreas É comum trabalhar com meddas de rsco relatvo. Mas relatvo a quê??? Relatvo ao padrão global da regão Em nglês: standardzed mortalty rato (SMR) Em cada área, calcular o número esperado de eventos caso rsco na área seja gual ao rsco na regão total E = Pop * r onde r = Σ O / Σ Pop Isto é, r = número total de eventos na regão dvddo pela população total na regão Compare o número observado de eventos em com o número esperado: SMR = O / E É comum SMR ser multplcada por 100

Aleatoredade da contagem de eventos Número observado O de eventos na área é varável aleatóra Isto mplca que O possu dstrbução de probabldade, valor esperado, varânca, etc. Hpótese comum: O Posson( λ ) λ = número esperado na área Se rsco é constante na regão, então λ = E onde E = r * Pop

Função de Probabldade da Posson λ=0,3 λ=1 λ=5 λ=10 λ=25 λ=60

Padronzar a estrutura etára/sexo das populações Quando rsco vara com dade ou sexo, não é sufcente apenas a padronzação do tamanho da população Exemplos: Mortes volentas, câncer, doenças cardíacas, AIDS, etc = índce da área j = índce da classe de dade-sexo j=1 ndca MASC de 0 a 4 anos de dade j=2 ndca MASC de 5 a 9 anos de dade, etc...

Número esperado de eventos na área e classe j Fxar atenção numa classe j. Por exemplo, j=5 que sgnfca homens de 20 a 24 anos de dade Oj = número de eventos que ocorreram entre pessoas da classe j na área A taxa global na classe de dade-sexo j é dada por r j = O j Pop j = total de eventos na classe população total na classe j j Então Ej = Popj * rj = número esperado se rsco na classe j fosse constante no espaço

SMR padronzada por dade/sexo Número esperado na área se rsco é constante no espaço é E dado por = E j = soma dos números esperados nas j classes de dade-sexo O Comparar número observado com o esperado: SMR = E Hpótese comum sobre a dstrbução de probabldade dos valores observados: O Posson( λ ) Hpótese adconal de rsco constante no espaço em cada classe de dade-sexo λ = E onde E como acma O Posson( E ) hpótese de rsco constante por ndvíduo

Mapas de SMR Vantagens: escala de rsco RELATIVO permte comparar dferentes varáves se adotamos uma escala escala únca em város mapas. Por exemplo, taxas de morbdade de doenças com ncdênca muto dferentes. Padronzação dreta pode ser usada (com população mundal como padrão) quando queremos oferecer o estudo para possíves comparações nternaconas. Estas taxas tendem a ter mas varânca.

Problemas de Estmação em Áreas Pequenas Valores extremos ocorrem nas áreas com pequenas populações O que mas chama a atenção num mapa (os valores extremos), é o menos confável! As maores osclações não estarão, em geral, assocadas com varações no rsco subjacente; serão apenas flutuação aleatóra casual.

Mortaldade Infantl em MG Taxas muncpas em Mnas Geras em 1994. Exstam 756 muncípos em MG. RMP varam de 0 a 600! Observe a forma de funl. razão de mortaldade padronzada 600 500 400 300 200 100 0 0 5 logartmo nascdos vvos 10

EFEITO DA INSTABILIDADE Exemplo de mortaldade nfantl por muncípo em MG 15 muncípos com: 0 mortes e < 30 nascdos vvos. Se uma únca morte é regstrada, taxas passam de 0 para valores entre 116 e 1048!!! O valor extremo anteror era 608.9

Como resolver? Agregar áreas para formar áreas maores. Desvantagem é perder nformação localzada. Mapas de probabldade (a segur) Estmar melhor o rsco localzado de uma área. Pode-se obter grande redução do problema abordagens bayesanas. Abordagens bayesanas: empírca: fácl de mplementar puramente bayesana: preferível mas requer mas esforço computaconal. Só veremos abordagem bayesana empírca

Mapas de probabldade Choynowsk (JASA, 1959) propôs fazer mapas com P-valores: Suponha O com dstrbução Posson(E ) (rsco constante no espaço). Defna então: ρ = P( X O ) se O E P( X O ) se O < E onde X tem dstrbução Posson(E ). ρ 0 ndca taxa muto alta ou muto baxa.

Mapa de probabldades com mortaldade nfantl em Auckland, NZ

Problemas P-valores muto próxmos de zero se N é muto grande (mas a segur). Não levam em conta smlardade espacal. Não são meddas fáces de nterpretar.

P-valor é nfluencado por E P-valor é nfluencado ao revés pelo tamanho da população de rsco! Pequenas dferenças entre O e E terão ρ próxmo de zero se E é grande. Exemplo: Com E = 1000, se O > 1052 então ρ < 0.05. No entanto, a dferença entre esses valores é de apenas 5,2% do valor esperado. Explcação mas técnca: Suponha que O - E = 1.05 E. Usando Teorema Central do Lmte, 1.05 ( ) X E O E E P X > O = > (0,1) > P P N = P N E E E quando E ( (0,1) > 1.05 E ) 0

Como usar o P-valor? O melhor é NÃO fazer mapas de probabldades baseadas nos ρ Um procedmento possível em duas etapas: Taxa é alta (ou baxa) ou pode ser consderada típca? Típca Nada a fazer Alta P-valor é próxmo de 0? Não Nada a fazer Sm Taxa alta e confável Áreas de rsco elevado

Voltando ao exemplo da NZ Medana = 2.4 (por 1000) percentl 75% = 3.6 percentl 80% = 4.0 Taxa alta é > 4.0 Destas áreas, quas possuem p-valor < 0.05?

Abordagem Bayesana Empírca Hstórco em atlas: Manton, Tsutakawa, etc. Assumr que rscos das dferentes áreas não são totalmente desconectados e assm pedr uma força pros vznhos (to borrow strength from the neghbors) Idéa: contrar taxa em dreção à méda global. Fator de contração depende da população da área.

Exemplo Clássco: Efron Dados de 18 batedores de baseball: n o de vezes no taco e n o de acertos Dados até a metade do campeonato. Qual a melhor predção para o desempenho fnal de cada batedor? Smplesmente a proporção de acertos, certo? Ou não? Usar todos os outros jogadores para estmar um dado jogador. Mas como jogador A pode ajudar a prever o desempenho do jogador B??

Estmação e resultado fnal Meo Fnal Bayes

Proposta de Marshall (1991) Fácl de ser mplementada (pode usar excel) e produz resultados smlares ao de métodos mas sofstcados Idéa: cada área possu um taxa subjacente (por 1) θ desconhecda. Embora dferentes, estas taxas possuem certa estrutura. Se pudéssemos fazer um hstograma desses rscos subjacentes, deveríamos observar algo semelhante a quê? 70 60 frequênca 50 40 30 20 10 0 0 50 100 150 200 250 300 350 rsco relatvo teta * 100

Objetvo: recuperar θ Numa área, observa-se um número aleatóro O de casos. NÃO assummos rsco constante: O tem dstrbução de Posson com número esperado de casos gual a Pop θ Assume-se que as taxas θ possuem dstrbução com méda m e varânca V. Qual é a melhor estmatva possível dos θ? Melhor θˆ em que sentdo? Melhor no sentdo de mnmzar a soma dos erros de estmação de todas as áreas: ˆ ( ) 2 θ θ

Smplfcar o problema Buscar estmatva ótma APENAS DENTRE as estmatvas que podem ser escrtas como médas ponderadas de m e da taxa observada na área Solução: θˆ = w r + (1 w ) m Problema: V e m não são conhecdos. onde Bayes empírco estma estes valores a partr dos dados (daí vem o nome empírco) w = V V m + Pop

Estmando m e V m = O Pop = taxa global V = Pop ( r m) Pop 2 m Pop méda

Taxas usuas (por 1000)

Taxas Bayesanas Empírcas

Estmatva contra em dreção à méda regonal Mortaldade nfantl em MG 600 estmatva bayesana 500 400 300 200 100 0 0 100 200 300 400 500 600 razão de mortaldade padronzada

Efeto de contração é maor nos muncípos menores 400 RMP - Bayes 300 200 100 0-100 0 5 logartmo de nascdos vvos 10

Estmatva Bayesana Empírca Espacal Fazer estmatva bayesana localmente: contrar em dreção a uma méda local e não, a uma méda global Basta aplcar o método anteror em cada área consderando como regão a sua vznhança Isto é equvalente a supor que as taxas da vznhança da área possuem méda m e varânca V