Técnicas de Amostragem

Documentos relacionados
TÉCNICAS DE AMOSTRAGEM

Técnicas de Amostragem

AMOSTRAGEM. É a parte da Teoria Estatística que define os procedimentos para os planejamentos amostrais e as técnicas de estimação utilizadas.

Bioestatística Aula 4

TÉCNICAS DE AMOSTRAGEM

Noções de Amostragem

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

P. P. G. em Agricultura de Precisão DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)

Em várias ocasiões há de se proceder à coleta de dados diretamente na origem, isto é, dos sujeitos com quem pretendemos realizar determinado estudo.

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

TÉCNICAS DE AMOSTRAGEM

Sistema de Informações e Pesquisa de Marketing Aula 12 24/10/17

Amostras, amostragem e tamanho da amostra

Intervalos de Confiança

AULA 4: DISTRIBUIÇÕES DE PROBABILIDADES AMOSTRAIS. Gleici Castro Perdoná

Amostra Aleatória Simples

Inventário Florestal. Amostragem

Estatística Aplicada à Gestão

BIOESTATÍSTICA AULA 4. Anderson Castro Soares de Oliveira Jose Nilton da Cruz. Departamento de Estatística/ICET/UFMT

Estatística II Aula 2. Prof.: Patricia Maria Bortolon, D. Sc.

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Les Estatística Aplicada II AMOSTRA E POPULAÇÃO

Em várias ocasiões há de se proceder à coleta de dados diretamente na origem, isto é, dos sujeitos com quem pretendemos realizar determinado estudo.

A Importância do Desenho Amostral. Donald Pianto Departamento de Estatística UnB

Universidade Federal de Lavras

Professora Ana Hermínia Andrade. Período

CAPÍTULO 3 POPULAÇÃO E AMOSTRA

Cap. 4 - Estimação por Intervalo

Amostragem e Distribuição Amostral. Tipos de amostragem, distribuição amostral de média, proporção e variância

AULA 03 Estimativas e tamanhos amostrais

17/07/2017. Semiprobabilística. Amostra. Amostra Probabilística. Estatística. Amostra Não probabilística TÉCNICAS DE AMOSTRAGEM NOÇÕES DE AMOSTRAGEM

TÉCNICAS DE AMOSTRAGEM

01/06/2016. Semiprobabilística. Amostra. Amostra Probabilística. Bioestatística. Amostra Não probabilística TÉCNICAS DE AMOSTRAGEM

Introdução à Probabilidade e à Estatística II

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva

III AMOSTRAGEM E INTERVALO DE CONFIANÇA Conceito de Amostragem AMOSTRA ALEATÓRIA

Bioestatística INFERÊNCIA ESTATÍSTICA. Silvia Shimakura

5 Avaliação dos estimadores propostos

Intervalos de Confiança

MAE0229 Introdução à Probabilidade e Estatística II

Inferência Estatistica

Noções de Amostragem. Universidade Estadual de Santa Cruz Gustavo Fragoso

Estimativas e Tamanhos de Amostras

5 TORIA ELEMENTAR DA AMOSTRAGEM

Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM

1 NOÇÕES DE AMOSTRAGEM

Probabilidade e Estatística

INTRODUÇÃO

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Elementos de Estatística. Michel H. Montoril Departamento de Estatística - UFJF

amostra é o subconjunto do universo ou da população por meio do qual se estabelecem ou se estimam as características desse universo ou população

27/05/2016. Semiprobabilística. Amostra. Amostra Probabilística. Bioestatística TÉCNICAS DE AMOSTRAGEM NOÇÕES DE AMOSTRAGEM. Amostra Sistemática

TIPOS DE AMOSTRAGEM Amostragem Probabilística e Não-Probabilística. Amostragem PROBABILÍSTICA: Amostragem Aleatória Simples: VANTAGENS:

Teoria de probabilidade - objetiva descrever e prever as características de populações infinitas

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

Distribuições Amostrais

Introdução à Inferência Estatística

Fernando de Pol Mayer

Inferência Estatística:

Introdução à Inferência Estatística

Capítulo 4 Inferência Estatística

Teorema central do limite e es/mação da proporção populacional p

Distribuições Amostrais - Tamanho da Amostra

Amostragem: Planejamento e Processos. Cap. 12 e 13 Introdução a Pesquisa de Marketing Naresh K. Malhotra

HEP-5800 BIOESTATÍSTICA

Estimador: combinação dos elementos da amostra, construída com a finalidade de representar, ou estimar, um parâmetro de interesse na população.

Inferência Estatística: Conceitos Básicos II

ESTIMAÇÃO DE PARÂMETROS

CE008 Introdução à Bioestatística INFERÊNCIA ESTATÍSTICA

Métodos de Amostragem Populações de Animais Silvestres Amostragem

AMOSTRAGEM. Importância da Utilização da Amostragem Economia Tempo Operacionalidade

AULA 07 Inferência a Partir de Duas Amostras

Probabilidade e Estatística

30/09/2015. Amostragem RISCO DA AMOSTRAGEM VANTAGEM DA AMOSTRAGEM AMOSTRAGEM. Por que se usam amostras? Probabilística. Custo menor.

MAE0212 Introdução à Probabilidade e Estatística II

Fernando de Pol Mayer

Estatística. Disciplina de Estatística 2012/2 Curso de Administração em Gestão Pública Profª. Ms. Valéria Espíndola Lessa

ESTATÍSTICA COMPUTACIONAL

A Inferência Estatística é um conjunto de técnicas que objetiva estudar a população através de evidências fornecidas por uma amostra.

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

Distribuições Amostrais

Distribuições Amostrais e Estimação Pontual de Parâmetros

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Amostragem. Amostragem. Técnica: possibilita realizar a pesquisa em universos infinitos.

CONHECIMENTOS ESPECÍFICOS

Pesquisa Operacional II. Professor: Roberto César

MAT 461 Tópicos de Matemática II Aula 8: Resumo de Probabilidade

Cap. 8 - Intervalos Estatísticos para uma Única Amostra

Intervalos de confiança

Técnicas de Amostragem. É o estudo de um pequeno grupo de elementos retirado de uma população que se pretende conhecer.

Aula 9: Introdução à Inferência Estatística

Introdução à Inferência Estatística

Métodos Estocásticos da Engenharia II

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Inferência Estatística:

Processo de Amostragem

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

Análise Multivariada Aplicada à Contabilidade

Transcrição:

Técnicas de Amostragem Departamento de Estatística - UnB IE-Instituto de Ciências Exatas Abril de 2018 Técnicas de Amostragem 1-93

Agenda 1 Vantagens do Método de Amostragem; 2 Fases de um Levantamento por Amostragem; 3 Amostragem Aleatória Simples; 4 Amostragem Aleatória Estraticada; 5 Amostragem Sistemática; 6 Amostragem por Conglomerado; 7 Regressão com Plano Amostral. Técnicas de Amostragem 2-93

Vantagens do Método de Amostragem Objetivo Principal: Obter informações sobre o todo, baseando-se no resultado de uma amostra. Importância Conveniente no estudo de populações grandes; Indispensável no estudo de populações innitas; Indispensável quando ocorre destruição de material. Vantagens Redução de Custo; Maior Velocidade; Maior Escopo; Maior Precisão. Técnicas de Amostragem 3-93

Fases de um Levantamento por Amostragem 1 Objetivos; Técnicas de Amostragem 4-93

Fases de um Levantamento por Amostragem 1 Objetivos; 2 População a ser amostrada; Técnicas de Amostragem 4-93

Fases de um Levantamento por Amostragem 1 Objetivos; 2 População a ser amostrada; 3 Dados a serem coletados; Técnicas de Amostragem 4-93

Fases de um Levantamento por Amostragem 1 Objetivos; 2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão; Técnicas de Amostragem 4-93

Fases de um Levantamento por Amostragem 1 Objetivos; 2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão; 5 Métodos de mensuração; Técnicas de Amostragem 4-93

Fases de um Levantamento por Amostragem 1 Objetivos; 2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão; 5 Métodos de mensuração; 6 Cadastro (frame); Técnicas de Amostragem 4-93

Fases de um Levantamento por Amostragem 1 Objetivos; 2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão; 5 Métodos de mensuração; 6 Cadastro (frame); 7 Tamanho da amostra/seleção; Técnicas de Amostragem 4-93

Fases de um Levantamento por Amostragem 1 Objetivos; 2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão; 5 Métodos de mensuração; 6 Cadastro (frame); 7 Tamanho da amostra/seleção; 8 Pré-teste (não-aleatório); Técnicas de Amostragem 4-93

Fases de um Levantamento por Amostragem 1 Objetivos; 2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão; 5 Métodos de mensuração; 6 Cadastro (frame); 7 Tamanho da amostra/seleção; 8 Pré-teste (não-aleatório); 9 Organização do trabalho de campo; Técnicas de Amostragem 4-93

Fases de um Levantamento por Amostragem 1 Objetivos; 2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão; 5 Métodos de mensuração; 6 Cadastro (frame); 7 Tamanho da amostra/seleção; 8 Pré-teste (não-aleatório); 9 Organização do trabalho de campo; 10 Análise dos resultados; Técnicas de Amostragem 4-93

Fases de um Levantamento por Amostragem 1 Objetivos; 2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão; 5 Métodos de mensuração; 6 Cadastro (frame); 7 Tamanho da amostra/seleção; 8 Pré-teste (não-aleatório); 9 Organização do trabalho de campo; 10 Análise dos resultados; 11 Informação obtida para levantamentos futuros; Técnicas de Amostragem 4-93

Fases de um Levantamento por Amostragem 1 Objetivos; 2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão; 5 Métodos de mensuração; 6 Cadastro (frame); 7 Tamanho da amostra/seleção; 8 Pré-teste (não-aleatório); 9 Organização do trabalho de campo; 10 Análise dos resultados; 11 Informação obtida para levantamentos futuros; 12 Relatório nal. Técnicas de Amostragem 4-93

Tipos de Amostragem O papel da teoria de amostragem é fazer amostragem mais eciente, ou seja, com o menor custo possível produzir estimativas mais precisas. Tipos de Amostragem Amostragem Acidental; Técnicas de Amostragem 5-93

Tipos de Amostragem O papel da teoria de amostragem é fazer amostragem mais eciente, ou seja, com o menor custo possível produzir estimativas mais precisas. Tipos de Amostragem Amostragem Acidental; Amostragem Típica; Técnicas de Amostragem 5-93

Tipos de Amostragem O papel da teoria de amostragem é fazer amostragem mais eciente, ou seja, com o menor custo possível produzir estimativas mais precisas. Tipos de Amostragem Amostragem Acidental; Amostragem Típica; Amostragem Proposital; Técnicas de Amostragem 5-93

Tipos de Amostragem O papel da teoria de amostragem é fazer amostragem mais eciente, ou seja, com o menor custo possível produzir estimativas mais precisas. Tipos de Amostragem Amostragem Acidental; Amostragem Típica; Amostragem Proposital; Amostragem por Cotas; Técnicas de Amostragem 5-93

Tipos de Amostragem O papel da teoria de amostragem é fazer amostragem mais eciente, ou seja, com o menor custo possível produzir estimativas mais precisas. Tipos de Amostragem Amostragem Acidental; Amostragem Típica; Amostragem Proposital; Amostragem por Cotas; Amostragem Probabilística. Técnicas de Amostragem 5-93

Vantagens do Método de Amostragem Exemplo: População com 6 elementos. Amostra de tamanho 2. C 6 2 = 15 S 1 = (1, 2), S 2 = (1, 3),..., S 15 = (5, 6). Sorteia-se um número entre 1 e 15. Se o número é j, S j é a amostra selecionada. Com reposição; Com probabilidades iguais; Com probabilidades diferentes; Sem Reposição. Com probabilidades iguais; Com probabilidades diferentes; Técnicas de Amostragem 6-93

Amostragem Aleatória Simples (AAS) AAS é um método de selecionar n unidades de N tal qualquer uma das C N n amostras distintas tenha mesma chance de ser selecionada. Exemplo: Pop = {a,b,c,d}. C 4 2 = 6 ab ac ad p = 1 6 = 1 C N n bc bd cd n N. n 1 N 1. n 2 N 2... 1 N n+1 = n!(n n)! N! = 1 C N n Técnicas de Amostragem 7-93

Amostragem Aleatória Simples (AAS) O Plano é descrito do seguinte modo: Seja o Universo U = {1, 2,..., N} i) Utilizando-se de um processo aleatório, sorteia-se com igual probabilidade um elemento da população U. ii) Repete-se o processo anterior até que sejam sorteadas n unidades. iii) Caso seja permitido o sorteio de uma unidade mais de uma vez, tem-se o processo AAS com reposição (AAS c ). Quando o elemento sorteado é removido de U antes do sorteio da próxima unidade, tem-se o plano AAS sem reposição (AAS s ). Técnicas de Amostragem 8-93

Amostragem Aleatória Simples (AAS) Do ponto de vista prático, o plano AAS s é muito mais interessante, pois é intuitivo Não se ganha mais informação se uma mesma unidade aparece mais de uma vez na amostra. Por outro lado, o plano AAS c introduz vantagens matemáticas e estatísticas, como a independência entre as unidades sorteadas, o que facilita muito a determinação das propriedades dos estimadores. Técnicas de Amostragem 9-93

Amostragem Aleatória Simples (AAS) Parâmetros da População TOTAL: T = N j=1 Y j = NY MÉDIA: Y = N j=1 Y j N = µ VARIÂNCIA: σ 2 = N j=1 (Y j Y) 2 N S 2 = N j=1 (Y j Y) 2 N 1 Estimadores TOTAL: ˆT = Ny MÉDIA: y = n j=1 y j n VARIÂNCIA: s 2 = n j=1 (y j y) 2 n 1 Técnicas de Amostragem 10-93

Amostragem Aleatória Simples com Reposição (AAS c ) Exemplo: Seja a variável renda familiar dada por (12, 30, 18), com T = 60, µ = 20 e σ 2 = 168/3 = 56. Tomada uma amostra de n = 2, tem-se as seguintes amostras. (12,12) (12,30) (12,18) (30,12) (30,30) (30,18) (18,12) (18,30) (18,18) P 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 y 12 21 15 21 30 24 15 24 18 s 2 0 162 18 162 0 72 18 72 0 ˆT 24 42 30 42 60 48 30 48 36 Técnicas de Amostragem 11-93

Amostragem Aleatória Simples com Reposição (AAS c ) y 12 15 18 21 24 30 P 1/9 2/9 1/9 2/9 2/9 1/9 E(y) = 12+30+18+42+48+30 9 = 180 9 = 20 = µ Var(y) = σ2 n = 56 2 = 28 s 2 0 18 72 162 P 3/9 2/9 2/9 2/9 E(s 2 ) = 0+36+144+324 9 = 504 9 = 56 = σ 2 ˆT 24 30 36 42 48 60 P 1/9 2/9 1/9 2/9 2/9 1/9 E( ˆT) = 24+60+36+84+96+60 9 = 360 9 = 40 = T Técnicas de Amostragem 12-93

Normalidade Assintótica e Intervalos de Conança À medida que o tamanho da amostra aumenta, as distribuições de y e ˆT vão se aproximando da distribuição normal de acordo com o Teorema Central do Limite (TCL). Então, para n sucientemente grande, temos que y µ σ 2 /n a N(0, 1) ˆT T N σ 2 /n a N(0, 1) Isso possibilita a obtenção de intervalos de conança aproximados para y e ˆT. Técnicas de Amostragem 13-93

Normalidade Assintótica e Intervalos de Conança Assim, com relação à média populacional ( ) y µ P σ 2 /n z α/2 1 α n grande ( ) P y z α/2 σ 2 /n µ y + z α/2 σ 2 /n 1 α Na falta de σ 2, usar s 2. Técnicas de Amostragem 14-93

Determinação do Tamanho da Amostra Determinar o tamanho da amostra n, de tal forma que o estimador obtido tenha um erro máximo de estimação igual a ɛ, com determinado grau de conança γ. P( y µ ɛ) 1 α n grande P( y µ z α/2 σ 2 /n) 1 α ɛ = z α/2 σ 2 n n = z2 α/2 σ2 ɛ 2 Técnicas de Amostragem 15-93

Determinação do Tamanho da Amostra Exemplo1: Seja o intervalo (18 ± 1, 96 48/10) = (18 ± 4, 29) para a renda familiar com 95% de conança. Sabendo que σ 2 = 48, qual o tamanho da amostra para se ter um erro máximo de 2. Técnicas de Amostragem 16-93

Determinação do Tamanho da Amostra Exemplo1: Seja o intervalo (18 ± 1, 96 48/10) = (18 ± 4, 29) para a renda familiar com 95% de conança. Sabendo que σ 2 = 48, qual o tamanho da amostra para se ter um erro máximo de 2. n = 1,962 48 ( 2) 2 = 3,84 48 2 = 3, 84 24 93 Técnicas de Amostragem 16-93

Determinação do Tamanho da Amostra Exemplo1: Seja o intervalo (18 ± 1, 96 48/10) = (18 ± 4, 29) para a renda familiar com 95% de conança. Sabendo que σ 2 = 48, qual o tamanho da amostra para se ter um erro máximo de 2. n = 1,962 48 ( 2) 2 = 3,84 48 2 = 3, 84 24 93 Exemplo2: Deseja-se estimar determinada característica da população com 95% de conança e erro máximo de 10% da média. Qual o tamanho da amostra sabendo que CV = 20%? Técnicas de Amostragem 16-93

Determinação do Tamanho da Amostra Exemplo1: Seja o intervalo (18 ± 1, 96 48/10) = (18 ± 4, 29) para a renda familiar com 95% de conança. Sabendo que σ 2 = 48, qual o tamanho da amostra para se ter um erro máximo de 2. n = 1,962 48 ( 2) 2 = 3,84 48 2 = 3, 84 24 93 Exemplo2: Deseja-se estimar determinada característica da população com 95% de conança e erro máximo de 10% da média. Qual o tamanho da amostra sabendo que CV = 20%? n = 1,962 0,2 2 0,1 2 = 3,84 0,04 0,01 = 0,1536 0,01 16 Técnicas de Amostragem 16-93

Determinação do Tamanho da Amostra Exemplo1: Seja o intervalo (18 ± 1, 96 48/10) = (18 ± 4, 29) para a renda familiar com 95% de conança. Sabendo que σ 2 = 48, qual o tamanho da amostra para se ter um erro máximo de 2. n = 1,962 48 ( 2) 2 = 3,84 48 2 = 3, 84 24 93 Exemplo2: Deseja-se estimar determinada característica da população com 95% de conança e erro máximo de 10% da média. Qual o tamanho da amostra sabendo que CV = 20%? n = 1,962 0,2 2 = 3,84 0,04 0,1 2 0,01 = 0,1536 ( zα/2 σ P( y Y ry) = 1 α n = ry 0,01 16 ) 2 n = ( ) zα/2 CV 2 r Técnicas de Amostragem 16-93

Amostragem Aleatória Simples sem Reposição (AAS s ) - C N n A AAS s funciona de modo idêntico à AAS c, a não ser pela não recolocação do elemento sorteado. Portanto, cada elemento da população só pode aparecer uma vez na amostra. Técnicas de Amostragem 17-93

Estimação do Total e da Média Populacional Não é dicil mostrar que os estimadores não-viesados para µ e T são: y = 1 n n i=1 y i Var(y) = (1 f ) S2 n ˆT = Ny = N n σ 2 N 1 n, f = n N Var( ˆT) = N 2 N n σ 2 N 1 n onde N n N 1 é chamado de Correção para Populações Finitas (CPF), ou do inglês Finite Population Correction (FPC). Técnicas de Amostragem 18-93

Amostragem Aleatória Simples sem Reposição (AAS s ) e var(y) = (1 f ) s2 n var( ˆT) = N 2 (1 f ) s2 n Exemplo: Considere o mesmo exemplo da renda familiar, com valores (12, 30, 18), e T = 60, µ = 20 e S 2 = 168/2 = 84. Tomada uma amostra de n = 2, tem-se as seguintes amostras. (12,30) (12,18) (30,18) P 1/3 1/3 1/3 y 21 15 24 s 2 162 18 72 ˆT 42 30 48 Técnicas de Amostragem 19-93

Amostragem Aleatória Simples sem Reposição (AAS s ) y 15 21 24 P 1/3 1/3 1/3 E(y) = 15+21+24 3 = 60 3 = 20 = µ Var(y) = (1 f ) S2 n = ( 1 2 3) 84 2 = 14 s 2 18 72 162 P 1/3 1/3 1/3 E(s 2 ) = 18+72+162 3 = 252 3 = 84 = S 2 ˆT 30 42 48 P 1/3 1/3 1/3 E( ˆT) = 30+42+48 3 = 120 3 = 40 = T Técnicas de Amostragem 20-93

Normalidade Assintótica e Intervalos de Conança Verique que a Variância de y é menor do que na AAS c. y µ (1 f )S 2 /n a N(0, 1) ˆT T N (1 f )S 2 /n a N(0, 1) ( ) y µ P (1 f )S 2 /n z α/2 1 α ) P (y z α/2 (1 f )S 2 /n µ y + z α/2 (1 f )S 2 /n 1 α Se n < 50, utilizar t de Student com n 1 graus de liberdade. Técnicas de Amostragem 21-93

Normalidade Assintótica e Intervalos de Conança Exemplo: Seja y = 1, 296, s 2 = 2, 397, n = 1000 e N = 36000. Estime o intervalo para µ com 95% de conança. Técnicas de Amostragem 22-93

Normalidade Assintótica e Intervalos de Conança Exemplo: Seja y = 1, 296, s 2 = 2, 397, n = 1000 e N = 36000. Estime o intervalo para µ com 95% de conança. IC(µ; 0, 95) = ( ) (1 ) 1, 296 ± 1, 96 1000 2,397 36000 1000 Técnicas de Amostragem 22-93

Normalidade Assintótica e Intervalos de Conança Exemplo: Seja y = 1, 296, s 2 = 2, 397, n = 1000 e N = 36000. Estime o intervalo para µ com 95% de conança. ( (1 IC(µ; 0, 95) = 1, 296 ± 1, 96 1000 36000 ( ) IC(µ; 0, 95) = 1, 296 ± 1, 96 35 36 2,397 1000 ) ) 2,397 1000 Técnicas de Amostragem 22-93

Normalidade Assintótica e Intervalos de Conança Exemplo: Seja y = 1, 296, s 2 = 2, 397, n = 1000 e N = 36000. Estime o intervalo para µ com 95% de conança. ( (1 IC(µ; 0, 95) = 1, 296 ± 1, 96 1000 36000 ( ) IC(µ; 0, 95) = 1, 296 ± 1, 96 35 36 2,397 1000 ) ) 2,397 1000 IC(µ; 0, 95) = (1, 296 ± 1, 96 0, 048) = (1, 296 ± 0, 094) IC(µ; 0, 95) = (1, 20; 1, 39) Técnicas de Amostragem 22-93

Determinação do Tamanho da Amostra Determinar o tamanho da amostra n, de tal forma que o estimador obtido tenha um erro máximo de estimação igual a ɛ, com determinado grau de conança γ. Var(y) = (1 f ) S2 n = S2 n (1 f ) ɛ = z α/2 S 2 /n n = z2 α/2 S2 ɛ 2 = S2 n, onde n = n 1 f Note que n = n 1 n N n = n 1 + n N Técnicas de Amostragem 23-93

Determinação do Tamanho da Amostra Exemplo: Considere o exemplo anterior. Qual o tamanho da amostra com 95% de conança para se ter um erro de 0, 05. Técnicas de Amostragem 24-93

Determinação do Tamanho da Amostra Exemplo: Considere o exemplo anterior. Qual o tamanho da amostra com 95% de conança para se ter um erro de 0, 05. n = 1, 962 2, 397 3, 84 2, 397 (0, 05) 2 = = 3683, 8 0, 0025 Técnicas de Amostragem 24-93

Determinação do Tamanho da Amostra Exemplo: Considere o exemplo anterior. Qual o tamanho da amostra com 95% de conança para se ter um erro de 0, 05. n = 1, 962 2, 397 3, 84 2, 397 (0, 05) 2 = = 3683, 8 0, 0025 n = 3683, 8 1 + 3683,8 36000 = 3683, 8 1, 10 3342 Técnicas de Amostragem 24-93

Comparação entre AAS c e AAS s Quando existem 2 planos amostrais é importante saber qual é o melhor. Um conceito importante, chamado de Efeito do Planejamento (EPA) ou do inglês Design Eect (De), compara a variância de um plano amostral qualquer com relação a um plano considerado padrão. A estatística y é em ambos os planos um estimador não-viesado de µ. Assim, Deff = EPA = Var(AAS s(y)) Var(AAS c (y)) = (1 f )S2 /n σ 2 /n = N n N 1 σ2 /n = N n σ 2 /n N 1 Quando Deff > 1, tem-se que o plano do numerador é menos eciente que o padrão e quando Deff < 1, tem-se a situação contrária. Da expressão acima verica-se que N n N 1 < 1, n > 1 Técnicas de Amostragem 25-93

Comparação entre AAS c e AAS s ou seja, o plano AAS s é sempre melhor do que o plano AAS c. Note que esse resultado conrma a intuição popular de que amostras sem reposição são melhores do aquelas com elementos repetidos. Técnicas de Amostragem 26-93

Amostragem para Proporções e Porcentagens Algumas vezes desejamos estimar o número total, a proporção ou a porcentagem de unidades na população que possuem alguma característica ou atributo. Exemplos: Número de pessoas desempregadas; a porcentagem da população que é nativa; porcentagem de votos de determinado candidato. A classicação pode ser introduzida diretamente no questionário com questões do tipo Sim ou Não. Técnicas de Amostragem 27-93

Variância da Estimativa Amostral AAS(n) A = {e 1, e 2,..., e n } Dena: y i = 1, se e i possui A; e y i = 0, caso contrário. y = 1 n n i=1 y i = p é um estimador não-viesado de P. s 2 = 1 n 1 n i=1 (y i y) 2 = Var(p) = Var(y) = N n S 2 N n Var(p) = N n N f = n N s 2 n = N n Nn n n 1 pq = N n NPQ Nn npq n 1 = N n pq N n 1 N 1 = N n N 1 PQ n = (1 f ) pq n 1 Se N N n N 1 Var(p) = pq n 1 Técnicas de Amostragem 28-93

Total com o Atributo A ˆN A = Np Var( ˆN A ) = N 2 Var(p) = N 2 N n N pq n 1 = N(N n)pq n 1 Exemplo: De uma lista de 3042 nomes e endereços, uma AAS de 200 nomes mostrou 38 endereços errados. Estime o número total de endereços que precisam de correção na lista e encontre o erro padrão dessa estimativa. Técnicas de Amostragem 29-93

Total com o Atributo A ˆN A = Np Var( ˆN A ) = N 2 Var(p) = N 2 N n N pq n 1 = N(N n)pq n 1 Exemplo: De uma lista de 3042 nomes e endereços, uma AAS de 200 nomes mostrou 38 endereços errados. Estime o número total de endereços que precisam de correção na lista e encontre o erro padrão dessa estimativa. N = 3042, n = 200, n A = 38, p = 38/200 = 0, 19 Técnicas de Amostragem 29-93

Total com o Atributo A ˆN A = Np Var( ˆN A ) = N 2 Var(p) = N 2 N n N pq n 1 = N(N n)pq n 1 Exemplo: De uma lista de 3042 nomes e endereços, uma AAS de 200 nomes mostrou 38 endereços errados. Estime o número total de endereços que precisam de correção na lista e encontre o erro padrão dessa estimativa. N = 3042, n = 200, n A = 38, p = 38/200 = 0, 19 ˆN A = Np = 3042 0, 19 = 578 Técnicas de Amostragem 29-93

Total com o Atributo A ˆN A = Np Var( ˆN A ) = N 2 Var(p) = N 2 N n N pq n 1 = N(N n)pq n 1 Exemplo: De uma lista de 3042 nomes e endereços, uma AAS de 200 nomes mostrou 38 endereços errados. Estime o número total de endereços que precisam de correção na lista e encontre o erro padrão dessa estimativa. N = 3042, n = 200, n A = 38, p = 38/200 = 0, 19 ˆN A = Np = 3042 0, 19 = 578 EP( ˆN A ) = N 3042(3042 200) 200 1 0, 19 0, 81 = 6686 = 81, 8 Técnicas de Amostragem 29-93

Intervalo de Conança para P y N(Y, Var(y)) ) P (y z α/2 Var(y) Y y + z α/2 Var(y) 1 α IC(P; γ) = p ± z α/2 (1 f )pq/(n 1) Técnicas de Amostragem 30-93

Tamanho de Amostra para Proporções P( p P d) = α p é normalmente distribuído σp 2 = Var(p) = N n PQ N 1 n N n PQ d = z α/2 N 1 n n = z 2 α/2 PQ [( d 2 ) ] 1+ N 1 z 2 α/2 PQ d 2 1 n 0 = z2 α/2 PQ n = n d 2 0 1+ n 0 N Se N n z2 α/2 PQ d 2 P = 0, 5 PQ = 0, 25 n = 22 = 1 4 d 2 d 2 α = 0, 05 z α/2 2 Essa fórmula só é válida se 0, 25 P 0, 75 Técnicas de Amostragem 31-93

Tamanho de Amostra para Proporções Exemplo: d = 0, 05 n = 1 0,05 2 = 1 0,0025 = 400 Se N = 3200 n = 356 Técnicas de Amostragem 32-93

Tamanho de Amostra para Proporções Exemplo: d = 0, 05 n = 1 0,05 2 = 1 0,0025 = 400 Se N = 3200 n = 356 Fazendo o tamanho mínimo temos: α = 0, 05 d = 0, 05 n = 1,962 0,25 0,05 2 = 385 Técnicas de Amostragem 32-93

Tamanho de Amostra para Proporções Exemplo: d = 0, 05 n = 1 0,05 2 = 1 0,0025 = 400 Se N = 3200 n = 356 Fazendo o tamanho mínimo temos: α = 0, 05 d = 0, 05 n = 1,962 0,25 0,05 2 = 385 Considerando um erro de 2%: d = 0, 02 n = 1 0,02 2 = 1 0,0004 = 2500 Técnicas de Amostragem 32-93

Amostragem Estraticada Na amostragem estraticada a população de N unidades é primeiro dividida em subpopulações de N 1, N 2,..., N L unidades. Essas subpopulações, que são chamadas de estratos, não se sobrepõem e juntas compreendem toda a população, tal que N 1 + N 2 +... + N L = N. Técnicas de Amostragem 33-93

Amostragem Estraticada Na amostragem estraticada a população de N unidades é primeiro dividida em subpopulações de N 1, N 2,..., N L unidades. Essas subpopulações, que são chamadas de estratos, não se sobrepõem e juntas compreendem toda a população, tal que N 1 + N 2 +... + N L = N. Para obter o benefício total da estraticação, os valores de N h precisam ser conhecidos. Os tamanhos das amostras dentro de cada estrato são denotados por n 1, n 2,..., n L, respectivamente. Técnicas de Amostragem 33-93

Amostragem Estraticada A estraticação é usada principalmente para resolver alguns problemas como: 1 A melhoria da precisão das estimativas; 2 Produzir estimativas para toda a população e subpopulações; 3 Garantir que elementos de cada subpopulação estejam na amostra. Técnicas de Amostragem 34-93

Amostragem Estraticada A estraticação é usada principalmente para resolver alguns problemas como: 1 A melhoria da precisão das estimativas; 2 Produzir estimativas para toda a população e subpopulações; 3 Garantir que elementos de cada subpopulação estejam na amostra. Vamos abordar muito mais o primeiro problema. Considere que seja possível dividir uma população heterogênea em subpopulações ou estratos internamente homogêneos. Se cada estrato é homogêneo, em que as medições variam pouco de uma unidade para outra, uma estimativa precisa da média de qualquer estrato pode ser obtida de uma amostra menor desses estratos. Essa estimativas podem então ser combinadas dentro de uma estimativa precisa para toda a população. Técnicas de Amostragem 34-93

Amostragem Estraticada Exemplo: Considere uma pesquisa feita em uma população com N = 8 domicílios, onde são conhecidas as variáveis Renda Domiciliar (Y) e o Local do Domicílio (W), com os códigos A para Região de Alta Renda e B para Região de Baixa Renda. Tem-se então Y 13 17 6 5 10 12 19 6 W B A B B B A A B µ = 13+17+6+5+10+12+19+6 8 = 88 8 = 11 σ 2 = 22 +6 2 +5 2 +6 2 +1 2 +1 2 +8 2 +5 2 σ 2 = 24 8 = 4+36+25+36+1+1+64+25 8 = 192 8 Técnicas de Amostragem 35-93

Amostragem Estraticada Retirando uma AAS c de tamanho n = 4, sabe-se que Var(y) = σ2 n = 24 4 = 6 Usando W para estraticar a população em 2 estratos, constrói-se as seguintes subpopulações: Y A 17 12 19 µ A = 16 σ 2 A = 8, 7 Y B 13 6 5 10 6 µ B = 8 σ 2 B = 9, 2 Sorteando-se em cada estrato uma AAS c de tamanho n = 2 Var(y A ) = 8,7 2 = 4, 35 Var(y B ) = 9,2 2 = 4, 60 Técnicas de Amostragem 36-93

Amostragem Estraticada Com base em y A e y B pode-se construir um estimador para µ y e s = 3y A +5y B 3+5 = 3y A +5y B 8 Var(y es ) = ( ) 3 2 8 Var(yA ) + ( 5 8 Var(y es ) = 2, 40 Deff = Var(y es ) Var(y) = 2,40 6 = 0, 40 ) 2 Var(yB ) = 9 64 25 4, 35 + 644, 60 Ou seja, como o mesmo tamanho de amostra, diminuiu-se a variância do estimador em mais da metade. O resultado será mais ecaz quanto mais homogêneos forem os estratos. Mas a simples estraticação por si só não produz necessariamente estimativas mais ecientes do que a AAS. Técnicas de Amostragem 37-93

Amostragem Estraticada Exemplo: Considere que os estratos do exemplo anterior sejam: Y A 13 17 6 5 µ A = 10, 25 σa 2 = 24, 69 Y B 10 12 19 6 µ A = 11, 75 σa 2 = 22, 19 Sorteando-se em cada estrato uma AAS c de tamanho n = 2 Var(y A ) = 24,69 2 = 12, 34 Var(y B ) = 22,19 Var(y es ) = 16 64 12, 34 + 16 64 Deff = 5,86 6 = 0, 98 11, 09 = 5, 86 2 = 11, 09 Ou seja, um desempenho bastante próximo do plano AAS c. Técnicas de Amostragem 38-93

Amostragem Estraticada A execução de um plano de amostragem estraticada (AE) possui os seguintes passos: 1 Divisão da população em subpopulações bem denidas (estratos); Técnicas de Amostragem 39-93

Amostragem Estraticada A execução de um plano de amostragem estraticada (AE) possui os seguintes passos: 1 Divisão da população em subpopulações bem denidas (estratos); 2 De cada estrato retira-se uma amostra, geralmente independente; Técnicas de Amostragem 39-93

Amostragem Estraticada A execução de um plano de amostragem estraticada (AE) possui os seguintes passos: 1 Divisão da população em subpopulações bem denidas (estratos); 2 De cada estrato retira-se uma amostra, geralmente independente; 3 Em cada estrato usam-se estimadores convenientes para os parâmetros do estrato; Técnicas de Amostragem 39-93

Amostragem Estraticada A execução de um plano de amostragem estraticada (AE) possui os seguintes passos: 1 Divisão da população em subpopulações bem denidas (estratos); 2 De cada estrato retira-se uma amostra, geralmente independente; 3 Em cada estrato usam-se estimadores convenientes para os parâmetros do estrato; 4 Monta-se para a população um estimador combinando os estimadores de cada estrato e determinam-se suas propriedades. Técnicas de Amostragem 39-93

Amostragem Estraticada A estimativa usada para a média na amostragem estraticada é y es = y st (es de estraticada e st de stratied). y st = H H N h y h N = W h y h h=1 h=1 onde N = N 1 + N 2 +... + N H. y coincidirá com y st se para todo estrato n h n = N h N ou n h N h = n N ou f h = f Técnicas de Amostragem 40-93

Amostragem Estraticada Com a alocação proporcional, temos que n h = W h n = N h N n. Substituindo na fórmula da Var(y st ), Var(y st ) = (1 f ) n W h s 2 h Técnicas de Amostragem 41-93

Alocação Ótima Em AE, o problema está em selecionar os valores de n h. Eles podem ser selecionados para minimizar a Var(y st ) para um custo especicado de tomar a amostra ou para minimizar o custo para um valor especicado da Var(y st ). A função de custo mais simples é da forma: C = C o + H h=1 C hn h onde: C = custo total da amostragem; C 0 = custo xo da amostragem (conhecido); C h = custo da unidade amostral no estrato h (conhecido). Técnicas de Amostragem 42-93

Alocação Ótima Dentro de qualquer estrato o custo é proporcional ao tamanho da amostra, mas o custo por unidade C h pode variar de estrato para estrato. Se os custos de viagem entre unidades são substanciais, estudos matemáticos e empíricos sugerem que os custos são melhores representados pela expressão t h nh. 1 Quais são os valores de n 1, n 2,..., n H tal que Var(y st ) seja mínima?(custo xo) Técnicas de Amostragem 43-93

Alocação Ótima Dentro de qualquer estrato o custo é proporcional ao tamanho da amostra, mas o custo por unidade C h pode variar de estrato para estrato. Se os custos de viagem entre unidades são substanciais, estudos matemáticos e empíricos sugerem que os custos são melhores representados pela expressão t h nh. 1 Quais são os valores de n 1, n 2,..., n H tal que Var(y st ) seja mínima?(custo xo) 2 Quais são os valores de n 1, n 2,..., n H tal que C seja mínimo?(variância xa) Teorema: Em amostragem aleatória estraticada com uma função de custo linear, a variância da média estimada y st é mínima para um cuto xo C, e o custo é mínimo para uma variância xa V, quando n h é proporcional a W h S h / C h. Técnicas de Amostragem 43-93

Alocação Ótima Se C h = C, isto é, se o custo por unidade é o mesmo em todos os estratos, a função de custo se torna C = C 0 + Cn, e a alocação ótima para um custo xo se reduz para uma alocação ótima para um tamanho de amostra xo. Teorema: Em AE, a Var(y st ) é minimizada para um tamanho de amostra total n xa se n h = n W hs h W h S h = n N hs h N h S h Essa alocação é denominada Alocação Ótima de Neyman (Neyman(1934) provou o resultado). Técnicas de Amostragem 44-93

Efeito do Planejamento Se inteligentemente usada, a estraticação quase sempre resulta em uma menor variância para a média ou total estimado do que a dada por uma AAS comparável. Não é verdade, entretanto, que qualquer AE fornece uma variância menor do que a AAS. Se os valores de n h estão longe do ótimo, a AE pode ter uma variância maior. Por isso, vamos comparar a AAS com a AE com alocação proporcional e ótima. Essa comparação mostra como o ganho devido à estraticação é alcançado. Teorema: Com relação à AAS c, tem-se que V ot V pr V AASc. Técnicas de Amostragem 45-93

Efeito do Planejamento Assim, sempre que os estratos tiverem médias distintas (σe 2 grande), deve-se usar alocação proporcional ou ótima. Se além disso, os desvios padrões de cada estrato diferirem muito entre si (σdp 2 grande), recomenda-se a alocação ótima. Daí Deff (AE pr ) = V pr V AASc = σ2 d σ 2 = 1 σ2 e σ 2 Deff (AE ot ) = V ot V AASc = σ2 d σ2 dp σ 2 = 1 σ2 e σ2 dp σ 2 σ 2 Técnicas de Amostragem 46-93

Efeito do Planejamento Exemplo: Exemplo dos habitantes de 64 cidades americanas. Cálculo da Alocação Ótima Estrato N h S h N h S h n h 1 16 232,04 3712,64 12,21 2 48 74,71 3586,08 11,79 Total 64 306,75 7298,72 24,00 Técnicas de Amostragem 47-93

Efeito do Planejamento Exemplo: Exemplo dos habitantes de 64 cidades americanas. Cálculo da Alocação Ótima Estrato N h S h N h S h n h 1 16 232,04 3712,64 12,21 2 48 74,71 3586,08 11,79 Total 64 306,75 7298,72 24,00 Quando a estraticação produz ganhos substanciais? Técnicas de Amostragem 47-93

Efeito do Planejamento Exemplo: Exemplo dos habitantes de 64 cidades americanas. Cálculo da Alocação Ótima Estrato N h S h N h S h n h 1 16 232,04 3712,64 12,21 2 48 74,71 3586,08 11,79 Total 64 306,75 7298,72 24,00 Quando a estraticação produz ganhos substanciais? 1 A população é composta de unidades variando amplamente no tamanho; 2 As principais variáveis a serem medidas estão fortemente relacionadas ao tamanho das instituições; 3 Uma boa medida de tamanho está disponível para separar os estratos. Técnicas de Amostragem 47-93

Amostragem Sistemática (todo k-ésimo) Idealização Vamos supor que uma população de N elementos está ordenada. Suponha ainda que N = nk, onde k é um inteiro. Deseja-se retirar uma amostra de tamanho n. Considere a seguinte estratégia: Técnicas de Amostragem 48-93

Amostragem Sistemática (todo k-ésimo) Idealização Vamos supor que uma população de N elementos está ordenada. Suponha ainda que N = nk, onde k é um inteiro. Deseja-se retirar uma amostra de tamanho n. Considere a seguinte estratégia: 1) Selecionar aleatoriamente um número entre 1 e k, onde k = N/n. Seja x esse número. Técnicas de Amostragem 48-93

Amostragem Sistemática (todo k-ésimo) Idealização Vamos supor que uma população de N elementos está ordenada. Suponha ainda que N = nk, onde k é um inteiro. Deseja-se retirar uma amostra de tamanho n. Considere a seguinte estratégia: 1) Selecionar aleatoriamente um número entre 1 e k, onde k = N/n. Seja x esse número. 2) Tome como elementos da amostra os seguintes: x, x + k, x + 2k,..., x + (n 1)k AAS(n) C N n (Número de amostras) AS(n) k amostras (mutuamente excludentes) P(E i A) = 1 k Técnicas de Amostragem 48-93

Amostragem Sistemática (todo k-ésimo) Se N não é um número múltiplo de k, as diferentes amostras variam de tamanho de uma para outra. N = 23 n = 5 k = 23 5 5 N = nk Possíveis Amostras I II III IV V 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Técnicas de Amostragem 49-93

Amostragem Sistemática (todo k-ésimo) Se N não é um número múltiplo de k, as diferentes amostras variam de tamanho de uma para outra. N = 23 n = 5 k = 23 5 5 N = nk Possíveis Amostras I II III IV V 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 n = 5 n = 5 n = 5 n = 4 n = 4 Técnicas de Amostragem 49-93

Amostragem Sistemática (todo k-ésimo) Isso introduz uma pertubação na teoria de amostragem sistemática. Se n > 50 isso será ignorado, por simplicidade. Outro método de seleção das amostras foi sugerido por Lahiri(1952); 1) Seja k o inteiro mais próximo de N n ; Técnicas de Amostragem 50-93

Amostragem Sistemática (todo k-ésimo) Isso introduz uma pertubação na teoria de amostragem sistemática. Se n > 50 isso será ignorado, por simplicidade. Outro método de seleção das amostras foi sugerido por Lahiri(1952); 1) Seja k o inteiro mais próximo de N n ; 2) Suponha que os números estejam organizados como um círculo; Técnicas de Amostragem 50-93

Amostragem Sistemática (todo k-ésimo) Isso introduz uma pertubação na teoria de amostragem sistemática. Se n > 50 isso será ignorado, por simplicidade. Outro método de seleção das amostras foi sugerido por Lahiri(1952); 1) Seja k o inteiro mais próximo de N n ; 2) Suponha que os números estejam organizados como um círculo; 3) Selecione aleatoriamente um número entre 1 e N. Seja x esse número; Técnicas de Amostragem 50-93

Amostragem Sistemática (todo k-ésimo) Isso introduz uma pertubação na teoria de amostragem sistemática. Se n > 50 isso será ignorado, por simplicidade. Outro método de seleção das amostras foi sugerido por Lahiri(1952); 1) Seja k o inteiro mais próximo de N n ; 2) Suponha que os números estejam organizados como um círculo; 3) Selecione aleatoriamente um número entre 1 e N. Seja x esse número; 4) Selecione a amostra a partir desse número de k em k posições. x, x + k, x + 2k,...,retorno ao início. Exemplo: k = 23 5 5 x = 19 19, 1, 6, 11, 16 Todas as unidades tem igual x = 22 22, 4, 9, 14, 19 probabilidade de seleção. Técnicas de Amostragem 50-93

Populações em Ordem Aleatória A AS é algumas vezes usada, por sua conveniência, em populações em que a numeração das unidades é efetivamente aleatória. Isso acontece em amostras de um arquivo organizado alfabeticamente por nomes, se o item que está sendo medido não tem relação com o nome do indivíduo. Técnicas de Amostragem 51-93

Populações em Ordem Aleatória A AS é algumas vezes usada, por sua conveniência, em populações em que a numeração das unidades é efetivamente aleatória. Isso acontece em amostras de um arquivo organizado alfabeticamente por nomes, se o item que está sendo medido não tem relação com o nome do indivíduo. Nessas situações esperamos que a AS seja equivalente à AAS, e tenha a mesma variância. Para qualquer população nita, dado n e k, isso não é exatamente verdade, principalmente quando n e k são pequenos. Técnicas de Amostragem 51-93

Populações em Ordem Aleatória A AS é algumas vezes usada, por sua conveniência, em populações em que a numeração das unidades é efetivamente aleatória. Isso acontece em amostras de um arquivo organizado alfabeticamente por nomes, se o item que está sendo medido não tem relação com o nome do indivíduo. Nessas situações esperamos que a AS seja equivalente à AAS, e tenha a mesma variância. Para qualquer população nita, dado n e k, isso não é exatamente verdade, principalmente quando n e k são pequenos. Teorema: Considere todas as N! populações nitas que são formadas pelas N! permutações de qualquer série nita de números y 1, y 2,..., y N. Então, em média sobre essas populações nitas E(Var(y s )) = Var(y) Técnicas de Amostragem 51-93

Populações em Ordem Aleatória A AS é algumas vezes usada, por sua conveniência, em populações em que a numeração das unidades é efetivamente aleatória. Isso acontece em amostras de um arquivo organizado alfabeticamente por nomes, se o item que está sendo medido não tem relação com o nome do indivíduo. Nessas situações esperamos que a AS seja equivalente à AAS, e tenha a mesma variância. Para qualquer população nita, dado n e k, isso não é exatamente verdade, principalmente quando n e k são pequenos. Teorema: Considere todas as N! populações nitas que são formadas pelas N! permutações de qualquer série nita de números y 1, y 2,..., y N. Então, em média sobre essas populações nitas E(Var(y s )) = Var(y) n AS AAS Técnicas de Amostragem 51-93

Amostragem por Conglomerados (Cluster) Os planos amostrais vistos até agora sorteavam unidades elementares diretamente da população ou de estratos desta mesma população. Quando os sistemas de referências (cadastros ou frames) não são adequados e o custo de atualizá-los é muito elevado, ou ainda quando a movimentação para identicar as unidades elementares no campo é cara e consome muito tempo, a tarefa amostral pode ser facilitada se forem selecionados grupos de unidades elementares, os chamados conglomerados ou clusters. Técnicas de Amostragem 52-93

Amostragem por Conglomerados (Cluster) Pop = {E 1, E 2,..., E N } Elemento: pessoa adulta que mora no Plano Piloto. Técnicas de Amostragem 53-93

Amostragem por Conglomerados (Cluster) Pop = {E 1, E 2,..., E N } Elemento: pessoa adulta que mora no Plano Piloto. 1) Em algumas situações não existe um cadastro dos elementos da população. Existe um cadastro das residências. Pop = { R }{{} 1, R 2,..., R }{{}}{{} N M 1 M 2 M i = número de pessoas adultas na R i. M N } Cada residência é um Conglomerado de pessoas. Conglomerado: é um conjunto de elementos da população. A = {r 1, r 2,..., r n } - seleciona-se uma amostra de conglomerados. Técnicas de Amostragem 53-93

Amostragem por Conglomerados (Cluster) 2) Em algumas situações, mesmo existindo um cadastro, é mais econômico a amostragem por conglomerados. Por exemplo, uma AAS de 600 casas cobre mais uniformemente uma cidade do que 20 blocos contendo uma média de 30 casas cada um. Técnicas de Amostragem 54-93

Amostragem por Conglomerados (Cluster) 2) Em algumas situações, mesmo existindo um cadastro, é mais econômico a amostragem por conglomerados. Por exemplo, uma AAS de 600 casas cobre mais uniformemente uma cidade do que 20 blocos contendo uma média de 30 casas cada um. Mas grandes custos são envolvidos em localizar as 600 casas e na viagem entre elas do que em localizar 20 blocos e visitar todas as casas desses blocos. Quando custo é balanceado contra precisão, a unidade maior pode se mostrar superior. Técnicas de Amostragem 54-93

Amostragem por Conglomerados (Cluster) 2) Em algumas situações, mesmo existindo um cadastro, é mais econômico a amostragem por conglomerados. Por exemplo, uma AAS de 600 casas cobre mais uniformemente uma cidade do que 20 blocos contendo uma média de 30 casas cada um. Mas grandes custos são envolvidos em localizar as 600 casas e na viagem entre elas do que em localizar 20 blocos e visitar todas as casas desses blocos. Quando custo é balanceado contra precisão, a unidade maior pode se mostrar superior. Um dos inconvenientes do uso da amostragem por conglomerados (AC) é que as unidades, dentro de um mesmo conglomerado, tendem a ter valores parecidos, e isto torna esses planos menos ecientes. Técnicas de Amostragem 54-93

Amostragem por Conglomerados (Cluster) A AC tende a: i) Ter um menor custo por elemento; ii) Ter maior variância; e iii) Maiores problemas para análises estatística. Técnicas de Amostragem 55-93

Amostragem por Conglomerados (Cluster) A AC tende a: i) Ter um menor custo por elemento; ii) Ter maior variância; e iii) Maiores problemas para análises estatística. Técnicas de Amostragem 55-93

Estimativas em Conglomerados Se cada unidade contém o mesmo número m de elementos, seja p i = a i m a proporção de elementos na i-ésima unidade que cai na classe C. A proporção caindo em C na amostra é p = n i=1 a i nm = 1 n n j=1 p j ou seja, p é uma média não ponderada das quantidades p i. Consequentemente, se y i é substituído por p i, as fórmulas para a média podem ser aplicadas diretamente para fornecer a verdadeira e estimada variância de p. Var(p) = 1 f n N (p i P) 2 i=1 N 1 Var(p) = 1 f n n (p i p) 2 i=1 n 1 Técnicas de Amostragem 56-93

Estimativas em Conglomerados Se o tamanho do conglomerado não é constante, seja m i o número de elementos no i-ésimo conglomerado e seja p i = a i m. A proporção i de unidades caindo na classe C na amostra é p = n a i aleatório n m i aleatório Estruturalmente, isso é uma típica estimativa de razão. Ela é levemente viesada, embora o viés raramente tenha importância prática. Técnicas de Amostragem 57-93

Estimativas em Conglomerados Se trocarmos y i por a i e x i por m i Var( ˆR) = 1 f nx 2 1 N 1 N i=1 (Y i RX i ) 2 R = Y X ˆR = y x P = N i=1 A i N i=1 M i p = n i=1 a i n i=1 m i A variância aproximada de p é Var(p) = 1 f nm 2 1 N 1 N i=1 (A i PM i ) 2 Var(p) = 1 f nm 2 1 n 1 n i=1 (a i pm i ) 2 M = N i=1 m i N m = n i=1 m i n ou Var(p) = 1 f a 2 nm 2 i 2p a im i +p 2 m 2 i n 1 Técnicas de Amostragem 58-93

Estimativas em Conglomerados Exemplo: Uma AAS de 30 domicílios foi retirada de uma população de 15.000 domicílios e foi vericada a proporção de pessoas que consultaram um médico no último ano. Domicílio No. pessoas Masc Fem Visitou o Médico Sim Não 1 5 1 4 5 0 2 6 3 3 0 6...... 30 4 2 2 1 3 Total 104 53 51 30 74 Técnicas de Amostragem 59-93

Estimativas em Conglomerados binomial: n = 104 p = 30 104 = 0, 2885 Var(p) = pq n 1 = 0,2885 0,7115 104 1 = 0,20526775 103 = 0, 00199 correto: n = 30 p = a i mi = 30 104 = 0, 2885 (como antes) m = 104 30 = 3, 4667 a2 i = 86 m 2 i = 404 a i m i = 113 Var(p) = 86 2 0,2885 113+0,28852 404 30 29 3,4667 2 = 0, 00520 Estimando a proporção de homens na população binomial: Var(p) = 0, 00240 razão: Var(p) = 0, 00114 Técnicas de Amostragem 60-93

Amostragem Complexa O termo Amostragem Complexa é utilizada quando a amostra é coletada utilizando conglomerados, estraticação e probabilidade de seleção desigual (Chambers e Skinner,2003). Técnicas de Amostragem 61-93

Amostragem Complexa O termo Amostragem Complexa é utilizada quando a amostra é coletada utilizando conglomerados, estraticação e probabilidade de seleção desigual (Chambers e Skinner,2003). Geralmente em pesquisas com grandes conjuntos de dados, a amostra é coletada a partir de uma combinação dessas técnicas, como por exemplo, uma pesquisa pode utilizar estraticação com diversos estágios de conglomerados e utilizar estimadores tipo razão e regressão para a estimação dos parâmetros (Lohr, 1999). Técnicas de Amostragem 61-93

Amostragem Complexa O termo Amostragem Complexa é utilizada quando a amostra é coletada utilizando conglomerados, estraticação e probabilidade de seleção desigual (Chambers e Skinner,2003). Geralmente em pesquisas com grandes conjuntos de dados, a amostra é coletada a partir de uma combinação dessas técnicas, como por exemplo, uma pesquisa pode utilizar estraticação com diversos estágios de conglomerados e utilizar estimadores tipo razão e regressão para a estimação dos parâmetros (Lohr, 1999).As fórmulas para estimação dos erros padrão se tornam horrendas, especialmente se existem diversos estágios de aglomeração sem reposição. Técnicas de Amostragem 61-93

Amostragem Complexa Aplicar métodos estatísticos clássicos para analisar tais dados leva a inferências erradas. Em particular, ignorar o desenho amostral pode levar a uma séria subestimação do erro padrão das estimativas e consequentemente uma baixa cobertura dos intervalos de conança e uma superestimação dos níveis dos testes (Chambers e Skinner,2003). Técnicas de Amostragem 62-93

Amostragem Complexa Aplicar métodos estatísticos clássicos para analisar tais dados leva a inferências erradas. Em particular, ignorar o desenho amostral pode levar a uma séria subestimação do erro padrão das estimativas e consequentemente uma baixa cobertura dos intervalos de conança e uma superestimação dos níveis dos testes (Chambers e Skinner,2003). Considere o exemplo a seguir sobre a estimação do total de mosquiteiros em Gambia, na África, a m de reduzir os casos de Malária (Lohr, 1999): Técnicas de Amostragem 62-93

Amostragem Complexa Aplicar métodos estatísticos clássicos para analisar tais dados leva a inferências erradas. Em particular, ignorar o desenho amostral pode levar a uma séria subestimação do erro padrão das estimativas e consequentemente uma baixa cobertura dos intervalos de conança e uma superestimação dos níveis dos testes (Chambers e Skinner,2003). Considere o exemplo a seguir sobre a estimação do total de mosquiteiros em Gambia, na África, a m de reduzir os casos de Malária (Lohr, 1999): Em 1991 um pesquisa nacional foi feita para estimar a prevalência de mosquiteiros nas casas em áreas rurais. A amostra e os resultados estão descritos em D'Alessandro et al. (1994). Técnicas de Amostragem 62-93

Amostragem Complexa O cadastro consiste de todas a vilas rurais com menos de 3000 pessoas na Gambia. Técnicas de Amostragem 63-93

Amostragem Complexa O cadastro consiste de todas a vilas rurais com menos de 3000 pessoas na Gambia. As vilas foram estraticadas em três regiões geográcas (leste, central e oeste) e se a vila tem serviço de saúde pública ou não. Técnicas de Amostragem 63-93

Amostragem Complexa O cadastro consiste de todas a vilas rurais com menos de 3000 pessoas na Gambia. As vilas foram estraticadas em três regiões geográcas (leste, central e oeste) e se a vila tem serviço de saúde pública ou não. Em cada região, 5 distritos foram selecionados com probabilidade proporcional ao tamanho da população do distrito, estimada pelo Censo Nacional de 1983. Técnicas de Amostragem 63-93

Amostragem Complexa O cadastro consiste de todas a vilas rurais com menos de 3000 pessoas na Gambia. As vilas foram estraticadas em três regiões geográcas (leste, central e oeste) e se a vila tem serviço de saúde pública ou não. Em cada região, 5 distritos foram selecionados com probabilidade proporcional ao tamanho da população do distrito, estimada pelo Censo Nacional de 1983. Em cada distrito, 4 vilas foram selecionadas, novamente com proporcional ao tamanho da população do distrito: 2 vilas com serviço de saúde pública e 2 sem serviço de saúde pública. Técnicas de Amostragem 63-93

Amostragem Complexa O cadastro consiste de todas a vilas rurais com menos de 3000 pessoas na Gambia. As vilas foram estraticadas em três regiões geográcas (leste, central e oeste) e se a vila tem serviço de saúde pública ou não. Em cada região, 5 distritos foram selecionados com probabilidade proporcional ao tamanho da população do distrito, estimada pelo Censo Nacional de 1983. Em cada distrito, 4 vilas foram selecionadas, novamente com proporcional ao tamanho da população do distrito: 2 vilas com serviço de saúde pública e 2 sem serviço de saúde pública. Finalmente, 6 casa foram escolhidas de cada vila, e o pesquisador anotou o número de camas e de mosquiteiros, junto com outras informações da residência. Técnicas de Amostragem 63-93

Amostragem Complexa O cadastro consiste de todas a vilas rurais com menos de 3000 pessoas na Gambia. As vilas foram estraticadas em três regiões geográcas (leste, central e oeste) e se a vila tem serviço de saúde pública ou não. Em cada região, 5 distritos foram selecionados com probabilidade proporcional ao tamanho da população do distrito, estimada pelo Censo Nacional de 1983. Em cada distrito, 4 vilas foram selecionadas, novamente com proporcional ao tamanho da população do distrito: 2 vilas com serviço de saúde pública e 2 sem serviço de saúde pública. Finalmente, 6 casa foram escolhidas de cada vila, e o pesquisador anotou o número de camas e de mosquiteiros, junto com outras informações da residência. Em resumo, o desenho amostral está a seguir: Técnicas de Amostragem 63-93

Amostragem Complexa Estágio Unidade Amostral Estraticação 1 Distrito Região 2 Vila Serviço de Saúde Pública ou não 3 Residência Técnicas de Amostragem 64-93

Amostragem Complexa Estágio Unidade Amostral Estraticação 1 Distrito Região 2 Vila Serviço de Saúde Pública ou não 3 Residência Para calcular as estimativas pontuais e os erros padrão usando as fórmulas mostradas anteriomente, precisamos inicar no terceiro estágio e os seguintes passos para estimar o número total de mosquiterios nas camas. Técnicas de Amostragem 64-93

Amostragem Complexa Estágio Unidade Amostral Estraticação 1 Distrito Região 2 Vila Serviço de Saúde Pública ou não 3 Residência Para calcular as estimativas pontuais e os erros padrão usando as fórmulas mostradas anteriomente, precisamos inicar no terceiro estágio e os seguintes passos para estimar o número total de mosquiterios nas camas. 1 Registre o número total de mosquiteiros em cada residência; Técnicas de Amostragem 64-93

Amostragem Complexa Estágio Unidade Amostral Estraticação 1 Distrito Região 2 Vila Serviço de Saúde Pública ou não 3 Residência Para calcular as estimativas pontuais e os erros padrão usando as fórmulas mostradas anteriomente, precisamos inicar no terceiro estágio e os seguintes passos para estimar o número total de mosquiterios nas camas. 1 Registre o número total de mosquiteiros em cada residência; 2 Estime o número total de mosquiteiros em cada vila por (número de residências na vila) (número médio de mosquiteiros por residência); Técnicas de Amostragem 64-93

Amostragem Complexa 3 Estime o número total de mosquiteiros pelo serviço de saúde pública em cada distrito, usando as fórmulas para probabilidades proporcionais ao tamannho; Técnicas de Amostragem 65-93

Amostragem Complexa 3 Estime o número total de mosquiteiros pelo serviço de saúde pública em cada distrito, usando as fórmulas para probabilidades proporcionais ao tamannho; 4 Adicione a estimativas dos 2 estratos (serviço de saúde pública ou não) à estimativa do número de mosquiteiros em cada distrito. Some as variâncias estimadas dos 2 estratos à variância estimada do distrito; Técnicas de Amostragem 65-93

Amostragem Complexa 3 Estime o número total de mosquiteiros pelo serviço de saúde pública em cada distrito, usando as fórmulas para probabilidades proporcionais ao tamannho; 4 Adicione a estimativas dos 2 estratos (serviço de saúde pública ou não) à estimativa do número de mosquiteiros em cada distrito. Some as variâncias estimadas dos 2 estratos à variância estimada do distrito; 5 Nesse ponto você tem o número total de mosquiteiros estimados e a variância estimada para cada distrito. Agora use as fórmulas para amostragem em 2 estágios para estimar o número total de mosquiteiros para cada região; Técnicas de Amostragem 65-93

Amostragem Complexa 3 Estime o número total de mosquiteiros pelo serviço de saúde pública em cada distrito, usando as fórmulas para probabilidades proporcionais ao tamannho; 4 Adicione a estimativas dos 2 estratos (serviço de saúde pública ou não) à estimativa do número de mosquiteiros em cada distrito. Some as variâncias estimadas dos 2 estratos à variância estimada do distrito; 5 Nesse ponto você tem o número total de mosquiteiros estimados e a variância estimada para cada distrito. Agora use as fórmulas para amostragem em 2 estágios para estimar o número total de mosquiteiros para cada região; 6 Finalmente, some as estimativas de total para cada região para estimar o número total de mosquiteiros em Gambia. Some as variâncias das regiões pelas fórmulas da estraticada. Técnicas de Amostragem 65-93

Amostragem Complexa Parece complicado né? Técnicas de Amostragem 66-93

Amostragem Complexa Parece complicado né? Note ainda que toda a análise deve ser feita considerando os pesos amostrais, que nada mais são do que o inverso das probabilidades W i = 1 π i Técnicas de Amostragem 66-93

Amostragem Complexa Parece complicado né? Note ainda que toda a análise deve ser feita considerando os pesos amostrais, que nada mais são do que o inverso das probabilidades W i = 1 π i Na amostragem estraticada, os pesos amostrais para a j-ésima unidade no h-ésimo estrato são dados por w hj = (N h /n h ), e o total pode ser simplesmente estimado por ˆt str = H h=1 j s h w hj y hj Técnicas de Amostragem 66-93