Laboratório em Planos Complexos de Amostragem Vigitel Janeiro de 2013 1
Histórico Inquérito por Telefone Vantagens Baixo custo Rapidez no preenchimento dos questionários Maior controle sobre erros não amostrais Desvantagens Problemas de cobertura Disponibilidade das listas telefônicas Atualização dos cadastros de telefones
Métodos usuais de amostragem de linhas telefônicas residenciais Fonte de Informação Métodos de Seleção Pontos Críticos Lista telefônica Sorteio aleatório ou estratificado Cobertura Atualização do cadastro Disponibilidade Prefixos do número do telefone Random Digital Dialing (RDD) 11-3061 - Complexidade Lista comercial Sorteio aleatório ou estratificado Custo Cobertura
Vigitel Plano de Amostragem Abrangência: 26 capitais e Distrito Federal População de estudo Adultos (>=18 anos) residentes nas capitais Número mínimo de entrevista: 2.000 em cada cidade
Vigitel População População de Estudo Amostra probabilística Vigitel Pesos de Pós-estratificação (idade, sexo e escolaridade) Resultados para população de estudo (N)
Rio de Janeiro São Paulo Curitiba Belo Horizonte Porto Alegre Florianópolis Vitória Distrito Federal Goiânica Salvador Recife Cuiabá Belém Campo Grande Aracaju São Luis Natal Fortaleza Manaus Porto Velho João Pessoa Teresina Maceió Boa Vista Rio Branco Macapá Palmas % Vigitel Cobertura de domicílios com acesso a linha telefônica fixa. Capitais brasileiras e Distrito Federal, 2010 80 70 60 50 40 30 20 10 0 Média Capitais Fonte: Censo 2010
Sorteio da Amostra Primeiro estágio: Cadastro eletrônico de linhas residenciais fixas Amostragem sistemática ordenada por CEP
Sorteio da Amostra Universo Amostra Amostra 5.000 linhas telefônicas Réplica 1 200 CEP3 linhas telefônicas Réplica 2 200 linhas telefônicas Réplica 25 200 linhas telefônicas CEP3 N % n % 660 93.002 42,67 Réplicas 2.134 42,68 Amostra 661 13.9091 6,38 2 319 3 46,38 5 n 666 % 35.805 % 16,43 % % 821 % 16,42 % 660 2.134 42,68 43,00 43,00 43,00 43,00 43,00 668 25.880 11,87 594 11,88 661 319 6,38 6,50 6,50 6,50 6,00 6,00 670 14.560 6,68 334 6,68 666 821 16,42 16,00 16,00 16,00 16,50 16,50 671 31.984 14,67 734 14,68 668 594 11,88 12,00 12,00 12,00 12,00 12,00 672 2.809 1,29 64 1,28 670 334 6,68 7,00 7,00 6,50 6,50 6,50 Total 217.949 100,00 5.000 100 671 734 14,68 14,50 14,50 15,00 15,00 15,00 672 64 1,28 1,00 1,00 1,00 1,00 1,00 Total 5.000 100 100,0 0 100,0 0 100,0 0 100,0 0 100,0 0
Resultados Distribuição das linhas telefônicas por réplicas e CEP4. Aracaju, 2010 Amostra sorteada 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Réplicas 4916 4909 4908 4907 4906 4905 4903 4902 4901 4900
Sorteio da Amostra Segundo estágio: Sorteio de um adulto residente no domicílio
Pesos Peso da amostra para uma capital qualquer é dado por: peso _ amostra ij ifa i * número_ adultos ij 1 * qtde _ linhas _ telefônicas sendo i=1, 2,..., 27 (capitais) e j= 1, 2,..., n (entrevistas) ij O peso final: peso _ final peso _ amostra * ijk ij N popadultai n i PesoPos jkl sendo i= 1, 2,... 27 (cidades) j=1,2,..., n (entrevistas) k= 1, 2,..., 36 (células da pós-estratificação)
Operacional de campo
Processo em 2010 Amostra de linhas telefônicas (n=5.000) Linhas telefônicas utilizadas (média de 3.000) 57% Status 43% Empresa Não existe Fora de serviço 10 tentativas sem sucesso Elegível Não elegível Taxa de Resposta (77%)
% Percentual de linhas elegíveis 80 70 60 50 40 30 20 10 0 Municípios
(%) Taxa de resposta 100 90 80 70 60 50 40 30 20 10 0 Municípios
Resultados Distribuição das linhas telefônicas por réplicas e CEP4. Aracaju, 2010 Amostra sorteada Amostra realizada 100% 100% 90% 90% 80% 4916 80% 4916 70% 4909 70% 4909 60% 50% 40% 30% 20% 10% 4908 4907 4906 4905 4903 4902 4901 60% 50% 40% 30% 20% 10% 4908 4907 4906 4905 4903 4902 4901 0% 4900 0% 4900 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Réplicas Réplicas
% % Resultados Aracaju/2010 Taxa de elegível Taxa resposta 90 90 80 80 70 70 60 60 50 50 40 40 30 30 20 20 10 10 0 1 2 3 4 5 6 7 8 9 1011121314151617 0 1 2 3 4 5 6 7 8 9 1011121314151617 Réplicas Réplicas
Peso de Pós-Estratificação
Regressão logística múltipla Variável resposta : (0) Sem telefone fixo PNAD (1) Com telefone fixo Variáveis explicativas : Faixa etária Sexo Anos de estudo Cor da pele Posse de plano de saúde
Métodos Seleção de variáveis para construção dos pesos de pós-estratificação Região Variáveis Estimativa Erro-Padrão t P> t Constante -1.355 0.056-24.250 0.000 Norte Anos Estudo 0.105 0.005 20.190 0.000 Raça Branca 0.316 0.041 7.640 0.000 Tem Plano Saúde 1.270 0.057 22.090 0.000 Constante -4.106 0.147-27.950 0.000 Anos Estudo 0.139 0.003 44.290 0.000 Nordeste Raça Branca 0.189 0.030 6.310 0.000 Tem Plano Saúde 1.430 0.041 34.800 0.000 Área Urbana 2.691 0.149 18.070 0.000 Constante -2.956 0.125-23.580 0.000 Anos Estudo 0.112 0.031 36.250 0.000 Sudeste Raça Branca 0.391 0.029 13.620 0.000 Tem Plano Saúde 1.293 0.035 36.830 0.000 Região Metropolitana 0.445 0.043 10.380 0.000 Área Urbana 2.061 0.127 16.280 0.000 Constante -2.581 0.137-18.520 0.000 Anos Estudo 0.133 0.005 25.110 0.000 Sul Raça Branca 0.383 0.051 7.510 0.000 Tem Plano Saúde 1.061 0.046 22.980 0.000 Região Metropolitana 0.179 0.061 2.950 0.000 Área Urbana 1.824 0.127 14.410 0.000 Constante -3.189 0.199-15.960 0.000 Anos Estudo 0.109 0.005 21.560 0.000 Centro-Oeste Raça Branca 0.360 0.041 8.870 0.000 Tem Plano Saúde 1.153 0.061 18.810 0.000 Região Metropolitana 0.730 0.087 8.350 0.000 Área Urbana 2.319 0.205 11.290 0.000
0 0.25 Probabilidade (mean) p/(mean) p0.25.5 Probabilidade.5.75.75 LTR segundo cor da pele e anos de estudo cor da pele branca Raca Branca cor da pele não branca Raca Não Branca Tem Telefone Tem Telefone Não Tem Telefone Não Tem Telefone 0 5 10 15 anos de estudo (a) Indivíduos com cor da pele branca (mean) p (mean) p0 0 5 10 15 anos de estudo (mean) p (b) Indivíduos com cor da pele não branca (mean) p0 Fonte: BERNAL, R.T.I.; SILVA, NN da. Linhas Telefonicas Residenciais: uso em inquéritos epidemiológicos no Brasil. São Paulo; 2006 [Dissertação de Mestrado FSP USP].
Métodos Pesos de pós-estratificação - Célula Distribuição de frequência bivariada da população e da amostra. Método de ponderação por célula População Amostra Total 1 2... K 1 2... K 1 FR 11 FR 12... FR 1K FR 1. 1 fr 11 fr 12... fr 1K fr 1. 2 FR 21 FR 22... FR 2K FR 2. 2 fr 21 fr 22... fr 2K fr 2..................................... H FR H1 FR H2... FR HK FR H. H fr H1 fr H2... fr HK fr H. Total FR. 1 FR. 2 FR. K 1 Total fr. 1 fr. 2 fr. K 1 Total Figura extraída do livro do KALTON, 1983 pp.56 peso _ pósestraticação FR f HK HK
População Amostra Idade e escolaridade Sexo Sexo Total Idade e escolaridade M F M F Total 40a49 e 0a8 0.10 0.09 0.20 40a49 e 0a8 0.05 0.08 0.13 50a59 e 0a8 0.09 0.09 0.18 50a59 e 0a8 0.06 0.08 0.14 60+ e 0a8 0.11 0.12 0.23 60+ e 0a8 0.06 0.14 0.20 40a49 e 9a11 0.05 0.08 0.13 40a49 e 9a11 0.07 0.10 0.17 50a59 e 9a11 0.04 0.03 0.07 50a59 e 9a11 0.03 0.07 0.10 H,60+ e 9a11 0.01 0.01 0.02 H,60+ e 9a11 0.02 0.02 0.04 40a49 e 12+ 0.05 0.07 0.12 40a49 e 12+ 0.05 0.07 0.12 50a59 e 12+ 0.03 0.02 0.04 50a59 e 12+ 0.02 0.04 0.07 60+ e 12+ 0.01 0.01 0.01 60+ e 12+ 0.01 0.02 0.03 Total 0.47 0.53 1.00 Total 0.38 0.62 1.00 peso _ pósestraticação FR fr HK hk Pesos de pós-estratificação Idade e escolaridade Sexo M F 40a49 e 0a8 1.956 1.213 50a59 e 0a8 1.371 1.153 60+ e 0a8 1.763 0.859 40a49 e 9a11 0.654 0.835 50a59 e 9a11 1.147 0.447 H,60+ e 9a11 0.459 0.411 40a49 e 12+ 1.160 0.956 50a59 e 12+ 1.097 0.421 60+ e 12+ 0.462 0.368
Exemplo: Pirâmide etária e distribuição da variável escolaridade segundo inquérito. Município de Rio Branco-AC, 2007 [65;96] [55;64] [45;54] [35;44] [25;34] [65;96] [55;64] [45;54] [35;44] [25;34] [18;24] [18;24] v -20-15 -10-5 0 5 10 15 20 v -20-15 -10-5 0 5 10 15 20 H M (a) População (PNAD) H M (b) Amostra Vigitel 50 45 40 35 30 25 20 15 10 5 0 % [0;8] [9;11] [12; 20]
[65;96] [55;64] [45;54] [35;44] [65;96] [55;64] [45;54] [35;44] [25;34] Exemplo: [18;24] v [25;34] [18;24] -20-15 -10-5 0 5 10 15 20-20 -15-10 -5 0 5 10 15 20 H M H M Pirâmide etária e distribuição da variável escolaridade segundo inquérito. (a) População (PNAD) (b) Amostra Vigitel 50 45 40 35 30 25 20 15 10 5 0 % Município de Rio Branco-AC, 2007 [0;8] [9;11] [12; 20] Anos de estudo v (c) População - PNAD (d) Amostra Vigitel
Medidas resumo do peso final em Rio Branco Categorias Medidas resumo Peso final Categorias Medidas resumo Peso final Média 4357.4 Média 3092.3 Homem, 18a24,0a8 DP 1772.1 Mulher, 18a24,0a8 DP 1774.1 CV 0.4 CV 0.6 Média 436.9 Média 543.2 Homem, 18a24, 9a11 DP 174.7 Mulher, 18a24, 9a11 DP 211.5 CV 0.4 CV 0.4 Média 179.3 Média 177.5 Homem, 18a24, 12ou+ DP 63.0 Mulher, 18a24, 12ou+ DP 72.0 CV 0.4 CV 0.4 Média 2800.4 Média 1819.6 Homem, 25a34, 0a8 DP 1396.7 Mulher, 25a34, 0a8 DP 874.2 CV 0.5 CV 0.5 Média 529.8 Média 427.4 Homem, 25a34,9a11 DP 253.6 Mulher, 25a34,9a11 DP 204.6 CV 0.5 CV 0.5 Média 214.5 Média 190.9 Homem, 25a34. 12ou+ DP 97.6 Mulher, 25a34. 12ou+ DP 89.3 CV 0.5 CV 0.5 Média 1163.3 Média 828.7 Homem,35a44,0a8 DP 547.5 Mulher,35a44,0a8 DP 417.5 CV 0.5 CV 0.5 Média 365.1 Média 311.5 Homem, 35a44, 9a11 DP 159.7 Mulher, 35a44, 9a11 DP 162.4 CV 0.4 CV 0.5 Média 294.2 Média 209.9 Homem, 35a44,12ou+ DP 129.1 Mulher, 35a44,12ou+ DP 95.8 CV 0.4 CV 0.5 Média 850.4 Média 560.3 Homem,45a54,0a8 DP 435.4 Mulher,45a54,0a8 DP 253.2 CV 0.5 CV 0.5 Média 294.6 Média 195.5 Homem, 45a54,9a11 DP 126.4 Mulher, 45a54,9a11 DP 87.6
Avaliação dos pesos 2006 a 2011
Média do efeito de delineamento (deff) e do tamanho efetivo da amostra (ndeff) por indicador segundo região peso da amostra Não há diferença entre regiões Efeito do sorteio de um adulto no domicílio produz deff entre 1.17 e 1.31 Indicador Norte Nordeste Sudeste Sul Centro-Oeste DEFF ndeff DEFF ndeff DEFF ndeff DEFF ndeff DEFF ndeff FLV recomendado 1.18 1700 1.18 1702 1.18 1694 1.18 1695 1.18 1690 FLV regular 1.18 1690 1.20 1672 1.20 1661 1.21 1656 1.20 1667 Obesidade 1.19 1689 1.19 1683 1.19 1679 1.21 1655 1.18 1690 Hipertensão arterial 1.20 1672 1.18 1694 1.19 1674 1.19 1684 1.18 1696 Ex-fumante 1.20 1661 1.18 1696 1.20 1664 1.20 1666 1.19 1680 Diabetes 1.21 1654 1.17 1714 1.17 1712 1.17 1712 1.17 1719 Excesso de peso 1.21 1647 1.20 1662 1.22 1645 1.21 1647 1.21 1653 Fuma 20 ou mais 1.23 1641 1.19 1687 1.23 1628 1.27 1586 1.20 1674 Leite com gordura 1.22 1641 1.21 1652 1.22 1639 1.22 1639 1.22 1646 Gordura 1.25 1606 1.24 1619 1.25 1604 1.24 1612 1.22 1636 Fumante 1.26 1593 1.22 1644 1.23 1628 1.25 1600 1.21 1649 Refrigerante 5 ou mais 1.27 1582 1.27 1581 1.26 1587 1.26 1587 1.25 1602 Mamografia 1.26 217 1.23 297 1.23 319 1.27 330 1.25 280 Mamografia 2 anos 1.23 221 1.22 298 1.25 311 1.26 325 1.21 288 Papanicolau 1.31 645 1.29 630 1.31 595 1.28 613 1.30 639 Papanicolau 3 anos 1.29 655 1.26 643 1.28 609 1.25 626 1.26 657
Métodos Pesos de pós-estratificação - Rake Tabela de contingência da população e da amostra População Amostra Marginal 1 2... K 1 2... K Marginal 1 FR 1. 1 w 11 w 12... w 1K fr 1. 2 FR 2. 2 w 21 w 22... w 2K fr 2......................... H FR H. H w H1 w H2... w HK fr H. Marginal FR. 1 FR. 2 FR. K 1 Marginal fr. 1 fr. 2 fr. K 1
Saída da macro Raking
Saída da macro Raking
Saída da macro Raking