Ensaios sobre Estimação em Pequenos Domínios no INE Aplicação o Estimaor EBLUP e o Estimaor sintético a regressão no Inquérito ao Emprego Pero Campos 1,2, Luís Correia 1, Paula Marques 1, Jorge M. Menes 1,3 1 Instituto Nacional e Estatística 2 LIAAD INESC-Porto 3 Centro e Estatística e Gestão e Informação, ISEGI-UNL, XVIII Jornaas e Classificação e Análise e Daos Universiae e Trás-os-Montes e Alto Douro, 7 a 9 e Abril e 2011
Ínice Motivação Os estimaores e pequenos omínios O Inquérito ao Emprego Os estimaores SYNTH_B e o EBLUP Resultaos Conclusões
Motivação Os métoos e estimação habituais não permitem, em muitos casos, a proução e inicaores com precisão suficiente Os métoos e estimação em pequenos omínios afiguram-se como uma alternativa aos métoos irectos ou esign-base quano a imensão a amostra nos omínios não permite a obtenção e resultaos fiáveis Em certos inquéritos o INE, como no Inquérito ao Emprego (IE), a imensão é certas uniaes territoriais, NUTS II, para certos inicaores, não permite a proução e informação com precisão suficiente
Os estimaores e pequenos omínios Rao (2003) classifica os estimaores e pequenos omínios em irectos, inirectos, sintéticos e combinaos Neste trabalho utilizam-se estimaores sintéticos e combinaos. Os estimaores sintéticos assentam na hipótese e que o omínio e estuo tem características semelhantes a outro omínio e maior imensão Os estimaores combinaos resultam e combinação linear entre um estimaor irecto e um estimaor sintético
Os estimaores e pequenos omínios Desenvolvimentos sobre estes estimaores e aplicações, poem ser encontraos em Rao (2003), Fay e Herritot (1979), Longfor (1999, 2001) e You (2008). No projecto Eurarea (Eurarea, 2004) estuamse vários estimaores com o objectivo e partilhar informação a nível europeu.
O Inquérito ao Emprego (IE) O IE é uma operação estatística que tem como objectivo principal a caracterização o mercao e trabalho. Trata-se e um inquérito às famílias, por amostragem e alojamentos, realizao e forma contínua e trimestralmente. A amostra total está iviia em seis subamostras e obeece a um esquema e rotação no qual os alojamentos são observaos urante seis trimestres consecutivos. O Regulamento Comunitário a que está sujeito estabelece níveis e representativiae em nível e em evolução que se trauzem na obrigatorieae e prouzir informação fiável a nível nacional e NUTS II (Nomenclatura as uniaes territoriais para fins estatísticos).
Características a amostra o IE 1ºT e 2008 e a população Amostra População Inivíuos 42 226 10,6 Milhões Agregaos 15 926 3,9 Milhões Domínios NUTS III 24* 30 Dim. mínima (in.) 273 (S Estrela + C Beira) 41 000 (Pinhal Interior S) Dim. máxima (in.) 4749 (Grane Lisboa) 2 Milhões (G Lisboa)
Estimaor sintético e regressão (SYNTH_B) O estimaor sintético ao nível o omínio (SYNTH_B), é efinio a seguinte forma Seno: Yˆ ˆ SYNTH _ B T Y X Y a estimativa a méia populacional no omínio ˆ X a matriz as méias populacionais as variáveis auxiliares ao nível os omínios é um vector e coeficientes e regressão ˆ
Estimaor sintético e regressão (SYNTH_B) O cálculo as estimativas nos omínios epene a estimação os parâmetros o moelo que são obtios através o algoritmo scoring e Fisher usao para eterminar numericamente estimaores e máxima verosimilhança. A estimação moel-base pressupõe que os valores a variável e estuo resultam a realização e variáveis aleatórias, isto é, e um processo estocástico, cuja istribuição conjunta poe ser explicaa através e um moelo
Estimaor sintético e regressão (SYNTH_B) No moelo linear e regressão, as variáveis auxiliares encontram se agregaas ao nível os omínios. Trata-se e um moelo com uma componente fixa e uas componentes aleatórias: y X T β u e com 2 e u e ii N(0, u ) n A variância é estimaa a partir as variâncias os m omínios presentes na amostra 2 1 2 ˆ e ( yi y. ) n m i 2 seno u e e os efeitos aleatórios ao nível o omínio (=1,,D) e o inivíuo, respectivamente
Empirical Best Unbiase Estimator (EBLUP) O estimaor EBLUP tem como bases e esenvolvimento as o estimaor BLUP, (Best Linear Unbiase Preiction), que não impõe pressupostos e normaliae nos efeitos aleatórios u. Y i ˆX i û i assumino-se Y ~N i V
Empirical Best Unbiase Estimator (EBLUP) As componentes a variância são estimaas a partir a amostra via ML-Maximum Likelihoo ou REML-Resiual Maximum Likelihoo, aas pelo erro quarático méio méio (MSE): MSE[ ] ( ˆ ) G ( ˆ ) 2 G ( ˆ ) Y i O estimaor EBLUP utilizao é o e nível área (usualmente enominao EBLUP_B) e é ao por t t EBLUP G1 2 3 X (y X ˆ)
Resultaos A variável Y a estimar representa a taxa e esemprego ao nível as NUTS III (ou agregações e NUTS III). O moelo proposto recorre aos aos (aministrativos) o Instituto o Emprego e Formação Profissional, nomeaamente o número e esempregaos inscritos nos Centros e Emprego.
Minho-Lima+Cavao; Ave; Grane Porto; Tâmega+Entre Douro e Vouga; Douro+Alto Trás-os-Montes. Baixo Vouga; Baixo Monego; Pinhal Litoral; Pinhal Interior Norte+Sul; Dão-Lafões; Serra a Estrela+Cova a Beira; Beira Interior Norte+Sul. Oeste sem Mafra; Grane Lisboa + Mafra; Península e Setúbal; Méio Tejo; Lezíria o Tejo Alentejo Litoral; Alto Alentejo; Alentejo Central; Baixo Alentejo. Algarve Coeficientes e variação (%) «Comparação gráfica entre os coeficientes e variação obtios pelo estimaor EBLUP e pelo estimaor irecto actualmente utilizao no IE. 0,5 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 CV EBLUP CV IE
Estimativas e coeficientes e variação a taxa e esemprego (estimaores irecto, sintético e EBLUP ao nível as NUTS III) NUTS III Dimensão Estimativa (%) Coeficiente e variação (%) amostra DIRECT SYNTH_B EBLUP_B DIRECT SYNTH_B EBLUP_B 1 Minho-Lima+Cávao 2143 5.0 5.9 5.5 15.7 17.8 13.0 2 Ave 1625 9.8 9.1 9.1 11.4 12.7 10.3 3 Grane Porto 4134 11.2 11.5 10.9 7.4 10.0 7.2 4 Tâmega+Entre D e V 2924 7.7 7.5 7.5 9.9 15.4 9.2 5 Douro + Alto T-os-M 1320 7.3 5.6 6.8 15.2 19.1 13.5 6 Baixo Vouga 909 5.6 5.7 6.1 23.7 19.3 16.8 7 Baixo Monego 916 4.1 5.9 4.9 20.1 18.3 15.2 8 Pinhal Litoral 653 4.1 4.5 5.3 33.3 23.8 19.2 9 Pinhal Interior N + S 503 4.0 4.1 5.0 30.7 27.4 19.9 10 Dão-Lafões 776 3.6 4.1 4.9 33.7 27.2 20.0 11 S Estrela + C Beira 273 8.4 8.6 6.7 44.0 13.7 19.5 12 Beira Interior N + S 508 5.8 6.2 6.0 38.5 18.0 20.5 13 Oeste sem Mafra 907 6.2 6.2 6.3 22.7 15.8 16.6 14 G Lisboa + Mafra 4749 8.8 8.5 9.1 8.0 12.6 7.4 15 P e Setúbal 2105 8.0 8.4 7.9 13.8 12.9 11.7 16 Méio Tejo 678 5.7 5.3 6.1 33.6 20.0 19.5 17 Lezíria o Tejo 1170 7.3 6.5 6.8 18.9 16.2 15.3 18 Alentejo Litoral 698 6.2 5.8 6.2 23.5 20.8 17.2 19 Alto Alentejo 982 7.6 8.6 6.6 21.7 12.1 17.0 20 Alentejo Central 1284 11.4 9.7 8.0 14.7 11.5 14.1 21 Baixo Alentejo 1057 8.2 9.5 7.0 19.2 11.3 16.0 22 Algarve 4261 8.0 6.3 7.4 11.5 16.9 10.8 23 Açores 3961 5.6 5.4-15.9 21.9-24 Maeira 3690 6.2 6.9-16.1 16.8 -
Conclusões Foram aplicaos ois estimaores ao IE. A variável Y a estimar representa a taxa e esemprego ao nível as NUTS III (ou agregações e NUTS III). O moelo proposto recorre aos aos (aministrativos) o Instituto o Emprego e Formação Profissional, nomeaamente o número e esempregaos inscritos nos Centros e Emprego. Os resultaos apresentaos mostram que é possível obter ganhos e precisão nas estimativas prouzias que corresponem às regiões e menor imensão.
Conclusões Assim seno, a utilização estes estimaores faz melhorar a precisão as estimativas. Poe-se constatar que a iferença entre as estimativas obtias pelo estimaor sintético e as obtias pelo estimaor irecto, são, em quase toas as regiões, inferiores à uniae em valor absoluto. Relativamente à precisão as mesmas nota-se um ganho generalizao, em especial no estimaor EBLUP. Este ganho é mais acentuao nas regiões cuja imensão amostral é menor.