TÉCNICAS DE AMOSTRAGEM

Documentos relacionados
Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

TÉCNICAS DE AMOSTRAGEM

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva

Amostra Aleatória Simples

Cap. 4 - Estimação por Intervalo

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Estimação de valores. Luiz Carlos Terra

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

ESTATÍSTICA COMPUTACIONAL

Capítulo 4 Inferência Estatística

Intervalos Estatísticos para uma única Amostra - parte I

AULA 7 - Inferência em MQO: ICs e Testes de

TÉCNICAS DE AMOSTRAGEM

Aula 9: Introdução à Inferência Estatística

Inferência Estatística:

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

Inferência Estatística

Universidade Federal de Lavras

ESTIMAÇÃO DE PARÂMETROS

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Teorema central do limite e es/mação da proporção populacional p

TÉCNICAS DE AMOSTRAGEM

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Teoria da Estimação. Fabricio Goecking Avelar. junho Universidade Federal de Alfenas - Instituto de Ciências Exatas

Universidade Federal Fluminense INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA

Aula 9 Intervalo de confiança para a média da N(μ; σ 2 ), σ 2 desconhecida

Aula 3 - Revisão de Probabilidade e Estatística: Esclarecimento de Dúvidas

Distribuições Amostrais

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Professora Ana Hermínia Andrade. Período

Intervalos de Confiança

6- Probabilidade e amostras: A distribuição das médias amostrais

Exemplo 7.0 Numa linha de produção, os pesos de pacotes de pó de café embalados por uma máquina têm distribuição Normal, com média

Métodos Quantitativos para Ciência da Computação Experimental

Bioestatística INFERÊNCIA ESTATÍSTICA. Silvia Shimakura

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

TESTE DE HIPÓTESE. Introdução

AULA 03 Estimativas e tamanhos amostrais

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Intervalos de Confiança

Testes de Hipóteses Paramétricos

Inferência Estatistica

Cálculo das Probabilidades e Estatística I

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

Introdução a Estatística

Inferência Estatística. Teoria da Estimação

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

Intervalos de Confiança - Amostras Pequenas

Introdução à Bioestatística Turma Nutrição

Intervalos de Confiança Prof. Walter Sousa

Testes de Hipóteses Paramétricos

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba

Aula 7 Intervalos de confiança

Introdução à Probabilidade e à Estatística II

Cap. 8 - Intervalos Estatísticos para uma Única Amostra

Intervalos de Confiança

5 Avaliação dos estimadores propostos

Estimação e Testes de Hipóteses

Probabilidade e Estatística

Uma estatística é uma característica da amostra. Ou seja, se

Distribuições por Amostragem

Catarina Marques. Estatística II Licenciatura em Gestão. Conceitos: População, Unidade Estatística e Amostra

AULA 4: DISTRIBUIÇÕES DE PROBABILIDADES AMOSTRAIS. Gleici Castro Perdoná

Testes de Hipótese para uma única Amostra - parte II

1) Considere Y N(1, 1) e X Y = y N(y, 4). A quantidade de interesse é θ = P (X > 1).

1 Teoria da Decisão Estatística

de estimativa. Essa estimativa, chamada de confiança ou estimativa intervalar, consiste em uma faixa, ou intervalo, de valores em vez de apenas um úni

Prof. Eduardo Bezerra. 6 de abril de 2018

Les Estatística Aplicada II AMOSTRA E POPULAÇÃO

MAE0229 Introdução à Probabilidade e Estatística II

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

Distribuições derivadas da distribuição Normal. Distribuição Normal., x real.

Estatística Indutiva

Distribuições Amostrais - Tamanho da Amostra

Inventário Florestal. Amostragem

Distribuição Amostral e Estimação Pontual de Parâmetros

x P(X = x) 0,1 0,7 0,2

Professora Ana Hermínia Andrade. Período

Estatística Aplicada

X 2. (σ 2 + µ 2 ) = 1 n (nσ 2 + nµ 2 ) = σ 2 + µ 2. µ = 0 E(T ) = σ 2

Inferência para duas populações

Fernando de Pol Mayer

Distribuições Amostrais

TESTE DE KOLMOGOROV-SMIRNOV. Professor Ewaldo Santana Universidade Estadual do Maranhão - UEMA

Unidade IV Inferência estatística

Estimação: (A) Propriedades e Distribuições Amostrais

Fernando de Pol Mayer

Inferência Estatística

AULA 04 Teste de hipótese

Inferência Estatística:

1.1. Definições importantes

AULA 05 Teste de Hipótese

Distribuição t de Student

SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20

Inferência estatística

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

P. P. G. em Agricultura de Precisão DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)

LEEC Probabilidades e Estatística 1 a Chamada 13/06/2005. Parte Prática C (C) M 1% 9% 10% (M) 4% 86% 90% 5% 95% 100%

1 Inferência Estatística - Teoria da Estimação

Transcrição:

TÉCNICAS DE AMOSTRAGEM Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro

Sumário

Teorema Central do Limite (TCL) Se y 1, y 2,..., y n são variáveis aleatórias independentes e identicamente distribuídas, vindos de uma amostra aleatória simples com reposição (AASc), tem-se que: n(y Y ) N (0, 1). σ O TCL pode ser aplicado para uma amostra aleatória simples sem reposição (AAS), sob certas condições: N e n grandes ; e f = n N pequena. y Y Ou seja, sob AAS temos: (1 f ) S2 n N (0, 1). Veja que sob as condições anteriores, (1 f ) 1 e S 2 σ 2. E a probabilidade de uma unidade ser selecionada mais de uma vez é pequena. Portanto, AAS e AASc se equivalem.

Vamos ver um exemplo de simulação. Seja uma P 5000, donde seleciona-se 1.000 amostras de tamanho 50. Padronizando as médias de cada amostra temos a seguinte distribuição. Densidade 0.0 0.1 0.2 0.3 0.4 3.5 2.5 1.5 0.5 0.5 1.5 2.5 3.5 Figura: Frequência das médias amostrais. z

Vê-se que a distribuição da média amostral tem uma cara parecida com a distribuição normal padrão. O número de AAS possíveis é combinação de 5.000 em grupos de 50: 2,283864431193e+120. Veja que em nenhum momento faz-se suposições sobre a distribuição da variável de interesse y. Esse é o pulo do gato: independente da distribuição da variável de interesse, a distribuição da média amostral será aproximadamente normal. Então, temos que Pr y Y z 1 α/2 (1 f ) S2 1 α. n De outra forma, ) (y z 1 α/2 Pr (1 f ) S2 n Y y + z 1 α/2 (1 f ) S2 n sendo α o nível de significância ou 1 α é o nível de confiança. 1 α,

Define-se, então, um intervalo de confiança 1 α para a média populacional, baseado no seu valor estimado pela média amostral IC (1 α)100% (Y ) = y z 1 α/2 (1 f ) S2 n ; y + z 1 α/2 (1 f ) S2. n Como o valor da variância também não é conhecido, vamos definir um intervalo aproximado substituindo S 2 por seu estimador s 2, ic (1 α)100% (Y ) = y z 1 α/2 (1 f ) s2 n ; y + z 1 α/2 (1 f ) s2. n Pode-se chamar de margem de erro o valor D y = z 1 α/2 Para o total populacional, tem-se DŶ = Nz 1 α/2 (1 f ) S2 n. (1 f ) S2 n = ND y.

Exercício No caso de amostras pequenas aconselha-se substituir z 1 α/2 por t 1 α/2; n 1, que é o valor da ordenada da distribuição t-student, com n 1 graus de liberdade. Amostra pequena: alguns autores falam em n menor que 30, outros em n menor que 50. Uma AAS de 35 domicílios foi selecionada de uma população de 1.000 domicílios. O número de moradores em cada domicílio da amostra é: 3 1 4 6 6 6 1 3 6 1 2 1 1 1 2 1 2 3 4 3 3 3 6 3 3 2 6 5 6 2 6 1 5 5 6 1. Construa um intervalo de confiança (aproximado) de 95% para o número médio de moradores por domicílio na população. 2. Construa um intervalo de confiança (aproximado) de 95% para a população total.

Costuma-se, também, chamar a margem de erro de erro amostral. Neste caso, a palavra erro não tem o significado ruim como popularmente se entende. O erro amostral é inerente ao processo da amostragem e existe pelo simples fato de se observar apenas uma amostra da população. O erro amostral é controlável e depende da combinação do tamanho da amostra e da variância populacional da variável de interesse y.

Então, pode-se representrar o erro amostral por: E θ = θ θ. Não se pode calcular o erro amostral, pois o parâmetro θ é desconhecido. Pode-se, no entanto, estabelecer um limite superior para o erro amostral e calcular a probabilidade dessa ocorrência, ou seja: Pr(E θ < D θ) = 1 α. No caso da média temos que: Pr(E y < D y ) = Pr( y Y < D y ) = 1 α.

Então, se fixarmos a margem de erro ou erro amostral máximo admitido um nível de confiança, ou seja: z 1 α/2 ( 1 n N ) S 2 n = D y. Podemos calcular, utilizando o TCL, um valor para n de maneira que o erro amostral seja menor que a margem superior fixada, com probabilidade 1 α. O tamanho de uma AAS será, então, função do erro amostral máximo admitido e da homogeneidade da população em relação a variável de interesse y.

Tamanho da amostra na amostra aleatória simples (AAS) z 2 1 α/2s 2 n = D 2 + 1, y N z2 1 α/2 S2 ou n = n 0 1 1 + n = 0 1 N + 1 com n 0 = z2 1 α/2s 2. D 2 y n 0 N Note que para N grande temos n n 0. Pode-se fixar a variância do estimador, Var(y), ao invés do erro amostral. Neste caso, S 2 n = Var(y) + 1, N S2 ou n = n 0 1 + n 0 N 1 = 1 + 1 n 0 N com n 0 = S2 Var(y).

Outra maneira é trabalhar com o erro relativo: R y = y Y, Y Assim, o erro relativo máximo é dado por 1 ( R y = z 1 α/2 1 n ) S 2 Y N n tal que ou n = n 0 1 + n 0 N 1 = 1 + 1 n 0 N z 2 1 α/2s 2 n = R 2Y 2 + 1, y N z2 1 α/2 S2 com n 0 = z2 1 α/2[cv(y)] 2 R 2 y e CV(y) = S Y.

Exemplo Deseja-se estimar a média salarial dos operários de uma empresa que tem 5.000 operários. Sabe-se que a variância dos salários é da ordem de 2.226.000. Qual deve ser o tamanho da amostra de maneira que o erro amostral máximo seja de R$50,00 ao nível de significância de 5%? N = 5.000 S 2 = 2.226.000 D y = 50 z 0,975 = 1, 96 n 0 = (1, 96)2 2.226.000 = 3420, 561 50 2 3.420, 561 n = = 2031, 077. 1 + 3.420, 561/5.000 Então, devemos tomar uma amostra de n = 2032 salários de operários.