Bioestatística e Computação I Distribuição Amostral da Média Maria Virginia P Dutra Eloane G Ramos Vania Matos Fonseca Variável aleatória numérica parâmetros desconhecidos média desvio padrão estimativa dos parâmetros a partir de uma amostra inferência estatística Pós Graduação em Saúde da Mulher e da Criança IFF FIOCRUZ Baseado nas aulas de M. Pagano e Gravreau e Geraldo Marcelo da Cunha Distribuição de probabilidade de uma variável aleatória na população (e. altura ou peso) 000 i i= = 000 Na distribuição da população parâmetro estimador do parâmetro µ média da população σ desvio-padrão Deseja-se estimar a média desta variável para a população em questão. Retira-se uma amostra de 000 pessoas dessa população. Calcula-se a média a partir da amostra. Na amostra estimador - média da amostra ou média amostral estimador de máima verossimilhança SD desvio padrão da amostra
Se for selecionada uma nova amostra a média amostral será diferente da anterior. Eiste uma incerteza na estimação de um parâmetro populacional a partir de uma amostra. Incerteza da estimação depende de vários fatores Tamanho mínimo da amostra Garantia da precisão desejada Cálculo do tamanho da amostra Características desejáveis da amostra População homogênea. Se os indivíduos forem muito parecidos, qualquer amostra será representativa do grupo inteiro. Representatividade da amostra para a variável de interesse garantir que a amostra contenha indivíduos de toda a faia etária pretendida faias de renda, locais/condições de moradia, acesso aos serviços de saúde, condições gerais de saúde amostra estratificada Amostra aleatória Cada indivíduo da população deve ter igual probabilidade (>0) de ser selecionado. Viés de seleção Se algum dos critérios anteriores não for satisfeito. Viés de seleção Estimação não viesada Estimação viesada População População - 0 µ µ - 0 amostras amostras - - 0 3 - - 0 3
Eemplo: Deseja-se estimar a média de uma variável numérica para a população do Rio de Janeiro. Retira-se várias amostras de tamanho n. Amostra, média = Amostra, média = desvio SD Distribuiçãos dos valores medidos em cada amostra Amostra Amostra desvio SD População, média = µ desvio padrão = σ Amostra 3 Amostra 3, média = desvio SD3 3 Amostra, média = desvio SD N(µ,σ) - - 0-0 µ Média populacional µ = 3, Desviopadrão populacional σ 3 3 Amostra 3 0 3 0 3 Distribuição amostral Média Amostral.. 3 3. 3.0 3.0 3.0 3.0330 3. 3. 3.3 3.0. 3.030 3.300 3.3 3.030 3.0 3.03 3.3 3..003 3.0 3.0 3.0 3.3 3.3 Variável aleatória Amostra 3 0 3 0 3 3.. 3. 3.0 3.0 3.0 3.0330 3. 3. 3.3 3.0. 3.030 3.300 3.3 3.030 3.0 3.03 3.3 3..003 3.0 3.0 3.0 3.3 3.3 Distribuição da variável aleatória formada pelas médias amostrais calculadas a partir de várias amostras de tamanho n. Distribuição Amostral da Média Variabilidade SDM..0. 3.0 3..0..0
Distribuição amostral Não é prático selecionar várias amostras para estimar a média populacional. Entretanto, a distribuição amostral possui propriedades que permitem inferir sobre a média populacional a partir de uma única amostra de tamanho n, por meio do intervalo de confiança. Dado que é uma variável aleatória numérica A distribuição de probabilidade populacional da variável possui média µ e desvio σ Foram selecionadas várias amostras dessa população de tamanho n.a média da distribuição amostral,, é idêntica a média populacional µ..o desvio-padrão da distribuição amostral, n SD M, é igual a. SD M tem um nome especial: erro-padrão da média (EP). 3.Se n é suficientemente grande (>30), a distribuição amostral é aproimadamente normal, independente da distribuição populacional. Eemplo: Níveis séricos de colesterol. Suponha que a média na população é µ = mg/00ml e o desvio é σ = mg/00ml. Ao retirarmos várias amostras de tamanho n = 30, quantas amostras terão média maior ou igual a 30 mg/00m?
µ = σ = = = EP= n = 30 =, n = 30 P( 30) =? Distribuição amostral ( ) Distribuição na população () 00 00 300 00 Nível sérico de colesterol (mg/00ml) Transforma-se a variável em uma variável com distribuição normal padrão (Z) e consulta-se a tabela da distribuição (A.3). Z= EP = / n = / 30 =, Para =30 z= 30 =,, Pela tabela A.3: - -3 - - 0 3 z P( 30) = P(z,) = 0,0 =,% f(z) Eercícios E se tivéssemos selecionado amostras de tamanho n=00, quantas amostras teriam média maior ou igual a 30 mg/00m? Capítulo a, e 0 Z= EP = / n = / 00 =, Para =30 z= 30 =,3, Pela tabela A.3: P( 30) = P(z,3) < 0,00 (< 0,%)