Estatística II Aula Prof.: Patricia Maria Bortolon, D. Sc.
Distribuições Amostrais
... vocês lembram que: Antes de tudo... Estatística Parâmetro Amostra População E usamos estatíticas das amostras para estimar parâmetros da população
Finalidade da amostragem Obter uma indicação do valor de um ou mais parâmetros de uma população, tais como média, o desvio padrão populacional, ou a proporção de itens que possuem determinadas característica.
Variabilidade Amostral Mas você pode retirar várias amostras diferentes de uma mesma população!! Cada amostra pode te dar diferentes valores para a média, desvio-padrão ou proporção. Como saber então qual o valor do parâmetro na população? É preciso conhecer como a estatística varia de amostra para amostra...
Eemplo Vamos supor uma população finita com 5 elementos, que são os números 3, 5, 7, 9, 11. Neste caso, é fácil calcular os parâmetros média e desvio padrão da população: A média dessa população é 3 5 7 9 11 7 E seu desvio padrão é 5 3 7 5 7 7 7 5 9 7 11 7 8,83 Vamos supor que eu não pudesse calcular diretamente a média da população e tivesse que fazêlo através de estimativas com base em amostras de elementos...
Eemplo Quantas amostras diferentes seria possível montar? 5 5!!3! 543! 3! 10 Vamos listar as amostras e suas médias: Amostras 3 e 5 3 e 7 3 e 9 3 e 11 5 e 7 5 e 9 5 e 11 7 e 9 7 e 11 9 e 11 Médias 4 5 6 7 6 7 8 8 9 10 Cada amostra tem uma probabilidade de ser escolhida igual a 1/10.
Eemplo Posso calcular a probabilidade de encontrar cada um dos diferentes valores de média nas amostras, que será: Prob. 4 1/10 5 1/10 0,5 0,0 6 /10 7 /10 8 /10 9 1/10 10 1/10 0,15 Mas isso nada mais é 0,10 do que uma Distribuição Amostral!! 0,05 O que acabamos de construir foi uma distribuição de probabilidades da média da amostra 0,00 4 5 6 7 8 9 10
Distribuição Amostral Uma distribuição amostral é uma distribuição de probabilidades que indica até que ponto uma estatística amostral tende a variar devido a variações casuais na amostragem aleatória.
Voltando ao Eemplo No nosso eemplo qual a média das médias nas amostras? E qual o desvio-padrão dessas médias? 4 1 10 5 1 10 6 10 7 10 8 10 9 1 10 10 1 10 7 É igual a média da população 4 3 7 1 10 5 7 1 10 6 7 10 7 7 10 8 7 10 9 7 1 10 10 7 1 10 3 É menor que o desvio padrão da população Prob. 4 1/10 5 1/10 6 /10 7 /10 8 /10 9 1/10 10 1/10
Vamos ver outro eemplo, agora fazendo a amostragem com reposição...
Eemplo Suponha uma população (simplificada) de quatro pessoas de seu departamento. Tamanho da população N=4 Variável aleatória, X, é a idade dos indivíduos Valores de X: 18, 0,, 4 (anos)
Eemplo Parâmetros da distribuição da População: μ X N 18 i 0 4 4 1 P().3..1 σ (X i N μ).36 0 18 0 4 A B C D Distribuição Uniforme
Eemplo Agora, considere todas as amostras possíveis de tamanho n= 1o. Obs. o. Observação 18 0 4 18 18,18 18,0 18, 18,4 0 0,18 0,0 0, 0,4,18,0,,4 4 4,18 4,0 4, 4,4 16 amostras possíveis (amostragem com reposição) 1o. Obs. 16 médias amostrais o. Observação 18 0 4 18 18 19 0 1 0 19 0 1 0 1 3 4 1 3 4
Eemplo Distribuição Amostral de todas as médias amostrais 1 o. Obs 16 médias amostrais o. Observação 18 0 4 P(X).3 Distribuição das médias amostrais 18 18 19 0 1. 0 19 0 1.1 0 1 3 4 1 3 4 0 18 19 0 1 3 4 (não é mais uniforme) _ X
Eemplo Parâmetros da distribuição amostral da média μ X N X i 18 19 1 16 4 1 σ X (X i N μ X ) (18-1) (19-1) 16 (4-1) 1.58
Eemplo μ P(X).3..1 0 População N = 4 1 σ.36 18 0 4 A B C D Distribuição Amostral da Média n = μ _ X P(X).3..1 1 σ X 1.58 0 X 18 19 0 1 3 4 _ X
Por enquanto... pelo menos em nossos eemplos..., a média da distribuição amostral de, é igual a, a média da população;, o desvio padrão da distribuição amostral de, é menor do que, o desvio padrão populacional. Observem a notação!!!!
Mas... será que sempre podemos enumerar todas as amostras possíveis para então analisar a média amostral e quanto ela está próima da média da população? Não!! Alguns teoremas solucionam a questão... Teorema 1: Para amostras aleatórias de tamanho n etraídas de uma população com média e o desvio padrão, a distribuição amostral de tem média.
Erro Padrão Desvio padrão da estimativa Erro padrão: quanto menor, melhor! Erro padrão da média para populações infinitas e finitas: n ou n N N n 1 Você lembra? Fator de correção para populações finitas!! O que acontece se o erro padrão é pequeno? E se ele for grande? O que determina o tamanho do erro padrão?
Veja que interessante... No primeiro eemplo dessa aula tínhamos uma população com 5 elementos: 3, 5, 7, 9, 11 A média e o desvio padrão da população eram: 7 e Aí, listamos todas as amostras possíveis e calculamos a média e o desvio-padrão (erro padrão) das médias das amostras: 7 e Mas, se calcularmos o erro-padrão pela epressão do slide anterior, teremos: n N N n 1 8 As epressões nos dão o erro padrão sem que seja necessário listar todas as amostras possíveis, calcular suas médias e então obter o erro padrão da média das amostras!! 5 5 8 3 1 8 3 4 3
Efeito do tamanho da amostra sobre uma distribuição amostral À medida que aumenta o tamanho da amostra, há variabilidade cada vez menor entre as médias das amostras; A média da distribuição amostral é igual ao parâmetro da população, ou seja, é igual à média da população; Na medida em que o tamanho da amostra aumenta, a distribuição dos resultados amostrais tende para a forma da distribuição normal (ver apostila nas páginas 9 a 3).
Distribuição Amostral da Média Erro Padrão: População Normal Se a população é normal com média μ e desvio-padrão σ, a distribuição amostral da média é também distribuída normalmente com μ X μ e σ X σ n (Assume-se que a amostragem é feita com reposição ou sem reposição em uma população infinita)
Distribuição Amostral da Média Valor Z: População Normal Valor-Z para a distribuição amostral da média: Z (X σ μ X X ) (X μ) σ n onde: X μ σ = média da amostra = média da população = desvio padrão da população n = tamanho da amostra
Distribuição Amostral da Média Propriedades: População Normal μ μ (i.e. é não viesada ) População segue Distribuição Normal Distribuição Amostral da média segue Distribuição Normal (com a mesma média) μ μ
Distribuição Amostral da Média Propriedades: População Normal Para amostragem com reposição: À medida que n aumenta, σ diminui Maior tamanho de amostra Menor tamanho de amostra μ
Teorema do Limite Central Para grandes amostras, a distribuição amostral da média pode ser muito bem aproimada por uma distribuição normal, lembrando que para populações infinitas: e n Podemos então dizer formalmente que: Se é a média de uma amostra aleatória de tamanho n de uma população infinita com a média μ e o desvio padrão σ e se n é grande então z tem aproimadamente a distribuição normal padrão. / n
Teorema do Limite Central Se aplica a populações infinitas...... e a populações finitas em que n é grande mas representa uma porção pequena da população, ou seja, n/n é pequeno Em geral n=30 é considerado suficientemente grande Quando sabemos que a população tem distribuição normal, a distribuição amostral da média pode ser aproimada pela normal, independentemente do tamanho de n.
Teorema do Limite Central Estatística: Prof. André Carvalhal À medida em que o tamanho da amostra aumenta (n 30)... X
Teorema do Limite Central Estatística: Prof. André Carvalhal À medida em que o tamanho da amostra aumenta (n 30)... A distribuição amostral tornase praticamente normal. X
Teorema do Limite Central Estatística: Prof. André Carvalhal À medida em que o tamanho da amostra aumenta (n 30)... n A distribuição amostral tornase praticamente normal. X
Distribuição Amostral da Média Eemplo Suponha uma população com média μ = 8 e desviopadrão σ = 3. Suponha uma amostra aleatória de tamanho n = 36 é selecionada. Qual a probabilidade de que a média amostral esteja entre 7.75 e 8.5? Mesmo que a população não seja normalmente distribuída, o Teorema do Limite Central pode ser usado (n > 30). Então, a distribuição amostral da média é aproimadamente normal com μ 8 σ 0.5 σ n 3 36
Distribuição Amostral da Média Eemplo Primeiro, vamos calcular os valores-z para 7.75 e 8.5. Z Z 7.75-8 3 36 8.5-8 3 36 0.5 0.5 Agora, usando uma tabela de probabilidades da Distribuição Normal teremos: P(7.75 μ X 8.5) P(-0.5 Z 0.5) 0.3830
Distribuição Amostral da Média Eemplo Distribuição da População = (.5000-.3085) = (.1915) Amostra μ 8 X = 0.3830 Distribuição Amostral Distribuição Normal Padrão 7.75 8.5 μ X 8-0.5 0.5 μ z 0 Z
Distribuição Amostral da Proporção A proporção da população com determinada característica é denotada por π. A proporção da amostra ( p ) com esta característica dá uma estimativa de π: p X n número de itensna amostra coma característica de interesse tamanho da amostra 0 p 1 p segue uma Distribuição Binomial (Assume-se que a amostragem é feita com reposição ou sem reposição em uma população infinita)
Distribuição Amostral da Proporção Erro padrão para a proporção: σ p (1 ) n Valor-Z para a proporção: Z p σ p p (1 n )
Distribuição Amostral da Proporção Eemplo Se em um plebiscito a proporção de votantes à favor da Proposta A é π =.4, qual a probabilidade de que em uma amostra de 00 pessoas a proporção de votantes a favor esteja entre.40 and.45? Em outras palavras, se π =.4 e n = 00, qual a? P(.40 p.45)?
Distribuição Amostral da Proporção Eemplo σ p Encontre : σ p (1 n ).4(1.4) 00.03464 Converta para a Normal Padronizada: P(.40 p.45) P P(0.40.40.03464 Z Z 1.44).45.40.03464
Distribuição Amostral da Proporção Eemplo Use a tabela de probabilidade Normal acumulada: P(0 Z 1.44) = P(Z 1.44) 0.5 =.451 Distribuição Amostral Distribuição Normal Padronizada.451 Padronize.40.45 0 1.44 p Z