Distribuições de Estatísticas Amostrais e Teorema Cetral do Limite Vamos começar com um exemplo: A mega-sea de 996 a N 894 úmeros de a 6: Média: m 588 Desvio padrão: 756 49 amostras de 6 elemetos
Frequêcia relativa de cada úmero de a 6 a população 5 5 5 igualmete provável /6 6667 5 5 5 5 4 45 5 55 6 Distribuição das médias amostrais Bloco Freqüêcia 7 4474 56 6 848 7 7685 87 8 98459 9696 9 8 7 5 447 5 544444 78 658 6 76859 7 88556 66 9959 89 46 98 6667 8 874 7 4474 9 55778 77 685 6 77685 6 888889 5 496 496 4 45 4 477 9 444974 9 456 4 46748 478585 4 4897 5959 596 Mais Freqüêcia 9 8 7 6 5 4 Histograma Bloco Média amostral: x 588 Desvio padrão amostral : s 66574 Forma da distribuição de médias: ormal
Vamos lembrar: Parâmetro é uma medida umérica que descreve uma população Estatística é uma medida umérica que descreve uma amostra Iferêcia estatística: Obter coclusões sobre a população a partir de dados amostrais Estimação: A estimação é o processo que cosiste o uso de dados da amostra (dados amostrais) para estimar valores de parâmetros populacioais descohecidos, tais como média, desvio padrão, proporções etc Estimador: a quatidade calculada em fução dos elemetos da amostra, que será usada o processo de estimação do parâmetro desejado O estimador é, como vemos, uma estatística Será, portato, uma variável aleatória caracterizada por uma distribuição de probabilidade e seus respectivos parâmetros próprios Estimativa: cada valor particular assumido por um estimador ESTIMATIVA PONTUAL: é uma estimativa de um úico valor para um parâmetro populacioal Se o valor esperado de um estimador potual for igual ao parâmetro da população dizemos que o estimador potual é sem viés ( ão eviesado ou ão tedecioso)
Distribuições amostrais Por exemplo, com a média de uma amostra extraída de uma população será estimada a média dessa população Etretato, de uma mesma população pode-se tomar muitas amostras diferetes do mesmo tamaho Etão devemos estudar as distribuições de valores amostrais Uma distribuição amostrais é a distribuição de probabilidades dos resultados de todas as amostras possíveis de uma população Vamos cosiderar a distribuição amostral de médias Uma amostra aleatória simples (AAS) com reposição de tamaho de uma variável aleatória (população), com dada distribuição, é o cojuto de variáveis aleatórias idepedetes,,,, cada uma com a mesma distribuição de
Vamos ilustrar um caso simples como obter uma Distribuição Amostral de médias Assuma que existe uma população com: Tamaho N4 Variável aleatória: : a idade dos sujeitos em aos Valores de : 8,,, 4 A B C D Resumo das medidas para a distribuição da população: i μ N 8 4 4 P(x),,, (i μ) N,6 8 4 A B C D Distribuição Uiforme x
Cosidere todas as amostras aleatórias de tamaho e elemetos (x,x) obtidas de sorteios com reposição E vamos calcular a média da idade de cada amostra ª Obs ª Observação 8 4 8 8,8 8, 8, 8,4,8,,,4,8,,,4 4 4,8 4, 4, 4,4 6 amostras possíveis (amostragem com reposição) x x ( x,x) x 6 MédiasAmostrais ª ª Observação Obs 8 4 8 8 9 9 4 4 Vamos ecotrar a fução de probabilidade das médias, isto é, a fução de probabilidade dos valores da média das amostras Note que a média de cada amostra é uma variável aleatória P() 8 6 9 6 6 4 6 6 6 4 6 Média das μ Médias xip(x i) 8 i 6 amostrais ( μ 9 6 ) 4 6 Desvio-padrão das médias amostrais ( i 6 x μ P(x ) (8-) (9-) (4-),58 i i ) 6 6
Distribuição das médias das amostras 6 Médias Amostrais ª ª Observação Obs 8 4 8 8 9 9 P() 4 4 8 9 4 _,,, Distribuição das Médias Amostrais (ão uiforme) _ Comparado a Distribuição de Amostragem com a Distribuição da População P(),,, População N 4 μ,6 8 4 A B C D Distribuição das Médias Amostrais μ,58 _ P(),,, 8 9 4 _
Agora vamos cosiderar todas as amostras aleatórias de tamaho de elemetos (x,x,x ) obtidas de sorteios com reposição E vamos calcular a média da idade de cada amostra 8 8 8 8, 8, 8 8 8,67 8,667 8 8 9, 8,667 8 8 4, 4 8,667 8 8 8,67 5 9, 8 9, 6 9, 8, 7 9, 8 4,67 8 9, 8 8 9, 9 9, 8, 9, 8,67, 8 4,, 8 4 8,, 8 4,67 4, 8 4, 5, 8 4 4, 6, 8 8 8,67 7, 8 9, 8, 8, 9, 8 4,67, 8 9,,667,,667,67,667 4, 4,667 8, 5,667,67 6,667, 7,667 4, 8,667 4 8,67 9,667 4,,667 4,,667 4 4,67,667 8 8 9,, 8, 4, 8,67 5, 8 4, 6, 8, 7,,67 8,, 9, 4, 4, 8,67 4,, 4,, 4, 4,67 44, 4 8, 45, 4, 46, 4,67 47, 4 4, 48, 4 8 8, 49, 4 8,67 5, 4 8, 5, 4 8 4, 5, 4 8,67 5, 4, 54, 4, 55,667 4 4,67 56,667 4 8, 57,667 4, 58,667 4,67 59,667 4 4, 6,667 4 4 8, 6, 4 4,67 6, 4 4, 6, 4 4 4 4, 4, Fução de probabilidade da variável (++)/ P() 8, 8,66 9, 6,,66,,,66 6, 4, Média μ das Médias xi P(xi) 8 i amostrais ( 8,66 μ ) 4 Desvio- padrão das médias amostrais ( i ) x μ P(x ) (8- ) (8,66 - ) (4 - ), 9 i i
,,8,6,4,,,8,6,4, 4 5 6 7 8 9 Distribuição das Médias Amostrais para μ,9,,5,,5,,5,,5,,5,,5 4 A medida que aumeta a distribuição das médias vai tomado a forma de sio, com as média das distribuições amostrais iguais a média da população e o desvio padrão dimiuido O exemplo ilustra, uma situação particular, um resultado geral e muito importate em estatística: O Teorema Cetral do Limite 4 5 6 7,,5,,5,,5 4 5 6 7 8 9
Dado que : () A variável ou ão ser () Amostras da população Teorema Cetral do Limite (Amostragem com reposição ou população ifiita) aleatória ormal ) com uma com média μ desvio- padrão de mesmo tamaho são selecioadas aleatoriamete dos valores de distribuição de probabilidade ( que pode Etão : () A () A () O distribuição das médias amostrais x, se aproxima da distribuição ormal a medida que aumeta média das médias amostrais será igual a média da população : μ μ desvio- padrão das médias amostrais se aproximará de : O resultado realmete otável o TEOREMA DO LIMITE CENTRAL é que ele os diz que qualquer que seja a distribuição origial (com média e desviopadão defiidos) a distribuição das médias amostrais resultam uma distribuição ormal para tamahos de amsotra suficietemete grades Como regra prática, para amostras de tamaho >, a distribuição das médias pode ser rasoavelmete aproximada por uma distribuição ormal A aproximação fica melhor se fica maior Se a população origial é distribuida ormalmete, etão a distribuição da médias é ormal para qualquer tamaho de amostra é cohecido também por erro-padrão da média Assumese que a amostragem é com reposição ou sem reposição para uma população ifiita o erro-padrão da média dimiui à medida que o tamaho da amostra aumeta O teorema cetral do limite assume que a distribuição dos dados origiais tem variâcia fiita Existem distribuições em que essa codição ão é satisfeita e o teorema ão se aplica
Para calcularmos probabilidades utilizado a distribuição ormal utilizamos variáveis padroizadas Valor Z para a distribuição de médias amostrais : Z ( μ ) ( μ) ode: μ média da amostra média da população desvio padrão da população tamaho da amostra
Supoha uma população com média μ 8 e desvio padrão Supoha que teha sido selecioada uma amostra aleatória de tamaho 6 Qual é a probabilidade de que a média da amostra esteja etre 7,8 e 8,? Solução: Mesmo se a população ão for ormalmete distribuída, o Teorema do Limite Cetral pode ser utilizado ( > ) etão a distribuição de amostragem de aproximadamete ormal μ x com média m 8 x é e desvio padrão x,5 6
Mudado para variáveis padroizadas: P(7,8 8,) 7,8-8 -μ P 6 P(-,4 Z,4) 8, -8 6,8 Distribuição da População?????????????? Distribuição amostral Amostra Distribuição Normal Padroizada Padroizada 7,8 8, -,4,4 μ 8 μ 8 μ z x,554 +,554 Z Exemplo: A altura de uma população de homes é distribuida ormalmete com média 7 cm e desvio padrão de cm (a) Se selecioarmos um homem aleatóriamete qual a probabilidade de que sua altura seja maior que 65 cm? (b) Se selecioarmos 6 homes aleatoriamete, qual a probabilidade de que sua média seja maior que 65 cm?
(a) Note que já é cohecido as alturas tem distribuição ormal z 65 7 5 P ( 65) P(Z,5),8944,56,8944 65 m7 Z-,5 Z (b) Agora temos que cosiderar a distribuição das médias z 65 7-6 x 5 6 P ( 65) P(Z ),84,84,587 65 m 7 Z- Z
Amostragem sem reposição de uma população fiita Para amostras de tamaho, retiradas sem reposição de uma população fiita de tamaho N N N Fator de correção de população fiita A fórmula acima é ecessária a medida em que > 5 N Distribuição da proporção amostral ( p ) x proporção amostral: p x : úmero de elemetos a amostra Se a população tem proporção p, a distribuição de p para uma amostra aleatória de uma população grade é uma distribuição biomial com e para p com a caractgerística de iteresse : tamaho da amostra (úmero de lemetos) média : μ p(- p) desvio- padrão : p 5 e (- p) 5 a distribuição biomial pode ser aproximada pela distribuição ormal ( teorema cetral do limite) p p para populção fiita : N : tamaho da população p p(- p) N N
Valores Z para distribuição ormal de proporção amostral ( para p,5 e (-p),5) p p Z, p( p) o fator 5 para corrigir a situação devemos usar p : p : proporção amostral proporção populacioal : tamaho da amostra cotiuidade fica dividido por, ou seja, depededo da 5 5 p ou p em termos de x p Z x p, p( p) (úmero de sucessos em tetativas) temos : 5 5 este caso a correção de cotiuidade será : x ou x Exemplo: O presidete de uma distribuidora acredita que % das ecomedas feitas a firma são proveietes de clietes que compram pela primeira vez Supoha que o presidete esteja correto e que a proporção populacioal seja % Uma amostra aleatória simples de pedidos será usado para estimar a proporção de clietes que compram pela primeira vez (a) qual a distribuição amostral das proporções amostrais? (b) qual a probabilidade da proporção amostral ser estar o itervalo, p,4
Amostragem probabilística: quado todos os elemetos da população tiveram uma probabilidade cohecida e diferete de zero de pertecer à amostra Amostragem ão probabilística: quado ão se cohece a probabilidade de um elemeto da população pertecer à amostra Por exemplo, quado somos obrigados a colher a amostra a parte da população a que temos acesso A utilização de uma amostra probabilística é melhor para garatir a represetatividade da amostra, pois o acaso será o úico resposável por evetuais discrepâcias etre população e amostra Estas discrepâcias são levadas em cosideração as iferêcias estatísticas Quado trabalhamos com a amostragem ão probabilística, ão cohecemos a priori a probabilidade que um elemeto da população tem de pertecer à amostra Neste caso, ão é possível calcular o erro decorrete da geeralização dos resultados das aálises estatísticas da amostra para a população de ode a amostra foi retirada Utilizamos, geralmete, a amostragem ão probabilística por simplicidade ou por impossibilidade de se obter uma amostra probabilística, como seria desejável