Distribuições Amostrais 1
Da população, com parâmetro, retira-se k amostras de tamanho n e calcula-se a estatística. Estas estatísticas são as estimativas de. As estatísticas, sendo variáveis aleatórias, terão alguma distribuição de probabilidade, com uma média, uma variância, etc. A distribuição de probabilidade de uma estatística chama-se distribuição amostral da estatística ou distribuição por amostragem da estatística.
Se, por exemplo, a grandeza estatística particular adotada for a média, então a distribuição será denominada distribuição amostral das médias ou distribuição amostral da média. De forma similar, podemos ter distribuições amostrais de desvio padrão, da variância, da mediana, das proporções, etc. A inferência estatística se baseia em tais distribuições, assumindo, portanto, papel fundamental na análise estatística. 3
AMOSTRAS POPULAÇÃO 1 x 1 1 : média. amostra11 s : desvio padrão1 : média : desviopadrão 3 x s x s : média.amostra : desvio padrão. 3 3 : média.amostra3 : desvio padrão.3 4
Generalizando: População Amostras ˆ 1 ˆ ˆ 3...... ˆ n Distribuição Amostral 5
Observação: Usamos para a média populacional, para a média amostral. Da mesma forma designa a variância populacional (e o desvio padrão), a variância amostral ( e s o desvio padrão). s x Exemplo 1: Para ilustrar o conceito de distribuição amostral vamos construir a da média de uma amostra aleatória de tamanho n= extraída, sem reposição, de uma população de tamanho N=5, cujos os elementos são os números 3,5,7,9, e 11. (quadro) 6
Resumindo o processo: a) População com um parâmetro. b) Retira-se k amostras por um processo aleatório qualquer c) Calcula-se o valor para cada amostra (i = 1,,..., k). d) Com os valores de das k amostras constrói-se a distribuição amostral de. ˆi ˆi 7
Distribuição amostral da média (distribuição de ) Z (normal) ou t (t-student). Distribuição amostral da variância qui-quadrado ( ). Distribuição amostral de duas variâncias F (Fisher e Snedecor). Distribuição amostral da proporção Z (normal) 8
Distribuição Z (Normal) Se a variável possui distribuição normal, então distribuição normal. terá Portanto, se ~ N, ~ N, n isto é: a distribuição da variável por amostragem casual simples será sempre normal com a mesma média da população e variância n vezes menor. Isso significa que, quanto maior o tamanho da amostra, menor será a variância 9
o Se a população não é normal, qual a distribuição amostral de? o Se a população com parâmetros e não é normal, a variável não será exatamente normal, mas sim aproximadamente normal, isto é n Z N(0,1) onde n distribuição padronizada n fato que resulta do Teorema do Limite Central: 10
Teorema do Limite Central A distribuição das médias amostrais, obtidas de amostras de tamanho n, selecionadas ao acaso de uma população de tamanho N, com média e variância será aproximadamente normal com média e variância se a amostragem for realizada com reposição, ou x x n N n N 1 se a amostragem for realizada sem reposição em uma n população finita ( N > 0,05 ), independentemente da distribuição da variável em questão. x n 11
o Em notação tem-se: ~ N ; o n ~ N ; n N N n 1 Pop. infinita Pop. finita o A aproximação normal se torna progressivamente melhor com o aumento do tamanho da amostra. o No geral, considera-se que para n 30 a aproximação normal da distribuição amostral das médias é adequada, qualquer que seja a distribuição populacional da variável aleatória. o Se a população da variável possui distribuição normal, então qualquer que seja o tamanho da amostra para se calcular a média, esta terá distribuição também normal. 1
13
Exercício 1: Seja ~ N(80; 6). Dessa população retiramos uma amostra de tamanho 5, isto é, n=5. Calcular P( 83) e P( 8). 14
Distribuição t de Student (n<30) Sabe-se que e sua distribuição padronizada é dada por: ~ N( ; ) n Z n Em muitas situações não se conhece ou, mas sim sua estimativa s ou s 15
Precisamos substituir por seu estimador s, portanto, alteramos a estatística Z para a estatística t s n a qual segue uma distribuição t de Student com (n-1) graus de liberdade. Nestas situações a distribuição deixa de ser normal padronizada. 16
Características da distribuição t-student É simétrica em relação a média (semelhante a distribuição de Z), com média 0; Tem forma campanular (semelhante à normal); Quando n tende para infinito, a distribuição t- Student tende para a distribuição normal. Na prática, a aproximação é considerada boa quando n >30. Possui v=n-1 graus de liberdade. 17
CONDIÇÕES PARA UTILIZAR A DISTRIBUIÇÃO T STUDENT O tamanho da amostra é pequeno (n<30) é desconhecido A Tabela t A tabela t - Student fornece as probabilidades do valor t ser maior que um valor específico. Depende do número de graus de liberdade v = gl= n-1 18
0,14 0,1 0,1 0,08 0,06 0,04 0,0 0 0 5 10 15 0-0 t + Pt ( 10,764)? P(t g > t ) Pt ( 10, 764) 0, 01 g 0,1 0,05 0,05 0,01 0,005 1 3,078 6,314 1,706 31,81 63,656 1,886,90 4,303 6,965 9,95 3 1,638,353 3,18 4,541 5,841 4 1,533,13,776 3,747 4,604 5 1,476,015,571 3,365 4,03 6 1,440 1,943,447 3,143 3,707 7 1,415 1,895,365,998 3,499 8 1,397 1,860,306,896 3,355 9 1,383 1,833,6,81 3,50 10 1,37 1,81,8,764 3,169 11 1,363 1,796,01,718 3,106 1 1,356 1,78,179,681 3,055 13 1,350 1,771,160,650 3,01 14 1,345 1,761,145,64,977 15 1,341 1,753,131,60,947 16 1,337 1,746,10,583,91 17 1,333 1,740,110,567,898 18 1,330 1,734,101,55,878 19 1,38 1,79,093,539,861 0 1,35 1,75,086,58,845 1 1,33 1,71,080,518,831 1,31 1,717,074,508,819 3 1,319 1,714,069,500,807 4 1,318 1,711,064,49,797 5 1,316 1,708,060,485,787 6 1,315 1,706,056,479,779 7 1,314 1,703,05,473,771 8 1,313 1,701,048,467,763 9 1,311 1,699,045,46,756 30 1,310 1,697,04,457,750 40 1,303 1,684,01,43,704 50 1,99 1,676,009,403,678 60 1,96 1,671,000,390,660 10 1,89 1,658 1,980,358,617 1,8 1,645 1,960,36,576 19
Exercício : Obter os seguintes valores da distribuição t - Student: a) P (-,160 < t < a) = 0,95 com 13 g.l. b) P (a < t < 1,708) = 0,90 com 5 g.l. c) P (t > a) = 0,05 com 0 g.l. d) P (t < a) = 0,10 com 9 g.l. e) P( -,01 < t<,01) =K com 40 g. l. f) P(t <,01) = K com 11 g.l. g) P(t > -,13) = K com 4 g. l. h) P(t >,81) = K com 9 g. l. 0
Distribuição de qui-quadrado ( ) Retira-se uma amostra de n elementos de uma população normal com média e variância teremos que s n i 1 x n i x 1 segue uma distribuição de com n-1 graus liberdade. A transformação de s em é obtida por ( n 1) s que tem distribuição com n-1 graus de liberdade. 1
Os valores de não podem ser negativos Não é simétrica em = 0 Quanto maior o tamanho de n, a distribuição tende a normal. Como a curva não é simétrica, então olha-se na tabela dois valores de, quando queremos saber se um valor está entre limites. A tabela fornece as probabilidades do valor ser maior que um valor específico
0 + t P P( 10 3, 5)? ( g t ) P( 10 3, 5) 0,975 g 0,005 0,010 0,05 0,050 0,100 0,900 0,950 0,975 0,990 0,995 1 7,88 6,63 5,0 3,84,71 0,016 0,0039 0,0010 0,00016 0,00004 10,60 9,1 7,38 5,99 4,61 0,1 0,10 0,051 0,00 0,010 3 1,84 11,34 9,35 7,81 6,5 0,58 0,35 0, 0,11 0,07 4 14,86 13,8 11,14 9,49 7,78 1,06 0,71 0,48 0,30 0,1 5 16,75 15,09 1,83 11,07 9,4 1,61 1,15 0,83 0,55 0,41 6 18,55 16,81 14,45 1,59 10,64,0 1,64 1,4 0,87 0,68 7 0,8 18,48 16,01 14,07 1,0,83,17 1,69 1,4 0,99 8 1,95 0,09 17,53 15,51 13,36 3,49,73,18 1,65 1,34 9 3,59 1,67 19,0 16,9 14,68 4,17 3,33,70,09 1,73 10 5,19 3,1 0,48 18,31 15,99 4,87 3,94 3,5,56,16 11 6,76 4,7 1,9 19,68 17,8 5,58 4,57 3,8 3,05,60 1 8,30 6, 3,34 1,03 18,55 6,30 5,3 4,40 3,57 3,07 13 9,8 7,69 4,74,36 19,81 7,04 5,89 5,01 4,11 3,57 14 31,3 9,14 6,1 3,68 1,06 7,79 6,57 5,63 4,66 4,07 15 3,80 30,58 7,49 5,00,31 8,55 7,6 6,6 5,3 4,60 16 34,7 3,00 8,85 6,30 3,54 9,31 7,96 6,91 5,81 5,14 17 35,7 33,41 30,19 7,59 4,77 10,09 8,67 7,56 6,41 5,70 18 37,16 34,81 31,53 8,87 5,99 10,86 9,39 8,3 7,01 6,6 19 38,58 36,19 3,85 30,14 7,0 11,65 10,1 8,91 7,63 6,84 0 40,00 37,57 34,17 31,41 8,41 1,44 10,85 9,59 8,6 7,43 1 41,40 38,93 35,48 3,67 9,6 13,4 11,59 10,8 8,90 8,03 4,80 40,9 36,78 33,9 30,81 14,04 1,34 10,98 9,54 8,64 3 44,18 41,64 38,08 35,17 3,01 14,85 13,09 11,69 10,0 9,6 4 45,56 4,98 39,36 36,4 33,0 15,66 13,85 1,40 10,86 9,89 5 46,93 44,31 40,65 37,65 34,38 16,47 14,61 13,1 11,5 10,5 6 48,9 45,64 41,9 38,89 35,56 17,9 15,38 13,84 1,0 11,16 7 49,64 46,96 43,19 40,11 36,74 18,11 16,15 14,57 1,88 11,81 8 50,99 48,8 44,46 41,34 37,9 18,94 16,93 15,31 13,56 1,46 9 5,34 49,59 45,7 4,56 39,09 19,77 17,71 16,05 14,6 13,1 30 53,67 50,89 46,98 43,77 40,6 0,60 18,49 16,79 14,95 13,79 40 66,77 63,69 59,34 55,76 51,81 9,05 6,51 4,43,16 0,71 50 79,49 76,15 71,4 67,50 63,17 37,69 34,76 3,36 9,71 7,99 60 91,95 88,38 83,30 79,08 74,40 46,46 43,19 40,48 37,48 35,53 70 104,1 100,43 95,0 90,53 85,53 55,33 51,74 48,76 45,44 43,8 80 116,3 11,33 106,63 101,88 96,58 64,8 60,39 57,15 53,54 51,17 90 18,30 14,1 118,14 113,15 107,57 73,9 69,13 65,65 61,75 59,0 100 140,17 135,81 19,56 14,34 118,50 8,36 77,93 74, 70,06 67,33 3
0 + t P P( 10 3,5)? ( g t ) P( 10 3, 5) 0,975 P( 15?) 0,9 P( 15 8,55) 0,9 g 0,005 0,010 0,05 0,050 0,100 0,900 0,950 0,975 0,990 0,995 1 7,88 6,63 5,0 3,84,71 0,016 0,0039 0,0010 0,00016 0,00004 10,60 9,1 7,38 5,99 4,61 0,1 0,10 0,051 0,00 0,010 3 1,84 11,34 9,35 7,81 6,5 0,58 0,35 0, 0,11 0,07 4 14,86 13,8 11,14 9,49 7,78 1,06 0,71 0,48 0,30 0,1 5 16,75 15,09 1,83 11,07 9,4 1,61 1,15 0,83 0,55 0,41 6 18,55 16,81 14,45 1,59 10,64,0 1,64 1,4 0,87 0,68 7 0,8 18,48 16,01 14,07 1,0,83,17 1,69 1,4 0,99 8 1,95 0,09 17,53 15,51 13,36 3,49,73,18 1,65 1,34 9 3,59 1,67 19,0 16,9 14,68 4,17 3,33,70,09 1,73 10 5,19 3,1 0,48 18,31 15,99 4,87 3,94 3,5,56,16 11 6,76 4,7 1,9 19,68 17,8 5,58 4,57 3,8 3,05,60 1 8,30 6, 3,34 1,03 18,55 6,30 5,3 4,40 3,57 3,07 13 9,8 7,69 4,74,36 19,81 7,04 5,89 5,01 4,11 3,57 14 31,3 9,14 6,1 3,68 1,06 7,79 6,57 5,63 4,66 4,07 15 3,80 30,58 7,49 5,00,31 8,55 7,6 6,6 5,3 4,60 16 34,7 3,00 8,85 6,30 3,54 9,31 7,96 6,91 5,81 5,14 17 35,7 33,41 30,19 7,59 4,77 10,09 8,67 7,56 6,41 5,70 18 37,16 34,81 31,53 8,87 5,99 10,86 9,39 8,3 7,01 6,6 19 38,58 36,19 3,85 30,14 7,0 11,65 10,1 8,91 7,63 6,84 0 40,00 37,57 34,17 31,41 8,41 1,44 10,85 9,59 8,6 7,43 1 41,40 38,93 35,48 3,67 9,6 13,4 11,59 10,8 8,90 8,03 4,80 40,9 36,78 33,9 30,81 14,04 1,34 10,98 9,54 8,64 3 44,18 41,64 38,08 35,17 3,01 14,85 13,09 11,69 10,0 9,6 4 45,56 4,98 39,36 36,4 33,0 15,66 13,85 1,40 10,86 9,89 5 46,93 44,31 40,65 37,65 34,38 16,47 14,61 13,1 11,5 10,5 6 48,9 45,64 41,9 38,89 35,56 17,9 15,38 13,84 1,0 11,16 7 49,64 46,96 43,19 40,11 36,74 18,11 16,15 14,57 1,88 11,81 8 50,99 48,8 44,46 41,34 37,9 18,94 16,93 15,31 13,56 1,46 9 5,34 49,59 45,7 4,56 39,09 19,77 17,71 16,05 14,6 13,1 30 53,67 50,89 46,98 43,77 40,6 0,60 18,49 16,79 14,95 13,79 40 66,77 63,69 59,34 55,76 51,81 9,05 6,51 4,43,16 0,71 50 79,49 76,15 71,4 67,50 63,17 37,69 34,76 3,36 9,71 7,99 60 91,95 88,38 83,30 79,08 74,40 46,46 43,19 40,48 37,48 35,53 70 104,1 100,43 95,0 90,53 85,53 55,33 51,74 48,76 45,44 43,8 80 116,3 11,33 106,63 101,88 96,58 64,8 60,39 57,15 53,54 51,17 90 18,30 14,1 118,14 113,15 107,57 73,9 69,13 65,65 61,75 59,0 100 140,17 135,81 19,56 14,34 118,50 8,36 77,93 74, 70,06 67,33 4
Exercício 3: Obter os seguintes valores da distribuição de : a) P ( > a) = 0,05 com 1 g.l. b) P ( < a) = 0,05 com 1 g.l. c) P( > a) = 0,95 com 15 g. l. d) P( > a) = 0,10 com 11 g. l. e) P (7,6 < < a) = 0,90 com 15 g.l. f) P (a < < 34,17) = 0,95 com 0 g.l. g) P (19,768 < < 45,7) = k com 9 g.l. h) P( >9,488) = K com 4 g.l. i) P( < 30,191) = K com 17 g.l. j) P( > 8,343) = K com 9 g k) P( < 5,009) = K com 13 g.l. 5
Considerando uma população infinita, em que p é a probabilidade (ou proporção) de certo evento. p Seja a probabilidade (ou proporção) na amostra de tamanho n. A distribuição amostral de p será: ~ ; ; p N p pq n q 1 p Caso a amostragem seja realizada sem reposição e a população seja finita : p ~ N p; pq N n ; n N 1 q 1 p 6
7
Exercício 4: Uma v.a. tem distribuição normal com média 100 e desvio padrão 10. a) Calcule P(90 << 110) b) Se é a média de uma amostra aleatória simples de 16 elementos retirados dessa população, calcule P(90 110) 8
Exercício 5: A temperatura média em uma certa região tem sido de 6 C em certo mês do ano. Se o desvio padrão de uma amostra aleatória de 16 dias for igual a 5 C., qual a probabilidade da média da amostra; a) Ser maior do que 3,336 C? b) Estar entre,316 C e 9,684 C? 9
Exercício 6: Acredita-se que 30% das encomendas feitas a uma firma são provenientes de clientes que compram pela primeira vez. Uma amostra aleatória de 100 pedidos será usada para estimar a proporção de clientes que compram pela primeira vez. Qual a probabilidade da proporção amostral estar entre 0, e 0,4? 30
31
Distribuição Amostral de Duas variâncias. Distribuição F A distribuição da razão entre duas variâncias de Distribuição F de Fisher & Snedecor. s / s 1 é chamada Para se transformar a razão entre duas variâncias amostrais, na estatística F, utiliza-se da seguinte expressão:. s v 1 F 1 = n 1-1 1. s v = n - 1 A curva de F é não simétrica, tem origem no zero e apresenta uma tabela específica para cada valor de probabilidade solicitada ( ). As tabelas mais usadas são: = 0,10; = 0,05; = 0,05; = 0,01 e = 0,005. 3
,5% 0 + F P( F F ) 0,05 g, g 1 PF ( 15,0?) 0,05 PF ( 15,0,57) 0,05 g 33
,5% 0 + F P( F F ) 0,05 g, g 1 PF ( 5,5?) 0,05 PF ( 5,5?) 0,05 g 34
,5% 0 + F P( F F ) 0,05 g, g 1 PF ( 5,5?) 0,05 PF ( 5,5?) 0,05 g PF ( 5,5 3,13) 0,05 1 PF ( 5,5 ) 0,05 3,13 PF ( 5,5 0,319) 0,05 35
Exercício 7: Obter os seguintes valores da distribuição F de Snedecor: a) P(F > a) = 0,10 com v1 = 5 e v = 5 g.l. b) P(F < a) = 0,90 com n1 = 6 e n = 6 g.l. c) P(F > a) = 0,05 com v1 = 13 e v = 9 g.l. d) P(F > 1,84) = k com v1 = 0 e v = 40 g.l. e) P(F > 1,96) = k com v1 = 40 e v = 1 g.l. f) P(F< 6,37) = k com v1 = 6 e v = 8 g. l. 36
Supor duas populações infinitas 1 e, com proporções p 1 e p. Destas populações retiram-se amostras n 1 e n, então: p q p q p p N p p sendo q p 1 1 ˆ ˆ 1 ~ 1 ; ; 1 n1 n Se a amostragem for realizada sem reposição, e a população N n for finita, usar o fator de correção multiplicando na N 1 variância da população em questão. 37