ESTATÍSTICA BÁSICA Amostra Aleatória Tiago Viana Flor de Santana www.uel.br/pessoal/tiagodesantana/ tiagodesantana@uel.br sala 07 Curso: MATEMÁTICA Universidade Estadual de Londrina UEL Departamento de Estatística DSTA
Amostra Aleatória 1 Amostra aleatória 2 Estatística e parâmetros 3 Distribuições Amostrais Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 2 / 26
Amostra aleatória Passos para obtenção de uma amostra aleatória simples (AAS) 1 Utilizando um procedimento aleatório; 2 Sorteia-se um elemento da população; 3 Todos os elementos da população tem igual probabilidade de pertencer a amostra (independência); 4 Repete-se o procedimento até que sejam sorteadas as n unidades da amostra. Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 3 / 26
Amostra aleatória Exemplo 10.7 Em uma urna, há cinco tiras de papel, numeradas: 1, 3, 5, 5, 7. Para retirar uma amostra aleatória de tamanho 2 desta urna: 1 Sorteia-se uma tira observa-se sua numeração e recolocada na urna; 2 Então, sorteia-se uma segunda tira. As possíveis amostras de tamanho n = 2 são: (1, 1) (1, 3) (1, 5) (1, 7) (3, 1) (7, 7) Totalizando 25 possíveis amostras de tamanho 2. Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 4 / 26
Amostra aleatória Denotando por X o resultado de cada extração. A distribuição de X pode ser representada por: X = x 1 3 5 7 P(X = x) 1/5 1/5 2/5 1/5 Assim, a amostra aleatória de tamanho 2 pode ser representada de forma genérica pelo par ordenado (X 1, X 2 ) ou simplesmente X 1, X 2. Em que X 1 representa a primeira extração e X 2 a segunda extração. E tanto X 1 como X 2 com a mesma distribuição de X. Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 5 / 26
Amostra aleatória Definição Uma amostra aleatória simples (AAS) de tamanho n de uma variável aleatória X, com dada distribuição, é o conjunto de n variáveis aleatórias independentes X 1, X 2,..., X n, cada uma com a mesma distribuição de X. Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 6 / 26
Amostra aleatória 1 Quando a população é caracterizada por uma distribuição de probabilidade, o modo mais simples para sortear uma AAS é usar os procedimentos de simulação. 2 O processo de simular uma observação de uma distribuição especificada por seus parâmetros nada mais é do que retirar uma AAS de tamanho um da população; 3 Assim, para retirar uma AAS de n indivíduos da poupulação X, basta gerar n números aleatórios independentes dessa distribução. Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 7 / 26
Amostra aleatória Exemplo 10.8 Retira-se uma AAS de 5 alturas (em cm) de uma população de mulheres cujas alturas X seguem a distribuição Normal(167, 25). Pode-se obter essa amostra no R por meio da sequência de códigos: > set.seed(1) > round(rnorm(n=5,mean=167,sd=5),0) 164 168 163 175 169 Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 8 / 26
Amostra aleatória Algumas possíveis amostras Amostras X 1 X 2 X 3 X 4 X 5 Amostra1 164 168 163 175 169 Amostra2 170 166 159 168 174 Amostra3 163 171 171 172 164 Amostra4 166 164 169 167 166 Amostra5 168 182 172 164 162 Amostra6 159 171 164 174 174 Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 9 / 26
Amostra aleatória Definição Dada uma população X contínua, com fdp f X (x). A fdp conjunta da amostra (X 1, X 2,..., X n ) será expressa por f X1,X 2,...,X n (x 1, x 2,..., x n ) = f X1 (x 1 ) f X2 (x 2 )... f Xn (x n ) em que f i (x i ) denota a distribuição (marginal) de X i, i = 1,..., n. Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 10 / 26
Estatística e parâmetros Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 11 / 26
Estatística e parâmetros Após a obtenção da amostra (X 1, X 2,..., X n ), muitas vezes é de interesse estudar características específicas dessa amostra; Por exemplo: Se o interesse é estudar a média amostral, essa será obtida por meio da expressão X = 1 n {X 1 + X 2 +... + X n } X é uma variável aleatória pois é função de variáveis aleatórias. Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 12 / 26
Estatística e parâmetros Exemplo 10.8 Cont. Alturas (em cm) de uma população de mulheres cujas alturas X seguem a distribuição Normal(167, 25). Amostras X 1 X 2 X 3 X 4 X 5 X Amostra1 164 168 163 175 169 168,4 Amostra2 170 166 159 168 174 167,8 Amostra3 163 171 171 172 164 167,4 Amostra4 166 164 169 167 166 168,2 Amostra5 168 182 172 164 162 166,4 Amostra6 159 171 164 174 174 169,6 Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 13 / 26
Estatística e parâmetros Definição Uma estatística T é uma função de X 1, X 2,..., X n, ou seja, uma função da amostra. Exemplo X = 1/n S 2 = 1 n 1 T = g(x 1, X 2,..., X n ) n X i média amostral; i=1 n (X i X ) 2 variância amostral; i=1 X (1) = min{x 1, X 2,..., X n } o menor valor da amostra; X (n) = max{x 1, X 2,..., X n } o maior valor da amostra; Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 14 / 26
Estatística e parâmetros Definição Um parâmetro é uma medida usada para descrever uma característica da população. Exemplo Dada a população X, dois parâmetros de interesse podem ser µ = E(X ) σ 2 = Var(X ) Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 15 / 26
Distribuições Amostrais Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 16 / 26
Distribuições Amostrais O objetivo da inferência estatística é fazer uma afirmação a respeito dos parâmetros da população através da amostra. Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 17 / 26
Distribuições Amostrais 1 Seja θ um parâmetro da população X ; 2 E seja (X 1, X 2,..., X n ) uma amostra sorteada da população; 3 A afirmação sobre θ será baseada na estatística T, que é função da amostra, ou seja: T = g(x 1, X 2,..., X n ) ; 4 Após obtida a amostra, (x 1, x 2,..., x n ), obtém-se um valor particular de T, por exemplo: t 1 = g(x 1, x 2,..., x n ) ; 5 Se outras amostras fossem sorteadas outros valores para T seriam obtidos {t 1, t 2,..., t m } Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 18 / 26
Distribuições Amostrais Qual valor utilizar para estimar o parâmetro populacional θ? t 1 t 2 obtido da primeira amostra? obtido da segunda amostra?. t m obtido da m-ésima amostra? Faz-se necessário, portanto, estudar a distribuição amostral da estatística T. Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 19 / 26
Distribuições Amostrais Exemplo 10.9 Dada a população Descreva a distribuição da estatística X = x 1 3 5 7 P(X = x) 1/5 1/5 2/5 1/5 O espaço amostral é: X = X 1 + X 2 2. Ω = {(1, 1), (1, 2), (1, 3),..., (7, 7)}, com #Ω = 25 Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 20 / 26
Distribuições Amostrais Note que P( X = 1) = ( X1 + X 2 P 2 ) = 1 = P(X 1 + X 2 = 2) = P(X 1 = 1, X 2 = 1) = P(X 1 = 1)P(X 2 = 1 X 1 = 1) = 1/5 1/5 = 1/25. Logo a distribuição amostral da estatística X é dada por X = x 1 2 3 4 5 6 7 Total P( X = x) 1/25 2/25 5/25 6/25 6/25 4/25 1/25 1 Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 21 / 26
Distribuições Amostrais Distribuição de X 0.04 0.08 0.16 0.20 0.24 1 2 3 4 5 6 7 Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 22 / 26
Distribuições Amostrais Exemplo Qual seria a distribuição amostral da mediana das alturas de amostras de 5 mulheres retidas da população X Normal(167, 25)? Note que não é possível obter todas as amostras de tamanho 5 da população X (variável contínua). Portanto, deve-se simular uma quantidade grande de amostras e estudar sua distribuição. Simulando 200 amostras tem-se: E(Md) = 166, 9727 Var(Md) = 5, 6829 dp(md) = 2, 3838 Md 1 = 160, 1694 Md 200 = 172, 8020 Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 23 / 26
Distribuições Amostrais Pode-se obter as 200 amostras no R por meio da sequência de códigos: > amostras=matrix(data=0,nrow=200,ncol=5) > medianas.amostras=matrix(data=0,nrow=200,ncol=1) > set.seed(1) > for(i in 1:200){ + amostras[i,]=rnorm(n=5,mean=167,sd=5) + medianas.amostras[i,1]=median(amostras[i,]) + } > Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 24 / 26
Distribuições Amostrais Distribuição amostral da mediana, obtida de 200 amostras Densidade 0.00 0.05 0.10 0.15 0.20 População X ~ N(167, 25) 160.2 161.1 162.0 162.9 163.8 164.7 165.6 166.5 167.4 168.3 169.2 170.1 171.0 171.9 172.8 Medianas das amostras Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 25 / 26
Distribuições Amostrais Para o lar Exercícios 4, 5 e 6 da página 280. Santana,T.V.F. (UEL/DSTA) ESTATÍSTICA 26 / 26