ESTIMAÇÃO PARA A MÉDIAM
Objetivo Estimar a média µ de uma variável aleatória X, que represeta uma característica de iteresse de uma população, a partir de uma amostra.
Exemplos: µ : peso médio de homes a faixa etária de 0 a 30 aos, em uma certa localidade; µ : idade média dos habitates do sexo femiio a cidade de Satos, em 1990; µ : salário médio dos empregados da idústria metalúrgica em São Berardo do Campo, em 001; µ : taxa média de glicose em idivíduos do sexo femiio com idade superior a 60 aos, em determiada localidade; µ : comprimeto médio de jacarés adultos de uma certa raça.
Vamos observar elemetos, extraídos ao acaso e com reposição da população; Para cada elemeto selecioado, observamos o valor da variável X de iteresse. Obtemos, etão, uma amostra aleatória de tamaho de X, que represetamos por X 1, X,..., X.
Uma estimador potual para média amostral, X X 1 + X +... + X µ i 1 é dado pela X i. Uma estimador itervalar ou itervalo de cofiaça para tem a forma µ [ X - ε ; X + ε], sedo ε o erro amostral (margem de erro) calculado a partir da distribuição de probabilidade de. X
Distribuição amostral da médiam Exemplo 1: Cosidere uma população em que uma variável X assume um dos valores do cojuto {1, 3, 5, 5, 7}. A distribuição de probabilidade de X é dada por x 1 3 5 7 P(Xx) 1/5 1/5 /5 1/5 µ É fácil ver que x E(X) 4,, x Var(X) 4,16.
Vamos relacioar todas as amostras possíveis de tamaho, selecioadas ao acaso e com reposição dessa população, e ecotrar a distribuição da média amostral sedo X X 1 + X X 1 : valor selecioado a primeira extração; e X : valor selecioado a seguda extração.,
Amostra (X 1,X ) Probabilidade Média Amostral (1,1) 1/5 1 (1,3) 1/5 (1,5) /5 3 (1,7) 1/5 4 (3,1) 1/5 (3,3) 1/5 3 (3,5) /5 4 (3,7) 1/5 5 (5,1) /5 3 (5,3) /5 4 (5,5) 4/5 5 (5,7) /5 6 (7,1) 1/5 4 (7,3) 1/5 5 (7,5) /5 6 (7,7) 1/5 7 1
A distribuição de probabilidade de X para é x P( X x) 1 1/5 /5 3 5/5 4 6/5 5 6/5 6 4/5 7 1/5 Neste caso, E(X) 4, µ e Var(X),08 x x.
13/3 Repetido o mesmo procedimeto, para amostras de tamaho 3, temos a seguite distribuição de probabilidade de X, x P( X x) 1 1/15 5/3 3/15 7/3 9/15 3 16/15 11/3 4/15 13/3 7/15 5 3/15 17/3 15/15 19/3 6/15 7 1/15 Neste caso, E(X) 4, µ e Var(X) 1,39 x x 3.
Figura 1: Histogramas correspodetes às distribuições de X e de X, para amostras de {1,3,5,5,7}.
Dos histogramas, observamos que coforme aumeta, os valores de X tedem a se cocetrar cada vez mais em toro de E( ) 4, x, X µ uma vez que a variâcia vai dimiuido; os casos extremos passam a ter pequea probabilidade de ocorrêcia; para suficietemete grade, a forma do histograma aproxima-se de uma distribuição ormal.
Figura : Histogramas correspodetes às distribuições de X para amostras de algumas populações. 4ª 00, 73
Esses gráficos sugerem que, quado aumeta, idepedetemete da forma da distribuição de X, a distribuição de probabilidade da média amostral X aproxima-se de uma distribuição ormal.
Teorema do Limite Cetral Seja X uma v. a. que tem média e variâcia. Para uma amostra X 1, X,..., X, retirada ao acaso e com reposição de X, a distribuição de probabilidade da média amostral X aproxima-se, para grade, de uma distribuição ormal, com média µ e variâcia /, ou seja, µ X ~ N µ,,para grade, aproximadamete.
Cometários: Se a distribuição de X é ormal, etão X tem distribuição ormal exata, para todo. O desvio padrão, que é o desvio padrão da média amostral, também é deomiado erro padrão.
Itervalo de Cofiaça Como vimos, o estimador por itervalo para a média µ tem a forma [ ] X - ε ; X + ε Perguta: Como determiar ε?
Seja P(ε) γ, a probabilidade da média amostral estar a uma distâcia de, o máximo ε, da média populacioal µ (descohecida), ou seja, X γ P ( ) X-µ ε P( µ ε X µ+ε ) P ε X-µ ε ε P Z ε, sedo Z ~ N(0,1).
ε Deotado z, temos que γ P (-z Z z). Assim, cohecedo-se o coeficiete de cofiaça γ obtemos z.
Da o erro sedo Erro a estimativa itervalar igualdade z amostral z tal que ε ε γ ε é z, segue dado por P (-z, Z z), que com Z ~ N(0,1). O itervalo de cofiaça para a médiam, com coeficiete de cofiaça γ fica, etão, dado por sedo o X - z desvio ; padrão X + de z X., µ
Exemplo : Não se cohece o cosumo médio de combustível de automóveis da marca T. Sabe-se, o etato, que o desvio padrão do cosumo de combustível de automóveis dessa marca é 10 km/l. Na aálise de 100 automóveis da marca T, obteve-se cosumo médio de combustível de 8 km/l. Ecotre um itervalo de cofiaça para o cosumo médio de combustível dessa marca de carro. Adote um coeficiete de cofiaça igual a 95%. X: cosumo de combustível de automóveis da marca T 10 km/l 100 x (média amostral) 8 km/l γ 0,95 z 1,96
Pelo Teorema do Limite Cetral, o itervalo de cofiaça de 95% é dado, aproximadamete, por X 8 - - z 1,96 [ 8-1,96 ; 8 + 1,96 ] [ 6,04 ; 9,96 ] ; Observe que o erro amostral ε é 1,96 km/l. X 10 100 + ; z 8 + 1,96 10 100
Exemplo 3: Deseja-se estimar o tempo médio de estudo (em aos) da população adulta de um muicípio. Sabe-se que o tempo de estudo tem distribuição ormal com desvio padrão,6 aos. Foram etrevistados 5 idivíduos, obtedo-se para essa amostra, um tempo médio de estudo igual a 10,5 aos. Obter um itervalo de 90% de cofiaça para o tempo médio de estudo populacioal. X : tempo de estudo, em aos e X ~ N( µ ;,6 ) 5 x 10,5 aos γ 0,90 z 1,65
A estimativa itervalar com 90% de cofiaça é dada por (em aos): x - 10,5 z - ; 1,65 x +,5 5 z ; 10,5 + 1,65,5 5 [ ] 10,5-0,86 ; 10,5 + 0,86 [ ]. 9,64 ; 11,36
Dimesioameto da amostra A partir da relação ε z, o tamaho da amostra é determiado por z ε cohecedo-se o desvio padrão de X, o erro ε da estimativa e o coeficiete de cofiaça γ do itervalo, sedo z tal que γ P (-z Z z) e Z ~ N(0,1).,
Exemplo 4: A reda per-capita domiciliar uma certa região tem distribuição ormal com desvio padrão 50 reais e média µ descohecida. Se desejamos estimar a reda média µ com erro ε 50 reais e com uma cofiaça γ 95%, quatos domicílios devemos cosultar? X : reda per-capita domiciliar a região X ~ N( ; 50 ) µ?? tal que ε 50 reais, γ 0,95 z 1,96
Etão, z ε 1,96 ( 50) 50 96,04 Aproximadamete 97 domicílios devem ser cosultados.
Exemplo 5: A quatidade de colesterol X o sague das aluas de uma uiversidade segue uma distribuição de probabilidades com desvio padrão 50 mg/dl e média µ descohecida. Se desejamos estimar a quatidade média µ de colesterol com erro ε 0 mg/dl e cofiaça de 90%, quatas aluas devem realizar o exame de sague? X: quatidade de colesterol o sague das aluas da uiversidade 50 mg/dl?? tal que ε 0 mg/dl γ 0,90 z 1,65
Supodo que o tamaho da amostra a ser selecioada é suficietemete grade, pelo Teorema do Limite Cetral temos: z ε 1,65 ( 50) 0 06,5 Assim, aproximadamete 07 aluas devem realizar o exame de sague.
Na prática, a variâcia populacioal é descohecida e é substituída por sua estimativa, S 1-1 i 1 ( ) - X. X i A estimativa amostral do desvio padrão é s s.
Temos duas opções ao padroizar a variável X Se, o desvio padrão populacioal, for cohecido, usamos Z X µ X µ Se for descohecido, usamos seu estimador, o desvio padrão amostral S, e cosideramos a seguite variável padroizada T X S µ X S µ
Se a variável a população tem distribuição ormal, etão Z tem distribuição N(0,1) e T tem distribuição t de Studet com -1 graus de liberdade. Se o tamaho da amostra é grade, etão Z e T têm distribuição aproximadamete N(0,1).
-4-0 4 T 1 T 5 T 30 Z 0.0 0.1 0. 0.3 0.4
Assim, uma estimativa itervalar aproximada para a média populacioal µ, quado o tamaho da amostra é grade e é descohecido, é x - z s, x + z s, sedo s o desvio padrão amostral e z tal que γ P (-z Z z) com Z ~ N(0,1).
Exemplo 6: Para estimar a reda semaal média de garços de restaurates em uma grade cidade, é colhida uma amostra da reda semaal de 75 garços. A média e o desvio padrão amostrais ecotrados são R$ 7 e R$ 15 respectivamete. Determie um itervalo de cofiaça, com coeficiete de cofiaça de 90%, para a reda média semaal. X: reda semaal de garços da cidade 75 x 7 e s 15 γ 0,9 z 1,65
O itervalo de 90% de cofiaça é aproximadamete, por (em reais). x - 7 z - s 1,65, x 15 75 s + z ; 7 [ -,86 ; 7 +,86 ] [ 4,14 ; 9,86 ] + 1,65 7 15 75 dado,