Estimar uma proporção p (desconhecida) de elementos em uma população, apresentando certa característica de interesse, a partir da informação

ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL p 1

Objetivo Estimar uma proporção p (descohecida) de elemetos em uma população, apresetado certa característica de iteresse, a partir da iformação forecida por uma amostra. 2

Exemplos: p: proporção de aluos da USP que foram ao teatro pelo meos uma vez o último mês; p: proporção de cosumidores satisfeitos com os serviços prestados por uma empresa telefôica; p: proporção de eleitores da cidade de São Paulo que votariam em um determiado cadidato, caso a eleição para presidete se realizasse hoje; p: proporção de criaças de 2 a 6 aos, do estado de São Paulo, que ão estão matriculadas em escola de educação ifatil. 3

Dois possíveis procedimetos de estimação: Estimação potual Estimação itervalar - Vamos observar elemetos, extraídos ao acaso e com reposição de uma população grade; - Para cada elemeto selecioado, verificamos a preseça (sucesso) ou ão (fracasso) da característica de iteresse. 4

sedo que, Estimador potual O estimador potual para p, também deomiado proporção amostral, é defiido como X p ˆ, X deota o úmero de elemetos a amostra que apresetam a característica; deota o tamaho da amostra coletada. Se observamos o valor k da v. a. X, obtemos que deomiamos estimativa potual para p. p ˆ k 5 /

Exemplo 1: Sejam, p: proporção de aluos da USP que foram ao teatro pelo meos uma vez o último mês, e X: úmero de estudates que respodem sim em uma pesquisa com etrevistados. Supoha que foram etrevistados 500 estudates e que, desses, k 100 teriam afirmado que foram ao teatro pelo meos uma vez o último mês. 6

A estimativa potual (proporção amostral) para p é dada por: k 100 pˆ 0,20 500 ou seja, 20% dos estudates etrevistados afirmaram que foram ao teatro pelo meos uma vez o último mês., Note que, outra amostra de mesmo tamaho pode levar a uma outra estimativa potual para p. 7

Estimativa itervalar ou itervalo de cofiaça Para uma amostra observada, os estimadores potuais forecem como estimativa um úico valor umérico para o parâmetro. Os estimadores potuais são variáveis aleatórias e, portato, possuem uma distribuição de probabilidade, em geral, deomiada distribuição amostral. Idéia: costruir itervalos de cofiaça, que icorporem à estimativa potual iformações a respeito de sua variabilidade (erro amostral). Itervalos de cofiaça são obtidos por meio da distribuição amostral do estimador potual. 8

A estimativa itervalar correspode a um itervalo determiado da seguite maeira: [ p ˆ ε; pˆ + ε], sedo ε o erro amostral ou margem de erro. Perguta: Como ecotrar ε? 9

Seja P(ε) a probabilidade da estimativa potual estar a uma distâcia de, o máximo, ε da proporção verdadeira p, ou seja, P ( ε ) P( pˆ p ε ). A probabilidade P(ε) é também deomiada coeficiete de cofiaça do itervalo, que deotamos pela letra grega γ (gama). Afirma-se aida que a estimativa itervalar tem coeficiete de cofiaça γ P(ε). 10

11 ) ) (1 ) (1 ) (1 ( ) ( ) ( ) ( ) ˆ ( ) ( p p p p p X p p P p X p P p X p P p X P p p P P + + ε ε ε ε ε ε ε ε ε Formalmete, Como X ~ b(, p) temos que, para grade, a variável aleatória tem distribuição N(0,1). p( -p) X - p Z 1

Deste modo, para grade, P( ε ) P ε p(1 p) Z ε p(1 p), ode Z ~ N(0,1). 12

Deotado ε p( 1 p) z, temos que P(ε) γ P(-z Z z). Assim, podemos obter z cohecedo-se γ (ou P(ε)). Por exemplo, cosidere γ 0,80. z é tal que A(z) 0,90. Pela tabela, temos z 1,28. 13

Erro da estimativa itervalar Da igualdade z, ε p(1 p) é imediato mostrar que o erro amostral ε é dado por ε z p(1 ode z é tal que γ P(-z Z z), com Z ~ N(0,1). O itervalo de cofiaça tem a forma: IC Usar p) p(1 p) p(1 p) [ pˆ ε; pˆ + ε] pˆ z ; pˆ + z pˆ em vez de p para costruir itervalo., 14

Exemplo 7.21 Magalhães e Lima Pretede-se estudar a proporção p de cura usado-se um medicameto em doetes com cercária, que é uma das formas da esquistossomose. Um experimeto cosistiu em aplicar o medicameto em 200 pacietes, escolhidos ao acaso, e observou-se que 160 deles ficaram curados. Qual a proporção de curados? Apresete um Itervalo de Cofiaça com coeficiete de cofiaça igual a 95%. 15

160 p ˆ 0,8 200 P(ε) γ 0,95 P(-z Z z). Assim, obtemos z: A(z)0,5+0,4750,975 > z1,96 0,95 16

Substituido IC IC pˆ(1 pˆ) pˆ(1 pˆ) [ pˆ ε; pˆ + ε] pˆ z ; pˆ + z IC 0,8 1,96 Iterpretação: Em esaios como este, o verdadeiro p pertece a 95% dos 17 itervalos. 0,8(1 0,8) ;0,8 + 1,96 200 0,8(1 0,8) 200 [ 0,8 0,05544; 0,8 + 0,05544] [ 0,74456; 0,85544]

Dimesioameto da amostra p(1 p) Da relação ε z, segue que o tamaho amostral, dados γ e a margem de erro ε, tem a forma z p(1 p), ε ode z é tal que γ P(-z Z z) e Z ~ N(0,1). 2 Etretato, esta expressão, depede de p(1-p), que é descohecido. Como calcular o valor de? 18

Gráfico da fução p(1-p), para 0 p 1. Pela figura observamos que: a fução p(1-p) é uma parábola simétrica em toro de p 0,5; o máximo de p(1-p) é 0,25, alcaçado quado p 0,5. Assim, a prática, substituímos p(1-p) por seu valor máximo, obtedo 2 z 0,25, ε que pode forecer um valor de maior do que o ecessário. 19

Exemplo 2: No exemplo da USP (Exemplo 1) supoha que ehuma amostra foi coletada. Quatos estudates precisamos cosultar de modo que a estimativa potual esteja, o máximo, a 0,02 da proporção verdadeira p, com uma probabilidade de 0,95? Dados do problema: ε 0,02 (erro da estimativa); P(ε) γ 0,95 z 1,96. 2 1,96 p(1- p) 0,02 1,96 0,02 2 0,25 2401 estudates. 20

Perguta: É possível reduzir o tamaho da amostra quado temos alguma iformação a respeito de p? Por exemplo, sabemos que: p ão é superior a 0,30, ou p é pelo meos 0,80, ou p está etre 0,30 e 0,60. Resposta: Depede do tipo de iformação sobre p. Em algus casos, podemos substituir a iformação p(1-p), que aparece a expressão de, por um valor meor que 0,25. 21

Redução do tamaho da amostra Vimos que, se ada sabemos sobre o valor de p, o cálculo de, substituímos p(1-p) por seu valor máximo, e calculamos 2 z 0,25. ε Se temos a iformação de que p é o máximo 0,30 (p 0,30), etão o valor máximo de p(1-p) será dado por 0,3x0,7 0,21. Logo, reduzimos o valor de para z ε 2 0,21. 22

Agora, se p é pelo meos 0,80 (p 0,80), etão o máximo valor de p(1-p) é 0,8x0,2 0,16, e temos z ε 2 0,16. Mas, se 0,30 p 0,60, o máximo valor de p(1-p) é 0,5x0,50,25 e, este caso, ão há redução, ou seja, z ε 2 0,25. 23

Exemplo 3: No Exemplo 2, supoha que temos a iformação de que o máximo 30% dos aluos da USP foram ao teatro o último mês. Portato, temos que p 0,30 e, como vimos, o máximo de p(1-p) este caso é 0,21. Assim, precisamos amostrar z ε 2 0,21 1,96 0,02 2 0,21 2017 estudates, coseguido uma redução de 2401-2017 384 estudates. 24

)()(Itervalo de cofiaça para p Vimos que a estimativa itervalar para p tem a forma: [ p ˆ ε ; pˆ + ε ], com ε z )p 1 ( p e z tal que γ P(-z Z z) a N(0,1). Na prática, substituímos a proporção descohecida p pela proporção amostral pˆ, obtedo o seguite itervalo de cofiaça com coeficiete de cofiaça γ : IC )p ; γ pˆ 1 pˆ pˆ z ; pˆ + z pˆ 1 (ˆ p 25

Exemplo 4: No exemplo da USP, temos 500 e pˆ 0,20. Costruir um itervalo de cofiaça para p com coeficiete de cofiaça γ 0,95. Como γ 0,95 forece z 1,96, o itervalo é dado por: pˆ z p( ˆ 1 p) ˆ ; pˆ + z p( ˆ 1 p) ˆ 0,20 0,80 0,20 0,80 0,20 1,96 ; 0,20 + 1,96 500 500 [ 0,20 0,035 ; 0,20 + 0,035 ] [ 0,165 ; 0,235 ]. Nesse itervalo (γ 0,95), a estimativa potual para p é 0,20, com um erro amostral ε igual a 0,035. 26

Iterpretação do IC com γ 95%: Se sortearmos 100 amostras de tamaho 500 e costruirmos os respectivos 100 itervalos de cofiaça, com coeficiete de cofiaça de 95%, esperamos que, aproximadamete, 95 destes itervalos coteham o verdadeiro valor de p. Cometários: Da expressão ε z p( 1 p), é possível cocluir que: para γ fixado, o erro dimiui com o aumeto de. para fixado, o erro aumeta com o aumeto de γ. 27

Exemplo 5: Aida o exemplo da USP, temos k 100 e 500. Qual é a probabilidade da estimativa potual estar a uma distâcia de, o máximo, 0,03 da proporção verdadeira? Dados do problema: 500, pˆ 0,20 eε 0,03 P(ε) γ? Como a proporção verdadeira p é descohecida, utilizamos a estimativa potual pˆ para calcular z e, assim, obter γ (ou P(ε)). 28

)z ε p( 1 p) Logo, obtemos P ε 2 A( z 1 ) 2 A(1,68) (Cálculo de z: 0,03 500 1,68. 0,2 0,8 1 2 0,953 1 0,906 (90,6%). 29

Exemplo 6: Supoha que estamos iteressados em estimar a proporção p de pacietes com meos de 40 aos diagosticados com câcer os pulmões que sobrevivem pelo meos 5 aos. Em uma amostra aleatoriamete selecioada de 52 pacietes, somete 6 sobreviveram mais de 5 aos. - Estimativa por poto para p: 6 p ˆ 0115, 52 (proporção amostral) - Itervalo de cofiaça aproximado de 95% para p: 0,115(1 (0,115 1,96 52 (0,028, 0,202) 0,115) ; 0,115 + 1,96 0,115(1 52 0,115) ) 30

Cometário: Embora esse itervalo teha sido costruído usado a aproximação ormal para a distribuição biomial, poderíamos ter gerado um itervalo de cofiaça exato para p usado a própria distribuição biomial. Um itervalo exato é particularmete útil para pequeas amostras, em que o uso da aproximação ormal ão pode ser justificada. 31