Teorema do limite cetral e es/mação da proporção populacioal p 1
RESULTADO 1: Relembrado resultados importates Seja uma amostra aleatória de tamaho de uma variável aleatória X, com média µ e variâcia σ.temos que: E( X ) = µ e Var ( X ) = σ RESULTADO : Se X ~ N(µ,σ ), para uma amostra aleatória de qualquer tamaho de X, σ X ~ N µ, etão, Z = ~ N ( 0,1) X µ σ
3 RESULTADO 3:, 1 ~ = t S X T µ em que, é a variâcia amostral e t -1 represeta a distribuicão t-studet com -1 graus de liberdade.. 1 ) ( 1 = = X X S i i Se X ~ N(µ,σ ) etão, para uma amostra aleatória de tamaho de X, 3
Teorema do Limite Cetral (TLC) RESULTADO 4 Seja X uma v. a. que tem média µ e variâcia σ. Para amostras X 1, X,..., X, retiradas ao acaso e com reposição de X, a distribuição de probabilidade da média amostral X aproxima-se, para grade, de uma distribuição ormal, com média µ e variâcia σ /, ou seja, X ~ N µ, σ, para grade, aproximadamete. Sugestão: Assistir ao vídeo o lik https://www.youtube.com/watch?v=jvoxeymqhnm 4
5
Figura : Histogramas correspodetes às distribuições de X para amostras de algumas populações. 4ª 00, 73 6
Esses gráficos mostram que, quado aumeta, idepedetemete da forma da distribuição de X, a distribuição de probabilidade da média amostral X aproxima-se de uma distribuição ormal. coforme aumeta, os valores de X tedem a se cocetrar cada vez mais em toro de média µ, uma vez que a variâcia vai dimiuido; No R Pacote: RcmdrPlugi.TeachigDemos Simulação do Teorema do Limite Cetral 7
Portato se a variável X a população ão tem distribuição ormal, e é grade, usado o TLC o itervalo de cofiaça aproximado para µ, com coeficiete de cofiaça γ, é para σ cohecido: σ X z ; X + z σ, para σ descohecido: S X z ; X + z S sedo z tal que γ = P(-z Z z), com Z ~ N(0, 1), σ o desvio padrão da população e S o desvio padrão amostral. 8
Exemplo 1: Não se cohece o cosumo médio de combustível de automóveis da marca T. Sabe-se, o etato, que o desvio padrão do cosumo de combustível de automóveis dessa marca é 10 km/l. Na aálise de 150 automóveis da marca T, obteve-se cosumo médio de combustível de 8 km/l. Ecotre um itervalo de cofiaça para o cosumo médio de combustível dessa marca de carro. Adote um coeficiete de cofiaça igual a 95%. X: cosumo de combustível de automóveis da marca T σ = 10 km/l Amostra: = 150 x (média amostral) = 8 km/l γ = 0,95 z = 1,96 9
Pelo Teorema do Limite Cetral, o itervalo de cofiaça é dado, aproximadamete, por X z 8 1,96 σ ; X + z σ 10 ; 8 + 1,96 150 10 150 [ 8 1,96 x 0,8;8 + 1,96 x 0,8] = [ 6,40; 9,60] Observe que o erro amostral ε é 1,60 km/l. 10
Exemplo : A quatidade de colesterol X o sague das aluas de uma uiversidade tem uma distribuição com desvio padrão σ = 50 mg/dl e média µ descohecida. Se desejamos estimar a quatidade média µ de colesterol com erro ε = 10 mg/dl e cofiaça de 95%, quatas aluas devem formar a amostra para realizar o exame de sague? X: quatidade de colesterol o sague das aluas da uiversidade σ = 50 mg/dl ε = 10 mg/dl γ = 0,95 z = 1,96 =?? 11
Supodo que o tamaho da amostra a ser selecioada é suficietemete grade, pelo Teorema do Limite Cetral (TLC) temos: = z ε σ, = = 1,96 ( 50) 10 96,04 Assim, aproximadamete 97 aluas devem ser selecioadas para realizar o exame de sague. 1
Exemplo 3: Para estimar a reda semaal média de garços de restaurates em uma grade cidade, é colhida uma amostra da reda semaal de 75 garços. A média e o desvio padrão amostrais ecotrados são R$ 57 e R$ 50, respectivamete. Determie um itervalo de cofiaça, com coeficiete de cofiaça de 90%, para a reda média semaal de garços dessa cidade. X : reda semaal de garços da cidade Amostra: = 75 x = 57 e s = 50 γ = 0,9 z = 1,65 13
O itervalo de 90% de cofiaça é dado, aproximadamete, por x 57 - s z - 1,65 ; x 50 75 + z ; 57 s = 50 + 1,65 75 = [ - 9,53 ; 57 + 9,53 ] [ 517,47 ; 536,53 ] 57 = 14
Es/mação da proporção 15
Objetivo Estimar uma proporção p (descohecida) de elemetos em uma população, apresetado certa característica de iteresse, a partir da iformação forecida por uma amostra. 16
Exemplos: p: proporção de aluos da USP que foram ao teatro pelo meos uma vez o último mês; p: proporção de cosumidores satisfeitos com os serviços prestados por uma empresa telefôica; p: proporção de eleitores da cidade de São Paulo que votariam em um determiado cadidato, caso a eleição para presidete se realizasse hoje; p: proporção de criaças de a 6 aos, do estado de São Paulo, que ão estão matriculadas em escola de educação ifatil. 17
- Vamos observar elemetos, extraídos ao acaso da população, de forma idepedete; - Para cada elemeto selecioado da população, verificamos a preseça ( sucesso ) ou ão ( fracasso ) da característica de iteresse. Neste caso, temos uma amostra aleatória (a.a.) de tamaho de X, sedo X uma v.a. com distribuiçao de Beroulli, que represetamos por X 1, X,..., X, ode X i vale 1, se ocorre sucesso, ou 0, se ocorre fracasso para o i-ésimo elemeto da amostra. 18
Estimador potual O estimador potual para p, também deomiado proporção amostral, é defiido como X ˆ 1 p = +... + Note que: X 1 +... + X é o úmero de elemetos a amostra que apresetam a característica; p ˆ = X Se observamos k elemetos a amostra com a característica, obtemos p ˆ = k /, que deomiamos estimativa potual para p. X. 19
Exemplo 1: Seja p a proporção de aluos da USP que foram ao teatro pelo meos uma vez o último mês. Supoha que foram etrevistados = 500 estudates, e que, desses, k = 100 teriam afirmado que foram ao teatro pelo meos uma vez o último mês. A estimativa potual (proporção amostral) para p é dada por: k 100 pˆ = = = 0,0 500 ou seja, 0% dos estudates etrevistados afirmaram que foram ao teatro pelo meos uma vez o último mês., Note que outra amostra de mesmo tamaho pode levar a uma outra estimativa potual para p. 0
Itervalo de cofiaça para p Vimos que, para qualquer variável aleatória X, quado é grade, usado o Resultado 4 (TLC), um itervalo de cofiaça para µ tem a forma ε = z σ [ X ε ; X + ε], ode, sedo σ a variâcia de X. Neste caso, como X ~ Beroulli(p), com σ =p(1-p) e p ˆ = X, a estimativa itervalar para p é dada por [ p ˆ ε ; pˆ + ε ], com ε = z p( 1 p) e z tal que γ = P(-z Z z) a N(0,1). 1
Itervalo de cofiaça para p ˆ 1 ˆ ˆ ˆ 1 ˆ ˆ + = p p z p p p z p p ; γ IC ) ( ) ( ) ( ; Na prática, substituímos a proporção descohecida p pela proporção amostral, obtedo o seguite itervalo de cofiaça aproximado com coeficiete de cofiaça γ : pˆ
Exemplo 1 (cotiuação): No exemplo da USP, temos = 500 e pˆ = 0,0. Costruir um itervalo de cofiaça para p com coeficiete de cofiaça γ = 0,95. Como γ = 0,95 forece z = 1,96, o itervalo é dado por: pˆ z pˆ ( 1 pˆ ) pˆ ( 1 pˆ ; pˆ + z ) 0,0 0,80 0,0 0,80 = 0,0 1,96 ; 0,0 + 1,96 500 500 = [ 0,0 0,035 ; 0,0 + 0,035] = [ 0,165 ; 0,35]. 3
Iterpretação do IC com γ = 95%: Se sortearmos 100 amostras de tamaho = 500 e costruirmos os respectivos 100 itervalos de cofiaça, com coeficiete de cofiaça de 95%, esperamos que, aproximadamete, 95 destes itervalos coteham o verdadeiro valor de p. Cometários: Da expressão ε = z p( 1 p), é possível cocluir que: para γ fixado, o erro dimiui com o aumeto de. para fixado, o erro aumeta com o aumeto de γ. 4
Da relação Dimesioameto da amostra ε = z segue que o tamaho amostral, dados γ e a margem de erro ε, tem a forma = p(1 z ε p), p(1 p), ode z é tal que γ = P(-z Z z) e Z ~ N(0,1). Etretato, esta expressão, depede de p(1-p), que é descohecido. Como calcular o valor de? 5
Gráfico da fução p(1-p), para 0 p 1. Pela figura observamos que: a fução p(1-p) é uma parábola simétrica em toro de p = 0,5; o máximo de p(1-p) é 0,5, alcaçado quado p = 0,5. Assim, a prática, substituímos p(1-p) por seu valor máximo, obtedo z = 0,5, ε que pode forecer um valor de maior do que o ecessário. 6
Exemplo 1 (cotiuação): No exemplo da USP supoha que ehuma amostra foi coletada. Quatos estudates precisamos cosultar de modo que a estimativa potual esteja, o máximo, a 0,0 da proporção verdadeira p, com uma probabilidade de 0,95? Dados do problema: ε = 0,0 (erro da estimativa); γ = 0,95 z = 1,96. 1,96 = p(1- p) 0,0 1,96 0,0 0,5 = 401 estudates. 7
Perguta: É possível reduzir o tamaho da amostra quado temos alguma iformação a respeito de p? Por exemplo, sabemos que: p ão é superior a 0,30, ou p é pelo meos 0,80, ou p está etre 0,30 e 0,60. Resposta: Depede do tipo de iformação sobre p. Em algus casos, podemos substituir a iformação p(1-p), que aparece a expressão de, por um valor meor que 0,5. 8
Redução do tamaho da amostra Vimos que, se ada sabemos sobre o valor de p, o cálculo de, substituímos p(1-p) por seu valor máximo, e calculamos z = ε 0,5. Se temos a iformação de que p é o máximo 0,30 (p 0,30), etão o valor máximo de p(1-p) será dado por 0,3x0,7 = 0,1. Logo, reduzimos o valor de para z = ε 0,1. 9
Agora, se p é pelo meos 0,80 (p 0,80), etão o máximo valor de p(1-p) é 0,8 x 0, = 0,16, e temos z = ε 0,16. Mas, se 0,30 p 0,60 o máximo valor de p(1-p) é 0,5 x 0,5 = 0,5 e, este caso, ão há redução, ou seja, z = ε 0,5. 30
Exemplo 1 (cotiuação): No exemplo da USP, supoha que temos a iformação de que o máximo 30% dos aluos da USP foram ao teatro o último mês. Portato, temos que p 0,30 e, como vimos, o máximo valor de p(1-p) este caso é 0,1. Assim, precisamos amostrar z = ε 0,1= 1,96 0,0 0,1= 017 estudates, coseguido uma redução de 401-017 = 384 estudates. 31
Exemplo : Por ocasião do ceteário da imigração japoesa o Brasil, um Istituto de Pesquisa coduziu uma pesquisa, com a fialidade de cohecer algus aspectos dessa população vivedo o país. Etre outras questões, desejou-se estimar a proporção p de japoeses e descedetes o Brasil que perteciam a alguma associação de cultura japoesa. Foram selecioados 610 japoeses e descedetes, com mais de 16 aos de idade. Na amostra aleatória selecioada, 195 declararam frequetar ou pertecer a alguma associação de cultura japoesa. - Estimativa por poto para p: 195 pˆ = 0, 3 610 - Itervalo de cofiaça aproximado de 95% para p: 0,3(1 0,3) 0,3(1 0,3) (0,3 1,96 ; 0,3 + 1,96 ) 610 610 = (0,3-0,037; 0,3 + 0,037) = (0,83; 0,357) 3
Uma Ilustração Fote da Pesquisa a ítegra: http://www1.folha.uol.com.br/ poder/015/03/1603885- maioria-foi-as-ruas-cotracorrupcao-diz-datafolha.shtml 33
34
35
Parte iteira e primeira decimal de z Distribuição Normal : Valores de P( Z < z ) = A(z) Seguda decimal de z 0 1 3 4 5 6 7 8 9 0.0 0.5000 0.5040 0.5080 0.510 0.5160 0.5199 0.539 0.579 0.5319 0.5359 0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0. 0.5793 0.583 0.5871 0.5910 0.5948 0.5987 0.606 0.6064 0.6103 0.6141 0.3 0.6179 0.617 0.655 0.693 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.4 0.6554 0.6591 0.668 0.6664 0.6700 0.6736 0.677 0.6808 0.6844 0.6879 0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.713 0.7157 0.7190 0.74 0.6 0.757 0.791 0.734 0.7357 0.7389 0.74 0.7454 0.7486 0.7517 0.7549 0.7 0.7580 0.7611 0.764 0.7673 0.7704 0.7734 0.7764 0.7794 0.783 0.785 0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.803 0.8051 0.8078 0.8106 0.8133 0.9 0.8159 0.8186 0.81 0.838 0.864 0.889 0.8315 0.8340 0.8365 0.8389 1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.861 1.1 0.8643 0.8665 0.8686 0.8708 0.879 0.8749 0.8770 0.8790 0.8810 0.8830 1. 0.8849 0.8869 0.8888 0.8907 0.895 0.8944 0.896 0.8980 0.8997 0.9015 1.3 0.903 0.9049 0.9066 0.908 0.9099 0.9115 0.9131 0.9147 0.916 0.9177 1.4 0.919 0.907 0.9 0.936 0.951 0.965 0.979 0.99 0.9306 0.9319 1.5 0.933 0.9345 0.9357 0.9370 0.938 0.9394 0.9406 0.9418 0.949 0.9441 1.6 0.945 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.955 0.9535 0.9545 1.7 0.9554 0.9564 0.9573 0.958 0.9591 0.9599 0.9608 0.9616 0.965 0.9633 1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 1.9 0.9713 0.9719 0.976 0.973 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767.0 0.977 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.981 0.9817.1 0.981 0.986 0.9830 0.9834 0.9838 0.984 0.9846 0.9850 0.9854 0.9857. 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916.4 0.9918 0.990 0.99 0.995 0.997 0.999 0.9931 0.993 0.9934 0.9936.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.995.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.996 0.9963 0.9964.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.997 0.9973 0.9974.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981.9 0.9981 0.998 0.998 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990 3.1 0.9990 0.9991 0.9991 0.9991 0.999 0.999 0.999 0.999 0.9993 0.9993 3. 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995 3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997 3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998 3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 3.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 36 Volta 36