AULA: Iferêcia Estatística stica Prof. Víctor Hugo Lachos Dávila
Iferêcia Estatística Iferêcia Estatística é um cojuto de técicas que objetiva estudar uma oulação através de evidêcias forecidas or uma amostra. Poulação é o cojuto de todos os elemetos ou resultados sob ivestigação. Amostra é qualquer subcojuto da oulação.
Problemas da Iferêcia Exemlo: Qual a distribuição da altura dos brasileiros adultos?. Parece raoável esar um modelo Normal, a questão agora é idetificar os arâmetros (μ e σ ) ara que ela fique comletamete esecificada. Como faer isso? Medido a altura de todos os Brasileiros adultos. Neste caso ão é ecessário usar Iferêcia Estatística! Escolher estrategicamete uma amostra (X,X,...,X ) da oulação de adultos e através dessa amostra iferir sobre os arâmetros (μ e σ ) da oulação. Os resultados deederam da qualidade da amostra. Esta tem que ser reresetativa da oulação. Descrevemos aqui um dos roblemas básicos da Iferêcia estatística: Estimação 3
Problemas da Iferêcia Exemlo: suoha agora que desejamos saber se a média da altura dos brasileiros é maior que a dos argetios (,65m)? Para tomarmos uma decisão, escolhemos estrategicamete uma amostra (X,X,...,X ) da oulação de adultos e aalisamos se μ >,65 com alta robabilidade. Descrevemos aqui um outro roblema básico da Iferêcia estatística: Teste de Hióteses 4
Estimação Teste de Hióteses Qual é a robabilidade de "cara"o laçameto de uma moeda? A moeda é hoesta ou é desequilibrada? Qual é a roorção de votos que o cadidato A tem as eleições? O cadidato A vecerá as eleições? Qual é a roorção de motoristas que tiveram sua carteira areedida aós a vigêcia da ova lei de trâsito? Pelo meos % dos motoristas habilitados de SP tiveram suas carteiras areedidas aós a etrada da ova lei do trâsito ou ão? 5
Como Selecioar uma Amostra Ex: Aálise da quatidade de glóbulos bracos a sague de certo idivíduo. Uma gota do dedo seguramete será reresetativa ara a aálise. Caso Ideal! Ex: Oiião sobre um rojeto goverametal. Se escolhemos uma cidade favorecida o resultado certamete coterá erro (viés). Note que a maeira de se obter a amostra é muito imortate. A Tecologia da AMOSTRAGEM é uma das esecialidades detro da estatística que forece rocedimetos adequados. Aqui trataremos o caso mais simles e que serve de base ara rocedimetos muito mais elaborados: Amostragem aleatória simles (AAS) 6
AAS Suomos que odemos listar todos os N elemetos da oulação (oulação fiita). Usado métodos de geração de úmeros aleatórios, sorteia-se um elemeto da oulação, sedo que todos os elemetos tem a mesma chace de ser selecioados. Reete-se o rocedimeto até que sejam sorteadas as uidades da amostra. Temos AAS com reosição e sem reosição. AAS com reosição imlica que tehamos ideedêcia etre as uidades selecioadas, facilitado o estudo das roriedades dos estimadores. Logo, estas otas: AAS AAS com reosição 7
Algumas Defiições Defiição: Uma amostra aleatória simles (a.a) de tamaho de uma v.a. X, é o cojuto de v.a s ideedetes (X,X,...,X ), cada uma com a mesma distribuição de X. Defiição: As quatidades da oulação, em geral descohecidas, sobre as quais temos iteresse, são deomiadas arâmetros. θ, μ, σ Defiição: A combiação de elemetos da amostra, costruída com a fialidade de estimar um arâmetro, é chamado de estimador, exemlo, X Aos valores uméricos assumidos elos estimadores chamamos de estimativas exemlo, x Defiição: Chamamos de estatística a qualquer fução T da amostra aleatória, i.e. TT(X,X,...,X ) 8
Exemlo: Estamos iteressados a média (μ) e variâcia (σ ) das alturas de joves com idade etre 5 e 8 aos de certa cidade. Vamos coletar uma amostra ara tirar coclusões. Suoha que escolhemos ao acaso 0 joves (AAS). ˆ σ Possíveis estimadores ara μ (que or sua ve são estatísticas) ( Mi + Max) X +... + X0 ˆ μ t (,..., ) ; ˆ (,..., ) ; ˆ X X0 μ t X X0 X μ3 t3( X,..., X0) 0 X Possíveis estimadores ara σ t4( X ˆ,..., X0) ( X i X ) ; σ S i i Agora temos a amostra observada: (em metros),65;.57;,7;,66;,7;,74;,8;,68;,60;,77. As estimativas seriam: (,57 +,8) ˆ μ ˆ,69; μ,65; ˆ σ 0,005; ˆ σ s 0,006; ˆ σ 3 ( X i X ) 3,65 +... +,77 ˆ μ3 0 0,04 ; ˆ σ Max Mi ( ),69; ; 9
Proriedades dos estimadores Defiição: Um estimador é ão viciado ara um arâmetro se E( ) θ ) θ θˆ θ Defiição: Um estimador é cosistete, se, a medida que o tamaho de amostra aumeta, seu valor eserado coverge ara o arâmetro de iteresse e sua variâcia coverge ara ero. i.e. θˆ i) lim E( ˆ) θ θ ii) limvar( ˆ) θ 0 Observe que a defiição de cosistêcia estamos suodo que o estimador deede do tamaho de amostra. Na defiição de vício o resultado vale ara qualquer que seja. 0
Exemlo: Cosidere que uma certa característica X, a oulação tem media μ e variâcia σ. Uma amostra aleatória simles (a.a.) de tamaho, reresetado or (X,...,X ) é obtida ara estimar μ. Estude as roriedades da media amostral. Claro que E(X i ) μ, Var(X i ) σ e que os X i são ideedetes, i,...,. ) O estimador da media oulacioal μ, es da forma μ X. Logo X +... + X μ E( ˆμ ) E(X) E( ) μ X +... + X σ Var( ˆ μ ) Var(X) Var( ) Var( X i ) i Portato, a média amostral é um estimador ão viciado ara a média oulacioal μ e como sua variacia tede a ero coforme cresce, cocluímos também que é um estimador cosistete ara μ. Se o iteresseéestimarσ. Estude as roriedades de ˆ σ e ˆ σ S
Exemlo: Cosidere uma a.a. (X,...,X ) de uma variável X~N(0,6). Como se comorta em fução de. X 00 50 30 0 Àmedidaque aumeta, a f.d.. vai se cocetrado ao redor da média oulacioal 0. Quato maior o tamaho de amostra maior robabilidade que uma estimativa de este róxima da média oulacioal. X
Estimadores ara a média, roorção e Variâcia Parâmetro Esimador Proriedades μ Não viciado e cosistete X Não viciado e cosistete No de casos favoraveisà carateristica ˆ σ Não viciado e cosistete S ( X i X ) σ Viciado e cosistete ˆ σ ( X i X ) 3
Teorema Limite Cetral (TLC) Suoha que uma amostra aleatória simles (X,...X ) é retirada de uma oulação com média μ e variâcia σ. Etão, temos que X μ σ / N(0,), quado Em alavras o TLC garate que ara grade a distribuição da média amostral, devidamete adroiada, se comorta segudo um modelo Normal adroiado (Z). Em casos ode a verdadeira distribuição dos dados é simétrica, boas aroximações são obtidas ara ao redor de 30. Um estudo de simulação descreve graficamete o comortameto de X ara diferetes situações. X~U(0,), X~Bi(0,0,3) e X~Ex() 4
Efeito do tamaho de amostra sobre a distribuição de X 5
Exemlo: Numa certa cidade, a duração de coversas telefôicas em miutos, segue um modelo Exoecial com arâmetro 3. Observadose uma amostra aleatória de 50 dessas chamadas, qual será a robabilidade de em média, a duração de coversas telefôicas ão ultraassarem 4 miutos. Seja X : duração das chamadas, X ~ Ex(3). Logo E(X) 3 e Var(X) 9 Admitido que é grade o suficiete, odemos calcular a robabilidade desejada da seguite forma: X 3 4 3 P( X 4) P( ) P( Z,36) 9 / 50 9 / 50 0,9909 6
O Caso da Proorção Amostral ( ) Coletamos uma a.a. (X,...X ) de X~Beroulli(), com o objetivo de estimar. Defiimos a roorção amostral (estimador de ) como sedo a fração de idivíduos com a característica X, i.e., ˆ No de casos favoraveis à ˆ Note que odemos escrever carateristica ˆ X + X +... X P X, Assim, temos que Xi, 0, sucesso fracaso E( X) + E( X ) +... + E( X ) E( Pˆ) X + X +... + X ( ) ( ) Var( Pˆ) Var( ) Pelo TLC X E( X ) Var( X ) X ( ) / ) ( ) / N(0,) 7
Exemlo: A roorção de eças fora de esecificação um lote é de 0,4. Numa amostra de tamaho 30, calcule a robabilidade de que a roorção de eças defeituosas seja meor do que 0,5. Seja ˆ : a Etão, roorção de Como coseqüêcia do TLC, temos que eças defeituosas a amostra( roorção amostral). ˆ - E( Var( ˆ ) ˆ ) ˆ ( - - )/ N (0,), quado ˆ ~ N(0,40, P ( ˆ < 0,5) 0,40(0,6) 30 ), Assim, P ( ˆ 0,4 0,40(0,6) < 30 0,5 0,4 0,40(0,6) 30 ) P ( Z, ) 0,8686 8
Estimação or Itervalos Defiição[Itervalo de Cofiaça] Seja X,...,X uma amostra aleatória de uma oulação com a característica X~f(x,θ). Seja TG(X,...,X) e TH(X,...,X) duas estatísticas tais que T< T e que P ( T < θ < T ). O itervalo (T, T) é chamado de itervalo de 00(-)% de cofiaça ara θ. Notação: IC(μ,-) (T, T), ode T e T são os limite iferior suerior resectivamete e - é o coeficiete (ou ível) de cofiaça 9
Itervalo de cofiaça ara uma média oulacioal Suoha que X, LX é uma amostra aleatória de tamaho, de uma oulação ormal com média μ (descohecida) e variâcia σ (cohecida). Vimos que a média amostral X, tem distribuição ormal com média μ e variâcia σ /. Isto é Z X μ ~ N(0,) σ Logo, fixado um ível de cofiaça (-), ode-se determiar / de tal forma:. P( Z ) Ou que é equivalete X μ P( σ / ) - -/ - -/ 0
4748 6 4748 6 E E X X X σ μ σ σ μ / + ( ) E X E X X X IC + + ; ; ), ( σ σ μ Logo, itervalo de 00 (-)% de cofiaça ara μ é dado or:. Exemlo : Em uma idustria de cerveja, a quatidade de cerveja iserida em latas tem-se comortado como uma distribuição ormal com média 350 ml e desvio adrão 3 ml. Aós algus roblemas a liha de rodução, suseita-se que houve alteração a média. Uma amostra de 0 latas acusou uma média 346 ml. Obteha um itervalo de 95% ara a quatidade média μ de cerveja iserida em latas, suodo que ão teha ocorrido alteração a variabilidade.
Já que -0,95, temos da tabela ormal adrão 0,975,96. 0.95 σ IC( μ,0,95) X,96 ; X +, 96 σ IC( μ,0,95) 346,96 3 ( 344,69;347,3) 0 ;346 +,96 3 0 ( 346,3;346 +,3)
Determiação do tamaho da amostra ara estimação de μ O erro máximo de estimação a estimação de μ é dado or E σ / E σ No caso de oulação fiita de N elemetos é itroduida o fator de correção de oulação fiita E σ N N N / E ( N ) + / σ σ 3
Exemlo: Uma firma costrutora deseja estimar a resistêcia média das barras de aço utiliadas a costrução de casas. Qual o tamaho amostral ecessário ara garatir que haja um risco de 0,00 de ultraassar um erro de 5 kg ou mais a estimação? O desvio adrão da resistêcia ara este tio de barra é de 5 kg. Do euciado tem-se σ5, 0,00, e E5, 0,99953,9 E σ (3,9) (5) 5 70,605 7 5 4
Itervalo de cofiaça ara uma média oulacioal quado σ é descohecido A distribuição t-studet Suodo que a característica de iteresse da oulação é ormal, a estatística T X S μ () tem distribuição de robabilidade cohecida com distribuição t de Studet com - graus de liberdade. 5
6 R t k t k k k t f k + Γ + Γ + ; ) ( ) ( / ) ( / π A fução de desidade de um v.a t-studet com k graus de liberdade é dado or:.
Notação; T~t(k), idica que v.a tem distribuição t-studet com k graus de liberdade. Proriedades: se T~t(k) ( i) E( T ) 0; Var( T ) k ( ii) k T ~ N(0,) k, k > Uso Da Tabela Distribuição t-studet P( T t, k ) - t -,k 7
Cosiderado a estatística dada em (), ode-se mostrar que um itervalo de 00(-)% de cofiaça ara μ é dado or: IC S S μ,) X t X t /, ; + /, 443 4 443 4 E E ( X E X E) ( ; + Exemlo 3: Deseja-se avaliar a durea eserada μ do aço roduido sob um ovo rocesso de têmera. Uma amostra de 0 coros de rova de aço roduiu os seguites resultados, em HRc: 36,4 35,7 37, 36,5 34,9 35, 36,3 35,8 36,6 36,9 Costruir um itervalo de cofiaça ara μ, com ível de cofiaça de 95%. 8
X 0 ( X X ) 0 0 i i S X i 36,5; S 0,735; i 0,35 Já que, 0 (-)0,95, 0,05, temos: t0,975, 9,6 E (,6)(0,35) 0,53 ( X E X E) IC (μ, 0,95) ; + ( 36,5 0,53; 36,5 + 0,53) ( 35,97; 37,03) IC( μ,0,95) 9
Itervalo de cofiaça ara uma variâcia oulacioal A distribuição Qui-quadrado Suodo que a característica de iteresse da oulação é ormal, a estatística W ( ) S σ () tem distribuição de robabilidade cohecida com distribuição qui-quadrado com - graus de liberdade. A fução de desidade de um v.a qui-quadrado com k graus de liberdade é dado or:. f k ( w) w e ; k k / Γ () k w w > 0 Notação : W ~ χ ( k ) 30
Se W tem distribuição qui-quadrado com k graus de liberdade etão: E(W)k, Var(W)k; A distribuição é assimétrica á direita; A medida que os graus de liberdade aumeta a distribuição tora-se simétrica. 3
Uso Da Tabela Distribuição Qui-Quadrado Se W ~ χ P(W χ ) (k), k x -,k Exemlo 4: Suoha que W é uma v.a com 0 graus de liberdade determiar: (a) P(W>,56); (b) P(,56<W<4,87) (c) O valor de k tal que, P(W<k)0,95. 3
Da Estatística dada em () temos: W ( ) S ~ χ ( ) σ Para uma ível de cofiaça 00(-)% fixado ode-se determiar χ da distribuição qui-quadrado como mostra a figura::, χ e, X /,- X -/, - 33
P ) S σ ( /, /, /, /, ( ) χ W χ P χ χ Um itervalo de 00(-)% de cofiaça ara σ é ado or ( ) S IC( σ,) χ /, (, ) S χ /, Exemlo: retede-se avaliar a variabilidade associada ao resultado de um determiado método de aálise química. Com esse objetivo, efetuaram-se 4 aálises a uma determiada substâcia em que se segui o referido método, em codições erfeitamete estabiliadas. A variâcia amostral dos resultados (exressados uma determiada uidade) foi de 4,58. Admitido que o resultado das aálises segue uma distribuição ormal. Obteha um itervalo de 90% de cofiaça ara variâcia. 34
Para -0,90 0,0, da distribuição qui-quadrado com - 4-3 graus de liberdade temos: x 0.05,3 x 0.95,3 IC( σ,0,9) (4 )(4,58) (4 )(4,58), 35,7 3,09 (,995;8,047) 35
Itervalo de cofiaça ara uma roorção oulacioal Suoha que tem-se uma oulação dicotômica, costituída aeas or elemetos de dois tios, isto é, cada elemeto ode ser classificado com sucesso ou fracasso, suoha que robabilidade de sucesso é e de fracasso é q-, e desta oulação se retira uma amostra aleatória, X, X de observações. Vimos Z ˆ ( ) ~ N(0,) Para um ível cofiaça fixado em 00(-)%,um itervalo ara, ara uma amostra suficietemete grade. IC,) ˆ ( ) ˆ + ( / ; / ( ) 36
37 Abordagem otimista ) or substituir - ( -) ( ˆ ˆ Abordagem coservativa /4 or substituir -) ( ) ( ˆ) ˆ( ˆ ; ˆ) ˆ( ˆ ), ( / / a IC + ) ( 4 ˆ ; 4 ˆ ), ( / / b IC +
Exemlo: Um estudo foi feito ara determiar a roorção de famílias em uma comuidade que tem telefoe (). Uma amostra de 00 famílias é selecioada, ao acaso, e 60 afirmam ter telefoe. Que dier de com 95% de cofiaça? 60 00 Uma estimativa otual de é ˆ 0,8 (80%) Já que -0,95, temos da tabela ormal adrão 0975.,96. Substituido em (a) 0,8( 0,8) 0,8( 0,8) IC(,0,95) 0,8,96 ;0,8,96 + 00 00 ( 0,745;0,855) Em (b) IC(,0,95) 0,8,96 ;0,8,96 4 00 4 00 (0,73;0,869) 38
39 Determiação do tamaho da amostra ara estimação de O erro máximo de estimação a estimação de é dado or No caso de oulação fiita de N elemetos é itroduida o fator de correção de oulação fiita ) ( ) ( ) ( / / N E N + E ) ( ( ) / ) ( E ) ( N N E Quado ão se tem iformação de : ( ) / 0,5 E Quado ão se tem iformação de : (0,5) ) ( (0,5) / / + N E N
Exemlo: O serviço social de um muicíio deseja determiar a roorção de famílias com uma reda familiar iferior a R$ 00,00. Estudos ateriores idicam que esta roorção é de 0%. (a) Que tamaho de amostra se requer ara assegurar uma cofiaça de 95% que o erro máximo de estimação desta roorção ão ultraasse o 0,05? (b) Em quato variara o tamaho da amostra se o erro máximo ermissível é reduido a 0,0.? Dos dados temos 0,0 e -0,95. Da tabela ormal adrão 0,975.,96. (a) O erro máximo de estimação E0,05. (,96) ( 0, 0,8) 0,05 45,86 46 40
(b) O erro máximo de estimação E0,0. (,96) ( 0, 0,8) 0,0 646,56 647 No caso de estarmos usado ível de cofiaça de 95%, temos que 0,975.,96, etão temos: 0 E A exressão aterior é muito usado o laejameto de esquisa de levatameto, com o objetivo de estimar várias roorções como os exemlos seguites: Numa esquisa eleitoral, em que é comum a ecessidade de avaliar a roorção de cada cadidato; Na esquisa de mercado, em que ormalmete desejam-se avaliar as roorções de várias características dos cosumidores. 4
No caso de oulação fiita de N elemetos é itroduida o fator de correção de oulação fiita: N N + 0 0 4