mbarros.com 3 mbarros.com 4 Coteúdo IND 5 Iferêcia Estatística Aula 3 Novembro 005 Môica Barros Itervalos de Cofiaça para Difereças etre Médias (Variâcias supostas iguais) Itervalo de Cofiaça para a variâcia de uma Normal Itervalos de Cofiaça para a razão de variâcias Itervalo de Cofiaça aproximado para a média de uma Biomial mbarros.com mbarros.com Objetivo Comparação das médias de duas amostras aleatórias Normais. Exemplos: Agricultura, Medicia, Veteriária, Marketig, Produção, Fiaças, etc... Aplicações - Medicia Deseja-se medir o efeito da dieta sobre a pressão sagüíea e a taxa de colesterol de uma pessoa. Toma-se duas amostras parecidas de pessoas (mesmas idades, pesos, ível de atividade, etc... ). Umas das amostras é submetida a uma dieta com alto teor de gordura e cares vermelhas. O outro grupo igere uma dieta cosistido pricipalmete em vegetais, cares bracas e grãos.
mbarros.com 7 mbarros.com 8 Os pacietes são acompahados por um período de 3 meses, o qual são feitas medições quizeais da pressão sagüíea e da taxa de colesterol. Como a dieta afeta estas quatidades? A pressão sagüíea o grupo que igere mais gordura é sigificativamete maior que o outro grupo? E a taxa de colesterol? Aplicações - Veteriária A empresa produtora da ração Baby Dog decide laçar o mercado uma ova marca de ração, uper Baby Dog, que supostamete tem maior teor utritivo. Toma-se uma amostra de 00 cachorrihos com meses de idade, 00 deles alimetados com Baby Dog e 00 alimetados com uper Baby Dog. mbarros.com 5 mbarros.com 6 Ao completarem 6 meses de idade, os cães são ovamete examiados e registra-se o aumeto de peso o período de a 6 meses de idade. Perguta-se: a ração uper Baby Dog fez os cachorrihos crescerem mais que a Baby Dog? Qual a difereça o aumeto de peso médio dos cães submetidos às duas rações? Aplicações Marketig A empresa ABC cocetra seus aúcios de TV o horário obre, gastado uma imesa fortua em publicidade. Como forma de coter as despesas, a compahia decide direcioar seus aúcios para um horário mais tardio, e para programas vistos por um público pricipalmete das classes A e B. A questão de iteresse para a empresa é: esta mudaça foi eficaz? Ou seja, será que a empresa ecoomizou diheiro e aida mateve o mesmo ível de vedas após a mudaça do horário de seus aúcios?
mbarros.com mbarros.com Formulação Matemática tica Cosidere duas populações Normais com médias (µ e µ ) possivelmete distitas e com a mesma variâcia (esta hipótese é essecial para resolver o problema!). Isto é: X i N (µ, ) e Y j N (µ, ) Ode i,,..., m e j,,..., Cosidere as duas amostras aleatórias de X e Y com tamahos m e respectivamete, isto é: X ); Y ( Y,..., ) ( X,..., X m upoha que todos os parâmetros (µ, µ e ) são descohecidos. Etão o osso objetivo é: Achar um itervalo de cofiaça a 00(-α)% para (µ( - µ ). Y mbarros.com 9 mbarros.com 0 Ituitivamete, este itervalo deverá ser baseado as respectivas médias amostrais e terá a forma: ( X Y c, X Y + c) A questão que devemos respoder é: como achar esta costate c? olução: abemos que: X N( µ ; / ); Y N( µ ; / ) m e estas médias amostrais são idepedetes. Etão qualquer combiação liear de X e Y é Normal e, em particular: X Y N µ µ, + m
Além disso, temos que: ( m Ode é a variâcia amostral da a. amostra (X s) e a variâcia amostral dos Y s, ambas idepedetes. Daí: ) χ m ( ) χ (( m ) + ( ) ) χ + m mbarros.com 3 Revisão: eja Z N(0,) e V χ p, ambas idepedetes. Etão: T Z / V / p t p Tem uma distribuição t de tudet com p graus de liberdade, mbarros.com 4 Combiado os resultados temos: Z V X Y ( µ µ ) N (0,) + m (( m ) + ( ) ) χ+ m mbarros.com 5 Além disso, Z e V são idepedetes, etão a variável T dada por: T Z X Y ( µ µ ) t + m V ( m ) + ( ) + m + m + m Tem distribuição t de tudet com (m+-) graus de liberdade. mbarros.com 6
mbarros.com 9 mbarros.com 0 Para simplificar a otação, seja: Dado um ível de sigificâcia 00*(-α)% podemos achar um úmero b tal que: Prob{-b < T < b} (-α) b é obtido a partir da distribuição t com +m- graus de liberdade, ode T é a variável mostrada o slide aterior, calculada a partir da difereça etre as médias das duas amostras. R ( m ) + ( ) + m + m O IC 00*(-α)% para a difereça das médias é: ( X Y ) br; ( X Y ) + br) mbarros.com 7 mbarros.com 8 Exemplo Estuda-se um certo processo químico com o objetivo de tetar aumetar a produção de um certo composto. Atualmete usa-se a produção um certo tipo de catalisador A, mas um outro tipo de catalisador B é aceitável. Faz-se uma experiêcia com 8 tetativas para o catalisador A e o mesmo o de repetições para o catalisador B. R As médias e variâcias amostrais são: X 9.73, Y 93.75 e 3.89, 4.0. Costrua um itervalo de cofiaça 95% para µ - µ. olução m 8 ( m ) + ( ) + m ( + m ) 7(3.89) + 7(4.0) 4 4 0.989
mbarros.com 3 mbarros.com 4 b.45 da tabela t 4. O itervalo de cofiaça é: ( X Y ) ± br.0 ±. ( 4.4,0.0) Note que este itervalo iclui zero. Isso idica que pode ão existir difereça real a produção média usado os catalisadores A e B. Assim, baseado apeas este teste, parece ão haver razão para mudar do catalisador A para o B com o objetivo de aumetar a produção. mbarros.com IC para a variâcia da Normal ejam X, X,...,X iid N(µ, ) ode ambos µ e são descohecidos. Este é o caso usual a prática, ode desejamos iferir sobre um dos parâmetros quado ambos são descohecidos. A variâcia amostral é Também sabemos que / tem distribuição Qui-quadrado com - graus de liberdade. i ( X i X ) mbarros.com IC para a variâcia da Normal Dado α (0,) ache a e b da tabela Quiquadrado com ( - ) graus de liberdade tais que: Pr(a < (-) / < b) - α e Pr( (-) / < a) α/ Pr((-) / > b) Logo: Pr[(-) /b < < (-) /a] -α. IC para a variâcia da Normal O itervalo ((-) /b, (-) /a) é um itervalo aleatório com probabilidade -α de icluir o parâmetro descohecido. Exemplo ejam X, X,..., X 9 iid Normais com média µ e variâcia. Observa-se s 7.63. Ecotre um itervalo de cofiaça 95% para.
mbarros.com 7 mbarros.com 8 IC para a variâcia da Normal olução Neste caso precisamos ecotrar a e b de uma tabela Qui-quadrado com 8 graus de liberdade. O poto a tal que a probabilidade de estar abaixo dele é.5% é:.80 O poto b tal que a probabilidade de estar abaixo dele é 97.5% (ou seja, a probabilidade de estar acima dele é.5%) é: 7.535. IC para a variâcia da Normal O itervalo de cofiaça 95% para a variâcia da distribuição é: ( ) b ( ), a 8(7.63) 8(7.63), 7.535.80 (3.48, 8.004) mbarros.com 5 mbarros.com 6 A pricípio pode parecer estraho ecotrar um itervalo de cofiaça para a razão etre as variâcias de duas amostras. Mas, existem resultados distribucioais apropriados para lidar com este problema, equato ão existem distribuições apropriadas para testar, por exemplo, a difereça etre as variâcias das amostras. No exemplo do IC para a difereça etre médias foi ecessário supor que a variâcia das duas amostras era igual. Como verificar isso? Podemos fazer um itervalo de cofiaça para a RAZÃO das variâcias. e este itervalo icluir, existe evidêcia a favor da igualdade das variâcias. Do cotrário, se o itervalo ão icluir, ficaremos (o míimo) descofiados sobre a validade do teste t proposto ateriormete.
mbarros.com 3 mbarros.com 3 ituação X i N (µ, ) e Y j N (µ, ) Ode i,,..., m e j,,..., As variâcias amostrais para as duas amostras são os estimadores de e, dadas por: m ( X i X ) m i e ( Y j Y ) j abemos também que e são idepedetes, e múltiplos destas variâcias têm distribuição Qui-quadrado, ou seja: ( m ) ( ) χ χ m e mbarros.com 9 mbarros.com 30 Também, estas duas variáveis Quiquadrado são idepedetes, o que os permite usar a defiição de uma variável aleatória com distribuição F: χ p / p F χ / q q q p χ p F( p, q) χ q Assim, a variável aleatória: ( m ) /( m ) F ( ) /( ) Tem distribuição F com m- graus de liberdade o umerador e - graus o deomiador..
mbarros.com 35 mbarros.com 36 Como ecotrar um itervalo de cofiaça (- α)% para a razão de variâcias? Dado α (0,), ache a e b tais que: Pr(a < F < b) -α e F F(-,m-) Por coveção escolhemos a e b tais que: Pr(F a) α/, Pr (F b) α/ Pr(F < b) -α/, e este valor é ecotrado a partir de uma tabela da fução de distribuição F mbarros.com 33 Frequetemete α é um valor pequeo, e ão existe a tabela, e daí temos que usar um truque, que decorre da maeira como uma variável F é criada. Lembre-se que se F F(p,q), F é a razão de variáveis aleatórias Qui quadrado idepedetes, divididas pelos seus graus de liberdade. mbarros.com 34 Logo, se F F(p,q) etão F (V /p)/(v /q) qv /pv ode V e V são idepedetes. Etão W /F (pv )/(qv ) (V /q)/(v /p) tem desidade F(q,p). Logo: α Pr( F a) Pr Pr F a F a Também, os seguites evetos são equivaletes: a < F < b a < < b a < < b Logo, o itervalo: a, b é um itervalo aleatório com probabilidade -α de icluir o valor descohecido /
mbarros.com 39 mbarros.com 40 Exemplo Cosidere duas amostras Normais tais que m 0 (tamaho da a. amostra), 5 (tamaho da a. amostra), 0 e 35.6. Ecotre um itervalo de cofiaça 95% para a razão de variâcias. (35.6) (0).78 mbarros.com 37 Precisamos achar a e b tais que: e F F(m-,-) F(9,4) etão Pr(F a) α/ 0.05 e Pr(F b) α/ 0.05. Logo: Pr(F b) 0.0975 b 8.90. E: Pr(F a) 0.05 Pr(F > a) 0.975 Pr < 0. 975 ( 49, ) F a ode F F Etão, olhado para a tabela F(4,9) segue que: mbarros.com 38 uma Biomial a 4.7 a 4.7 eja Y Bi(,p) ode é cohecido e 0 < p < é descohecido. O itervalo de cofiaça 95% para / é:.78 (.78a,.78b),.78(8.90) 4.7 ( 0.376, 5.84) Assim, E(Y) p, VAR(Y) p(-p), e Y p ˆ é o estimador de máxima verossimilhaça para p. Pelo Teorema Cetral do Limite: Y (0,) p( p) N aprox se é grade.
mbarros.com 43 mbarros.com 44 uma Biomial Mas, precisamos de uma estimativa do desvio padrão de Y para calcular o itervalo de cofiaça para µ E(Y) p, e etão substituímos p o deomiador pelo seu estimador de máxima verossimilhaça. uma Biomial Este itervalo foi obtido da seguite maeira: Y (0,) p( p) N aprox Ou seja, um itervalo de cofiaça -α aproximado para p é: ( ) z ˆ α /, p + z α / ( ) mbarros.com 4 Dividido o umerador e o deomiador acima por leva a: ( Y / ) ( Y / ) Z ( ) ( ) ( ) mbarros.com 4 uma Biomial E como Z defiido acima é aproximadamete N(0,) etão: Pr[-z -α/ < Z < z -α/ ] -α e obtemos o itervalo idicado. uma Biomial Exemplo Uma pesquisa do govero afirma que 0% dos homes com idade iferior a 5 aos estão desempregados. Ecotre a probabilidade de que, ao tomarmos uma amostra de 400 homes com meos de 5 aos, a proporção estimada de desempregados seja superior a %.
mbarros.com 47 mbarros.com 48 uma Biomial uma Biomial olução A probabilidade real (segudo o govero) de um homem desta faixa etária estar desempregado é p 0%. Toma-se uma amostra de tamaho 400 e estima-se p a partir desta amostra. Podemos utilizar o Teorema Cetral do Limite e ecotramos: p ( p) p( p) ( ) é aproximadamete N(0,) mbarros.com 45 A probabilidade desejada é: Pr ( > 0.) 00 Pr 3 Pr 400 /0 ( )( ) ( 0.0 ) > ( )( ) ( 0. 0.0 ) 9 /0 9 /0 00 3 400 /0 ( 0.0) > ( 0.0) Pr Z > Pr( Z >.33) 0. 098 Logo, existe uma probabilidade de cerca de 9% de que a estimativa amostral ultrapasse %, mesmo que o valor real seja 0%. 4 3 mbarros.com 46 uma Biomial Exemplo Cosidere ovamete a situação do exemplo aterior. upoha que a probabilidade de um homem com meos de 5 estar desempregado é descohecida, e será estimada a partir de uma amostra de 400 homes. upoha que observamos p^ 0.. Ecotre um itervalo de cofiaça 90% aproximado para p. uma Biomial olução Pelo exemplo aterior: p ( ) ( ) ( ) ( )( ) ( p ˆ ) 6.546 ( p ˆ ) p p p 0. 0.88 400 É aproximadamete N(0,). Usado a tabela da Normal leva a: (.645 < Z < +.645) 0.90 Pr(.645 < 6.546( p ) < +.645) 0. 90 Pr
uma Biomial Logo: Pr Pr.645 6.546 < p < + ( 9.33% < p < 4.67% ).645 6.546 Pr0..645 6.546 < p < 0. +.645 6.546 Ou seja, estas codições há 90% de probabilidade da taxa de desemprego real estar etre 9.33% e 4.67%. mbarros.com 49