CAPÍTULO 6 - ESTIMAÇÃO E TESTES DE HIPÓTESES 6. INTRODUÇÃO INFERÊNCIA ESTATÍSTICA Estimação por poto por itervalo Testes de Hipóteses População X θ =? Amostra θ Iferêcia Estatística X, X,..., X 6. ESTIMAÇÃO Cosideremos uma amostra ( X, X,..., X ) de uma v.a. X que descreve uma característica de iteresse de uma população. Seja θ um parâmetro que desejamos estimar. Um estimador do parâmetro θ é qualquer fução das observações X, X,... X. Chamaremos de estimativa a cada particular valor assumido por um estimador. Por exemplo, seja X a altura das pessoas de uma determiada localidade e supoha que estejamos iteressados em estimar a altura média µ dessa população. Para tato uma amostra aleatória ( X, X,..., X 30 ) de 30 pessoas foi retirada e a sua altura média X foi de,67 m. Nesta situação, a média populacioal µ é o parâmetro a ser estimado, a média amostral X é o estimador utilizado e o valor da média,67 m é uma estimativa para µ. O problema da estimação é determiar uma fução dos valores amostrais (X, X,... X ) que seja próxima de θ, segudo algum critério. Existem vários métodos de obteção de estimadores, e para um mesmo parâmetro podemos ter mais de um estimador. Sedo assim, é ecessário estudar algumas propriedades que os distiguem us dos outros. 6.. PROPRIEDADES DOS ESTIMADORES
6 ESTATÍSTICA DEFINIÇÃO : Um estimador θ é dito um estimador ão-viesado ( ou ão-tedecioso) do parâmetro θ se : E ( $ θ ) = θ ou seja, se a média da sua distribuição amostral é igual a θ. Por exemplo: X= i= p $ = X X i é um estimador ão - viesado de é um estimador ão - viesado de p µ s = i= ( X -X ) i - é um estimador ão - viesado de σ DEFINIÇÃO : Se $ θ e $ θ são dois estimadores ão viesados de um mesmo parâmetro θ, e aida : V ( $ θ ) < V ( $ θ ), etão $θ é dito mais eficiete do que θ $. Por exemplo, cosideremos uma população ormal X, com parâmetros µ e σ. Queremos estimar a mediaa Md dessa população. Por ser uma distribuição simétrica, sabemos que µ = Md. Defiido como X a média e como md a mediaa da amostra, qual dos dois estimadores é o melhor para a mediaa populacioal? Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
ESTATÍSTICA 7 Sabemos que X : N( µ, σ / ) e pode-se demostrar que a distribuição da πσ mediaa amostral tem uma distribuição próxima à md : N Md,. Os dois estimadores são ão-viesados, mas X é mais eficiete pois : V(X ) < V( Md ) Assim, para estimar-se a mediaa desta população, é preferível usar a média da amostra como estimador. OBSERVAÇÃO : Existem procedimetos ou métodos para se obter estimadores. Etre eles podemos citar o Método de Máxima Verossimilhaça, o Método dos Míimos quadrados, o Método dos Mometos e o Método de Bayes. 6.. ESTIMATIVA POR PONTO Uma estimativa por poto de algum parâmetro populacioal θ é um úico valor $θ calculado através de dados amostrais, para o qual temos alguma garatia de que este está perto do parâmetro θ a ser estimado. 6..3 ESTIMATIVA POR INTERVALO Uma estimativa por itervalo de um parâmetro θ é um itervalo da forma : $θ I < θ < $ θ S ode θ $ I e $θ S depedem do valor da estatística θ $ para uma particular amostra e também da distribuição amostral de θ $. 6..4 ESTIMATIVAS PARA A MÉDIA POPULACIONAL µ Uma estimativa potual para a média µ é dada pela estatística : X i i X = = Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
8 ESTATÍSTICA Uma estimativa por itervalo para µ pode ser ecotrada cosiderado a distribuição amostral de X, ou seja : X : N µ, σ, para grade. Z = X- µ σ / Se fixarmos um valor α de probabilidade : α α / α / P (-z < Z < z α/ α/ P -z < X µ α <z σ/ ou aida, P X - z ) = α / α/ = α -z α/ σ < < X + z σ µ α α/ / = 0 α z α/ Podemos, etão dizer que existe -α de probabilidade de que o itervalo acima, chamado de INTERVALO DE CONFIANÇA para µ, coteha o valor verdadeiro do parâmetro µ. OBSERVAÇÕES : ( ) -α é chamado de ível de cofiaça do itervalo e α é o ível de sigificâcia. ( ) O itervalo de cofiaça acima é válido quado o tamaho da amostra é grade e o desvio padrão σ é cohecido. Quado ão cohecemos σ, que é o caso mais geral, substituímos este valor pelo desvio padrão s da amostra, desde que a amostra seja grade. ( 3 ) Se é pequeo e descohecemos σ, etão a estatística usada é : T= X- µ s/ T tem distribuição t de Studet com - graus de liberdade. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
ESTATÍSTICA 9 6..4. Erro e Tamaho da Amostra Se X é usada como uma estimativa de µ, podemos ter (-α ).00 % de cofiaça de que o erro e é meor do que : e < z α/ σ. e e X - z α/ σ X X + z α/ Se X é usada como uma estimativa de µ, podemos ter (-α ).00 % de cofiaça de que o erro é meor do que um valor especificado e quado o tamaho da amostra é : = z α/. σ e σ OBSERVAÇÃO : Quado ão se cohece σ, pode-se estimá-lo através de uma amostra piloto ou através do cohecimeto de σ uma situação semelhate. EXEMPLO Uma máquia eche pacotes de café com uma variâcia igual a 00 g. Ela estava regulada para echê-los com 500 g, em média. Agora, ela se desregulou e queremos saber qual a ova média µ. Uma amostra aleatória de 5 pacotes foi retirada e apresetou uma média igual a 485 g. ( a ) Uma estimativa potual para a média µ é dada pela média amostral : X = 485 g. ( b ) Vamos costruir um itervalo de cofiaça de 95 % ( I.C.) para µ : Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
0 ESTATÍSTICA X = 485 g σ = 00 ( σ = 0) = 5 -α = 0,95 z α/ = z 0,05 =,96 0,05 α = 0,95 0,05 -Z0,05 0 Z0,05 Z -,96,96 P X - z σ < < X+z σ. µ α. = ( α).00% α/ / P( 48,08 < µ < 488,9 ) = 95%. Assim podemos ter 95 % de cofiaça de que o itervalo ( 48,08 ; 488,9) cotem o valor da média µ dos pesos dos pacotes que são echidos por esta máquia. Note que o valor 500g ão está o itervalo, idicado que, de fato, a máquia está desregulada. ( c ) Qual o erro máximo cometido a estimativa de µ este caso? Podemos ter 95% de cofiaça que a média amostral X = 485 difere da média populacioal µ por um valor meor que : e = z α/ σ 0 = 96,. = 39, g. 5 ( d ) Para que este erro seja dimiuído para g, qual deveria ser o tamaho da amostra ecessária para isto ocorrer com 95 % de cofiaça? = z α/. σ e =,96.0 = 96,04 Ou seja, se = 96 podemos ter 95 % de cofiaça que o erro a estimativa de µ seria meor do que g. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
ESTATÍSTICA 6..5 ESTIMATIVAS PARA A PROPORÇÃO Uma estimativa potual para p, uma proporção populacioal, é dada pela estatística : $p = x ode x é o úmero de elemetos a amostra que possuem uma determiada característica e é o tamaho da amostra. Uma estimativa por itervalo para p pode ser ecotrada através da distribuição amostral de, a proporção amostral. $p Sabemos que : $p : N p,, para grade Se fixarmos um valor α de probabilidade : α α / α / Z= p $ - p -z α/ 0 z α/ P(-z < Z < z α/ α/ P z < p-p $ α ou aida : ) = α < z / α/ P p$ - zα < p <p+z $ = α / α/ = α Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
ESTATÍSTICA Como a situação mais comum é ão se cohecer o desvio padrão podemos estimá-lo por : por : $$., Assim, um itervalo de cofiaça de ( - α ).00% para o parâmetro p é dado P p$ - z $ $ < p <p+z $ $ $ = ( ). 00% α/ α/ α ode $p é a proporção amostral, é o tamaho da amostra, $q = - $p e zα/ é o valor da v.a. Z com área de α/ à direita. Podemos dizer, etão, que existe ( - α)00% de cofiaça que o itervalo acima cotem o valor real da proporção p. 6..5. Erro e Tamaho da Amostra Se $p é usado como uma estimativa de p, podemos estar ( - α )00% cofiates de que o erro e será tal que : e < z α/ $$ Se $p é usado como um estimativa de p, podemos estar ( - α )00% cofiates de que o erro será meor do que e quado o tamaho da amostra for : = z α /. $$ e Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
ESTATÍSTICA 3 OBSERVAÇÃO : Como $p já é uma estatística ecotrada a partir da amostra e portato ão cohecida aida, a pior das hipóteses, poderíamos tomar $p = 0,5. Neste caso : / = z α 4e EXEMPLO Numa amostra aleatória de =500 famílias que possuem aparelho de TV uma cidade do Caadá, foi ecotrado que x = 340 possuem TV a cores. ( a ) Uma estimativa potual para a proporção de famílias ( que já possuem TV ) que tem TV a cores é dada por : $p = x =340 500 = 0,68 ( ou 68% ) ( b ) Um itervalo de cofiaça de 95% para a proporção real de famílias esta cidade que possuem TV a cores, dado que possuem TV é : $p = 0,68 = 500 z α/ = z 0,05 =,96 0,05 α = 0,95 0,05 -Z 0 Z 0,05 0,05 -,96,96 Z P p$ - z P 0,68-,96. $ $ < p < p+z $ 0,68.0,3 500 P(0,64 < p < 0,7) = 95% $ $ = ( ). 00% α/ α/ α < p < 0,68-,96. 0,68.0,3 500 = 95% Existe 95% de cofiaça de que o itervalo (0,64 ; 0,7) cotem o valor da proporção p das famílias que possuem TV a cores, dado que possuem TV, esta cidade. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
4 ESTATÍSTICA ( c ) O erro máximo cometido com 95% de cofiaça é : e = p$ - p = z α / $$ = 0,04 ( ou 4% ) ( d ) Qual deve ser o tamaho da amostra para estarmos 95% cofiates de que o erro ao estimarmos p seja meor do que 0,0? = =,96 z α/. $$. 06803,., e 0,0 = 090 ( e ) Se ão for utilizado p = 0,68 como uma estimativa de p, o tamaho da amostra em (d) seria : =,96 4.0,0 = 40. 6..6 ESTIMATIVAS PARA DIFERENÇAS 6..6. Estimativas para difereças etre duas médias Se tivermos duas populações com médias µ e µ e variâcias σ e σ, respectivamete, um estimador potual para a difereça etre µ e µ é dado pela estatística X - X, baseada em amostras idepedetes de cada uma das populações, com tamahos e, respectivamete. Uma estimativa por itervalo pode ser obtida para µ e µ, a partir da distribuição amostral de X - X. Sabemos que, para e suficietemete grades: X X N σ : µ µ, + σ Z = X X ( µ µ ) σ σ + Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
ESTATÍSTICA 5 α α / α / -z α/ 0 z α/ P(z < z < z α/ α/ ) = α P -z < X X ( µ µ ) α/ σ σ + <z α/ = α P (?????) ver apostila Quado e são grades e descohecemos σ e σ, podemos substituir estas variâcias pelas variâcias amostrais s e s. EXEMPLO Um teste sobre esportes foi aplicado a 50 meias e 75 meios. As meias obtiveram média de 76,0 com um desvio padrão de 6, equato que os meios obtiveram média 8,0 com desvio padrão de 8. Ecotre um itervalo de cofiaça de 96% para a difereça µ - µ, ode µ é a média de todos os meios e µ é a média de todas as meias que poderiam fazer este teste. Pop. (meios) X amostra = 75 µ =? X = 8, s = 8 Pop. (meias) X amostra = 50 µ =? X = 76, s = 6 Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
6 ESTATÍSTICA α = 004, α = 096, z = z =, 054 α/ 0,0 σ σ σ σ P X X zα/ + < µ µ < X X + zα/ + = α 6 6 P 8-76 -,054 8 + < µ µ < 8-76 +,054 8 + = 096, 75 50 75 50 P ( 3,4 < µ µ < 8,58 ) = 0,96 Existe 96% de cofiaça de que o itervalo costruído coteha a difereça etre as médias reais µ µ das otas de meios e meias. 6..6. Estimativas para Difereças etre Duas Proporções Cosidere duas amostras idepedetes selecioadas de duas populações biomiais com parâmetros p e p, respectivamete. Uma estimativa potual para a difereça etre duas proporções p - p é dada pela estatística $p - $p ode $p e $p são proporções amostrais. Uma estimativa por itervalo para a difereça etre as duas proporções é obtida através da distribuição amostral da difereça de duas proporções. Sabemos que : p$ p $ : N p p, + p$ -p$ -(p-p ) e Z = + P(-z < Z < z α/ α/ P -z α/ < P p$ - p$ ) = α p$ -p$ -(p -p ) + < z α/ zα + < p p < p$ -p$ + zα/ + / = α = α Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
ESTATÍSTICA 7 O desvio padrão da distribuição amostral poderá ser estimado por $ $ $ $ +. EXEMPLO Sejam p e p as proporções reais de defeitos de um processo já existete e de um ovo processo, respectivamete. Uma amostra aleatória de cada processo foi retirada com = 500 e = 000, obtedo-se : p $ = X p $ = X = = 75 500 = 0,05 e 80 000 = 0,04 Uma estimativa potual para p - p, a difereça etre as duas proporções pesquisadas é $p - $p = 0,05-0,04 = 0,0. Um itervalo de cofiaça de 90% para p - p é dado por : P 0,0 -,65 0,05.0,95 004096,., + < p p < 0,0 +,65 0,05.0,95 004096,., + = 090, 500 000 500 000 P( - 0,007 < p p < 0,07 ) = 0,90 Existe 90 % de cofiaça de que o itervalo costruído cotem a difereça etre as duas proporções p - p de defeitos dos processos. Observe que o zero está este itervalo. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
8 ESTATÍSTICA 6.3 TESTES DE HIPÓTESES 6.3. INTRODUÇÃO Um importate tipo de problema em Iferêcia Estatística é determiar se uma amostra pode ter vido de uma população tedo uma distribuição parcial ou completamete especificada. Por exemplo, se sabemos que uma amostra veio de uma distribuição ormal, é razoável dizer que ela veio de uma distribuição com média µ 0? Ou, se duas amostras vieram de distribuições ormais, é razoável dizer que estas vieram de distribuições que têm médias iguais? Como estatísticas como estas são v.a s que têm suas próprias distribuições de probabilidade, afirmações sobre seus parâmetros devem ser feitas em termos de probabilidade. 6.3. HIPÓTESE ESTATÍSTICA Uma hipótese estatística é uma afirmação sobre a distribuição (ou parâmetros) de uma ou mais variáveis aleatórias. Uma hipótese estatística pode ser verdadeira ou ão. Por exemplo, supoha que X seja a média de uma amostra de tamaho retirada de uma distribuição N (µ, σ ), ode σ é cohecida e µ é descohecida. Supoha que se deseje verificar se é razoável que esta amostra teha vido de uma população N (µ 0, σ ) cosiderado a possibilidade de que esta poderia ter vido de alguma distribuição ormal N (µ, σ ), ode µ µ 0. Podemos abreviar esta questão dizedo que desejamos testar a hipótese estatística : H 0 : µ = µ 0 cotra a alterativa H : µ µ 0 usado a amostra de tamaho e a média X. H 0 é chamada de Hipótese Nula e H é chamada de Hipótese Alterativa. 6.3.3 ERROS DO TIPO I E TIPO II Em um teste de hipótese podem ocorrer dois tipos de erros : ERRO TIPO I : rejeitar H 0 quado H 0 é verdadeira. ERRO TIPO II :aceitar H 0 quado H 0 é falsa. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
ESTATÍSTICA 9 EXEMPLO (Meyer) Um fabricate vem produzido pios para serem utilizados sob determiadas codições de trabalho. Verificou-se que a duração de vida ( em horas) desses pios é N (00,9). Um ovo esquema de fabricação foi itroduzido com o objetivo de aumetar a duração de vida desses pios. Quer dizer, a expectativa é que a duração de vida X terá distribuição N ( µ, 9) ode µ > 00. ( Admita que a variâcia cotiua a mesma ). Deste modo, o fabricate e o comprador potecial desses pios estão iteressados em testar as seguites hipóteses : H 0 : µ = 00 H : µ > 00 ( estamos supodo que osso processo ão pode ser pior que o atigo ) ERRO TIPO I : Rejeitamos que a média seja 00 quado a realidade ão houve melhora a qualidade dos pios ( a realidade a média cotiua sedo 00). ERRO TIPO II : Aceitamos que a média é 00 ( o processo cotiua o mesmo ) quado a realidade a qualidade dos pios melhora ( a média é > 00). As probabilidades dos dois tipos de erros serão α e β, respectivamete. A probabilidade α do ERRO TIPO I é chamado de NÍVEL DE SIGNIFICÂNCIA. Estas probabilidades, codicioadas à realidade estão resumidas o quadro abaixo : Decisão Aceitar H 0 Rejeitar H 0 H 0 verdadeira Decisão Correta - α Erro Tipo I α Realidade H 0 falsa Erro Tipo II β Decisão Correta -β 6.3.4 TESTE DE HIPÓTESE Um teste de hipótese estatística é uma regra geral tal que, quado os valores de uma amostra são obtidos, leva à decisão de aceitar ou rejeitar a hipótese cosiderada. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
30 ESTATÍSTICA 6.3.5 REGIÃO CRÍTICA ( R.C. ) A faixa de valores da variável de teste que leva à rejeição de H 0 é deomiada região crítica do teste. A faixa restate é chamada de região de aceitação (R.A.). OBSERVAÇÕES : ( ) Os erros do tipo I e II estão relacioados. Um decréscimo a probabilidade de um geralmete resulta um acréscimo a probabilidade do outro. ( ) O tamaho da região crítica, e portato a probabilidade de cometer um erro do tipo I, pode sempre ser reduzida ajustado os valores críticos. ( 3 ) Um acréscimo o tamaho da amostra reduzirá α e β simultaeamete. ( 4 ) Se a hipótese ula é falsa, β atige o máximo quado o valor verdadeiro de um parâmetro está perto do valor hipotetizado. Quato maior a distâcia etre o valor verdadeiro e o valor hipotetizado, meor será β. 6.3.6 TESTE UNILATERAL E TESTE BILATERAL Um teste de uma hipótese estatística ode a hipótese alterativa H é uilateral como : H 0 : θ = θ 0 H : θ > θ 0 ou H 0 : θ = θ 0 H : θ < θ 0 são chamados de TESTES UNILATERAIS. A região crítica para a hipótese alterativa θ > θ 0 cai iteiramete a cauda direita da distribuição, equato que para a hipótese alterativa θ < θ 0 a região crítica cai à esquerda. R.A. R.A. α α α α z α θ -z α Um teste de hipótese ode a hipótese alterativa H é bilateral tal como : θ Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
ESTATÍSTICA 3 H 0 : θ = θ 0 H : θ θ 0 É chamado de TESTE BILATERAL R.A. α α / α / -z α/ z α/ θ A costrução de teste de hipótese para um parâmetro populacioal pode ser colocada do seguite modo. Existe uma v.a. X em uma dada população. Tem-se uma hipótese sobre determiado parâmetro θ dessa população. O objetivo do teste de hipótese é dizer, através de uma estatística θ $ obtida de uma amostra, se a hipótese H 0 é aceitável ou ão. Operacioalmete, isto é coseguido através de uma região Caso o valor da estatística do teste perteça a esta região, rejeitamos H 0, caso cotrário, ão rejeitamos H 0. Esta região é costruída de modo que P( $θ / H0 é verdadeira) = α sedo α um valor fixado, geralmete 5%, % ou 0,%. 6.3.7 PASSOS PARA A CONSTRUÇÃO DE UM TESTE DE HIPÓTESE. Fixe qual a hipótese H 0 a ser testada e qual a hipótese alterativa H.. Use a teoria estatística e as iformações dispoíveis para decidir qual estatística ( estimador) será usada para julgar a hipótese H 0. 3. Fixe a probabilidade α de cometer o erro do tipo I, e use este valor para costruir a região Lembre que esta região é costruída para a estatística defiida o segudo passo, usado os valores hipotetizados por H 0. 4. Use as iformações forecidas pela amostra para ecotrar o valor da estatística que levará à decisão. 5. Se o valor da estatística observado a amostra pertece à região crítica (), rejeite H 0, caso cotrário, ão rejeite H 0. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
3 ESTATÍSTICA 6.3.8 O VALOR DE p Quado realizamos um teste estatístico e verificamos que o valor da estatística do teste cai a, dizemos que o resultado do teste é estatisticamete sigificate ( rejeitamos H 0 ). Por exemplo, se um teste para o qual o ível de sigificâcia especificado é α = 0,05 e o teste é bilateral, etão a fica defiida como o gráfico abaixo, cosiderado que a distribuição Normal seja idicada. 0,05 0,95 0,05 p -,96 0,96 Quado realizamos um teste através de um programa computacioal de Estatística ecotramos, além do valor da estatística calculado, o valor de p (ível p) que é a probabilidade de se cometer o erro do tipo I, associado ao valor calculado da estatística. No exemplo acima, p = 0,004 é a probabilidade de Z >,9. Como p < 0,05, este caso, dizemos que o resultado é sigificate e rejeitamos H 0. Tipicamete, em muitas Ciêcias, resultados que produzem p 0,05 são cosiderados estatisticamete sigificates, mas lembre que este ível de sigificâcia aida evolve uma probabilidade de erro razoavelmete grade ( 5%). Resultados que são sigificates ao ível de p 0,0 são estatisticamete sigificates e íveis de p 0,005 ou p 0,00 cosiderados altamete sigificates. Estas classificações são meramete arbitrárias e são coveções iformalmete baseadas em experiêcia de pesquisa de modo geral.,9 Z 6.3.9 TESTE SOBRE A MÉDIA DE UMA POPULAÇÃO COM VARIÂNCIA CONHECIDA Cosidere o problema de testar a hipótese de que a média µ de uma população com variâcia cohecida σ, é igual a um valor especificado µ 0 cotra a alterativa bilateral de que a média ão é igual a µ 0 :. H 0 : µ = µ 0. H : µ µ 0 Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
ESTATÍSTICA 33 3. Uma estatística apropriada sobre a qual baseamos osso critério de decisão é a v.a. X. Já sabemos que X : N ( µ, σ / ) e que Z = X- µ. σ / 4. Se usamos o ível de sigificâcia α, é possível ecotrar dois valores críticos x e x tais que x < X < x defie a região de aceitação e as duas caudas da distribuição X > x e X > x costituem a região crítica A região crítica pode ser dada em termos de valores de Z fazedo : Z = x- µ 0 σ / 5. Portato, para um ível de sigificâcia α, a é defiida por : R.A. α α / α / x -z α/ z α/ x X Z 6. Da população, selecioamos uma amostra aleatória da tamaho e calculamos a média X e o valor de Z correspodete, sob H 0 verdadeira, isto é : Z = X µ 0 σ / 7. Se X da amostra ( ou Z calculado) cair a região crítica cocluímos que H 0 será rejeitada, ou seja, aceitamos que µ µ 0. OBSERVAÇÃO : O procedimeto de teste descrito acima é equivalete a ecotrar um itervalo de cofiaça de ( - α ).00% para µ e aceitar H 0 se µ 0 cair o itervalo. Se cair fora do itervalo, rejeitamos H 0 em favor da hipótese alterativa H. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
34 ESTATÍSTICA EXEMPLO Um fabricate de material esportivo desevolve uma ova liha de pesca sitética sobre a qual ele afirma que tem resistêcia média à ruptura de 8 Kg com um desvio padrão de 0,5 Kg. Teste a hipótese de que µ = 8 Kg, cotra a hipótese de que µ 8 Kg, se uma amostra de 50 lihas foi testada e apresetou uma média de resistêcia à ruptura de 7,8 Kg. Use um ível de 0,0 de sigificâcia. Solução : o ) H o : µ = 8 H : µ 8 o ) X : N( µ, σ / ). Se H 0 é verdadeira, X : N ( 8 ; 0,5 /50 ) 3 o ) Para α = 0,0 a será dada por Z < -,575 ou Z >,575 R.A. α 0,005 0,005 -,88 8 -,575 0,575 X Z 4 o ) X = 7,8 = 50 Z = X µ 0 = 7,8-8 σ / 05, / 50 = -,88 5 o ) Coclusão : Rejeitamos H 0 e cocluímos que a resistêcia média à ruptura ão é igual a 8 Kg. Esta média é meor do que 8 Kg. O valor de p este caso é de p = 0,0040 ou seja meor do que 0,005. 6.3.0 TESTE PARA PROPORÇÃO Temos uma população e temos como hipótese sobre a proporção p de elemetos portadores de uma característica. o ) H 0 : p = p 0 Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
ESTATÍSTICA 35 O problema forece iformações sobre a alterativa, que pode ter uma das 3 formas : H : p p 0 ( bilateral ) H : p > p 0 ( uilateral à direita ) H : p < p 0 ( uilateral à esquerda ) o ) A estatística a ser usada é $p, a proporção da amostra. Sabemos que : $p : N p, 3 o ) Fixado um valor de α, devemos costruir a para p a suposição de que os parâmetros defiidos em H 0 sejam verdadeiros. Assim : p $ : N p, 0 $ Z = p-p 0 0 0 0 0 e α / α / -z α/ R.A. α p z 4 o ) Calculamos o valor $p da amostra e o correspodete valor de Z. α/ p Z 5 o ) Rejeitamos H 0 se o valor de Z calculado cair a, caso cotrário, aceitamos H 0. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
36 ESTATÍSTICA EXEMPLO Um caçador de faisão afirma que ele acerta 80% dos pássaros em que ele atira. Você cocorda com esta afirmação se um dia qualquer ele acerta 9 dos 5 pássaros em que ele atira? Use 0,05 como ível de sigificâcia. Solução : o ) H 0 : p = 0,8 H : p 0,8 o ) $p = N p, 5 3 o ) Para α = 0,05 a região crítica fica defiida por valores de Z tais que Z < -,96 ou Z >,96. Sob a hipótese ula H 0 : $p : N 0,8, 0,8.0, 5 R.A. 0,05 0,95 0,05 -,96 0,96 4 o ) Da amostra tiramos que : Z p $ = 9 5 e Z = p-p $ 0 0 0 = 9 5-0,8 0,8.0, 5 = -,94 5 o ) Não rejeitamos H 0 e cocluímos que ão há razão para duvidar da afirmação do caçador. 6.3. TESTE PARA DIFERENÇA ENTRE DUAS PROPORÇÕES É comum termos que testar a hipótese de que duas proporções p e p são iguais. O procedimeto de teste é o seguite : o ) H 0 : p = p ( ou p - p = 0) Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
ESTATÍSTICA 37 H : p p ( bilateral ) ou H : p > p ( uilateral à direita ) ou H : p < p ( uilateral à esquerda ) o ) A estatística a ser usada é $p - $p. p$ - p $ : N p -p, 3 o ) Fixado α e sob H 0 : + Z = p$ -p$. $ $ + R.A. α α / α / -z α/ z α/ Z 4 o ) Calcule : p $ = x e p $ = x p $ = x + x + Z = p$ -p$. $ $ + EXEMPLO Uma votação será feita etre os residetes de uma cidade e a região rural ao redor desta cidade para determiar se um projeto químico deverá ser costruído. A costrução é detro dos limites da cidade e por esta razão muitos eleitores do campo setem que o projeto passará por causa da grade proporção dos eleitores da cidade, os quais são favoráveis. Para determiar se existe difereça sigificate a proporção de eleitores da cidade e do campo a favor do projeto, uma amostragem foi feita. Se 0 de 00 eleitores da cidade são a favor do projeto e 40 de 500 eleitores do campo são a favor, você cocordaria que a proporção de eleitores da cidade favoráveis ao projeto é Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
38 ESTATÍSTICA maior do que a proporção de eleitores do campo favoráveis ao projeto? Use α = 0,05. Solução : o ) H 0 : p = p H : p > p (uilateral) o ) α = 0,05 Região Crítica : R.A. 0,975 0,05,96 Z 3 o ) Cálculos : p $ = x p $ = x p $ = x + x + Assim : Z = = 0 00 = 0,6 = 40 00 = 0,48 = 0,6-0,48 0 + 40 00 + 500 = 0,5 0,5.0,49. + 00 500 = 9, 4 o ) Coclusão : Rejeitamos H 0 ( p = p ) e cocordamos que a proporção de eleitores da cidade favoráveis ao projeto é maior de que a proporção de eleitores do campo favoráveis ao projeto. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
ESTATÍSTICA 39 6.3. TESTE PARA DIFERENÇAS ENTRE DUAS MÉDIAS ( Variâcias Cohecidas ) Se µ e µ são as médias de duas populações, podemos testar a hipótese de que elas sejam iguais. O procedimeto é o seguite : o ) H 0 : µ = µ (µ - µ = 0) H : µ µ ( bilateral ) ou H : µ > µ ( uilateral à direita ) ou H : µ < µ ( uilateral à esquerda ) o ) A estatística a ser usada é X - X. X - X = N µ - µ, 3 o ) Fixado α e sob H 0 : σ σ + Z = X-X σ σ + R.A. α α / α / -z α/ z α/ Z 4 o ) Calculamos as médias X e X e o valor de Z. 5 o ) Rejeitamos H 0 se o valor de Z calculado cair a, caso cotrário aceitamos H 0. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR
40 ESTATÍSTICA EXEMPLO Um experimeto foi realizado para comparar o desgaste abrasivo de dois diferetes materiais lamiados. A variâcia da medida do desgaste (codificado) é cohecida como sedo 6 para o material e 5 para o material. No experimeto, 0 peças do material foram testadas, expodo cada peça a uma máquia e medido o desgaste e 30 peças do material foram testadas da mesma forma. Em cada caso, a profudidade do desgaste foi observada. A amostra do material deu uma média (codificada) de 85 uidades, equato que a amostra do material deu uma média de 8. Teste, ao ível de sigificâcia de 0,0, a hipótese de que os dois tipos de materiais apresetam a mesma média de desgaste abrasivo. o ) H 0 : µ = µ H : µ µ (uilateral) o ) α = 0,0 Região Crítica : Z < = -,96 e Z >,96. 3 o ) Cálculos : X = 85 e X = 8, = 0 e = 30, σ = 4 e σ = 5. Z = X-X σ σ + = (85 8) / (6/0 + 5/30) = 3,98 4 o ) Coclusão : Rejeitamos H 0 e cocluímos, ao ível de 0% de sigificâcia, que as médias de desgaste abrasivo ão é a mesma para os dois tipos de materiais. O material apreseta uma média sigificativamete maior de desgaste do que o material. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR