Cap. 5. Testes de Hipóteses Neste capítulo será estudado o segudo problema da iferêcia estatística: o teste de hipóteses. Um teste de hipóteses cosiste em verificar, a partir das observações de uma amostra, se uma afirmação (deomiada hipótese) sobre a distribuição de uma ou mais variáveis de determiada população em estudo verdadeira ou ão. Se a hipóteses se refere a um ou mais parâmetros de uma população, o teste é deomiado teste paramétrico. Se a hipótese é acerca da atureza da distribuição de uma variável da população em estudo, o teste é deomiado teste ão paramétrico. 5.1. CONCEITOS BÁSICOS Para eteder os procedimetos de um teste de hipóteses, serão apresetados a seguir algus coceitos básicos. 5.1.1. Hipótese ula e hipótese alterativa Deomia-se hipótese ula uma hipótese formulada com o ituito de ser testada sedo deotada por H. A hipótese alterativa é a hipótese cosiderada se as iformações da amostra forecerem iformações que levem à rejeição da hipótese ula. Por exemplo, supoha que o preço médio de certo artigo uma localidade teha sido historicamete igual a R$12,. Deseja-se saber se o preço do artigo caiu após a etrada de um artigo cocorrete o mercado da localidade. Neste caso formula-se as seguites hipóteses: H : = 12; H 1 : < 12. Ao se desevolver um teste de hipóteses supõe-se iicialmete que a hipótese ula seja verdadeira 5.1. Erro do tipo I e erro do tipo II Como a decisão em aceitar ou rejeitar H se baseia apeas as iformações de uma amostra da população, é possível cometer um dos seguites erros: a) Erro do tipo I ou de primeira espécie: cosiste em rejeitar uma hipótese ula verdadeira. b) Erro do tipo II ou de seguda espécie: cosiste em aceitar uma hipótese ula falsa. Como estes erros são ievitáveis, aturalmete um bom teste deve-se miimizar a probabilidades de se cometer estes erros. Como o erro do tipo I é o mais sério, em geral preocupa-se apeas com a probabilidade de se cometer este tipo de erro e o teste passa a ser deomiado teste de sigificâcia. 5.1.3. Nível de sigificâcia de um teste Deomia-se ível de sigificâcia a probabilidade de se cometer um erro do tipo I. O ível de sigificâcia é especificado ates de se aplicar o teste. Usualmete seus valores são 1% ou 5%. 5.1.4. Teste uilateral e teste bilateral Com relação ao exemplo acima, a hipótese alterativa era H 1 : < 12. Neste caso o teste é uilateral. Um teste uilateral pode ser esquerdo (como o exemplo em foco) ou direito, se a hipótese ula fosse H 1 : > 12. Se a hipótese ula fosse H 1 : 12, o teste seria bilateral. 5.1.5. Variável de teste Deomia-se variável teste uma variável aleatória que é fução das observações da amostra, utilizada para a tomada de decisão em aceitar ou rejeitar H. 5.1.6. Região de aceitação e região crítica
2 O estabelecimeto do ível de sigificâcia divide o domíio da variável de teste um duas regiões. Uma destas regiões é costituída de valores da variável teste que levam à aceitação de H. Esta região é deomiada região de aceitação. A outra região é costituída do cojuto de valores da variável de teste que levam à rejeição de H, deomiada região crítica. Os limites que separam a região de aceitação da região de rejeição são deomiados valores críticos. Num teste uilateral existe apeas um valor crítico e o caso de um teste bilateral existem dois valores críticos simétricos em relação ao valor esperado da variável de teste. 5.1.7. Valor da prova (p-valor) Dado um valor da variável teste obtido a partir de uma determiada amostra, deomiase valor da prova como a probabilidade de se ecotrar outra amostra que foreça uma estatística de teste tão ou mais extrema do que o existete. 5.2. Costrução de um teste de sigificâcia a prática Em lihas gerais, a costrução de um teste de hipóteses costa das seguites etapas: a) Formular as hipóteses H e H 1. b) Escolher a estatística de teste. c) Arbitrar/fixar o ível de sigificâcia. d) Determiar a regiões de aceitação de H e a região crítica a partir do ível de sigificâcia arbitrado em (c). e) Decidir se aceita ou rejeita H em com base o valor da variável de teste calculado a partir da amostra e a região crítica. 5.3. Tomada de Decisão em um Teste de Hipóteses Existem três procedimetos para se decidir se aceita ou rejeita H. Estes procedimetos serão apresetados a seguir. 5.3.1. Valor da variável de teste Calcula-se o valor da variável teste a partir dos dados da amostra e adota-se a seguite regra de decisão: se o valor da variável teste pertece à região de aceitação aceita-se H o ível de sigificâcia adotado; caso cotrário rejeita-se H. Este procedimeto pode ser utilizado para testes paramétricos e ão paramétricos. 5.3.2. Itervalo de cofiaça Costrói-se um itervalo de cofiaça para o parâmetro (ou combiação de parâmetros: difereça de parâmetros, razão de parâmetros) testado e adota-se a seguite regra de decisão: se o itervalo de cofiaça costruído cotiver o valor do parâmetro (ou da combiação de parâmetros) suposto a hipótese ula aceita-se H ; caso cotrário rejeita-se H o ível de sigificâcia adotado. O ível de cofiaça deste itervalo é = 1. 5.3.3. Valor da prova (p-valor) Utiliza-se a distribuição de probabilidade da variável teste para calcular o valor da prova e adota a seguite regra de decisão: se o valor da prova for maior ou igual ao ível de sigificâcia aceita-se H ; caso cotrário rejeita-se H o ível de sigificâcia adotado. 5.4. Testes para uma Amostra 5.4.1. Teste de Hipóteses para a Média Populacioal No caso do teste da média de uma população, as hipóteses são:
3 H : x (testebilateral) H : x H1 : (testeuilateral esquerdo) H : x H1 : (testeuilateral direito) Nas hipóteses acima, é valor de sob a hipótese ula H. Se a população da variável X tem distribuição ormal, com desvio padrão populacioal cohecido, a variável de teste é a variável ormal padroizada X Z ~ N(,1) Se o desvio padrão da população ão é cohecido, como ocorre a maioria dos problemas, a variável teste é a variável padroizada X T ~ t S 1 (5.2) ode S é o estimador de. Existem três formas de se testar hipóteses, todas levado ecessariamete à mesma coclusão. a) Testes de Sigificâcia: a.1) Quado o desvio padrão populacioal é cohecido: Teste bilateral (H 1 : ): Dado o ível de sigificâcia fixado α, calcular o valor crítico a partir de, (5.1) sedo tal que. Obtemos etão dois valores críticos: e. A região crítica é dada por Regra de decisão: rejeitar H se (equivalete à desigualdade ; aceitar H em caso cotrário. Teste uilateral esquerdo (H 1 : ): Dado o ível de sigificâcia fixado α, calcular o valor crítico a partir de. Obtemos etão o valor crítico:. A região crítica é dada por Regra de decisão: rejeitar H se (equivalete à desigualdade ; aceitar H em caso cotrário. Teste uilateral direito (H 1 : ): Dado o ível de sigificâcia fixado α, calcular o valor crítico a partir de. Obtemos etão o valor crítico:. A região crítica é dada por
4 Regra de decisão: rejeitar H se (equivalete à desigualdade ; aceitar H em caso cotrário. a.2) Quado o desvio padrão populacioal é descohecido: Teste bilateral (H 1 : ): Dado o ível de sigificâcia fixado α, calcular o valor crítico a partir de sedo tal que. Obtemos etão dois valores críticos: e. A região crítica é dada por Regra de decisão: rejeitar H se ; aceitar H em caso cotrário., (equivalete à desigualdade Teste uilateral esquerdo (H 1 : ): Dado o ível de sigificâcia fixado α, calcular o valor crítico a partir de. Obtemos etão o valor crítico:. A região crítica é dada por Regra de decisão: rejeitar H se ; aceitar H em caso cotrário. (equivalete à desigualdade Teste uilateral direito (H 1 : ): Dado o ível de sigificâcia fixado α, calcular o valor crítico a partir de. Obtemos etão o valor crítico:. A região crítica é dada por Regra de decisão: rejeitar H se (equivalete à desigualdade ; aceitar H em caso cotrário. Observação: Os valores costates os cabeçalhos da tabela t são iguais ao ível de sigificâcia o caso de testes bilaterais e iguais ao dobro do ível de sigificâcia o caso de testes uilaterais. b) Por Itervalos de Cofiaça: Utilizado a distribuição amostral de (equações 5.1 ou 5.2), podemos costruir itervalos de cofiaça ui e bilaterais. b.1) Quado o desvio padrão populacioal é cohecido: Teste bilateral (H 1 : ): Temos que
5 Logo, aceitamos H se o itervalo abaixo cotém o valor e rejeitamos H em caso cotrário Teste uilateral esquerdo (H 1 : ): Temos que. (5.3) Aceitamos H se o itervalo abaixo cotém o valor e rejeitamos H em caso cotrário. (5.4) Teste uilateral direito (H 1 : ): Temos que Aceitamos H se o itervalo abaixo cotém o valor de μ e rejeitamos caso cotrário. (5.5) b.2) Quado o desvio padrão populacioal σ for descohecido: Teste bilateral (H 1 : ): Temos que Logo, aceitamos H se o itervalo abaixo cotém o valor e rejeitamos H em caso cotrário Teste uilateral esquerdo (H 1 : ): Temos que. (5.6)
6 Aceitamos H se o itervalo abaixo cotém o valor e rejeitamos H em caso cotrário. (5.7) Teste uilateral direito (H 1 : ): Temos que Aceitamos H se o itervalo abaixo cotém o valor de μ e rejeitamos caso cotrário. (5.8) c) Valor da prova: a regra de decisão um ível de sigificâcia é a seguite: Teste bilateral (H 1 : ): rejeitar H o ível de sigificâcia cosiderado se (ou ) e aceitar H em caso cotrário. Teste uilateral esquerdo (H 1 : ): rejeitar H o ível de sigificâcia cosiderado se (ou e aceitar H em caso cotrário. Teste uilateral direito (H 1 : ): rejeitar H o ível de sigificâcia cosiderado se (ou ) e aceitar H em caso cotrário. Exemplo 5.1. O INMETRO decidiu ispecioar pacotes de café de 5g de um a determiada marca. Aceita-se como razoável um desvio-padrão de 3g. Após pesar 25 uidades selecioadas em diversos mercados, chegou-se a uma média amostral de 52g. Pode-se afirmar o peso médio do produto atede às especificações? Use um ível de cofiaça de 95%. Solução: O desvio-padrão é defiido à priori, logo cohecido. O teste de hipótese a ser realizado é: A estatística de teste é dada por A região de aceitação do teste é o itervalo (-1.96,1.96). Como o valor de ão pertece à região de aceitação, rejeitamos H, a um ível de 5% de sigificâcia. Portato, o peso médio das embalages é diferete de 5g. O p- valor do teste é dado por. O itervalo de cofiaça para a verdadeira média é dado por 325=5.8,53.2 ão cotém o valor testado (5g). Portato, utilizado as três formas de testes, chegamos à mesma coclusão. Exemplo 5.2. Supõe-se que o preço de determiado artigo os potos de veda de certa localidade tem distribuição ormal com média igual a R$15, e desvio padrão igual a R$1,. Suspeita-se que, devido ao aumeto da demada, o preço do referido artigo teha aumetado a região. Para verificar se isto ocorreu, um pesquisador aalisou os preços deste artigo em 4 potos de veda da localidade, escolhidos aleatoriamete, costatado que os potos de veda pesquisados o preço médio do artigo é R$11,. Qual é a coclusão do pesquisador, admitido-se um ível de sigificâcia de 5%? Utilize o valor da variável teste, o itervalo de cofiaça e o valor da prova.
7 Solução Seja X a variável aleatória que associa a cada poto de veda a localidade. As hipóteses do teste são: H : = 15; H 1 : > 15. A hipótese ula H cosidera que o aumeto da demada ão provocou aumeto do preço equato que a hipótese alterativa H 1 admite que o aumeto da demada provocou aumeto do preço. Como X tem distribuição ormal, a variável de teste é a variável ormal padroizada Z sedo seu valor dado por x z ode x 11, 15 e = 1. Com estes dados tem-se que z 11 15 3,16 1 4 O gráfico a seguir ilustra as regiões de aceitação e de rejeição de H ( z, 5= 1,64). Figura 5.1 a) Se for utilizado o valor da variável de teste para a tomada de decisão a regra de decisão é a seguite: rejeitar H o ível de sigificâcia de 5% se z > z, 5 e rejeitar H em caso cotrário. Observado-se a figura 5.1 tem-se da tabela do apêdice 1 que z, 5= 1,64. Como o valor da variável teste está a região crítica (z = 3,16), rejeita-se H o ível de sigificâcia de 5%, cocluido-se que o aumeto da demada provocou aumeto do preço do artigo a localidade. b) Se for utilizado o itervalo de cofiaça para a tomada de decisão deve-se costruir um itervalo de cofiaça para o preço médio a localidade. Sedo o desvio padrão populacioal cohecido este itervalo é x z, O itervalo de cofiaça uilateral de 95% para o preço médio a localidade é 11 1,64* 1, R $17,41; 4 Como o este itervalo ão cotém o preço médio a localidade suposto em H (=R$15,), rejeita-se a hipótese ula o ível de sigificâcia de 5% cocluido-se que o aumeto da demada causou aumeto do preço do artigo a localidade. c) Utilizado-se o valor da prova para um teste uilateral direito tem-se que:
8 valor da prova = P(Z > z) ode z é o valor da variável teste que este caso é 3,16. Etão valor da prova = P(Z > 3,16) =,8 Como o valor da prova (,8) é meor do que o ível de sigificâcia (,5) rejeitase H o ível de sigificâcia de 5% cocluido-se que o aumeto da demada causou aumeto do preço do artigo a localidade. Exemplo 5.3. O tempo gasto pelos operários a motagem de determiado equipameto produzido por uma empresa tem distribuição ormal com média igual a 85 miutos. Os operários foram submetidos a um processo de reciclagem com o objetivo de melhorar a produtividade. Para verificar se isso ocorreu, o pesquisador observou o tempo gasto a motagem de 5 uidades deste equipameto, escolhidas ao acaso a liha de produção, obtedo os seguites valores, em miutos: 81, 84, 82, 78, 77, 83, 79, 79, 76, 85. Cosiderado-se um ível de sigificâcia de 5%, pode-se afirmar que após a reciclagem dos operários houve aumeto da produtividade? Solução As hipóteses do teste são: H : = 85 x H 1 : < 85 A hipótese ula H cosidera que a produtividade dos operários ão aumetou equato que a hipótese alterativa H 1 admite que a produtividade dos operários aumetou porque acreditase que após a reciclagem os operários gastam em média meos tempo para motar o equipameto em coseqüêcia do aumeto da produtividade dos mesmos. Neste caso, sedo descohecido o desvio padrão populacioal, a estatística de teste é a variável T sedo seu valor dado por X T S ode e s x Pelos dados do problema tem-se que =1 e Etão temos que i 1 i1 x 1 2 i x i i1 x i 2 ( 1) e s=4.1. Logo, temos que 8,4 85 t 4,69 3,1 1 Esta variável teste tem distribuição t de Studet com = 1 = 1 1 = 9 graus de liberdade. O gráfico a seguir ilustra a esta situação para o ível de sigificâcia de 5%.
9 Figura 5.11 Na tabela do apêdice 2 obtém-se o cruzameto da liha = 9 e colua 4 (o caso de teste uilateral o valor do cabeçalho da tabela é o dobro do ível de sigificâcia), obtém-se t, 5 =1,83. a) Se for utilizado o valor da variável teste para a tomada de decisão, costata-se pelo gráfico acima que o valor da variável teste (t = 4,69) pertece à região de rejeição (-,1.83) e portato a decisão é de rejeitar a hipótese ula o ível de sigificâcia de 5%, cocluido-se que após a reciclagem o tempo gasto pelos operários a motagem do equipameto dimiuiu. b) Se for utilizado o itervalo de cofiaça para a tomada de decisão deve-se costruir um itervalo de cofiaça para o tempo médio gasto a motagem do equipameto. Sedo o desvio padrão populacioal descohecido, o itervalo de cofiaça de 95% para o tempo gasto pelos operários é 3,1, x t S, 1 ;8,4 1,83* ;82,2 1 Como o este itervalo ão cotém o tempo médio suposto em H (=85) gasto a motagem do equipameto, rejeita-se a hipótese ula o ível de sigificâcia de 5% cocluido-se que após a reciclagem dos operários o tempo gasto pelos operários a motagem do equipameto dimiuiu. c) Utilizado-se o valor da prova para um teste uilateral esquerdo tem-se que valor da prova = P(T 9 < t) = P(T 9 < 4,69)=.6% (usado algum software) Observado a tabela do apêdice 2 a liha = 9 costata-se que o valor 4,69 (o sial foi descosiderado porque a distribuição t é simétrica) está etre 3,25 (colua,995) e 4,78(colua,9995), cocluímos que P(T<-4.69)<.5. Assim sedo, rejeita-se H o ível de sigificâcia de 5% cocluido-se que o após a reciclagem o tempo gasto a motagem do equipameto dimiuiu. 5.4.2. Teste de hipóteses para a Proporção Populacioal Admitiremos aqui que amostragem é feita com reposição ou amostragem sem reposição de uma população ifiita ou população fiita muito maior que a amostra. Seja <π<1 a probabilidade de sucesso de um eveto de iteresse. As hipóteses deste tipo de teste são: H :
1 ( teste bilateral ) H 1 : (testeuilateral esquerdo) (testeuilateral direito) ode é o valor de sob a hipótese H. Dada uma amostra aleatória de tamaho, X 1, X 2,...,X, ode cada X i assume 1 (se sucesso ocorre) ou (se fracasso ocorre), seja P a proporção amostral (º de sucessos /º de ites), dada por Sob a hipótese ula, a proporção amostral P, o caso de grades amostras (3), tem distribuição aproximadamete ormal com média e desvio padrão ( 1 ) P Nesta codição, a variável de teste é a variável ormal padroizada P Z (5.9) ( 1 ) Para se decidir se aceita ou rejeita H adota-se os mesmos procedimetos do teste para a média populacioal. Teste bilateral (H 1 : ): O itervalo de cofiaça bilateral de ível 1(1-α)% para a tomada de decisão é dado por (5.1) Logo, aceitamos H se o itervalo acima cotém o valor e rejeitamos H em caso cotrário. Teste uilateral esquerdo (H 1 : ): Temos que Aceitamos H se o itervalo abaixo cotém o valor e rejeitamos H em caso cotrário. (5.11) Teste uilateral direito (H 1 : μ e rejeitamos caso cotrário ): Aceitamos H se o itervalo abaixo cotém o valor de. (5.12) Observação: No caso de teste da proporção usa-se o valor da proporção populacioal suposto em H ( ). Exemplo 5.4. Numa liha de produção, 1% dos ites de certo artigo apresetam defeitos de fabricação. Com o objetivo de reduzir este percetual, o produtor ivestiu a melhoria da qualidade do artigo. Para verificar se houve redução do percetual de ites defeituosos a liha de produção, foi observada uma amostra de 2 ites da produção, costatado-se que 12 ites são defeituosos. Pode-se afirmar que houve redução do percetual de ites defeituosos a liha de produção? Cosidere um ível de sigificâcia de 5%. Solução As hipóteses do teste são: H : =.1; H 1 : <.1.
11 A hipótese ula H cosidera que o ivestimeto a melhoria da qualidade do produto ão reduziu a proporção de ites defeituosos a produção equato que a hipótese alterativa H 1 admite que o ivestimeto a melhoria da qualidade do produto reduziu a proporção de ites defeituosos a produção. Sedo x = 12 o úmero de ites defeituosos a amostra de tamaho = 2 e, temos que p 12,6 2 Assim sedo, o valor da variável de teste é,6,1 z 1,89,1(1,1) 2 Figura 5.2 Observado-se o gráfico acima, tem-se da tabela do apêdice 1 que z 1, 64,5 a) Se for utilizado o valor da variável teste para a tomada de decisão, a região de aceitação é o itervalo (-1.64,+ ). Costata-se pelo gráfico acima que o valor da variável teste (z = 1,88) pertece à região de rejeição. Portato, a decisão é rejeitar a hipótese ula o ível de sigificâcia de 5%, cocluido-se que a proporção de ites com defeito de fabricação dimiuiu após o ivestimeto a melhoria da qualidade do artigo. b) Se for utilizado o itervalo de cofiaça para a tomada de decisão deve-se costruir um itervalo de cofiaça para a proporção de ites com defeito de fabricação. ( 1 ) (1 ) p z p z Sedo o teste uilateral, tem-se que = 1 = 1,5 =,95. Da tabela do apêdice 1 tem-se que z,95 = 1,64. Etão,1(1,1),6 1,64,6 1,64 2,1(1,1) 2 ou,25,95 Como o este itervalo ão cotém a proporção de ites com defeito de fabricação suposta em H ( =,1), rejeita-se a hipótese ula o ível de sigificâcia de 5% cocluido-se que a proporção de ites com defeito de fabricação dimiuiu após o ivestimeto a melhoria da qualidade do artigo. c) Utilizado-se o valor da prova para um teste uilateral esquerdo tem-se que valor da prova P ( Z z) P( Z 1,89) G( 1,89),5 P( Z,89) Da tabela do apêdice 1 tem-se que P ( Z 1,,89),476. Etão
12 valor da prova,5,476,294 Sedo o valor da prova (,294) meor que o ível de sigificâcia (,5), rejeita-se H o ível de sigificâcia de 5% cocluido-se que a proporção de ites com defeito de fabricação dimiuiu após o ivestimeto a melhoria da qualidade do artigo.
13 Apêdice 1) TABELA: Distribuição ormal padrão. P(Z>z) área tabulada z seguda decimal de z z,,1,2,3,4,5,6,7,8,9,,5,496,492,488,484,481,4761,4721,4681,4641,1,462,4562,4522,4483,4443,444,4364,4325,4286,4247,2,427,4168,4129,49,452,413,3974,3936,3897,3859,3,3821,3783,3745,377,3669,3632,3594,3557,352,3483,4,3446,349,3372,3336,33,3264,3228,3192,3156,3121,5,385,35,315,2981,2946,2912,2877,2842,281,2776,6,2743,279,2676,2643,2611,2578,2546,2514,2483,2451,7,242,2389,2358,2327,2296,2266,2236,226,2177,2148,8,2119,29,261,233,25,1977,1949,1922,1894,1867,9,1841,1814,1788,1762,1736,1711,1685,166,1635,1611 1,,1587,1562,1539,1515,1492,1469,1446,1423,141,1379 1,1,1357,1335,1314,1292,1271,1251,123,121,119,117 1,2,1151,1131,1112,193,175,156,138,12,13,985 1,3,968,951,934,918,91,885,869,853,838,823 1,4,88,793,778,764,749,735,722,78,694,681 1,5,668,655,643,63,618,66,594,582,571,559 1,6,548,537,526,516,55,495,485,475,465,455 1,7,446,436,427,418,49,41,392,384,375,367 1,8,359,352,344,336,329,322,314,37,31,294 1,9,287,281,274,268,262,256,25,244,239,233 2,,228,222,217,212,27,22,197,192,188,183 2,1,179,174,17,166,162,158,154,15,146,143 2,2,139,136,132,129,125,122,119,116,113,11 2,3,17,14,12,99,96,94,91,89,87,84 2,4,82,8,78,75,73,71,69,68,66,64 2,5,62,6,59,57,55,54,52,51,49,48 2,6,47,45,44,43,41,4,39,38,37,36 2,7,35,34,33,32,31,3,29,28,27,26 2,8,26,25,24,23,23,22,21,21,2,19 2,9,19,18,17,17,16,16,15,15,14,14 3,,135 3,5, 233 4,, 31 7 4,5, 3 4 5,, 287
2) 14