Noções de Testes de Hióteses Outro tio de roblema da Inferência Estatística é o de testar se uma conjectura sobre determinada característica de uma ou mais oulações é, ou não, aoiada ela evidência obtida de dados amostrais. Alguns exemlos:. Se substituído um rocessador A elo rocessador B, altera-se o temo de resosta de um comutador. 2. Um novo método de fabricação de lâmadas aumentará o temo médio de vida das lâmadas 3. Certa camanha ublicitária roduz efeitos ositivos nas vendas 4. A imlementação de um rograma de melhoria de qualidade em uma emresa restadora de serviços melhora a satisfação dos clientes Consideremos o exemlo das lâmadas. Suonha que no rocesso adrão o temo de vida médio é conhecido de 4 horas. Objetivo: testar o novo rocesso de fabricação. Modelo: Duas oulações de lâmadas: POP lâmadas fabricadas elo rocesso adrão; POP2 lâmadas fabricadas elo novo rocesso. Informação anterior: Temo de vida médio das lâmadas fabricadas elo rocesso adrão é de 4 horas. Pergunta: O temo de vida médio das lâmadas fabricadas elo novo rocesso é maior que 4 horas? Procedimento:. Estabelecer duas hióteses: H ) o novo rocesso não é melhor que o adrão; H ) o novo rocesso é melhor que o adrão. 2. Selecionar lâmadas fabricadas elo rocedimento novo, medir seus temos de vida e calcular o temo de vida médio X observado na amostra. 3. Suonha que a média da amostra selecionada é X 55 horas. O resultado arece indicar que o novo rocedimento é melhor. Calculando-se o intervalo de confiança de 95% ara o temo de vida médio do rocesso novo obteve-se: (3; 8)Ou seja, não temos evidência de que o novo rocesso é melhor, uma vez que a média 4 é um valor ossível ara a média do novo rocesso (está contido no intervalo). Logo, tomaríamos a decisão de não rejeitar a hiótese H. Vamos suor agora, que o intervalo de confiança de 95% tivesse os seguintes limites: (5; 6). Neste caso, teríamos forte evidência ara rejeitar H e afirmar que o novo rocesso é suerior.
2 Hióteses acima descritas em termos de arâmetros oulacionais ) A média dos temos de resosta do equiamento com o rocessador A é diferente da média dos temos de resosta com o rocessador B. 2) A média de duração das lâmadas roduzidas com o novo rocesso é maior que a média de duração das roduzidas com o rocesso antigo. 3) A média das vendas deois da camanha ublicitária é maior do que a média das vendas antes da camanha ublicitária. 4) A roorção de reclamações aós a realização do rograma de melhoria da qualidade é menor do que antes da realização do rograma. Hiótese nula e hiótese alternativa Em geral devemos decidir entre duas hióteses. Denominaremos essas hióteses de H hiótese nula H hiótese alternativa No exemlo das lâmadas se µ é a média do temo de vida das lâmadas fabricadas elo novo rocesso, então H ) µ 4 H ) µ > 4 A decisão de rejeitar H é equivalente à oinião H é falsa. A decisão de aceitar H não é equivalente à oinião H é verdadeira. Neste caso a oinião adequada é a de que os dados não contêm evidência suficientemente forte contra H. Para os outros exemlos: ) H: µa µb e H: µa µb Onde: µa é o temo médio de resosta com o rocessador A; e µb é o temo médio de resosta com o rocessador B. 3) H: µ2 µ e H: µ2 > µ onde: µ é o valor médio das vendas antes da camanha ublicitária; e µ2 é o valor médio das vendas deois da camanha ublicitária. 4) H: 2 e H: 2 < onde: é a roorção de reclamações antes do rograma de melhoria da qualidade; 2 é a roorção de reclamações deois do rograma de melhoria da qualidade.
3 Erro tio I e Erro tio II Qualquer que seja a decisão tomada em um teste de hióteses, estamos sujeitos a cometer erros, devido à resença da incerteza. Conclusão Situação da oulação do teste H verdadeira H falsa Não rejeitar H Correto (-α) Erro tio II (β) Rejeitar H Erro tio I (α) Correto (- β) Iremos considerar o seguinte: P( erro tio I ) P (rejeitar H H é verdadeira ) α P( erro tio II ) P (aceitar H H é falsa ) β É fundamental que, em cada caso, se saiba qual são os erros ossíveis e que se decida a riori qual é o mais sério. Não é ossível controlar ambos os erros ao mesmo temo. Quando diminuímos muita a robabilidade de erro tio I, aumentamos a robabilidade do erro tio II e vice-versa. Exemlo: No caso das lâmadas, o erro tio I seria arovar o novo rocesso de fabricação quando na realidade ele não é suerior. O erro tio II seria rejeitar o novo rocesso de fabricação quando é, de fato, melhor. Neste exemlo, o erro tio I é mais grave, ois acarretaria em um investimento sem retorno ara a indústria. Nível de significância e Poder O valor de α é fixado elo esquisador. Esta robabilidade recebe o nome de nível de significância do teste. Usualmente, esses valores são fixados em 5% ou %. O valor - β é chamado oder do teste. O oder do teste é a caacidade deste de detectar que H é falsa quando de fato esta hiótese é falsa. No caso das lâmadas, o oder do teste seria a robabilidade deste aceitar o novo rocesso de fabricação (rejeitar H ) quando este for realmente melhor. Como a robabilidade do erro tio I (α) é fixada, este deve ser o tio de erro mais grave, assim odemos decidir qual será a hiótese nula. ABORDAGEM CLÁSSICA Neste caso a regra de decisão é construída antes de se observar a amostra. Estatística de teste e região crítica A decisão entre as hióteses é tomada com base nos dados de uma amostra extraída da oulação. No nosso exemlo, suseitamos que o temo de vida médio das lâmadas é maior que 4. Colhe-se uma amostra aleatória de lâmadas e determina-se o valor da média amostral ara, através dela, comrovar ou refutar tal hiótese. Suonha que o esquisador decide adotar a seguinte regra de decisão:
4 Rejeitar Ho se X for maior que 8 Neste exemlo, X está sendo usada como estatística de teste e a região crítica ou região de rejeição aos valores que forem maiores que 8. TESTES PARA MÉDIAS ) Estabelecer as hióteses nula e alternativa Os testes odem ser bilaterais ou unilaterais Bilateral : H : µ µ H : µ µ Unilateral à direita: H : µ µ H : µ > µ Unilateral à esquerda H : µ µ H : µ < µ Se bilateral: Se unilateral à direita: Se unilateral à esquerda: - z z z - 2) Verifique a região crítica que corresonde à região de rejeição da hiótese nula, ou seja, as áreas sombreadas nas figuras. 3) Calcular a estatística do teste: Variância conhecida: z ( x µ ) n σ
5 Variância desconhecida: t ( x µ ) s n Onde: μ valor da média segundo H n tamanho da amostra σ desvio adrão da oulação s desvio adrão da amostra 4) Determine o valor crítico z c ( ou t c se a variância da oulação for desconhecida ) delimitando as regiões críticas 5) Analise o valor de z ou t (teste), verificando em que regiões se encontram, rejeitando ou não H. EXEMPLO : ( Variância conhecida ) Suonha, or exemlo, que insetores de controle de qualidade, estejam verificando o número de assas nas caixas ( equenas ) de flocos. Se há oucas assas os fregueses reclamarão. Se há muitas a comanhia erde dinheiro. As assas são ostas em caixas or um emacotador automático. Sabemos que a máquina funciona de maneira que o número de assas em cada caixa tenha distribuição normal com variância de 6,6. Em média cada caixa deve conter 7 assas. Uma amostra de 3 caixas acusou média igual a 7,38 assas or caixa. Vamos testar a hiótese de que a média é igual a 7. Utilizaremos α 5% H : µ 7 H : µ 7 H H -z z z (7,38 7) 3 z,34 O z crítico será,96 4,2 Com o,34 está na região de H ( entre -,96 e,96 ) não temos evidências ara rejeitar H. Podemos aceitar que a média é igual a 7. EXEMPLO 2: Variância desconhecida O temo ara transmitir MB em determinada rede de comutadores varia segundo um modelo normal, com média de 7,4s. Deois de algumas mudanças na rede, acredita-se numa redução no temo de transmissão dos dados. Foram realizados ensaios
6 indeendentes com um arquivo de MB e foram anotados os temos de transmissão em segundos. 6,8 7, 5,9 7,5 6,3 6,9 7,2 7,6 6,6 6,3 Existe evidência de que o temo médio de transmissão foi reduzido? Use nível de significância de %. As hióteses são: H: µ 7,4 s H: µ < 7,4 s Teste unilateral à esquerda Amostra: n média da amostra 6,82 desvio adrão da amostra,55 t ( x µ ) n ( 6,82 7,4) s,55 3,33 O t crítico ( gl 9 e α % ) é - 2,82. OBS: Veja que neste caso /2 % ou seja 2% Portanto t está na região de rejeição de H. O teste então rejeita H TESTE DE HIPÓTESES PARA PROPORÇÕES: A metodologia ara a execução do teste é análoga a do teste ara a média. Cálculo da estatística teste: z y n. n..( ) Onde: y y,5 se y > n. ; ou y y +,5 se y < n. (correção de continuidade) EXEMPLO: Uma emresa retira eriodicamente amostras aleatórias de 5 eças de sua linha de rodução ara análise da qualidade. As eças da amostra são classificadas como defeituosas ou não, sendo que a olítica da emresa exige que o rocesso rodutivo seja revisto se houver evidência de mais de,5% de eças defeituosas. Na última amostra, foram encontradas 9 eças defeituosas. Usando nível de significância de %, o rocesso recisa ser revisto? H:,5 H: >,5. Unilateral à direita
7 Amostra: y 9 em n 5 9 ˆ 5,8 z y n. n..( ) 8,5 (5).(,5) (5).(,5).(,5) 2,78,37 Como o z crítico é 2,326 e a amostra acusou o valor z, 37, que é menor que o z crítico, o teste aceita H. Não há evidências de que a roorção de eças defeituosa seja suerior a,5% Nível Descritivo ou -valor O rocedimento descrito anteriormente é conhecido como rocedimento clássico de testes de hióteses. Um outro rocedimento que vem sendo muito adotado consiste em aresentar o nível descritivo (ou -valor) do teste. A diferença básica entre esses dois rocedimentos é que, trabalhando-se com o -valor não é necessário construir a região crítica. Vejamos o seguinte exemlo: Suonha que no caso das lâmadas foi obtido X 55 ara uma amostra de lâmadas. O esquisador calcula a seguinte robabilidade: P ( X 55 / µ 4). O valor desta robabilidade é chamado de -valor e neste exemlo, indica a robabilidade de uma oulação com média 4 gerar uma amostra de tamanho que tenha média igual ou maior que o resultado observado. Caso esta robabilidade seja muito equena devemos suseitar da veracidade da hiótese e, ortanto rejeitar que µ 4. Se o -valor for menor ou igual a α rejeita-se H. Se o -valor for maior que α se aceita H. EXERCÍCIOS: CAP 8 ( Estatística ara Cursos de Engenharia e Informática Barbetta, Reis e Bórnia ) Exercícios 9 Referências Bibliográficas Barbetta, Reis & Bórnia. Estatística ara Cursos de Engenharia e Informática. Atlas, 24 Downing & Clark. Estatística Alicada. Editora Saraiva