TESTE DE HIPÓTESE. Introdução

TESTE DE HIPÓTESE Introdução O teste de hipótese estatística objetiva decidir se uma afirmação sobre uma população, usualmente um parâmetro desta, é, ou não, apoiada pela evidência obtida dos dados amostrais. Tal afirmação é o que chamamos de hipótese estatística, e a regra usada para decidir se ela é verdadeira ou não é o teste de hipótese. Por exemplo, com base na produtividade de uma hortaliça cultivada em uma área onde foi usado um novo fertilizante, e em outra área onde se utiliza o fertilizante padrão, temos de decidir se o novo fertilizante é, ou não, melhor. A dificuldade aqui e daí a necessidade de métodos estatísticos é que a produtividade varia de plantas para plantas.

Os testes de hipótese permitem-nos tomar decisões em presença da variabilidade, ou seja, verificar se está diante de uma decisão real (significativa) ou de uma diferença devida simplesmente à flutuação aleatória ao processo. Hipótese estatística Existem duas hipóteses envolvidas em qualquer estudo deste tipo: A hipótese alternativa H1, que é, em geral, a hipótese proposta pelo investigador; A hipótese nula H, negação da hipótese anterior.

Exemplo Para decidir se o novo processo de fabrico é melhor que o anterior, o gestor de produção da fábrica formula as seguintes hipóteses: H (hipótese nula): não há diferença entre os dois processos de fabrico H1 (hipótese alternativa): o novo processo de fabrico é melhor que o anterior. Obs.: Vamos sempre considera H como hipótese simples. Hipótese simples: é especificado apenas um valor para o parâmetro. Hipótese composta: é especificado mais de um valor para o parâmetro.

Exemplo Suponha que é foi feita uma auditoria na empresa do Sr. Zé das tintas, a qual resulta numa acusação de infração fiscal. Obviamente, se o fiscal das finanças não conseguir juntar provas que sustentem a acusação, a empresa não é considerada culpada. As hipóteses são as seguintes: - H (hipótese nula): a empresa não cometeu uma infração fiscal; - H1 (hipótese alternativa): a empresa cometeu uma infração fiscal. Decisões: Nesta situação podem ser tomadas duas decisões: 1) Rejeitar a hipótese nula: a empresa é considerada culpada, isto é, aceita-se a H1 como verdadeira;

) Não rejeitar a hipótese nula: na se consegui provar a veracidade de H1 e como tal, não se pode rejeitar a hipótese nula. Note que, isto não significa aceitar H, significa tão só, que não há provas (não há evidência) para rejeitar esta hipótese. Por isto é preferível dizer não rejeitar H a dizer aceitar H. Tipos de erro: Erro Tipo I e Tipo II Exemplo Relativamente ao exemplo anterior há duas possibilidades de tomar uma decisão errada: a empresa é considerada culpada quando de fato não cometeu nenhuma infração fiscal: Rejeitar H sendo H verdadeira;

não se rejeita a hipótese da empresa ser inocente, quando de fato esta cometeu uma infração fiscal: Não rejeitar H sendo H falsa. Definição: Erro Tipo I e Tipo II Os dois tipos de erro que podem ser cometidos são os seguintes: Erro tipo I: rejeitar H sendo H verdadeira (erro de rejeição); Erro tipo II: não rejeitar H sendo H falsa (erro de não rejeição). Probabilidades associadas aos erros: α = P(erro tipo I) = P(Rejeitar H/ H é verdade) é chamado o nível de significância do teste; β = P(erro tipo II) = P(não rejeitar H/ H é falsa) 1 β é chamado poder do teste.

Obs.: A determinação de β é mais difícil, pois usualmente não se especificam valores fixos para o parâmetro na situação alternativa. Como se conduz um teste de hipóteses? Uma vez recolhida uma amostra, observamos o valor de alguma estatística (função da amostra aleatória) cuja distribuição de probabilidade é conhecida sob o pressuposto de H ser verdadeira. Tal estatística é chamada estatística de teste. A decisão a tomar será a de rejeitar H ou não rejeitar H. O valor de α - nível de significância do teste - e a distribuição de probabilidade da estatística do teste vão ser utilizados para definir a chamada região crítica ou região de rejeição.

Se o valor observado da estatística do teste cair na região crítica, decidimos rejeitar H; caso contrário decide não rejeitar H. Em resumo, o processo geral consiste no seguinte: 1. Formular a hipótese nula (H) e a hipótese alternativa (H1);. Especificar um nível de significância; 3. Escolher a estatística a usar e encontrar a sua distribuição de probabilidade sob o pressuposto de H ser verdadeira; 4. Determinar a região de rejeição; 5. Calcular o valor observado da estatística do teste; 6. Decidir rejeitar H ou não rejeitar H.

Teste de hipótese para média Este teste é feito se baseado nas distribuições da média amostral. Veremos dois testes para média, que dependerão do conhecimento ou não do verdadeiro valor da variância. Teste de hipótese para média com variância desconhecida O procedimento para a realização desse este de hipótese pode ser resumido nos seguintes passos: 1º Passo: Enumerar as hipóteses estatísticas: 1º Tipo: Hipótese Bilateral H : µ = µ H1: µ µ

º Tipo: Hipótese unilateral à direita 3º Tipo: Hipótese unilateral à esquerda H : µ = µ H1: µ > µ H1: µ < µ H : µ = µ º Passo: Determinar a distribuição de X e, por conseguinte, a estatística de teste. σ Já vimos que X ~ N( µ, ) n Z X µ ~ N(, 1) σ = A estatística de teste é uma estatística amostral usada para tomar n uma decisão em relação à hipótese nula.

3º Passo: Fixar o nível de significância α. 4º Passo: Determinar a Região de Aceitação e a Região de Rejeição (crítica) que serão definidas de acordo com o α fixado: Para o 1º Tipo: A região crítica é o conjunto de todos os valores da estatística de teste que levam à rejeição da hipótese nula.

Com base no gráfico podemos formular as seguintes regras de decisão ou teste de hipótese (ou de significância): a) Rejeitar a Hipótese Nula ao nível de significância α se o valor de Z for maior que o valor de z α ou menor que o valor de z α. b) Em caso contrário, não rejeitamos a hipótese nula. O valor de ± z α é chamado valor crítico, separando a região crítica dos valores da estatística de teste que não levam à rejeição da hipótese nula. Comparação: Rejeita H: Z > z α Não Rejeita H: Z z α

Para o º Tipo: Unilateral à direita Comparação: Rejeita H Z > z : α 1 α Não Rejeita H Z z : α z α Para o 3º Tipo: Unilateral à esquerda Comparação: Rejeita H Z < z 1 α : α Não Rejeita H Z z : α z α

Teste de Hipótese para média quando a variância é desconhecida Este problema é idêntico ao ocorrido na construção do intervalo de confiança para média quando não tem conhecimento da variância populacional. Como a variância é desconhecida, é necessário fazer a suposição adicional de que a variável tenha distribuição Normal. Essa suposição é necessária para poder desenvolver a estatística do teste; contudo, os resultados ainda serão válidos se o afastamento da normalidade não for forte. Nesta situação a estatística de teste a ser usada é: X µ T = S n A qual tem distribuição t com n-1 graus de liberdade. Assim, temos os seguintes testes:

Para o 1º Tipo: Hipótese Bilateral Rejeita H: T > t α Não Rejeita H : Para o º Tipo: Hipótese Unilateral à direita T t α Rejeita H : T > t α Não Rejeita H : T t α Para o 3º Tipo: Hipótese Unilateral à esquerda Rejeita H Não Rejeita H T < t : α T t : α

Teste de Hipótese para uma proporção Este tipo de teste será realizado quando temos uma hipótese sobre a proporção de indivíduos portadores de certa característica. Esta hipótese afirma que essa proporção é igual a certo número p. Estão às hipóteses poderão ser descritas como: 1. Hipótese Bilateral. Hipótese Unilateral à direita 3. Hipótese Unilateral à esquerda H : p = p H1: p p H : p = p H1: p > p H : p = p H1: p < p Como já vimos à estatística pˆ, proporção de elementos da amostra portadores de certa característica tem distribuição normal quando o tamanho da amostra é grande, isto é: pˆ ~ N p, p(1 p) n

Fixando um valor α, o nível de significância do teste, deve construir a região crítica para suposição de que os parâmetros definidos em H sejam verdadeiros. A estatística de teste a ser usada será: pˆ p Z = p(1 p) n ~ N(, 1) onde p será a proporção na população e pˆ a proporção na amostra. pˆ na As regiões de aceitação e rejeição serão dadas de maneira similar às definidas para média: 1. Hipótese Bilateral. Hipótese Unilateral à direita 3. Hipótese Unilateral à esquerda

Daí pode concluir: 1. Hipótese Bilateral. Hipótese Unilateral à direita 3. Hipótese Unilateral à esquerda Rejeita H: Z > Não Rejeita H: z α Z z α Rejeita H: Z > Não Rejeita H: z α Z zα Rejeita H: Não Rejeita H: Z < zα Z zα