Teste de Hipótese e Intervalo de Confiança

Suponha que estamos interessados em investigar o tamanho da ruptura em um músculo do ombro... para determinar o tamanho exato da ruptura, é necessário um exame de raio-x. Qual seria o tamanho médio da extensão desta lesão?

Considere algumas amostras de pacientes: 4, 3.6, 2, 1.4, 2.7, 4.3 com média = 3 1, 2.8, 3.1, 4.3, 2.6, 1.2 com média = 2.5 3.5, 4.3, 1.7, 5.2, 2.3, 4.9 com média = 3.65 Todas as 3 amostras têm 6 observações, mas cada uma possui uma média diferente. Qual usar?

Em muitos problemas reais, precisamos fazer conjecturas sobre um parâmetro e verificar se essa conjectura pode ou não ser rejeitada. Estas conjecturas são chamadas de hipóteses. E este procedimento de tomada de decisão sobre uma hipótese é chamado de teste de hipótese.

Poderíamos fazer conjecturas do tipo: a média é igual a 2? a média é maior que 3.2? a média é menor que 2.9? Os três exemplos são hipóteses e precisamos testar estas hipóteses para verificar se fazem ou não sentido.

Observe que: O tamanho da ruptura em um músculo do ombro é uma variável aleatória... que possui uma distribuição de probabilidade associada a ela. mas a média do tamanho da ruptura também é uma variável aleatória... que, da mesma forma, possui uma distribuição de probabilidade associada.

Vamos fazer uma pausa para refletir sobre o que temos aprendido começamos representando os dados matematicamente; calculando estatísticas descritivas para olhar para os dados ; já sabemos que estes dados são variáveis aleatórias que possuem uma distribuição de probabilidade.

Voltando as amostras: 4, 3.6, 2, 1.4, 2.7, 4.3 com média = 3 1, 2.8, 3.1, 4.3, 2.6, 1.2 com média = 2.5 3.5, 4.3, 1.7, 5.2, 2.3, 4.9 com média = 3.65 Note que para cada amostra da VA tamanho da ruptura, existe uma amostra da VA média do tamanho da ruptura.

Formalmente Uma hipótese estatística é uma afirmação sobre os parâmetros de uma ou mais populações. Um parâmetro pode ser a média, a variância ou uma proporção da população. É importante dizer que as hipóteses são afirmações sobre a população e não sobre a amostra.

População

População Eu acho que a idade média desta população é 50 anos (hipótese).

População Eu acho que a idade média desta população é 50 anos (hipótese). Amostra aleatória Media X = 20

População Amostra aleatória Eu acho que a idade média desta população é 50 anos (hipótese). Media X = 20 Está longe. Rejeita a hipótese!

então: É improvavel que tenhamos uma média amostral com este valor...... Então rejeitamos a hipótese de = 50.... se a média da população é esta 20 = 50 Sample Mean

Hipótese Nula É o que queremos testar. Chamamos de H 0. Hipótese Alternativa é o complemento de H 0, denotada por H a.

Suponha que queremos testar a hipótese de que a idade média seja igual a 50. H 0 : = 50 H a : 50 H a contempla valores maiores e menores que 50. Temos aqui um teste bilateral. Teremos que nos preocupar com os dois lados da distribuição de probabilidade.

Podemos testar usando desigualdades H 0 : < 50 H a : 50 ou H 0 : > 50 H a : 50 H a contempla valores maiores ou menores ou iguais que 50. Temos aqui dois testes unilaterais. Teremos que nos preocupar apenas com o lado em questão da distribuição de probabilidade.

Quando decidir quando devemos ou não rejeitar uma hipótese nula? H 0 : = 50 H a : 50 Se nossas amostras apresentarem médias de idade, por exemplo, 50.2 ou 49.8, talvez não fosse uma boa idéia rejeitar H 0.

Vamos arbitrar estes limites como 48 e 52, isto é: As regiões para as quais a média é menor que 48 ou maior que 52 são ditas as regiões de rejeição do teste.

Definida a região de rejeição, precisa-se estabelecer uma estatística para o teste. Neste caso, a estatística é a média amostral. Seleciona-se uma amostra e calcula-se a média. Se ela cair na região de rejeição, rejeita-se H 0. Caso contrário não há como recusar a hipótese nula.

Definições A rejeição da hipótese nula H 0, quando ela for verdadeira, é definida como erro tipo I. A falha em rejeitar a hipótese nula H 0, quando ela é falsa, é definida como erro tipo II.

Algumas considerações: Em geral, o erro tipo I é mais sério que o erro tipo II. A hipótese nula é verdadeira até que se prove o contrário. A hipótese nula é escolhida de forma a ser o que o projetista quer negar.

Nível de Significância Denominado por. É a probabilidade do erro tipo I, isto é, = Prob(erro tipo I). Os valores típicos de são: 0,01, 0,05, 0,10. é também conhecido como tamanho do teste. Caracteriza a região de rejeição. Define os valores pouco prováveis da estatística da amostra se a hipótese nula é verdadeira.

Teste Uni-caudal Sampling Distribution Região Rejection de rejeição Region 1 - Nonrejection Region Nível de confiança (região de não rejeição) Não rejeita a hipótese nula Critical valor Value crítico Ho Value Sample Statistic Valor observado da estatística

Teste Uni-caudal Sampling Distribution Região Rejection de rejeição Region 1 - Nonrejection Region Nível de confiança (região de não rejeição) Rejeita a hipótese nula Valor observado da estatística Critical valor Value crítico Ho Value Sample Statistic

Teste Bi-caudal Rejeita a hipótese nula Rejection Region rejeição Região de 1/2 1 - Nonrejection Region Rejection Region Região de rejeição 1/2 Valor observado da estatística valor Critical crítico Value Ho Value Critical Valor Value crítico Sample Statistic

Teste de Hipótese Passo a Passo Identifique o parâmetro de interesse; Estabeleça H 0 e H a ; Estabeleça o nível de significância que determinará a região de rejeição; Estabeleça uma estatística apropriada de teste; Calcule o valor da estatística; Decida de H 0 deve ou não ser rejeitada.