Teste de hipóteses Página 1 de 8 Teste de hipóteses O teste de hipóteses serve para verificar se uma dada amostra é ou não compatível com a população de onde foi tirada a amostra. Um teste de hipóteses segue os seguintes passos: 1. Definição das hipóteses. Identificação da estatística de teste e caracterização da sua distribuição 3. Estabelecimento da regra de decisão, com especificação do nível de significância 4. Definição das hipóteses Definimos sempre duas amostras: Hipótese nula: a hipótese que vai ser testada Hipótese alternativa: a hipótese alternativa hipótese nula A hipótese alternativa (H 1 ) é a hipótese que traduz a conjectura que se pretende verificar É sempre uma desigualdade(> ou <) ou diferença( ), mas nunca uma igualdade(=) teste bilateral teste unilateral à esquerda teste unilateral à direita H 1 < > A hipótese nula (H 0 ) é a hipótese que se testa e é complementar a H 1. Considera-se verdadeira de início e o teste rejeita-a (aceitando então H 1 ) ou não (teste inconclusivo). É sempre uma igualdade. O responsável pelas tecnologias da informação de uma empresa pretende avaliar a capacidade de transmissão de dados da Intranet. Um dos testes a efectuar consiste em estimar o tempo médio de transferência de um ficheiro de 15 Mb, sendo a finalidade do teste validar a conjectura de que o tempo médio é inferior a 6 segundos. Hipótese alternativa (hipótese que traduz a conjectura): H 1 : µ < 6 Hipótese nula (hipótese complementar a H 1 ): H 0 : µ = 6 A hipótese complementar a H 1 é na verdade µ 6, mas considera-se µ = 6 por ser a que mais se aproxima de H 1 http://www.fe.up.pt/~leec005 Página 1 de 8
Teste de hipóteses Página de 8 Identificação da estatística de teste e caracterização da sua distribuição A estatística que é utilizada para verificar H 0 é designada por estatística de teste (ET ) sendo necessário conhecer a sua distribuição quando se admite que H 0 é verdadeira. O parâmetro da amostra que servirá a ET tem que corresponder ao parâmetro populacional em conjectura. ( µ X, σ S ). Em relação ao exemplo anterior foi retirada uma amostra de 50 elementos da qual sabemos a média ( X = 5. 51). Admitimos também que sabemos o desvio padrão populacional (σ = 1.84). Uma vez que = 50, podemos aproximar a distribuição de X (qualquer que ela seja) pela distribuição normal X µ, σ X µ = σ que por sua vez é normalizada. ET ( 0,1) Estabelecimento da regra de decisão e especificação do nível de significância A regra de decisão fixa o valor VC = ET(, valor crítico, a partir do qual se rejeita H 0, criando uma região de rejeição. A probabilidade α designa-se por nível de significância do teste e representa a probabilidade de se rejeitar H 0 quando esta hipótese é verdadeira. Este erro designa-se por erro de tipo I. Retomando o exemplo anteriror, tinhamos significância α = 5%. ET (0,1) e temos agora um nível de http://www.fe.up.pt/~leec005 Página de 8
Teste de hipóteses Página 3 de 8 Z < VC) = α VC = z( = z(0.05) = 1.645 ET < -1.645 rejeitar H 0 e aceitar H 1 ET -1.645 não rejeitar H 0 (teste inconclusivo) esta fase cálcula-se a estatística de teste e rejeita-se ou não H 0 consoante o valor de ET. ET X µ 5.51 6 = = = 1.88 1.88 < 1. 645 σ 1.84 50 rejeitar H 0 e aceitar H 1 O teste de hipóteses comprovou que o tempo médio de transferência de um ficheiro de 15 Mb é inferior a 6 segundos. Erro do tipo II Existe ainda a possibilidade de cometer um outro tipo de erro que corresponde a não rejeitar H 0 quando esta é falsa. Este erro é designado por erro do tipo II. A probabilidade de incorrer num erro do tipo II é denotada por β. H 0 verdadeira H 0 falsa H 0 rejeitada Erro do Tipo I α 1-β H 0 não rejeitada 1-α Erro do tipo II β Cálculo de um erro de tipo II, com µ = 5.8 e α = 5%: Vimos que no exemplo anteriror para α = 0.05, o VC = -1.645. Tinhamos µ = 6, σ = 1.84 e =50. Vamos converter VC para normal: http://www.fe.up.pt/~leec005 Página 3 de 8
Teste de hipóteses Página 4 de 8 X µ VC = z( = 1.645 = X σ 1.84 = 6 1.645 = 5.57 5.6 50 = µ + VC σ = E voltamos a convertê-lo para normal reduzido, com o novo µ = 5.8. X µ 5.6 5.8 VC = = = 0.77 σ 1.84 50 β = X > 5.6) = 1 Z < 0.77) = = 1 0.06 = 0.7794 Cálculo de um erro de tipo II, com µ = 5 e α = 5%: Já temos o VC em normal. Convertemo-lo para normal reduzido e calculamos β. X µ 5.6 5 VC = = =.31 σ 1.84 50 β = X > 5.6) = 1 Z <.31) = = 1 0.9896 = 0.0104 Potência de teste A potência de teste traduz a probabilidade de rejeitar H 0 quando este é falso. Como se vê na tabela anterior, equivale a 1 - β. A potência de teste é tanto maior, quanto maior for a diferença entre o parâmetro de H 0 (µ 0 = 6) e o novo parâmetro (µ). http://www.fe.up.pt/~leec005 Página 4 de 8
Teste de hipóteses Página 5 de 8 O desejável era diminuir α e β simultaneamente, visto serem os erros possíveis, mas tal não é possível porque são inversamente proporcionais. Lembra-te que ao diminuir α, diminuis o VC e ao diminuir o VC, aumentas β. A unica opção é aumentar o tamanho da amostra, diminuindo a variância da distribuição da estatistica de teste. Exercício: Seja X o Q.I. dos estudantes de certa escola, com distribuição ormal de média desconhecida e desvio padrão 15. Foi retirada uma amostra aleatória de 5 estudantes cujo Q.I. médio foi 106. a) Deveríamos concluir que a verdadeira média dos Q.I. de todos os alunos da escola é 100 contra a alternativa de ser superior a esse valor, para α = 0.01? b) Calcule a probabilidade de cometer um erro de tipo II (β), tomando como valor crítico para a média x = 106 e considerando que o verdadeiro valor da média dos Q.I. de todos os alunos da escola é 110. Resolução: a) Definição das hipóteses = 5 Temos estas informações do enunciado: σ = 15 Hipótese nula: H 0 : µ = 100 Hipótese alternativa: H 1 : µ > 100 X = 106 Identificação da estatística de teste e caracterização da sua distribuição Como dito no enunciado, a média segue uma distribuição normal, e se o parâmetro em questão é a média populacional, teremos que usar como estatística de teste a média amostral. σ X µ X ( µ, σ ) X µ, Z = (0,1) σ Estabelecimento da regra de decisão, com especificação do nível de significância Temos α = 0.01. P ( z > VC) = α z( =.35 ET.35 não rejeitar H 0 ET >.35 rejeitar H 0 e aceitar H 1 http://www.fe.up.pt/~leec005 Página 5 de 8
Teste de hipóteses Página 6 de 8 X µ 106 100 ET = = σ 15 5 =. 35 não rejeitar H 0 ão há evidência estatística para rejeitar a ideia que a média do Q.I. de todos os alunos da escola é 100. b) Tomamos H 0 como falsa, considerando que a média µ = 110. β = P não rejeitar H H é falsa) = ET VC µ = 110) = Exercício: ( 0 0 x µ 106 110 = P Z µ = 110 = P Z = ( 1.33) = 0.0918 15 P Z σ 5 Com o intuito de investigar o tipo de audiência de certo programa televisivo seleccionaram-se de forma aleatória 100 espectadores, cuja idade foi registada, tendo-se obtido um desvio padrão amostral S =.95. Convencionando-se que a assistência é considerada heterogénea se a variância das idades ultrapassar os 6 anos, que conclui para α = 5%? Resolução: Do enunciado temos: = 100 ; S =.95; α = 0. 05 Definição das hipóteses Hipótese nula: H 0 : σ = 6 Hipótese alternativa: H 1 : σ > 6 Identificação da estatística de teste e caracterização da sua distribuição Se o parâmetro populacional em causa é a variância σ, a estatística de teste será a variância amostral S. Para = 100, podemos aproximar a distribuição da estatistica de teste pela distribuição quiquadrado. ( 1) S χ 1 σ Estabelecimento da regra de decisão, com especificação do nível de significância Temos α = 0.05. P ( χ > VC) = α χ ( χ ( 99 99 100 = 14.3 ET VC não rejeitar H 0 ET > VC rejeitar H 0 e aceitar H 1 http://www.fe.up.pt/~leec005 Página 6 de 8
Teste de hipóteses Página 7 de 8 ( 1) S 99.95 ET = = = 143.59 143.59 > 14. 3 rejeitar H 0 e aceitar H 1 σ 6 A assistência é heterogénea. Testes mais comuns Além do teste à variância de uma população normal e do teste ao valor esperado de uma população, existem mais testes, dos quais é apresentado mais um. Teste à proporção binomial uma população constituída por elementos de dois tipos, o valor p, que corresponde à proporção de elementos de um dos dois tipos, designa-se por proporção binomial. Se uma amostra contem Y elementos de um dos dois tipos, a proporção amostral é Y /. Se a amostra for grande, temos: Y p p = p = ) (1 µ, σ As hipóteses a considerar num teste relativo à proporção binomial são: H 0 : p = p 0 H 1 : p p 0, p < p 0, p > p 0 A estatística de teste é: ET = Y p0 p0 ( 1 p0 ) ( 0,1) Exercício: Um analista político admite que certo candidato possa ter 0% dos votos. Feita uma sondagem, 14 dos 100 inquiridos revelaram tencionar votar no referido candidato. a) Que pode concluir para α = 5%? b) o caso de em 1000 inquiridos, 850 se declararem contra o candidato em causa, que conclusão se pode tirar para α = 1%? Resolução: a) Podemos fazer dois testes: bilateral e unilateral à esquerda Unilateral à esquerda Definição das hipóteses Bilateral http://www.fe.up.pt/~leec005 Página 7 de 8
Teste de hipóteses Página 8 de 8 Hipótese nula: H 0 : p = 0. Hipótese alternativa: H 1 : p < 0. Hipótese nula: H 0 : p = 0. Hipótese alternativa: H 1 : p 0. Identificação da estatística de teste e caracterização da sua distribuição Y p0 ET = ( 0,1) p 1 p ) 0 ( 0 Estabelecimento da regra de decisão, com especificação do nível de significância Temos α = 0.05. Temos α = 0.05. P ( z < VC) = α z( = 1.645 z < VC ) = α / z( α / ) = 1.96 z > VCD ) = α / z( α / ) = 1.96 ET VC não rejeitar H 0 ET < VC rejeitar H 0 e aceitar H 1 VC E ET VC D não rejeitar H 0 ET < VC E ou ET > VC D rejeitar H 0 A ET é igual para os dois testes mas a regra de decisão é diferente. 0.14 0. ET = = 1.5 0. 0.8 100-1.5-1.645 não rejeitar H 0-1.96-1.5 1.96 não rejeitar H 0 ão há evidência estatística para dizer que o analista político está errado. b) este caso, tanto a Definição das hipóteses como a Identificação da estatística de teste e caracterização da sua distribuição mantêm-se iguais. Estabelecimento da regra de decisão, com especificação do nível de significância Temos α = 0.01. Temos α = 0.01. P ( z < VC) = α z( =.33 z < VC ) = α / z( α / ) =.575 z > VCD ) = α / z( α / ) =.575 ET VC não rejeitar H 0 ET < VC rejeitar H 0 e aceitar H 1 VC E ET VC D não rejeitar H 0 ET < VC E ou ET > VC D rejeitar H 0 Y / = (1000-850) / 1000 = 0.15 0.15 0. ET = = 3.95 0. 0.8 1000-3.95 < -.33 rejeitar H 0 e aceitar H 1 3.95 <.575 rejeitar H 0 e aceitar H 1 Podemos concluir que o analista estava errado. E E http://www.fe.up.pt/~leec005 Página 8 de 8