HEP-58 BIOESTATÌSTICA UNIDADE IV INFERÊNCIA ESTATÍSTICA: TESTES DE HIPÓTESES Nila Nunes da Silva Regina I. T. Bernal
I. QUADRO CONCEITUAL São procedimentos estatísticos que consistem em usar dados de amostras (ESTIMATIVAS) para tomar decisões sobre rejeição de hipóteses construídas a respeito de valores populacionais. PROCEDIMENTO 1. Problema científico A SAÚDE ORAL DE CRIANÇAS COM 12 ANOS DE IDADE É PRECÁRIA. Ou Seja, o número de dentes estragados é alto. Ou ainda, a população apresenta CPOD médio superior a 7. 2. Hipóteses estatísticas Nula H : 7 igualdade Alternativa H 1 : > 7 maior...teste unilateral 3. Fia critério de decisão...para decidir rejeição de Ho. NÍVEL DE SIGNIFICÂNCIA (α) = probabilidade REJEITAR H, sendo H verdadeira. ( α) =,5 4. Identifica valor de () para (α) =,5...,5 = 1,64,5,5 5. Sorteia a amostra aleatória simples (n>3) 6. Calcula estimativas da média e respectivo erro padrão ( 8 ; s = 3) dp() 3 3 3 5,5,55 7. Calcula valor de...admitindo H verdadeira 8 7,55 1,55 1,82 8. Compara calculado com,5 ( 1,82 > 1,64 )...está localiado na região de rejeição do teste, portanto, 9. Decisão...Rejeita H, com risco de errar igual a 5%. Portanto, há evidências de que a média do cpod na população é maior que 7. Bioestatística II 1
II. TIPOS DE TESTE Os testes podem ser bicaudais ou unicaudais. Observe que no eemplo anterior, a hipótese científica indicou a direção da hipótese alternativa. Se o pesquisador desejasse apenas mostrar que a média da população é igual a 7, a hipótese nula continuaria a mesma, mas a hipótese alternativa referiria apenas que o cpod médio é diferente de 7 (maior ou menor). Nula H : 7 igualdade Alternativa H 1 : 7 diferente...teste bicaudal TESTE BICAUDAL ( α) =,5,25,25-1,96 1,96 Z,5 = 1,96 Z CALCULADO na amostra anterior = 1,82 1,82 < 1,96...fora da região de rejeição decisão: não rejeita H, sob com risco de errar igual a 5%. Portanto, há evidências para admitir que o cpod médio da população é igual 7. OBSERVAÇÃO H pode ser verdadeira Rejeita ERRO TIPO I ( α) =,5 falsa Rejeita Não há erro A direção do teste bicaudal é definida pela hipótese científica, antes de sortear a amostra. Perceba que o intervalo de confiança (95%) para a média populacional 6,9 ------- 9,1 conteria o valor 7. 1,96dp( ) 8 1,96.,55 8 1,78 Bioestatística II 2
III. TESTE PARA UMA MÉDIA COM DESVIO PADRÃO DESCONHECIDO Quando é usado o desvio padrão de X estimado na amostra e se n < 1 usa-se a distribuição t de Student com (n-1) graus de liberdade para identificar a região de rejeição e o t crítico. No eemplo anterior suponha que o s X = 3,5 então t (calculado) = 1,355 α =,5 n-1 graus de liberdade t (critico) = 1,83 1,355 < 1,83, não há evidências para rejeitar H. Ao nível de significância de 5% o CPOD MÉDIO da população é igual a 7. H : 7 H 1 : > 7???E se o teste fosse bicaudal????qual a decisão a respeito de H.??? IV - TESTE PARA UMA PROPORÇÃO RESTRIÇÕES... np e nq maiores que 5 H : P =,5 H 1 : P,5 Sob H ; a proporção amostral tem distribuição normal com média igual a,5 e erro padrão calculado por,5, 5. n ( α) =,5,25,25-1,96 1,96 Bioestatística II 3
Em uma amostra de 2 crianças, 8 eram desnutridas. Qual a decisão que podemos tomar sobre REJEITAR H com nível de significância igual a 5%? Z (calculado) =,4,5 (critico),5 = -1,96 2,88,3464 Há evidências para rejeitar H. Ao nível de significância de 5% admitimos que a proporção de crianças desnutridas na população é diferente de 5%. OBSERVAÇÃO: Note que se o teste fosse monocaudal à esquerda, continuaríamos rejeitando a hipótese de igualdade H. Mas aceitaríamos que a proporção de crianças desnutridas na população é menor que 5%. H : P =,5 H 1 : P <,5,5,5-1,64 Z calculado = -2,88????rejeita H V. SÍNTESE DO PROCEDIMENTO PROBLEMA CIENTÍFICO------------DEFINE HO E H1 SELECIONA A DISTRIBUIÇÃO NORMAL Z (, 1 ) FIXA O NÍVEL DE SIGNIFICANCIA ( α) -----------DEFINE O Z CRÍTICO ( Z,5 ) SORTEIA A AMOSTRA ALEATÓRIA SIMPLES OU SISTEMÁTICA (De preferência n>3) CALCULA AS ESTIMATIVAS ( ou p, e respectivos erros padrão) μ PADRONIZA ESTIMATIVAS usando a epressão (calculado) = dp() ( α DECIDE SE REJEITA OU NÃO H...NÍVEL DE SIGNIFICÂNCIA ) Bioestatística II 4
INTERPRETA RESULTADO À LUZ DO PROBLEMA CIENTÍFICO II - Critérios de decisão Hipóteses Alternativas H 1 MENOR Zcrítico ( α) =,5 Z,5 = - 1,64 Rejeita H, se Zcalc < - 1,64 H 1 MAIOR ( α) =,5 Z,5 =1,64 Zcalc > 1,64 H 1 DIFERENTE ( α) / 2=,5/2 Z,5= 1,96 ou 1,96 Valor absoluto de calc > 1,96 ou < -1,96. VI. PODER DO TESTE Vimos nos procedimentos anteriores, que a regra de decisão se baseou apenas no nível de significância ( ). A decisão de rejeitar ou não H, determina dois possíveis erros em relação à realidade do problema alvo da pesquisa. REALIDADE H DECISÃO ERRO PROBABILIDADE VERDADEIRA REJEITAR I (ALFA) FALSA ACEITAR II (BETA) PARA ALFA FIXADO, PODE-SE CONTROLAR A PROBABILIDADE DO ERRO TIPO II, (ACEITAR H FALSA). Suponha que estamos testando as hipóteses abaio. H : 2 H 1 : 2 AAS, (.n=25 ; σ X 5 ; σ 1 ) Nível de significância = =,5 Bioestatística II 5
A hipótese nula será rejeitada se a média estimada, na amostra sorteada, for maior que 21,6. Pois, sob H : 2 a distribuição amostral corresponde à distribuição normal representada na figura 1. Zcritico = 1,64...= μ...=... dp() 12...> = 21,64 Suponha agora que H é falsa. Ou seja, na realidade 2 é a verdade. Se não rejeitássemos a hipótese nula, estaríamos cometendo o erro tipo II. Ou seja, (aceitando H falsa), pois a média populacional é 23. Então a probabilidade de obter valores menores que 21,64 sob H 1 ( ( ) =,87. 23) é dado por H,5 2 2 H 1 21,64 23 23 (1 ) é então a probabilidade de rejeitar H quando na realidade ela é falsa. Chama-se o poder do teste. SÍNTESE: DECISÃO H VERDADE REALIDADE H FALSA REJEITAR H ERRO TIPO I ( ) CORRETA Poder Teste (1 ) ACEITA H CORRETO (1 - ) ERRO TIPO II ( ) Bioestatística II 6
VII. TESTE DE HIPÓTESES PARA AS MÉDIAS DE DUAS POPULAÇÕES CORRELATAS Para estudar o efeito de certa dieta sobre o aumento de peso em adultos normais, estudaram-se os resultados da tabela abaio. Note que o mesmo indivíduo tem duas medidas e que esses resultados não podem ser considerados independentes. Peso antes e depois do uso da dieta. N.INDIVÍDUO PESO ANTES (pa) PESO DEPOIS (pd).d= (pd pa) 1 54 56 2 4 61 65 4 3 5 52 2 4 74 73-1 5 8 82 2 6 62 6-2 7 58 58 8 55 56 1 9 49 53 4 1 63 63 11 67 68 1 12 7 72 2 13 71 72 1 14 75 79 4 15 66 72 6 H : _ D = H 1 : _ D > _ (n = 15 ) ; d = 26/15 = 1,73 kg. s d = 2,12 kg. d t (calculado ) = 3, 16 e t (14gl ;,5 ) = 1,76. 2,12 / 15 Decisão ( 3,16 > 1,76 ) Rejeita-se H ao nível de significância de,5. Pode-se esperar que a dieta aumente em média o peso dos indivíduos. Bioestatística II 7
Eercícios 1) Desejando-se conhecer a média de consumo de carne em uma determinada população, selecionou-se uma amostra aleatória de 1 pessoas. Os resultados mostraram que, em média, os indivíduos consumiam 1. g/mês (desvio padrão de 625g). Teste a hipótese de que o consumo médio dessa população está de acordo com o esperado, que é 1.2g/mês, ( =1%). 2) Admite-se que a quantidade de carne ingerida por pessoa por semana (com renda familiar menor do que 3 salários mínimos e tamanho da família de 5 membros), na região sudeste, possui distribuição normal com média 6g e desvio padrão 1g. Deseja-se saber se no subdistrito de Pirituba o consumo médio é menor do que esta quantidade. Para isto foi conduida uma pesquisa, com nível de significância de 5%, cujos valores amostrais de consumo são apresentados a seguir. Elabore de forma completa o teste de hipótese. Consumo médio semanal (em gramas): 3; 4; 35; 45; 1; 22; 15; 5; 9; 8; 6; 15; 5; 17; 37; 2; 3) Em uma amostra aleatória de 5 alunos encontrou-se que a altura média foi de 165 cm (desvio padrão de 15 cm). Testar a hipótese de que essa média é igual ao esperado, sabendo-se que a média padrão é 17 cm (desvio padrão conhecido igual a 2 cm) ( =5%). 4) A fim de acelerar o tempo que um analgésico leva para penetrar na corrente sanguínea, um químico analista acrescentou certo componente à fórmula original, que acusava um tempo de médio de 43 minutos. Em 36 observações com a nova fórmula, obteve-se um tempo médio de 42 minutos, com desvio padrão de 6 minutos. a) O que podemos concluir, ao nível de 5% de significância, sobre a eficiência do novo componente? b) Qual seria a resposta ao nível de 1%? c) Que tipo de erro pode ser cometido? 5) No problema de teste de hipóteses, descreva os conceitos : a) de hipótese nula e alternativa, b) erro tipo I, nível de significância e região crítica. c) erro tipo II, poder do teste. 6) Tente comparar a inferência estatística mediante INTERVALO DE CONFIANÇA (95%) e TESTES DE HIPÓTESES, nível significância 5%. Bioestatística II 8