Bioestatística e Computação I Testes de Hipótese para Comparação de 2 Médias Maria Virginia P Dutra Eloane G Ramos Vania Matos Fonseca Pós Graduação em Saúde da Mulher e da Criança IFF FIOCRUZ Baseado nas aulas de M. Pagano e Gravreau e Geraldo Marcelo da Cunha
Comparação de duas populações Invasão francesa na Itália - 1537 Os ferimentos por armas de fogo eram cauterizados com óleo de sabugueiro em ebulição. Numa ocasião o dito óleo faltou e o cirurgião do exército Ambroise Pare passou a aplicar um digestivo feito de gemas de ovos, óelo de rosas e terebentina. Surpreendentemente, no dia seguinte, os que haviam sido tratados com o digestivo estavam com pouca dor, inflamação ou inchaço, enquanto os que haviam sido tratados com o óleo quente estavam com febre e muita dor.
Comparação de duas populações Bioimpedância como indicador de gravidade Os parâmetros da bioimpedância são medidos em pacientes atendidos na puericultura (grupo controle) e em pacientes sépticos internados na UPG-IFF (grupo sepse). Deseja-se determinar se as médias dos parâmetros da bioimpedância são significativamente diferentes entre os dois grupos.
Comparação de duas populações Dieta de farelo de aveia para baixar o LDL Deseja-se determinar se o farelo de aveia auxilia a baixar os níveis séricos de colesterol. Alguns indivíduos foram aleatoriamente colocados em uma dieta de farelo de aveia ou de flocos de milho. Após duas semanas seus níveis de LDL foram medidos. A dieta de cada um foi então invertida e, após mais duas semanas, o nível de colesterol LDL foi novamente registrado. Um teste de hipótese será conduzido para determinar se as médias de nível de colesterol LDL são signif. diferentes entre os dois grupos.
Comparação de duas populações Efeito do ruído sonoro na FR de prematuros Deseja-se determinar se o ruído de alta intensidade afeta a FR de prematuros internados em UTI neonatal. Para cada recém-nascido, registrou-se simultaneamente a FR e o ruído sonoro no interior da incubadora. Dado que o limiar de ruído recomendado em ambiente hospitalar é 65dBA, comparou-se a média de FR durante o tempo em que o ruído ficou abaixo do limiar com a respectiva média durante o tempo de ruído acima do limiar.
Comparação de duas populações Ensaio clínico Divide-se um grupo homogêneo em dois e aplica-se duas intervenções distintas Estudo observacional Valores espontâneos da variável de interesse em dois grupos ou momentos distintos Amostras pareadas Cada indivíduo é medido duas vezes em momentos ou situações distintas Amostras independentes
Comparação de duas populações Comparação de duas médias desconhecidas μ1 μ2 Qual a diferença em relação ao teste de uma média?
Teste t para duas médias O teste é o mesmo para estudo de intervenção ou observacional Amostras pareadas Teste t pareado Amostras independentes Teste t para duas amostras
Teste t pareado Cada indivíduo tem duas medições. Uma antes e outra depois de uma intervenção ou de uma evolução natural. auto-emparelhamento Cada indivíduo recebe um par que seja parecido com ele em relação a variáveis de interesse (ex.: sexo, idade,...).
Teste t pareado Problema 63 indivíduos com DAC participaram de um estudo para determinar se existe relação entre a exposição a monóxido de carbono e o decréscimo de tempo para experimentar angina durante exercícios. Cada um dos indivíduos realizou 2 baterias de teste. Na primeira, foram feitos 2 testes: um antes e outro após 1 hora descansando em ar ambiente. O decréscimo de tempo para apresentar angina foi registrado. Na segunda bateria também realizaram 2 testes: um antes e outro após 1 hora descansando em ar com monóxido de carbono. O decréscimo de tempo para apresentar angina foi novamente registrado.
Teste t pareado Redução percentual do tempo para angina após 1 hora respirando ar puro ou ar poluído Primeiros 10 indivíduos Indivíduo Ar puro Ar poluído 1 2.6 13.2 2-11.5-3.9 3 31.0 33.5 4 25.2 35.7 5 16.7 22.7 6-1.0 1.6 7-0.4 29.7 8-4.2 16.2 9-13.1-23.0 10 26.3-5.7
Teste t pareado Queda do tempo (%) para angina após 1 hora respirando ar puro ou ar poluído Primeiros 10 indivíduos Há evidência de que a redução de tempo seja diferente? Percent decrease 40 Ar puro Ar poluído 30 20 10 0-10 -20-30.5 1 2 2.5
Teste t pareado Queda do tempo (%) para angina após 1 hora respirando ar puro ou ar poluído Primeiros 10 indivíduos Há evidência de que a redução de tempo seja diferente? Variabilidade entre indivíduos Percent decrease 40 Ar puro Ar poluído 30 20 10 0-10 -20-30.5 1 2 2.5
Teste t pareado Primeiro, defina as diferenças individuais d i Indivíduo i Ar puro Rt1 Ar poluído Rt2 Diferença d = Rt1 - Rt2 1 2.6 13.2-10.6 2-11.5-3.9-7.6 3 31.0 33.5-2.5 4 25.2 35.7-10.5 5 16.7 22.7-6.0 6-1.0 1.6-2.6 7-0.4 29.7-30.1 8-4.2 16.2-20.4 9-13.1-23.0 9.9 10 26.3-5.7 32 d = n d i i=1 n
Teste t pareado Segundo, defina as hipóteses do teste H 0 : μ d = 0 H A : μ d 0 μ d média populacional das diferenças d média amostral das difrenças d = n d i i=1 n Reduz-se a um teste t de uma média com μ 0 =0 e n-1 graus de liberdade
Teste t pareado Terceiro, calcule a estatística de teste t n 1 = d 0 s d / n s d desvio-padrão das diferenças s d = n i=1 d i d 2 n 1 μ 0 =0
Indivíduo i Ar puro Rt1 i Ar poluído Rt2 i Diferença d i = Rt1 i - Rt2 i 1 2.6 13.2-10.6 2-11.5-3.9-7.6 3 31.0 33.5-2.5 4 25.2 35.7-10.5 5 16.7 22.7-6.0 6-1.0 1.6-2.6 7-0.4 29.7-30.1 8-4.2 16.2-20.4 9-13.1-23.0 9.9 10 26.3-5.7 32 d i d d i d 2 d = x 1 x 2 s d não tem nenhuma relação com s 1 e s 2
Teste t pareado n=63 0 =0 d= 6,63 s d =20,29 Há evidência para rejeitar H 0? -6,63 d
Teste t pareado n=63 0 =0 d= 6,63 s d =20,29 Pela tabela A.4 P(t 60 >2,59) < 0,01, logo P(t 62 >2,59) < 0,01 Como o teste é bilateral t 62 = d 0 s d / n = 6,63 20,29/ 63 = 2,59 p = P(t 62 >2,59 ou t 62 <-2,59) < 2 x 0,01 p < 0,02 Se α=0,05, qual a conclusão do teste?
Teste t pareado n=63 0 =0 d= 6,63 s d =20,29 p < 0,02 Se α=0,05 Rejeita-se H 0 : μ d =0 t 62 = d 0 s d / n = 6,63 20,29/ 63 = 2,59 Em favor de H A : μ d 0, ou seja: existe diferença Há evidência significativa (α=5%) de que a exposição por 1 hora ao monóxido de carbono diminua o tempo para angina durante o teste de exercícios, mais do que a não exposição.
Teste t pareado Qual a média dessa redução? Na média, a exposição ao monóx. carb. causa uma redução estimada de 6,63 pp no tempo para angina em relação a exposição ao ar puro. Qual o intervalo de confiança de 95% para essa média? IC95 %= d± t c s d n Pela tab. A.4: P(t 60 >t c )=0,025 t c =2,0 IC95 % 6,63± 2 20,29 63 = 6,63±5,11=[ 11,74 a 1,52 ]
Teste t pareado Em que outras situações podemos usar o teste t pareado?
Teste t para duas populações independentes População Amostra Grupo 1 Grupo 1 Controle μ e σ 1 1 Grupo 2 tratamento, doentes n 1 x 1 e s 1 Grupo 2 n 2 μ 2 e σ 2 Parâmetros desconhecidos x 2 e s 2 Estimadores
Teste t para duas populações independentes Problema Deseja-se determinar se há evidências de que o nível sérico de ferro seja diferente entre crianças saudáveis e as que sofrem de fibrose cística. Para o grupo controle, são selecionadas aleatoriamente crianças que são atendidas na puericultura do IFF. Para o grupo FC, são selecionados os pacientes atendidos no Centro de Referência do mesmo hospital.
Teste t para duas populações independentes Os dois grupos são independentes μ 1 e σ 1 : média e desvio-padrão populacional do nível sérico de ferro no grupo controle. μ 2 e σ 2 : média e desvio-padrão populacional do nível sérico de ferro no grupo com FC. Nas amostras x 1 e x 2 s 1 e s 2
Teste t para duas populações independentes Hipótese nula H0 : μ 1 = μ 2 Hipótese alternativa HA : μ 1 μ 2 O que mudou em relação ao teste para uma média?
Teste t para duas populações independentes As hipóteses podem ser reescritas como H0 : μ 1 μ 2 = 0 HA : μ 1 μ 2 0 Selecionam-se as duas amostras e obtém-se x 1 e x 2 s 1 e s 2
Teste t para duas populações independentes Pelo TCL: X ~N, n z= x / n Analogamente, se os grupos são independentes z= x 1 x 2 1 2 1 2 /n 1 2 2 /n 2 X 1 X 2 é aproximadamente normal com média 1 2 e variância igual a soma das duas variâncias.
Teste t para duas populações independentes Como o desvio-padrão populacional é (quase) sempre desconhecido t gl = x 1 x 2 1 2 s 1 2 /n 1 s 2 2 /n 2 O número exato de gl é difícil de calcular Utiliza-se uma aproximação gl= s 2 1 /n 1 s 2 2 /n 2 2 s 1 2 /n 1 2 n 1 1 s 2 2 /n 2 2 n 2 1 estatística de teste Arredonda-se gl para o inteiro mais baixo
Teste t para duas populações independentes Dados do problema H 0 : 1 2 =0 H A : 1 2 0 Grupo controle: n 1 =9, x 1 =18,9 mol /l, s 1 =5,9 mol /l Grupo com FC: n 2 =13, x 2 =11,9 mol /l, s 2 =6,3 mol /l Há evidências a priori de que H 0 seja falsa? Controle FC IC 95% 8 12 16 20 24 Nível sérico ferro (μmol/l)
Teste t para duas populações independentes H 0 : 1 2 =0 H A : 1 2 0 n 1 =9, x 1 =18,9, s 1 =5,9 n 2 =13, x 2 =11,9, s 2 =6,3 Assumindo H 0 verdadeira t gl = x 1 x 2 1 2 s 1 2 /n 1 s 2 2 /n 2 = x 1 x 2 s 1 2 /n 1 s 2 2 /n 2 = 18,9 11,9 5,9 2 /9 6,3 2 /13 =2,66 gl= s 2 1 /n 1 s 2 2 /n 2 2 s 1 2 /n 1 2 n 1 1 s 2 2 /n 2 2 n 2 1 = 5,92 /9 6,3 2 /13 2 5,9 2 /9 2 9 1 6,32 /13 2 13 1 =18,14 18
Teste t para duas populações independentes t 18 =2,66 Pela tabela A.4 P(t 18 >2,66) < 0,01 Como o teste é bilateral p = P(t 18 >2,66 ou t 18 <-2,66) < 2 x 0,01 p-valor < 0,02 Se α=0,05, qual a conclusão do teste?
Teste t para duas populações independentes t 18 =2,66 p < 0,02 Se α=0,05 Rejeita-se H0 : μ 1 =μ 2 Em favor de HA : μ 1 μ 2 Há evidência significativa (α=5%) de que o nível sérico de ferro seja diferente entre crianças saudáveis e as que sofrem de fibrose cística.
Teste t para duas populações independentes Qual a média dessa diferença? Uma estimativa da média da diferença do nível sérico de ferro entre crianças normais e com FC é x 1 x 2 =18,9 11,9=7 mol /l Qual o intervalo de confiança de 95% para essa diferença média? IC95 %= x 1 x 2 ±t c s 2 1 n 1 s 2 Pela tab. A.4: P(t 18 > t c ) = 0,025 t c =2,101 IC95 %=7±2,101 2,63=7±5,53= 1,47 a 12,53 2 n 2
Teste t para duas populações independentes Cite mais alguns exemplos de estudos que necessitarão do teste t para duas populações independentes.
Resumindo 1 população 2 populações Independentes Pareadas H 0 = 0 1 = 2 ou 1 2 =0 d =0 Estatística de teste z= x 0 / n t= x 0 s/ n t= x 1 x 2 s 2 1 s 2 2 n 1 n 2 t= d s d / n gl - n 1 s 2 1 s 2 2 n 1 s 2 1 n 1 2 n 2 2 n 1 1 s2 n 1 2 n 2 2 n 2 1 p-valor bilateral 2 P Z z 2 P t gl t 2 P t gl t 2 P t gl t
Exercício Deseja-se investigar os efeitos de um medicamento anti-hipertensivo em pessoas acima de 60 anos com hipertensão sistólica isolada. Para tal, selecionou-se aleatoriamente uma amostra de 2308 indivíduos para tomarem o medicamento e outra de 2293 para tomarem placebo, durante 1 ano. A pressão sanguínea sistólica média populacional do grupo de tratamento é μ 1 e do grupo controle μ 2. Nas amostras encontrou-se x 1 =142,5 mmhg, s 1 =15,7 mmhg x 2 =156,5 mmhg, s 2 =17,3 mmhg Conduza o teste de hipótese adequado com α=0,05.