Dr. Stenio Fernando Pimentel Duarte
Exemplo Distribuição de 300 pessoas, classificadas segundo o sexo e o tabagismo Tabagismo Fumante (%) Não Fumante (%) Masculino 92 (46,0) 108 (54,0) Sexo Feminino 38 (38,0) 62 (62,0) Total 130 (43,3) 170 (56,7) Total (%) 200 (100,0) 100 (100,0) 300 (100,0)
Utilização de testes de hipótese em estudos epidemiológicos De modo geral não existe certeza absoluta sobre a exatidão das conclusões científicas. Os métodos estatísticos permitem determinar a margem de erro associada às conclusões, com base no conhecimento da variabilidade observada nos resultados.
Utilização de testes de hipótese em estudos epidemiológicos Um dos grandes propósitos das ciências sociais : Verificar se duas ou mais variáveis apresentam-se associadas Existe associação entre duas variáveis se o conhecimento de uma altera a probabilidade do resultado de outra
Existe associação entre o clima e a propensão de uma pessoa ir à praia?
Um dos teste mais utilizados em pesquisa social Permite testar a significância da associação (ou discrepância) entre dados nominais (descrevem estado de saúde, religião, cor, por ex.) Permite comparar duas ou mais amostras (no sentido de significância).
Distribuição do X 2 é assimétrica, uma para cada valor de graus de liberdade. Válido para freqüências absolutas. Porcentagens (%) deverão ser transformadas em frequência absoluta. Necessário construir uma tabela de contingência.
Tabela 1 Distribuição de 300 pessoas, classificadas segundo o sexo e o tabagismo Tabagismo Fumante (%) Não Fumante (%) Masculino 92 (46,0) 108 (54,0) Sexo Feminino 38 (38,0) 62 (62,0) Total 130 (43,3) 170 (56,7) Total (%) 200 (100,0) 100 (100,0) 300 (100,0) Existe associação entre sexo e tabagismo? Existe diferença significativa entre a proporção de homens fumantes e a proporção de mulheres fumantes?
Teste de hipótese: procedimento básico para inferência estatística Inferência estatística População (N) Amostra (n) Decisão sobre o limite do tamanho da diferença (desvio) entre o valor encontrado a partir de uma amostra e o valor populacional.
Hipóteses: H o : proporção homens = proporção mulheres H 1 : proporção homens proporção mulheres H 0 : Sexo e tabagismo são variáveis independentes na população em estudo. OU H 1 : Existe associação entre as variáveis sexo e tabagismo na população em estudo, portanto, dependentes.
Estatística do teste X 2 Freqüência observada esperada Freqüência Medida da distância entre freqüência observada e esperada, em cada célula da tabela, na suposição das variáveis serem independentes (H 0 verdadeira).
Cálculo das freqüências esperadas: E = (total da linha) x (total da coluna) (total geral) Onde: = somatório fo = frequencia observada na célula fe = frequencia esperada na célula X 2 = (fo- fe) 2 fe
Tabela 1 Distribuição de 300 pessoas, classificadas segundo o sexo e o tabagismo Tabagismo Fumante (%) Não Fumante (%) Masculino 92 (46,0) 108 (54,0) Sexo Feminino 38 (38,0) 62 (62,0) Total 130 (43,3) 170 (56,7) Total (%) 200 (100,0) 100 (100,0) 300 (100,0) Tabela 2 Cálculo das freqüências esperadas Tabagismo Fumante Masculino E = 130 x 200 = 86,67 300 Sexo Feminino E = 130 x 100 = 43,33 300 Total 130 Não Fumante E= 170 x 200 = 113,33 300 E = 170 x 100 = 56,67 300 Total 200 100 300 170
Tabagismo Tratamento Novo Recuperação Tratamento Convencional Total 1 Trimestre 2 Trimestre 80 70 38 64 118 134 Total (%) 150 102 252 Tabela 2 Cálculo das freqüências esperadas Tabagismo Fumante Masculino E = 130 x 200 = 86,67 300 Sexo Feminino E = 130 x 100 = 43,33 300 Total 130 Não Fumante E= 170 x 200 = 113,33 300 E = 170 x 100 = 56,67 300 Total 200 100 300 170
Fumante Tabagismo Não Fumante Masculino (92 86,67) 2 = 0,328 86,67 (108 113,33) 2 = 0,251 113,33 Sexo Feminino (38 43,33) 2 = 0,656 43,33 (62 56,67) 2 = 0,501 56,67 Assim: X 2 = 0,328 + 0,656 + 0,251 + 0,501 = 1,74
Pequeno valor de X 2 variáveis podem ser independentes, onde as Fo tendem a se aproximarem das Fe. Grande valor de X 2 variáveis podem ser dependentes, onde a diferença entre as Fo e as Fe não são meramente casuais.
Como julgar se determinado valor de X 2 é grande ou pequeno para rejeitar H 0 em favor da H 1? Os possíveis valores de X2 seguem a chamada distribuição qui-quadrado com graus de liberdade (gl). Onde: l = número de linhas c = número de colunas gl = (l -1) x (c -1)
Tabela 4 Distribuição Qui-quadrado gl 0,25 0,10 0,05 0,025 0,010... 1 1,32 2,71 3,84 5,02 6,63... X2 = 1,74 gl = 1 (2-1) x (2-1) = 1 Usando nível de significância de 95% α = 5% p = 0,05 p > 0,05 o teste aceita H 0 Não há associação entre sexo e tabagismo na população em estudo. A diferença da proporção de homens fumantes e mulheres fumantes pode ser explicada por variações casuais.
Probabilidade de significância Supondo que duas variáveis sejam independentes (H 0 verdadeira), o valor de p é a probabilidade de a estatística do qui-quadrado acusar um valor > ou = ao de x2 calculado. f(x) Valor p X 2 x
Outra maneira de cálculo: Tabela 5 Distribuição de 300 pessoas, classificadas segundo o sexo e o tabagismo Tabagismo Fumante Não Fumante Masculino 92 (a) 108 (c) Sexo Feminino 38 (b) 62 (d) Total 130 (a + b) 170 (c + d ) Total 200 (a + c) 100 (b + c) 300 (n) a b a + b c a + c d b + d c + d n
X 2 = n (ad bc)2 (a+b)x(c+d)x(a+c)x(b+d)
Limitações: Não se aplica para frequência zero Pouco confiável para frequência < 5 Não diz tamanho do efeito (IC) ou força de associação É apenas uma resposta do tipo sim/não