Curso de Especialização em Fisioterapia Traumato-Ortopédica / 2010 NOÇÕES DE BIOSTATÍSTICA STICA Prof a. Lilian Pinto da Silva Faculdade de Fisioterapia Universidade Federal de Juiz de Fora lilian.pinto@ufjf.edu.br 1
Organização de dados Planilha eletrônica Microsoft Excel Organizar os dados colocando os sujeitos ou cases nas linhas e as medidas ou variáveis nas colunas 2
Medidas de tendência central Médias aritmética e ponderada Mediana elemento central de uma distribuição ordenada (medida de posição) Moda valor mais frequente 3
Relação entre as medidas de tendência central Moda = mediana = média distribuição simétrica 4
Relação entre as medidas de tendência central Moda < mediana < média distribuição assimétrica positiva 5
Relação entre as medidas de tendência central Moda > mediana > média distribuição assimétrica negativa 6
Medidas de posição Mediana Quartis: divide a distribuição em quatro partes iguais Decis: divide a distribuição em dez partes iguais Percentis: divide a distribuição em cem partes iguais 7
Medidas de dispersão Amplitude total range = valor máximo valor mínimo Desvio padrão mede o quanto que, em média, cada valor da distribuição distancia-se da média Variância DP 2 8
Curtose Medida de achatamento da curva 9
Construção da nossa planilha de dados Idade, peso, altura e índice de massa corporal (IMC) dos alunos presentes f x = C2/D2^2 Medidas de tendência central e de dispersão 10
Análise exploratória dos dados No Excel ir em: Ferramentas Análise de dados Análise descritiva 11
Análise exploratória dos dados 12
Análise exploratória dos dados 42 Box Plot (Dados sala_todos.sta 5v*29c) 40 38 36 34 32 30 28 26 Distribuição assimétrica positiva: 50% dos alunos da sala tem entre 25 e 21 anos 24 22 20 Idade Median = 25 25%-75% = (24, 29) Non-Outlier Range = (21, 36) Outliers 13
Análise exploratória dos dados 85 Box Plot (Dados sala_todos.sta 5v*29c) 80 75 70 65 60 55 50 45 40 Peso Median = 56 25%-75% = (48, 65) Non-Outlier Range = (42, 83) Distribuição simétrica 14
Análise exploratória dos dados 1,85 Box Plot (Dados sala_todos.sta 5v*29c) 1,80 1,75 1,70 1,65 1,60 1,55 1,50 1,45 Altura Median = 1,64 25%-75% = (1,59, 1,72) Non-Outlier Range = (1,5, 1,83) Distribuição simétrica 15
Análise exploratória dos dados 28 Box Plot (Dados sala_todos.sta 5v*29c) 26 24 22 20 18 16 IMC Median = 20,898 25%-75% = (18,9866, 24,093) Non-Outlier Range = (16,8242, 26,3702) Distribuição simétrica 16
Divisão da nossa planilha de dados No Statistica: Os dados foram divididos em dois grupos: Grupo 1 (sujeitos = 25 anos; n = 17) e Grupo 2 (sujeitos > 25 anos; n = 12) Criar variável grupo Nomear variáveis (colunas) Temos 29 cases (linhas) 17
Comparação de dados entre os dois grupos 42 Box Plot (Dados sala_todos.sta 5v*29c) 40 Idade 38 36 34 32 30 28 26 24 22 20 1 2 Grupo Median 25%-75% Non-Outlier Range Outliers As caixas não se sobrepõem, o que nos leva a crer que as duas amostras são diferentes quanto à variável idade 18
Comparação de dados entre os dois grupos Peso 85 80 75 70 65 60 55 50 45 Box Plot (Dados sala_todos.sta 5v*29c) As caixas se sobrepõem, o que nos leva a crer que as duas amostras não são diferentes quanto à variável peso 40 1 2 Grupo Median 25%-75% Non-Outlier Range 19
Comparação de dados entre os dois grupos Altura 1,85 1,80 1,75 1,70 1,65 1,60 1,55 Box Plot (Dados sala_todos.sta 5v*29c) As caixas se sobrepõem, o que nos leva a crer que as duas amostras não são diferentes quanto à variável peso 1,50 1,45 1 2 Grupo Median 25%-75% Non-Outlier Range 20
Comparação de dados entre os dois grupos IMC 28 26 24 22 20 18 Box Plot (Dados sala_todos.sta 5v*29c) As caixas se sobrepõem, o que nos leva a crer que as duas amostras não são diferentes quanto à variável peso 16 1 2 Grupo Median 25%-75% Non-Outlier Range 21
Teste de Normalidade Antes de aplicar os testes estatísticos para comparação de médias entre os dois grupos fazer teste de normalidade para verificar se os dados de cada grupo apresentam distribuição normal ou Gaussiana N > 30 Teste de Kolmogorov-Smirnov N = 30 Teste de Shapiro-Wilk No Statistica: Graphs Histograms... ir para a aba Advanced selecionar o teste desejado voltar para aba Quick selecionar variáveis a serem testadas Testar um grupo de cada vez separar em dois arquivos 22
Testes de Normalidade: como interpretar o resultado? 8 Histogram (Dados grupo1.sta 5v*17c) Idade = 17*1*normal(x; 23,5882; 1,0641) 7 6 5 No of obs 4 3 2 1 0 Idade: SW-W = 0,888359313, p = 0,0435 21 22 23 24 25 Idade Considerando um nível de significância de a = 0,05, se p valor <0,05 rejeitar a hipótese de que os dados têm distribuição normal 23
Teste de Normalidade (Grupo 1) 8 Histogram (Dados grupo1.sta 5v*17c) Idade = 17*1*normal(x; 23,5882; 1,0641) 5 Histogram (Dados grupo1.sta 5v*17c) Peso = 17*5*normal(x; 54,2353; 9,3309) 7 4 6 5 3 No of obs 4 3 No of obs 2 2 1 1 0 21 22 23 24 25 Idade: SW-W = 0,888359313, p = 0,0435 Idade 0 35 40 45 50 55 60 65 70 75 Peso: SW-W = 0,94193548, p = 0,3419 Peso 5 Histogram (Dados grupo1.sta 5v*17c) Altura = 17*0,02*normal(x; 1,6235; 0,0716) 7 Histogram (Dados grupo1.sta 5v*17c) IMC = 17*1*normal(x; 20,4707; 2,5085) 4 6 5 No of obs 3 2 No of obs 4 3 2 1 1 0 1,46 1,50 1,54 1,58 1,62 1,66 1,70 1,74 1,78 Altura: SW-W = 0,967455296, p = 0,7725 Altura 0 15 16 17 18 19 20 21 22 23 24 25 26 27 28 IMC: SW-W = 0,902477945, p = 0,0747 IMC 24
Teste de Normalidade (Grupo 1) 3 Histogram (Dados grupo2.sta 5v*12c) Idade = 12*1*normal(x; 31,5; 4,9267) 4 Histogram (Dados grupo2.sta 5v*12c) Peso = 12*5*normal(x; 64,4167; 10,8582) 3 2 No of obs No of obs 2 1 1 0 26 28 30 32 34 36 38 40 Idade: SW-W = 0,922813699, p = 0,3101 Idade 0 40 45 50 55 60 65 70 75 80 85 90 Peso: SW-W = 0,967725568, p = 0,8856 Peso 5 Histogram (Dados grupo2.sta 5v*12c) Altura = 12*0,05*normal(x; 1,68; 0,0888) 4 Histogram (Dados grupo2.sta 5v*12c) IMC = 12*1*normal(x; 22,7146; 2,5374) 4 3 No of obs 3 2 No of obs 2 1 1 0 1,45 1,50 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90 Altura: SW-W = 0,957888467, p = 0,7533 Altura 0 17 18 19 20 21 22 23 24 25 26 27 IMC: SW-W = 0,918771388, p = 0,2759 IMC 25
Testes estatísticos para comparação de médias entre duas amostras independentes Para dados que apresentam distribuição normal utilizar testes paramétricos Para dados que não apresentam distribuição normal utilizar testes não paramétricos Para a comparação de médias do peso, altura e IMC entre os grupos 1 e 2 será utilizado o teste t de Student para amostras independentes, considerando-se que tais dados apresentaram distribuição normal Para a comparação da média de idade entre os grupos 1 e 2 será utilizado o teste de Mann-Whitney, considerando-se que tais dados não apresentaram distribuição normal 26
Testes estatísticos para comparação de médias entre duas amostras independentes Resultado do teste t de Student p valor < 0,05 existe diferença estatisticamente significativa entre os grupos 1 e 2 para as variáveis peso e IMC (nossa suposição a partir da análise exploratória não foi confirmada para estas variáveis!) 27
Testes estatísticos para comparação de médias entre duas amostras independentes Resultado do teste de Mann-Whitney p valor < 0,05 existe diferença estatisticamente significativa entre os grupos 1 e 2 para a variável idade (nossa suposição a partir da análise exploratória foi confirmada para esta variável!) 28
Como escolher o testes estatísticos a ser aplicado para comparação de dados? Dados com distribuição normal (testes paramétricos) Duas amostras Amostras Múltiplas Dependentes Independentes Dependentes Independentes Teste t para amostras pareadas ou dependentes Teste t para amostras nãopareadas ou independentes Análise de variância (ANOVA) one-way para amostras dependentes ou medidas repetidas Análise de variância (ANOVA) one-way para amostras independentes post-hoc 29
Como escolher o testes estatísticos a ser aplicado para comparação de dados? Dados sem distribuição normal (testes não-paramétricos) Duas amostras Amostras Múltiplas Dependentes Independentes Dependentes Independentes Teste de Wilcoxon Teste de Mann- Whitney Teste de Friedman Teste de Kruskal-Wallis post-hoc 30
Exemplo: amostras múltiplas independentes com distribuição normal 65 60 55 50 45 40 Grupos; LS Means Current effect: F(3, 40)=6,2753, p=,00136 Effective hypothesis decomposition Vertical bars denote 0,95 confidence intervals A variável DPirr é diferente entre os grupos DPiRR 35 30 25 20 15 10 5 0 20-29 30-39 40-49 50-59 Grupos 31
Onde está a diferença? O resultado do post-hoc de Tukey e de Scheffe apontaram a existência de diferença estatisticamente significativa entre as faixas etárias de 40-49 e 50-59 anos em comparação a de 20-29 anos 32
Referências Glantz, S.A. Primer of Biostatistics. 4 ed. New York: McGraw-Hill, 1997 Vieira, S. Introdução a Bioestatística. 4 ed. Rio de Janeiro: Campus-Elsevier, 2008 33