Como calcular a amostra na pesquisa odontológica? Mauro Henrique Nogueira Guimarães de Abreu Universidade Federal de Minas Gerais 2010
Referências 1. Babbie, E. Métodos de pesquisa de survey. Belo Horizonte: Editora UFMG, 2001. 519p. 2. Hulley, S.B. et al. Delineando a pesquisa clínica: uma abordagem epidemiológica. 3.ed. São Paulo: Artmed, 2008. 384p. 3. Luiz, R.R. et al. Planejamento amostral. In: Luiz, R.R.; Costa, A.J.L.; Nadanovsky, P. Epidemiologia e bioestatística na pesquisa odontológica. São Paulo: Atheneu, 2005. p.245-272. 4. Lwanga, S.K.; Lemeshow, S. Sample size determination in health studies. Geneva: WHO, 1991. 80p. 5. Pereira, M.G. Epidemiologia. Teoria e Prática. Rio de Janeiro: Guanabara Koogan, 1995. 583p. 6. Riffenburgh, R.H. Statistics in medicine. 2.ed. San Diego: Elsevier, 2006. 622p. 7. Silva, N.N. Amostragem probabilística. 2.ed. São Paulo: EDUSP, 2004. 235p.
Conteúdo programático Conceitos gerais Esquemas amostrais Tamanho da amostra
Conceitos iniciais População: é a agregação de elementos da qual é extraída a amostra do meu estudo Amostra representativa: os objetos de estudos foram selecionados de forma a conseguir boa cobertura, os métodos de avaliação desses objetos são conhecidos e passíveis de reprodução/repetição (confiabilidade)
Conceitos iniciais Amostras probabilísticas: são amostras obtidas por aleatorização. A idéia de aleatorização é conseguir uma amostra com características bem próximas da população
Conceitos iniciais Amostras probabilísticas: são amostras obtidas por aleatorização. Essa amostra não pode ser considerada representativa da população
Quando utilizar amostras? Quando trabalhar com população? Depende do meu objeto de estudo: Avaliar a prevalência de cárie entre os 45 escolares com necessidade especial de uma determinada escola do meu município? Amostra OU População
Quando utilizar amostras? Quando trabalhar com população? Depende do meu objeto de estudo: Avaliar a prevalência de cárie entre os brasileiros em 2003? Amostra OU População
Utilidade da amostragem População muita extensa Não há tempo e/ou recursos suficientes para o estudo de toda a população O estudo objetiva avaliar vários detalhes de cada unidade do estudo A característica a ser estudada é muito variável, sujeita a alterações bruscas em curto período de tempo
Para determinar a população-alvo: Determinar critérios de exclusão e inclusão específicos Inclusão: aspectos que serão importantes para o estudo: características demográficas, clínicas, geográficas, temporais. Exclusão: questões que podem dificultar a coleta de dados por falta de adesão, incapacidade de fornecer dados, alto risco de efeitos adversos.
Para determinar a população-alvo: Estudo sobre a adesão de pais/responsáveis a medidas de controle mecânico-químico de placa em pacientes com deficiências físicas (Abreu et al., 2002) Critérios de inclusão: diagnóstico médico da referida deficiência, idade entre 7 e 21 anos, ambos os sexos, pais autorizaram Critérios de exclusão: outros diagnósticos médicos (Ex. Síndrome de Down)
Unidade de observação Depende do objeto do estudo: Cárie dentária: dente, grupo de dentes, indivíduo, comunidade Biofilme/Placa dentária: superfície, dente, grupo de dentes, indivíduo, comunidade Oclusopatias: indivíduo, comunidade Opinião/percepção: indivíduo, comunidade
Escolhendo sujeitos para o estudo que representem a população de interesse VERDADE NO UNIVERSO Inferência Erros VERDADE NO ESTUDO Inferência Erros ACHADOS NO ESTUDO Questão de pesquisa Delineamento Plano de estudo Implantação Estudo realizado População-alvo Amostra pretendida Sujeitos estudados Fenômenos de interesse Variáveis pretendidas Aferições realizadas Validade externa Validade interna (HULLEY et al., 2008)
Esquemas amostrais Com a determinação da unidade amostral e da população-alvo, passa-se à definição do esquema probabilístico mais adequado para a seleção da amostra. Mais uma vez, o esquema a ser escolhido depende do meu objetivo.
Esquemas amostrais Amostragem aleatória simples Abreu et al. (2002): População-alvo: escolares 7-21 anos com deficiência física, matriculados na Escola João Moreira Salles. Há uma listagem atualizada e confiável desses alunos. Numero todos os indivíduos e faço sorteio ou uso Tabela de Números Aleatórios (dando a mesma chance para todos) para selecionar a amostra.
Esquemas amostrais Amostragem aleatória simples Tabela de números aleatórios 8 0 7 7 8 7 0 2 7 6 5 8 6 8 4 0 0 7 0 8 9 7 3 3 1 1 4 6 1 8 2 0 8 5 2 5 4 0 5 6 4 8 0 6 6 3 8 6 9 6 7 5 4 9 9 4 3 6 1 5
Esquemas amostrais Amostragem aleatória simples Tabela de números aleatórios Numerei os escolares de 1 a 176 Vou escolher uma forma de ler a tabela de números aleatórios: por exemplo, sempre da esquerda para a direita e de cima para baixo. Assim teremos os seguintes selecionados:
Esquemas amostrais Tabela de números aleatórios 8 0 7 7 8 7 0 2 7 5 8 6 8 4 0 0 7 0 9 7 3 3 1 1 4 6 1 1 0 8 5 2 5 4 0 5 4 8 0 6 6 3 8 6 9 7 5 4 9 9 4 3 6 1
Como sortear no Epi Info?
AMOSTRAGEM ALEATÓRIA SIMPLES
Esquemas amostrais Amostragem sistemática Você sorteia o primeiro indivíduo e segue um intervalo de amostragem Exemplo: selecionamos aleatoriamente o indivíduo número 15 e, a partir de então, selecionamos o no. 25, 35, 45, 55, etc... (com um intervalo de amostragem igual a 10).
AMOSTRAGEM SISTEMÁTICA
Esquemas amostrais Amostragem aleatória estratificada Vamos supor que o objetivo da minha pesquisa é avaliar a opinião de CD com até 10 anos de formados e com mais de 10 anos de formados, na cidade de Itajubá sobre o atendimento odontológico ao paciente com aids. O objetivo da estratificação é diminuir a possibilidade de erro. Desta forma, realiza-se o processo de AAS ou sistemática em cada grupo separadamente.
AMOSTRAGEM ALEATÓRIA ESTRATIFICADA
Esquemas amostrais Amostragem por conglomerados Vamos supor que o objetivo da minha pesquisa avaliar a experiência de cárie dentária entre adultos de uma cidade. Não há lista atualizada desses adultos. Deve-se sortear setores censitários ou quadras e trabalhar com amostra domiciliar. Efeito do Desenho Design of EFFect (DEFF)
AMOSTRAGEM POR CONGLOMERADOS
AMOSTRAGEM POR CONGLOMERADOS
Tamanho da amostra É uma questão que deve ser sempre avaliada para que eu diminua o meu erro aleatório. No entanto eu não posso incluir pessoas em excesso por questões de tempo/recursos e questões éticas. Não existe, geralmente, um número MÁGICO de participantes para que eu realize meu estudo
Tamanho de amostra Preciso conhecer e definir alguns parâmetros anteriormente: Precisão ( margem de erro ): Exemplo ao definir a prevalência de cárie em uma comunidade, eu posso considerar aceitável um erro de 3%. Ou seja, se a prevalência estiver próxima a 77%, o estudo aceitaria encontrar valores entre 74% e 80%. O pesquisador define a precisão necessária
Tamanho de amostra Qual é o objetivo do meu estudo???? Descrever uma proporção? Descrever uma variável quantitativa? Comparar duas proporções? Comparar duas médias? Estudar determinantes de doenças em populações? Caso-controle? Coorte?
Tamanho de amostra Estimativas para proporções Devo ter conhecimento sobre Prevalência da condição a ser estudada (p) Proporção de indivíduos sem a condição (1-p) Precisão requerida para a estimativa (d) Nível de confiança (1- ) - seu valor z
Valores de ou Valor ou Valores tabelados de z 0,001 3,291 0,01 2,576 0,05 1,960 0,10 1,645 0,20 1,290
Tamanho de amostra Estimativas para proporções A fórmula é: n= (nível de confiança) (p) (1-p) (d) (d) 2
Tamanho de amostra Estimativas para proporções: Exemplos Exemplos: A coordenação de saúde bucal de um município deseja conhecer a prevalência de crianças livres de cárie aos 12 anos de idade. Quantas crianças seriam necessárias se a precisão admissível é de 5%, com um grau de confiança de 95% e se o valor real parece não exceder 20%?
Tamanho de amostra Estimativas para proporções: Resolução Proporção da população (p) = 20% (0,20) Nível de confiança (1- ) = 95% (1,96 - em tabela) Precisão (d = 15%-25%) n= (1,96) (1,96) (0,2) (1-0,2) (0,05) (0,05) n= 246 crianças
População infinita Prevalência esperada Precisão Aperte F4
IC 95% - 246 indivíduos
Tamanho de amostra Estimativas para proporções: Exercício Você precisa fazer um cálculo amostral para conhecer a prevalência de livres de cárie dentária aos 7 anos em uma comunidade. Quantas crianças seriam examinadas se, a precisão admissível é de 5%, com um grau de confiança de 95% e se o valor real parece não exceder 40%?
Tamanho de amostra Estimativas para proporções: Exemplos Você precisa fazer um cálculo amostral para conhecer a prevalência de livres de cárie dentária aos 12 anos em uma comunidade. Quantas crianças seriam examinadas se, a precisão admissível é de 15 por cento do valor real (0,15 x p) com um grau de confiança de 95% e se o valor real parece não exceder 20%?
Tamanho de amostra Estimativas para proporções: Resolução Proporção da população (p) = 20% (0,20) Nível de confiança = 95% Precisão relativa (de 17%-23%) = 15% (de 20%) n= (1,96) (1,96) (0,2) (1-0,2) 683 crianças 2 (0,15) x (0,20)
Tamanho de amostra Estimativas para proporções: Resolução n= 683 crianças E se meu universo for de 500 crianças? n final = n 1+n/N Onde: n final = tamanho da amostra final ajustado n = tamanho da amostra obtida no cálculo anterior N = população finita
Tamanho de amostra Estimativas para proporções: Resolução n final = n 1+n/N - n final = 683 1+683/500 - n final = 683 1+1,366 - n final = 289 crianças
Tamanho de amostra Estimativas para médias Para o cálculo eu preciso determinar Desvio padrão da média (s) Precisão requerida para a estimativa (e) Nível de confiança (1- ) - seu valor z
Tamanho de amostra Estimativas para médias A fórmula é a seguinte: n= (nível de confiança) (s) e 2 2 2
Tamanho de amostra Estimativas para médias: Exemplo: Deseja-se conhecer o número médio de dentes permanentes com experiência de cárie em uma comunidade, aos 12 anos. Em um estudo prévio, os valores encontrados foram: CPOD médio valendo 2,7 e desvio padrão 0,5. Quantas crianças deve-se examinar se eu admito uma precisão igual a 0,2 e um nível de confiança de 95%.
Tamanho de amostra Estimativas para médias: Desvio padrão (s) = 0,5 Nível de confiança = 95% Erro aceitável = 0,2 Na fórmula tem-se: (1,96) (1,96) (0,5) (0,5) = 25 (0,2) (0,2) Deveríamos examinar 25 crianças
Tamanho de amostra Estimativas para médias: Exercício Um estudo quer determinar o número médio de papilas sangrantes em pacientes com Paralisia Cerebral. O estudo piloto mostrou que em média há 12 papilas com desvio padrão igual a 6. Considerando um nível de confiança de 95%, um erro de 10% da média, quantos indivíduos deveriam participar do estudo?
Tamanho de amostra Estimativas para médias: Exercício Média de papilas = 12 Desvio padrão (s) = 6 Nível de confiança = 95% Erro aceitável (10,8-13,2) = 10% (de 12) n= (1,96) (1,96) (6) (6) = 96 indivíduos (1,2) 2
Tamanho de amostra Em um estudo laboratorial, deseja-se determinar a força de adesão em MPa de um novo sistema adesivo em dentina. Supondo em estudo piloto, o teste de tração revelou uma força foi igual a 20,4 (±3,7) MPa. Considerando o nível de confiança igual a 95% e erro aceitável de 10% da média, quantos corpos de prova deveriam ser testados?
Tamanho de amostra Estimativas para médias: Exercício Força de adesão= 20,4 Desvio padrão (s) = 3,7 Nível de confiança = 95% Erro aceitável (18,36-22,44) = 10% (de 20,4) n= (1,96) (1,96) (3,7) (3,7) = 13 corpos de prova (2,04) 2
E quando a média não for um bom parâmetro??
Tamanho de amostra Estimativas para variáveis quantitativas: A fórmula é a seguinte: n= (desvio padrão) (erro aceitável) (diferença DP) 2 2 Riffenburg (2006, p.402)
Não há muito desenvolvimento de técnicas de cálculo amostral quando a distribuição não é normal Riffenburg (2006, p.415)
Tamanho de amostra ESTUDOS COMPARATIVOS: PROPORÇÃO Um estudo deseja comparar a eficácia de um novo selante. A eficácia da nova terapia, por estudo piloto, vem sendo de 50% enquanto que para a terapia tradicional é de 40%. Qual é a amostra necessária para se verificar a eficácia da paralisação do processo carioso, se há uma diferença de 10% entre os grupos, com nível de significância de 5% (α=0,05) e um poder do teste de 0,9 (β=0,10)?
DECISÃO DO JÚRI Inocência: o réu não falsificou dinheiro Culpa: o réu falsificou dinheiro Padrão para rejeitar a inocência: Dúvida além do razoável Julgamento correto: Culpar o estelionatário Julgamento correto: Absolver o inocente Julgamento incorreto: Condenar o inocente Julgamento incorreto: Absolver o estelionatário TESTE ESTATÍSTICO H.Nula Não há associação entre tabaco e Ca de boca H.Alternativa Há associação Padrão para rejeitar uma H.Nula: Nível de significância estatística (α) Inferência correta: concluir que há associação entre Ca e tabaco quando há essa associação na população Inferência correta: concluir que não há essa associação quando não houver na população Inferência incorreta (erro tipo I - α): concluir que há associação quando não houver Inferência incorreta (erro tipo II - β): concluir que não há associação quando houver
UMA SÍNTESE DESSAS IDEIAS... Verdade na população Há associação entre variáveis (H1) Não há associação (H0) Resultados na amostra do estudo Rejeita a Hipótese Nula (H1) Aceita a Hipótese Nula (H0) CORRETA Poder do teste ERRO TIPO II ERRO TIPO I CORRETA
Os valores... Valores de α e β Valores tabelados (bicaudal) Valores tabelados (unicaudal) 0.001 3.29 3.09 0.01 2.58 2.33 0.05 1.96 1.64 0.10 1.64 1.28 0.20 1.29 0.84
FÓRMULA n={z 1-α/2 2p(1-p) + z β [ p 1 (1-p 1 )+p 2 (1-p 2 )]} 2 d 2 I. p = média das proporções das condições comparadas II. P 1 = proporção da condição de um grupo III. P 2 = proporção da condição do outro grupo IV. d = diferença entre os grupos V. α = nível de significância VI. 1-β = poder do teste
CÁLCULO n={1,96 2(0,45)(1-0,45) + 1,28[ 0,4(1-0,4)+0,5(1-0,5)]} 2 (0,10) 2 n=518 dentes em cada grupo I. p = média das proporções das condições comparadas (0,45) II. P 1 = proporção da condição de um grupo (0,40) III. P 2 = proporção da condição do outro grupo (0,50) IV. d = diferença entre os grupos (0,10) V. α = nível de significância (1,96) VI. 1-β = poder do teste (0,90 i.e. β=0,10-1,28)
1) http://www.statpages.org/proppowr.html
2) EPI INFO 6.04d Epi Table
3) Laboratório de Epidemiologia e Estatística LEE USP http://www.lee.dante.br/pesquisa/amostragem/di_2_pro.html
3) Laboratório de Epidemiologia e Estatística LEE - USP
4) http://www.cct.cuhk.edu.hk/stat/
4) http://www.cct.cuhk.edu.hk/stat/
4) http://www.cct.cuhk.edu.hk/stat
5) http://www.quesgen.com/ssprop.php
E em estudos de coorte? Exposto Doentes Amostra nãodoentes Não-doentes Doentes Não-exposto População Não-doentes Observação
Estudos de coorte: análise Incidência entre os expostos Incidências entre os não-expostos Risco Relativo = IE/IñE Risco Atribuído = IE - IñE
1) EPI INFO 6.04d e 2002 Stat Calc
1) EPI INFO 6.04d e 2002 Stat Calc
2) Power and Sample Size Calculations
2) Power and Sample Size Calculations
E em estudos de caso-controle? Expostos Não-expostos Doentes Expostos Não-expostos Não-doentes Observação População
1) EPI INFO 6.04d e 2002 Stat Calc
2) Power and Sample Size Calculations
2) Power and Sample Size Calculations v Teste Exato de Fisher
E se o caso-controle for pareado? Gênero Idade Nível econômico Tipo de pele Gênero Idade Nível econômico Tipo de pele Gênero Idade Nível econômico Tipo de pele Gênero Idade Nível econômico
Coeficiente de correlação para exposição entre os pares casos e controles Odds Ratio (Razão das chances)
RISCO versus ODDS RISCO = a possibilidade de que algo aconteça a possibilidade de que tudo aconteça ODDS = a possibilidade de que algo aconteça a possibilidade de que algo não aconteça Exemplo: Entre 100 pessoas estudadas, 20 desenvolvem câncer de boca em um ano. O RISCO é 1 em 5 (Ex: 20 em 100). A ODDS é de 1 em 4 (Ex: 20 comparados a 80).
Estudos de caso-controle Análise dos dados ODDS RATIO = CHANCE/ODDS = possibilidade de ocorrência de um evento possibilidade da não ocorrência do evento a c b d OR = a x d b x c Exposição Doença / evento Presente Ausente Presente a b Ausente c d
TAMANHO DE AMOSTRA ESTUDOS COMPARATIVOS: MÉDIA Uma pesquisadora deseja verificar a existência de diferenças entre o CPOD de crianças de níveis econômicos distintos. Estudos anteriores indicam que o CPOD das crianças mais ricas é igual a 2,5 (s = 0,5) enquanto que nas mais pobres a média é igual a 4,0 (s = 0,7). Quantas crianças deveriam participar do estudo se é desejado detectar um diferença entre os dois grupos de 0,5 unidade, com nível de significância de 5% e um poder do teste de 80%?
FÓRMULA n = (z 1-α/2 + z β ) 2 (s 12 + s 22 ) d 2
n= (1,96+1,29) 2 (0,5 2 + 0,7 2 ) 0,5 2 n= 32 crianças
Falhas que devem ser evitadas (1) A entrada de pacientes na clínica é por volta de 50 pacientes no ano, dos quais 10% podem não querer participar do estudo. Assim, ao longo de 2 anos do estudo, a amostra será de 90 pacientes. Embora a maioria dos estudos precise balancear a viabilidade com o poder, o tamanho da amostra não pode ser decidido no número de pacientes disponíveis apenas. Em estudos nos quais o número de pacientes disponíveis é um conhecido fator limitante, o cálculo amostral deverá, também ser feito, para indicar se: O poder que o estudo tem para detectar as diferenças de importância clínica/epidemiológica, OU A diferença que será detectada quando o poder desejado é aplicado. http://www.sgul.ac.uk/about-st-georges/divisions/faculty-of-medicine-and-biomedical-sciences/community-health-sciences/discipline-groups/statistics-guide/sample-size-calculations
Falhas que devem ser evitadas (2) O cálculo amostral não foi realizado pois não havia qualquer informação anterior para se basear Faça um estudo piloto; Utilize a proporção que garanta o maior cálculo (50%);
Falhas que devem ser evitadas (3) Um estudo prévio na mesma região que eu estou estudando, recrutou 150 indivíduos e encontrou resultados estatisticamente significativos (p=0,014), assim uma amostra similar deve ser suficiente no meu estudo. Estudos prévios podem ter tido sorte de encontrar tais diferenças, devido à variação amostral aleatória.
maurohenrique@ufmg.br