PRÁTICAS CIRÚRGICAS BASEADAS EM EVIDÊNCIAS: TOMOGRAFIA COMPUTADORIZADA HELICOIDAL NO DIAGNÓSTICO DA APENDICITE AGUDA

Documentos relacionados
Journal Club. Setor Abdome. Apresentação: Lucas Novais Bomfim Orientação: Dr. George Rosas

DIAGNÓSTICO. Processo de decisão clínica que baseia-se, conscientemente ou não, em probabilidade. Uso dos testes diagnósticos

Testes de triagem e provas diagnósticas

Fazer um diagnóstico. Necessidade dos testes. Foco principal. Variabilidade do teste. Diminuição das incertezas definição de normal

Exercício 4 Desempenho Diagnóstico

Fazer um diagnóstico. Testes Diagnósticos. Necessidade dos testes. Foco principal

UNIVERSIDADE FEDERAL DO RIO DE JANEIRO CENTRO DE CIÊNCIAS DA SAÚDE INSTITUTO DE ESTUDOS EM SAÚDE COLETIVA DISCIPLINA: MÉTODO EPIDEMIOLÓGICO

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão.

UNIVERSIDADE FEDERAL DE SANTA CATARINA CENTRO DE CIÊNCIAS DA SAÚDE DEPARTAMENTO DE SAÚDE PÚBLICA AULA TESTES DIAGNÓSTICOS Eleonora D Orsi Lúcio

probabilidade e não certeza Concebido como um teste laboratorial, mas também se aplica à informação obtida na história, exame físico ou raio x, etc.

Efficacy and Safety of Nonoperative Treatment for Acute Appendicitis: A Meta-analysis Pediatrics, Março 2017

Testes Diagnósticos. HEP Cassia Maria Buchalla

UNIVERSIDADE DE SÃO PAULO AVALIAÇÃO DE TESTES DE DIAGNÓSTICO

CE055 - Bioestatística A - Prova 1 - Gabarito

TEP suspeita: tratar ou não tratar? AngioTCMD negativa exclui o diagnóstico de TEP?

Curso de Metodologia Científica para Residentes. Luiz Watanabe e Ana Márcia Gaudard

Revisão sistemática: o que é? Como fazer?

Tipos de Revisão da Literatura

Universidade de São Paulo Faculdade de Saúde Pública Departamento de Epidemiologia. Testes Diagnósticos ANA PAULA SAYURI SATO

O PAPEL DOS TESTES DIAGNÓSTICOS EM POLÍTICA PÚBLICA DE SAÚDE E EM DECISÕES CLÍNICAS. Murilo Contó National Consultant PAHO/WHO

Saúde Baseada em Evidências APS Baseada em Evidências Odontologia Baseada em Evidências Decisões Baseadas em Evidências

A maioria das crianças com traumatismo craniano são jovens, do sexo masculino e têm trauma leve.

Avaliação crítica de artigos sobre diagnóstico

USG intra-op necessária mesmo com boa Tomografia e Ressonância?

Uso de Evidências no Cotidiano da Gestão Municipal do SUS

Curso de Aperfeiçoamento: Pesquisa Científica em Cirurgia Coordenadora: Profa. Dra. Lydia Masako Ferreira Vice coordenador: Juan Montano

Epidemiologia clínica

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...

Fisiopatologia Laboratorial. Exames Complementares de Diagnóstico e sua Validade

Imunologia Aplicada. Sorologia

Epidemiologia Analítica TESTES DIAGNÓSTICOS 2

Saúde Baseada em Evidências Tomada de decisões em saúde baseada em evidências. Verônica Abdala BIREME/OPAS/OMS Março 2010

APENDICITE AGUDA O QUE É APÊNCIDE CECAL? O QUE É APENDICITE E PORQUE OCORRE

Rafael Izbicki 1 / 38

ASPECTOS ÉTICOS NA APENDICITE AGUDA

Validade interna e externa em estudos epidemiológicos. Sensibilidade; Especificidade; Valor Preditivo Positivo; Valor Preditivo Negativo

Evidence-Based Medicine

PROVA DE CONHECIMENTO EM METODOLOGIA CIENTÍFICA E INTERPRETAÇÃO DE ARTIGO CIENTÍFICO NÍVEL DOUTORADO PROVA A. Candidato:

AULA 06 Correlação. Ernesto F. L. Amaral. 04 de outubro de 2013

Medidas de Associação-Efeito. Teste de significância

Modelos Bayesianos. Ernesto F. L. Amaral Magna M. Inácio

Acurácia como métrica de Avaliação de Modelos de Classificação

NBC TA 530 Amostragem em Auditoria Se aplica quando o auditor independente decide usar amostragem na execução de procedimentos de auditoria Trata do

Bioestatística F Testes Diagnósticos

CAPÍTULO 4- ESTRUTURA DO ARTIGO CIENTÍFICO

Capítulo 5 Artigos sobre Testes Diagnósticos

Ferramenta de rastreamento global: uma revisão das evidências (edição de 2016)

Declaração de possíveis conflitos de interesses

Artículo Especial: Evaluación de la evidencia científica Albert J. Jovell Y Maria D. Navarro-Rubio Med Clin (Barc) 1995;105:

Stela Adami Vayego DEST/UFPR

Amostragem e distribuições por amostragem

Desenvolvendo um protocolo de pesquisa. Profª Gracian Li Pereira Fundamentos de Pesquisa 4º período FACIMED 2011/2

Desenhos de estudos científicos. Heitor Carvalho Gomes

Tópicos. Definição. Ensaios de diagnóstico 27/11/2013. Critérios de Validação de Ensaios de Diagnóstico Imunológico e Molecular

Bioestatística F Desenho de Estudos na Área da Saúde

Elementos de Estatística. Michel H. Montoril Departamento de Estatística - UFJF

AVALIAÇÃO DOS DOENTES COM SUSPEITA CLÍNICA DE TEP COM RECURSO A ANGIO-TC Estudo retrospectivo

Caso Clínico. Paciente do sexo masculino, 41 anos. Clínica: Dor em FID e região lombar direita. HPP: Nefrolitíase. Solicitado TC de abdome.

Probabilidades em Biomedicina: Uma Aplicação da Regra de Bayes

PONTO DE VISTA / VIEWPOINT

Medicina baseada em evidências parte II Carlos Augusto Cardim de Oliveira

ABDOME AGUDO INFLAMATÓRIO EM PEDIATRIA

n Sub-títulos n Referências n Métodos: n O que você fez desenho do estudo n Em qual ordem n Como você fez n Por que você fez n Preparação

Processo de Enfermagem Avaliação de Indivíduos e Famílias Diná Monteiro da Cruz

Diagnóstico de TEV Perspetiva do Laboratório: o papel dos D-Dímeros no diagnóstico. Luísa Lopes dos Santos IPO-Porto

Bioestatística INFERÊNCIA ESTATÍSTICA. Silvia Shimakura

UNIVERSIDADE FEDERAL DE GOIÁS FACULDADE DE MEDICINA PROGRAMA DE PÓS-GRADUAÇÃO EM CIENCIAS DA SAÚDE. Processo seletivo 2018

BIOESTATÍSTICA AULA 4. Anderson Castro Soares de Oliveira Jose Nilton da Cruz. Departamento de Estatística/ICET/UFMT

RISCO. em epidemiologia

Epidemiologia Descritiva CURSO DE EPIDEMIOLOGIA VETERINÁRIA, ACT Prof. Luís Gustavo Corbellini EPILAB /FAVET - UFRGS

Journal Club (set/2010)

Metodologia Científica I Roumayne Andrade

16/05/15 EXAME CLÍNICO! EXAME CLÍNICO! EXAME CLÍNICO! Declínio notável na capacidade de clínicos para a realização de um exame clínico habilidoso.

AULA 04 Teste de hipótese

Tipos de estudos epidemiológicos

Epidemiologia Analítica TESTES DIAGNÓSTICOS

Noções de Epidemiologia

Universidade Federal de Ouro Preto. Probabilidade e avaliação de testes diagnósticos

Dimensionamento de ensaios de não inferioridade para o caso de grupos paralelos e resposta binária: algumas comparações

PLANO DE ENSINO. TOTAL: 80 horas (60 horas teóricas; 20 horas práticas)

III AMOSTRAGEM E INTERVALO DE CONFIANÇA Conceito de Amostragem AMOSTRA ALEATÓRIA

10/07/2007. Bases de dados de diretrizes. Objetivos. Diretrizes Clínicas. Definição Diretrizes ou Protocolos

Imagem da Semana: Radiografia de abdome

AULA 05 Teste de Hipótese

Epidemiologia clínica

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Bioestatística Aula 4

Avaliação da telelaringoscopia no diagnóstico das lesões benignas da laringe

Avaliação de testes diagnósticos

04/03/2008. Identificar o desenho do estudo. Opinião de especialista Exemplo: Revisão Narrativa. Identificando Principais Tipos de Estudos

UNIVERSIDADE DE SÃO PAULO

TIPOS DE ESTUDOS EPIDEMIOLÓGICOS. CLÁUDIA PINHO HARTLEBEN MÉDICA VETERINÁRIA

Ricardo Alexandre Arcêncio Outubro 2017

Medicina baseada em evidências Carlos Augusto Cardim de Oliveira

DETERMINANTES DE UM VALOR PREDITIVO

Stela Adami Vayego Estatística II CE003/DEST/UFPR

Linha Técnica Sessão VI Métodos de Homogeneização

Prof. Lorí Viali, Dr.

UNIVERSIDADE DE SÃO PAULO. Epidemiologia Geral HEP 141. Maria Regina Alves Cardoso

RM padrão de 1,5T no câncer endometrial: moderada concordância entre radiologistas

Transcrição:

Ensino ISSN 0100-6991 Vol. 35 - Nº 4, Jul. / Ago. 2008 PRÁTICAS CIRÚRGICAS BASEADAS EM EVIDÊNCIAS: TOMOGRAFIA COMPUTADORIZADA HELICOIDAL NO DIAGNÓSTICO DA APENDICITE AGUDA EVIDENCE-BASED SURGICAL PRACTICES: HELICAL COMPUTED TOMOGRAPHY IN ACUTE APPENDICITIS DIAGNOSIS Carlos Alberto Guimarães, TCBC-RJ 1 ; Bráulio dos Santos 2 ; Grupo de Estudos de Revisão Sistemática do Rio de Janeiro RESUMO: Os cirurgiões são instados a não somente ler os artigos dos periódicos, mas também a compreendê-los e analisá-los criticamente quanto à validade. Eles cuidam melhor dos seus pacientes se são capazes de analisar criticamente a literatura e aplicar os resultados a sua prática. Este é o segundo artigo de uma série - Práticas Cirúrgicas Baseadas em Evidência que tem por objetivo apresentar a avaliação crítica de um teste diagnóstico (Rev. Col. Bras. Cir. 2008; 35(4): 269-273). Descritores: Medicina baseada em evidências; Educação médica continuada; Diagnóstico; Estudos transversais; Apendicectomia; Apendicite; Ultra-sonografia; Tomografia; Tomografia Computadorizada por Raios X. INTRODUÇÃO A elaboração de um diagnóstico é um exercício cognitivo que envolve o raciocínio lógico e o reconhecimento de padrões. Inicialmente se enumeram as possibilidades diagnósticas e estimam-se as suas probabilidades relativas. No segundo passo do processo diagnóstico, incorporam-se novas informações para modificar as probabilidade relativas, para afastar algumas possibilidades e, finalmente, para escolher o diagnóstico mais provável. Assim, passa-se de uma probabilidade a probabilidade pré-teste para outra probabilidade a probabilidade pós-teste. No processo do diagnóstico diferencial, se considerarmos todas as hipóteses como igualmente prováveis e solicitarmos testes diagnósticos simultâneos, certamente o paciente será submetido a exames desnecessários. Por outro lado, o cirurgião experiente vai considerar primeiro aquelas doenças mais prováveis ou as que são potencialmente mais graves ou as que são mais responsivas ao tratamento. O objetivo deste segundo artigo da série Práticas Cirúrgicas Baseadas em Evidências é prover os cirurgiões com um guia para a análise da validade dos estudos que exploram as propriedades de um teste diagnóstico. CENÁRIO CLÍNICO Um jovem de 18 anos foi admitido no Serviço de Emergência, queixando-se de dor na projeção do hipogástrio que já durava três dias. O exame físico mostrou dor moderada à descompressão súbita no quadrante inferior direito do abdome. A temperatura axilar era de 38,8 C e o exame de sangue revelou leucocitose e aumento da proteína C-reativa. O cirurgião-chefe solicitou ao residente que providenciasse uma ultra-sonografia (US) com compressão gradual, mas esse último questionou se a tomografia computadorizada helicoidal não teria uma melhor acurácia diagnostica. O cirurgião-chefe respondeu que desconhecia as evidências científicas da superioridade da tomografia computadorizada (TC) no diagnóstico da apendicite e deu ao residente a tarefa de buscar a literatura para que voltassem a discutir o assunto no dia seguinte. BUSCA BIBLIOGRÁFICA O residente, que já havia realizado um breve treinamento sobre busca em bases bibliográficas, resolveu acessar a base MEDLINE pela interface PubMed (http:// www.pubmed.gov). Na base MeSH, ele selecionou os descritores relevantes e acabou elaborando a seguinte estratégia: ( Tomgraphy, Spiral Computed [Mesh] AND Appendicitis [Mesh]). Com essa estratégia, ele chegou a 41 artigos e selecionou, pelo título, um que comparava a tomografia computadorizada com a ultra-sonografia, era de acesso livre e podia ser obtido no endereço http:// www.sma.org.sg/smj/4801/4801a12.pdf¹. AVALIAÇÃO CRÍTICA DO ARTIGO ENCONTRADO A avaliação crítica do artigo foi baseada na leitura do texto How to Use an Article About a Diagnostic Test ². 1. Professor Titular de Clínica Cirúrgica do Curso de Graduação em Medicina da Fundação Educacional Serra dos Órgãos (Teresópolis, RJ); Professor Adjunto do Departamento de Cirurgia UFRJ. 2. Médico da Coordenação de Ensino e Pesquisa (Unidade de Epidemiologia Clínica) do Instituto Nacional de Cardiologia, Ministério da Saúde. Recebido em: 15/01/2008 Aceito para publicação em: 20/02/2008 269

Rev. Col. Bras. Cir. Quando se decide que um artigo sobre um teste diagnóstico é particularmente relevante (título e resumo sugerem que a informação seja importante para o problema do nosso paciente), podemos fazer as mesmas três perguntas mencionadas no primeiro artigo desta série³. Essas três questões serão respondidas, utilizando o artigo de Gamanagatti et al. que comparou a acurácia da tomografia computadorizada helicoidal (TCH) e da ultrasonografia no diagnóstico da apendicite aguda. OS RESULTADOS DO ESTUDO SÃO VÁLIDOS? Foi realizada uma comparação independente (cega) do teste diagnóstico com o padrão-ouro? A avaliação do desempenho de um teste requer a sua comparação com algum procedimento que assegure o diagnóstico de interesse. A esse procedimento, seja ele um exame laboratorial, patológico, funcional ou de imagem, achado cirúrgico ou mesmo seguimento clínico, chamamos padrão de referência ou padrão-ouro. Embora o padrão-ouro quase sempre seja imperfeito, ele deve ser uma das formas consensualmente aceitas pela comunidade científica para certificar o diagnóstico em questão. Sempre que possível, o teste estudado e o padrão-ouro devem ser interpretados de forma independente, ou seja, o profissional que avalia o teste não deve saber do resultado do padrão-ouro e vice-versa. No estudo em questão, os dois testes foram realizados pelo mesmo radiologista, mas foram depois avaliados independentemente por dois outros profissionais mais experientes, e apenas essa última avaliação foi considerada na análise. No entanto, o padrão-ouro para o diagnóstico de apendicite foi o achado operatório e o cirurgião conhecia os resultados dos exames de imagem. O mascaramento dos resultados dos exames resultaria numa avaliação mais correta de seu desempenho diagnóstico, mas seria eticamente inaceitável, já que no melhor interesse dos pacientes, os cirurgiões devem ter acesso a todas as informações pré-operatórias disponíveis. A amostra dos doentes utilizada no teste diagnóstico incluiu o espectro encontrado na prática clínica? A amostra ideal de um estudo de acurácia diagnostica deve ser representativa da população submetida ao teste na prática clínica. Amostras que contenham apenas pacientes com probabilidade pré-teste muito alta ou muito baixa de doença, só são aceitáveis em situações específicas (por exemplo, testes de rastreamento freqüentemente são aplicados a populações de baixo risco de doença; exames invasivos em geral só são realizadas em populações de risco alto). Gamanagatti et al. incluíram pacientes consecutivos que chegaram ao hospital com dor abdominal aguda e achados clínicos e laboratoriais sugestivos de apendicite. Portanto, a amostra foi representativa da população à qual, na prática, os testes serão aplicados. O resultado do teste que está sendo avaliado influenciou na decisão de realizar o teste padrão-ouro? Para uma avaliação adequada do desempenho diagnóstico de um teste, todos os pacientes incluídos devem submeter-se ao teste e ao padrão-ouro. Quando o padrão-ouro é um procedimento invasivo, a decisão de realizá-lo é freqüente 270 e compreensivelmente influenciada pelo resultado do teste sob investigação. Os autores relatam que o cirurgião sabia dos resultados dos exames de imagem, mas essa informação não foi utilizada para a decisão de operar os pacientes. Como o artigo não descreve como isso foi alcançado (uma possibilidade seria o cirurgião só ter acesso aos resultados da US e da TC após decisão de operar ou não o paciente), é legítimo que haja dúvida quanto à correção do procedimento. Seis dos 58 pacientes examinados com a US e a TC não foram submetidos à intervenção cirúrgica; a melhor solução seria incluir todos os pacientes na análise estatística e utilizar as conclusões extraídas do seguimento clínico como substitutas do padrão-ouro. No entanto, os autores optaram por excluí-los, o que pode ter viciado as suas estimativas. Foi realizada uma descrição detalhada do teste diagnóstico para permitir sua reprodução? A maior parte dos testes diagnósticos é sujeita a variações técnicas que influenciam o seu desempenho diagnóstico. Portanto, os estudos de acurácia devem incluir descrições operacionais suficientemente detalhadas para que o leitor possa julgar se os testes foram realizados com técnica adequada e para que ele possa reproduzi-los em sua prática. Na nossa opinião, esse item foi abordado corretamente no artigo analisado. QUAIS SÃO OS RESULTADOS DO ESTUDO? As razões de verossimilhança para os resultados do teste são apresentadas ou os dados estão disponíveis para calculá-las? A utilidade de um teste diagnóstico se baseia na sua capacidade de modificar a estimativa prévia de probabilidade de doença. Essa probabilidade prévia, ou probabilidade préteste, pode ser obtida de várias maneiras: pela prevalência populacional da doença, por meio de regras de predição clínica ou simplesmente pela tradução numérica do grau de suspeição do diagnóstico pelo médico. A base para a interpretação de testes diagnósticos é a tabela de contingência teste x doença (tabela 1). Das quatro casas da tabela, duas correspondem a acertos do teste (teste positivo e doença, teste negativo e ausência da doença) e duas a erros (teste positivo e ausência da doença, teste nega- Tabela 1 - Contingência teste x doença. D + D - T + VP FP T - FN VN D + Doente D - Não doente T + Teste positivo T - Teste negativo VP Verdadeiro positivo VN Verdadeiro negativo FP Falso positivo FN Falso negativo

Vol. 35 - Nº 4, Jul. / Ago. 2008 tivo e doença). A essas casas damos, respectivamente, o nome de verdadeiro positivo (VP), verdadeiro negativo (VN), falso positivo (FP) e falso negativo (FN). Há várias formas de expressarmos as propriedades de um teste. Uma delas é a acurácia, ou seja a proporção de acertos: VP + VN Acurácia = VP + + FN A acurácia, isoladamente, é insuficiente para a estimativa das probabilidades pós-teste. A sensibilidade e a especificidade são propriedades mais úteis. A sensibilidade (S) é a proporção dos doentes com testes positivos: VP S = VP + FN e a especificidade (E) a proporção dos não doentes com testes negativos: VN E = A sensibilidade e a especificidade, em conjunto, permitem calcular probabilidades pós-teste a partir de probabilidades pré-teste, mas as expressões mais simples da capacidade de o teste modificar a plausibilidade de doença são as razões de verossimilhança. A razão de verossimilhança (RV) do resultado de um teste é a razão entre a proporção de doentes e a proporção de não doentes que apresentam esse resultado, ou seja: RV + = VP T + D+ ) = VP + FN = T + D ) FP 1 S E de resultados possíveis, enquanto a chance é o número de resultados favoráveis dividido pelo seu complemento (número de resultados desfavoráveis). A probabilidade e a chance podem ser facilmente convertidas entre si: P C = 1 P e C P = 1+ C A razão de verossimilhança positiva é a razão entre as chances de doença pós e pré-teste quando o teste é positivo e a razão de verossimilhança negativa a razão entre as chances pós e pré-teste quando o teste é negativo. Dito de outra forma: quando o teste é positivo, C pós = C pré x RV+ quando o teste é negativo, C pós = C pré x RV- Quanto maior for a razão de verossimilhança positiva, maior a sua utilidade (maior aumento da chance pós-teste). A razão de verossimilhança negativa será tanto mais útil quanto mais próxima de zero (maior redução da chance pós-teste). Uma razão de verossimilhança igual a um significa que o resultado do exame não modifica a estimativa pré-teste. Esses cálculos podem ser realizados manualmente ou por meio de programas de computador, mas uma forma prática de estimar a probabilidade pós-teste a partir da probabilidade pré-teste e da razão de verossimilhança é o nomograma de Fagan 4, que pode ser encontrado facilmente na internet (por exemplo em http://www.cche.net/usersguides/figures/diagnosis_f1.jpg). Um princípio básico na análise de estudos de acurácia é sempre construir as tabelas 2x2 a partir da descrição dos resultados e conferir se as estimativas do desempenho diagnóstico coincidem com as do texto. Dessa forma, construímos as tabelas para a US (tabela 2) e TC (tabela 3). Os intervalos de confiança da sensibilidade e especificidade foram calculados pelo método de Wilson 5 Tabela 2 - Contingência para a ultra-sonografia com compressão gradual. RV = FN T D+ ) VP + FN 1 S = = T D ) VN E Antes de prosseguirmos, é necessário introduzir um conceito auxiliar ao de probabilidade, a chance. Vamos supor um baralho de 52 cartas e que dele retiremos uma aleatoriamente. A probabilidade (P) de que essa carta seja de copas será o número de copas dividido pelo número total de cartas do baralho: 13/52, ou seja,1/4. A chance (C) de que a carta seja de copas é o número de copas dividido pelo número de cartas que não são copas:13/39, ou seja,1/3. A probabilidade é, portanto, o número de resultados favoráveis dividido pelo total 271 T + 32 1 33 T - 16 3 19 Total 48 4 52 S 66,67 (52,54 a 78,32) E 75,00 (30,06 a 95,44) RV+ 2,67 (0,91 a 14,73) RV- 0,44 (0,26 a 1,18) S Sensibilidade E Especificidade RV + Razão de verossimilhança positiva RV - Razão de verossimilhança negativa

Rev. Col. Bras. Cir. e os das razões de verossimilhança pelo método de escore 6,7, usando o programa CIA versão 2.0.0 (Trevor Bryant. Universidade de Southampton, 2000). O conceito de intervalo de confiança já foi discutido no primeiro artigo da série³. O nosso cálculo não coincide com a sensibilidade e especificidade da US descritas pelos autores, que correspondem à seguinte tabela (tabela 4). Ou seja, na Tabela da TC há quatro pacientes com apendicite, mas na da US apenas três! Provavelmente, a diferença se deve ao paciente com apêndice macroscopicamente normal à cirurgia, que ainda assim foi retirado devido à forte suspeita clínica de apendicite. Esse paciente deve ter sido considerado doente na análise da US e são na da TC devido a uma distração dos autores (e omissão do revisor do periódico, que certamente não conferiu os cálculos). Como o padrãoouro estabelecido pelos próprios autores é o aspecto macroscópico do apêndice e não a decisão quanto à sua retirada, consideraremos corretos os cálculos do Quadro 2, e não os do quatro. A TC apresentou razões de verossimilhança positiva e negativa melhores que as da US. Os intervalos de confiança de 95% das razões de verossimilhança da US passam pelo valor nulo (um), ou seja, com o tamanho amostral do estudo Tabela 3 - Contingência para a tomografia computadorizada helicoidal. T + 46 1 47 T - 2 3 5 Total 48 4 52 nem mesmo temos um nível razoável de confiança de que a US contribua para o diagnóstico de apendicite. OS RESULTADOS IRÃO AJUDAR NO CUIDADO DOS MEUS DOENTES? Os resultados dos testes são reprodutíveis e a interpretação é possível no local onde trabalho? O valor de qualquer teste diagnóstico depende da sua capacidade de dar o mesmo resultado, quando aplicado novamente no mesmo paciente. Uma baixa reprodutibilidade pode ser devida a variações biológicas dos pacientes, variações dos equipamentos ou variações dos indivíduos que realizam e interpretam os exames. Um artigo sobre um teste diagnóstico deve mencionar aquilo que se espera da sua reprodutibilidade. Isso é particularmente importante quando uma expertise é necessária para realizar ou interpretar o teste. A ultra-sonografia é simples, barata, não expõe o paciente à radiação, porém é muito dependente do operador, especialmente quando feita com a técnica da compressão gradual. Ademais, o excesso de gases intestinais dificulta muito a interpretação. Por outro lado, a tomografia computadorizada helicoidal é supostamente operador-independente, não requer preparo do paciente nem administração de contraste, mas expõe o paciente à radiação ionizante. No artigo de Gamanagatti et al., não há menção à reprodutibilidade dos testes. Tanto as ultra-sonografias com a técnica da compressão gradual como as tomografias computadorizadas helicoidais foram realizadas por médicos residentes, mas na análise estatística só foram consideradas as avaliações dos dois radiologistas seniores. S 95,83 (86,02 a 98,85) E 75,00 (30,06 a 95,44) RV+ 3,83 (1,36 a 21,04) RV- 0,06 (0,01 a 0,24) Tabela 4 - Contingência para a ultra-sonografia com compressão gradual (sic). T + 33 0 33 T - 16 3 19 Total 49 3 52 S 67,35 (53,38 a 78,79) E 100,00 (43,85 a 100,00) RV+ 4 * (1,17 a 4 * ) RV- 0,33 (0,37 a 4 * ) * 4 significa que a estimativa não é calculável (divisão por zero). 272 Os resultados são aplicáveis aos meus doentes? A questão é saber se o teste terá a mesma acurácia entre os meus pacientes e os mencionados no artigo. Se as condições da minha prática clínica são semelhantes às do estudo, e se os meus pacientes preenchem os critérios de inclusão e de exclusão, posso imaginar que os resultados sejam diretamente aplicáveis. Os pacientes incluídos no artigo de Gamanagatti et al. constituem uma amostra predominantemente de adultos (90%) que em um Serviço de Emergência apresentaram quadro clínico-laboratorial sugestivo de apendicite aguda. Como o paciente do cenário clínico preenche os critérios de elegibilidade do estudo, posso aplicar os resultados desse teste diagnóstico. Os resultados poderão mudar a minha conduta? A TC apresentou razão de verossimilhança positiva de 3,83 e negativa de 0,06. Como o teste positivo aumenta a chance de doença em cerca de quatro vezes e o teste negativo reduz a chance de doença em cerca de 17 vezes, seria razoável pensar que a TC é muito mais útil para excluir do que para confirmar o diagnóstico de apendicite, mas a verdade é um pouco mais complexa. Sugerimos que o leitor imprima o nomograma de Fagan (ou faça as contas, se tiver inclinação matemática) e confira os

Vol. 35 - Nº 4, Jul. / Ago. 2008 resultados seguintes, usando as razões de verossimilhança da TC helicoidal no estudo. 1. Paciente com probabilidade pré-teste de 5%: positiva: 16,8%; negativa: 0,3%. 2. Paciente com probabilidade pré-teste de 50%: positiva: 79,3%; negativa: 5,7%. 3. Paciente com probabilidade pré-teste de 90%: positiva: 97,2%; negativa: 35,1%. A utilidade do exame depende não apenas das razões de verossimilhança, mas também da probabilidade pré-teste, do limiar de diagnóstico (probabilidade abaixo da qual o médico afasta o diagnóstico) e do limiar de tratamento (probabilidade acima da qual o médico considera o diagnóstico confirmado e inicia um procedimento terapêutico). No nosso primeiro exemplo (probabilidade pré-teste de 5%), o exame negativo traria pouca informação adicional e o exame positivo resultaria numa probabilidade pós-teste intermediária, na qual não nos decidiríamos pela cirurgia imediata nem afastaríamos o diagnóstico. No último exemplo (probabilidade pré-teste de 90%), o exame positivo não modificaria a conduta e o negativo colocaria novamente o paciente numa probabilidade intermediária. O segundo exemplo (probabilidade de 50%) é aquele em que o teste se mostraria mais útil, já que um exame positivo seria suficiente para apoiar a decisão pela cirurgia e um exame negativo seria suficiente para optarmos por outras alternativas diagnósticas. Os doentes se beneficiarão com os resultados dos testes? O último critério para a utilidade de um teste diagnóstico é o julgamento se a informação adicional que ele fornece resulta, finalmente, em algum benefício para o paciente. Em algumas situações clínicas, o teste diagnóstico pode ter boa acurácia, mas a sua utilidade será limitada, se a modificação da conduta não tiver impacto sobre os desfechos clínicos importantes. Por outro lado, não há dúvida do valor de um teste quando a doença, se não diagnosticada, tem prognóstico ruim, quando o teste tem riscos aceitáveis e quando existe um tratamento efetivo, e esse é o caso no estudo em questão. RESOLUÇÃO DO CENÁRIO CLÍNICO Apesar de alguns problemas metodológicos e do pequeno tamanho amostral, o cirurgião-chefe e o residente concordaram que o artigo apoiava a superioridade da TC helicoidal sobre a US com compressão gradual e decidiram, até a avaliação de novas evidências, usar a TCH, como exame de imagem de escolha, nos pacientes com dor abdominal aguda e suspeita de apendicite. ABSTRACT Surgeons are told that they need not only read journal articles, but also understand them and make a critical appraisal of their validity. They offer better care if they are able to appraise critically the original literature and apply the results to their practice. This is the second article of a series Evidence-Based Surgical Practices which focus on critical appraisal of a diagnostic test. Key words: Evidence-based medicine; Education, medical, continuing; Diagnosis; Cross-sectional studies; Appendectomy; Appendicitis; Ultrasonography; Tomography; Tomography, X-Ray Computed. REFERÊNCIAS 1. Gamanagatti S, Vashisht S, Kapoor A, Chumber S, Bal S. Comparison of graded compression ultrasonography and unenhanced spiral computed tomography in the diagnosis of acute appendicitis. Singapore Med J. 2007;48(1):80-7. 2. Centre for Health Evidence [homepage on the Internet]. Edmonton: Centre for Health Evidence; c2001. Jaeschke R, Guyatt GH, Sackett DL; Evidence Based Medicine Working Group. How to Use an article about a diagnostic test. [update 2007 Aug 15; cited 2008 apr 13]; [about 16 screens]. Available from: http://www.cche.net/text/usersguides/diagnosis.asp 3. Santos B, Guimarães CA; Grupo de Estudos de Revisão Sistemática do Rio de Janeiro. Práticas cirúrgicas baseadas em evidências: apendicectomia laparoscópica versus a céu aberto. Rev Col Bras Cir. 2008;35(1):56-60. 4. Fagan TJ. Nomogram for Bayes theorem [letter]. N Engl J Med. 1975;293(3):257. 273 5. Wilson EB. Probable inference, the law of succession, and statistical inference. J Am Stat Assoc. 1927;22:209-12. 6. Gart JJ, Nam JM. Approximate interval estimation of the ratio of binomial parameters: a review and corrections for skewness. Biometrics. 1988;44(2):323-38. 7. Nam JM. Confidence limits for the ratio of two binomial proportions based on likelihood scores: non-iterative method. Biom J. 1995;37(3):375-9. Como citar este artigo: Guimarães CA, Santos B; Grupo de Estudos de Revisão Sistemática do Rio de Janeiro. Práticas cirúrgicas baseadas em evidências: tomografia computadorizada helicoidal no diagnóstico da apendicite aguda. Rev Col Bras Cir. [periódico na Internet] 2008; 35(4). Disponível em URL: http://www.scielo.br/rcbc Endereço eletrônico: GERS-Rio@yahoogroups.com