1 Introdução. Edson Zangiacomi MARTINEZ 1 Jorge Alberto ACHCAR 2 Francisco LOUZADA-NETO 2

Save this PDF as:
 WORD  PNG  TXT  JPG

Tamanho: px
Começar a partir da página:

Download "1 Introdução. Edson Zangiacomi MARTINEZ 1 Jorge Alberto ACHCAR 2 Francisco LOUZADA-NETO 2"

Transcrição

1 ANÁLISE BAYESIANA DO DESEMPENHO DE DOIS TESTES DIAGNÓSTICOS QUANDO INDIVÍDUOS COM RESULTADOS NEGATIVOS EM AMBOS OS TESTES NÃO SÃO VERIFICADOS POR UM PADRÃO-OURO Edson Zangacom MARTINEZ 1 Jorge Alberto ACHCAR 2 Francsco LOUZADA-NETO 2 RESUMO: Na lteratura médca, os estudos sobre o desempenho de testes dagnóstcos utlzam freqüentemente as meddas de sensbldade e especfcdade. Essas meddas estmam, respectvamente, a probabldade de um teste fornecer um resultado postvo, dado que o ndvíduo realmente é portador da doença, e a probabldade do teste fornecer um resultado negatvo, dado que o ndvíduo não é portador da doença. Essas meddas são obtdas da comparação dreta dos resultados do teste e de um procedmento denomnado padrão-ouro, que classfca os ndvíduos corretamente como doentes e não doentes. No entanto, em alguns estudos, são submetdos ao padrão-ouro somente os ndvíduos com resultados postvos em pelo menos um dos testes sob nvestgação. No presente estudo, propomos o uso de um modelo Bayesano para a estmação da sensbldade e da especfcdade nesta stuação. Uma extensão do modelo é apresentada, de modo que o efeto de co-varáves sobre as meddas de desempenho possa ser estudado. Uma aplcação a dados reas, obtdos da lteratura médca, lustra a metodologa. PALAVRAS CHAVE: Sensbldade; especfcdade; testes dagnóstcos; métodos Bayesanos. 1 Introdução Os métodos estatístcos aplcados à medcna dagnóstca apresentaram enormes avanços nas últmas décadas. Grande parte desses métodos está voltada ao problema de classfcar ndvíduos em grupos, os testes dagnóstcos compõem o prncpal exemplo. Esses testes são descrtos como métodos capazes de ndcar a presença ou a ausênca de uma determnada doença, com uma certa chance de erro, e a quantfcação dessas chances de erro é bascamente o objetvo dos métodos estatístcos. Na termnologa médca, a probabldade de um teste dagnóstco produzr um resultado postvo, dado que o ndvíduo é realmente portador da doença, é chamada sensbldade (S) do teste, ou taxa de verdaderos postvos (TVP). A probabldade do teste produzr um resultado negatvo, 1 Departamento de Medcna Socal, Faculdade de Medcna de Rberão Preto - FMRP, Unversdade de São Paulo USP, CEP , Rberão Preto, SP, Brasl. E-mal: 2 Departamento de Estatístca, Unversdade Federal de São Carlos UFSCar, Caxa Postal 676, CEP , São Carlos, SP, Brasl. E-mal: / Rev. Mat. Estat., São Paulo, v.22, n.3, p.21-32,

2 dado que o ndvíduo não porta a doença, é chamada especfcdade (E). O complemento de E, ou seja, 1 E, é freqüentemente chamado de taxa de falsos postvos (TFP). Essas meddas são tradconalmente obtdas da comparação dos resultados dos testes com os resultados de um teste de referênca, denomnado genercamente padrão-ouro. Em lnguagem matemátca, a sensbldade de um teste dagnóstco é dada por S = P(T=1 D=1) e a especfcdade é dada por E = P(T=0 D=0), onde T = 1 representa um resultado postvo para o teste, T=0 representa um resultado negatvo, e D = 1 e D = 0 representam o verdadero estado do ndvíduo segundo um padrão-ouro, respectvamente, doente ou não doente. Um padrão ouro deal classfca corretamente os ndvíduos como doentes ou não doentes, mas, na prátca, são geralmente procedmentos nvasvos, caros, mutas vezes dolorosos, que podem oferecer rscos ao pacente, e usualmente não são aplcados a ndvíduos com pouca evdênca de serem portadores da doença (Sox, 1986). Ilustrando esta stuação, Claeys et al. (2003) conduzram um estudo objetvando estmar o desempenho da nspeção vsual com ácdo acétco e da ctologa cervcal (teste de Papancolaou) em detectar lesões precursoras do câncer do colo do útero, sendo que todas as mulheres que compuseram a amostra foram submetdas a ambos os testes, mas apenas as que receberam resultado postvo em pelo menos um dos testes foram submetdas ao padrão-ouro. O teste de referênca escolhdo fo a colposcopa seguda de bópsa, um procedmento não ndcado a mulheres sem evdêncas da doença. Um método estatístco drgdo à análse de dados de medcna dagnóstca em que os ndvíduos com resultados negatvos em todos os testes sob nvestgação não são verfcados pelo padrão ouro fo ncalmente proposto por Schatzkn et al. (1987). Este método trata especfcamente da nvestgação do desempenho de dos testes dagnóstcos, e tem por lmtação não estmar dretamente sensbldades e especfcdades, mas sm o quanto um teste tem melhor desempenho que outro. Sejam dos testes dagnóstcos denotados respectvamente por T 1 e T 2, onde T v = 1 representa um resultado postvo para o teste v, v = 1,2, e T v = 0 representa um resultado negatvo. A Tabela 1 representa, genercamente, os resultados de ambos os testes perante um padrão-ouro deal. Os valores d e h que aparecem entre colchetes são desconhecdos, embora a soma d + h, ou seja, o total de ndvíduos não verfcados pelo padrão-ouro, seja conhecda. Os valores n + e n também são desconhecdos, e referem-se aos totas de ndvíduos classfcados respectvamente como doentes e não doentes pelo padrão-ouro. Por notação, S v e E v são respectvamente as sensbldades e especfcdades do teste v, v=1,2. Tabela 1 - Representação genérca dos resultados de dos testes dagnóstcos, em que os ndvíduos negatvos em ambos testes não são verfcados pelo padrão-ouro. Os valores entre colchetes são desconhecdos Doentes Não doentes T 2 = 1 T 2 = 0 Total T 2 = 1 T 2 = 0 Total T 1 = 1 a b a + b e f e + f T 1 = 0 c [d] c + [d] g [h] g + [h] Total a + c b + [d] [n + ] e + g f + [h] [n ] Schatzkn et al. (1987) mostraram que estmatvas das sensbldades dos testes 1 e 2, dadas respectvamente por (a+b)/n + e por (a+c)/n +, não podem ser dretamente obtdas, 22 Rev. Mat. Estat., São Paulo, v.22, n.3, p.21-32, 2004

3 pos n + é desconhecdo. Por outro lado, a razão S 1 /S 2 é estmada dretamente por (a+b)/(a+c). Essa razão é denomnada por Schatzkn et al. (1987) de taxa relatva de verdaderos postvos (rtvp), e é nterpretável como o número de vezes em que a sensbldade do teste 1 é maor que a sensbldade do teste 2. Por sua vez, a razão de especfcdades E 1 /E 2 não pode ser analogamente estmada por (g+h)/(f+h), pos h é um valor desconhecdo. Como alternatva, Schatzkn et al. (1987) propôs a estmação da razão (1 E 1 )/ (1 E 2 ), denomnada taxa relatva de falsos postvos (rtfp). Um estmador de rtfp é dado smplesmente por (e+f)/(e+g). A construção de ntervalos de confança para rtvp e para rtfp é dscutda por Cheng e Macaluso (1997), Chock et al. (1997), Cheng et al. (2000) e, mas recentemente, por Alonzo et al. (2004). Walter (1999) propôs um modelo capaz de estmar as sensbldades e as especfcdades de dos testes dagnóstcos quando os ndvíduos com resultados negatvos em ambos testes não são submetdos ao padrão-ouro. Uma extensão Bayesana desse modelo fo posterormente proposta por Van der Merwe e Martz (2002), utlzando amostradores de Gbbs. No presente artgo, apresentamos um modelo Bayesano bastante smlar ao proposto por Van der Merwe e Martz (2002) e por Joseph et al. (1995) e estendemos a proposta à stuação em que um vetor de co-varáves está presente. Nesta modelagem, utlzamos o algortmo de Metropols-Hastngs. Para lustrar uma aplcação do modelo proposto a dados reas, utlzamos dados retrados da lteratura médca, na qual obtvemos estmatvas das meddas de sensbldade, especfcdade e prevalênca. 2 Formulação do modelo Joseph et al. (1995) ntroduzram um modelo Bayesano baseado em amostradores de Gbbs para estmar as meddas de desempenho de um ou mas testes dagnóstcos em stuações em que um padrão-ouro não é dsponível. Esse modelo pode ser faclmente estenddo às stuações em que os ndvíduos amostrados com resultados negatvos aos testes dagnóstcos sob nvestgação não são verfcados pelo padrão-ouro. Seja p a prevalênca da doença em questão na população e D a verdadera condção do ndvíduo, onde D=1 denota um ndvíduo com a doença e D=0 denota um ndvíduo lvre da doença. Assm, p = P(D=1). Sejam T 1 e T 2 duas varáves aleatóras relatvas aos resultados dos testes dagnóstcos, onde T v = 1 denota um teste com resultado postvo e T v = 0 denota um resultado negatvo, para v=1,2. As sensbldades dos testes dagnóstcos são dadas por S v = P(T v =1 D=1) e as especfcdades dadas por E v =P(T v =0 D=0), onde v=1,2. Da aplcação da teora da probabldade, podemos escrever a relação: P(T 1 =1, T 2 =1, D=1) = P(D=1) P(T 1 =1 D=1) P(T 2 =1 T 1 =1, D=1). (1) Sob o pressuposto de que T 1 e T 2 são varáves aleatóras ndependentes, a equação (1) pode ser reescrta da forma: P(T 1 =1, T 2 =1, D=1) = P(D=1) P(T 1 =1 D=1) P(T 2 =1 D=1) = ps 1 S 2. (2) Analogamente, podemos obter as probabldades assocadas às outras sete possíves combnações de D e dos resultados dos testes T 1 e T 2, como exbdo na Tabela 2. O produto dessas probabldades, elevadas às respectvas quantdades mostradas na quarta Rev. Mat. Estat., São Paulo, v.22, n.3, p.21-32,

4 coluna da Tabela 2, defne a função de verossmlhança L(θ 1 ), onde θ 1 é o vetor de parâmetros θ 1 T = (S 1,S 2, E 1,E 2, p). Tabela 2 - Contrbuções de todas as possíves combnações entre as varáves D, T 1 e T 2 à verossmlhança. Os valores entre colchetes são desconhecdos D T 1 T 2 Número de ndvíduos Contrbução à verossmlhança a ps 1 S b ps 1 (1 S 2 ) c p(1 S 1 )S [d] p(1 S 1 )(1 S 2 ) e (1 p) (1 E 1 ) (1 E 2 ) f (1 p) (1 E 1 ) E g (1 p) E 1 (1 E 2 ) [h] (1 p) E 1 E 2 Na Tabela 2, d e h são valores desconhecdos, mas u = d + h é uma quantdade conhecda, dada pelo número total de ndvíduos não verfcados. Para não haver confusão na notação entre quantdades conhecdas e desconhecdas, sejam Y 1 = d e Y 2 = h. As varáves Y 1 e Y 2 referem-se respectvamente ao número de ndvíduos doentes não verfcados e ao número de ndvíduos não doentes e não verfcados. Estas varáves, na termnologa ntroduzda por Tanner e Wong (1987), são defndas como varáves latentes, desde que exste a possbldade de reproduz-las por meo de suas dstrbuções de probabldade, apesar de não serem observáves. A partr da fórmula de Bayes, verfca-se que a dstrbução condconal de Y 1 é dada por: ( )( ) p 1 S Y 1 u, θ 1 ~ bnomal ( )( ) 1 1 S u ; 2, (3) p 1 S1 1 S2 + (1 p) E1E2 e Y 2 = u Y 1 (lembrando que Y 1 e Y 2 são desconhecdos, mas u é conhecdo). Na análse Bayesana do modelo é assumdo que as densdades a pror para todos os parâmetros do vetor θ 1 possuem dstrbução beta, onde α θ e β θ genercamente denotam os hperparâmetros (conhecdos) da dstrbução de θ. Sendo Z T =(a,b,c,e,f,g) um vetor de quantdades observáves, e combnando a função de verossmlhança com as densdades a pror, as demas dstrbuções condconas para o algortmo de amostradores de Gbbs são dadas por: p Z, Y 1, Y 2, α p, β p ~ Beta (a+b+c+y 1 +α p ; e+f+g+y 2 +β p ), S 1 Z, Y 1, Y 2, α S 1, β S 1 ~ Beta (a+b+ α S 1 ; c+y 1 + β S 1 ), (4) 24 Rev. Mat. Estat., São Paulo, v.22, n.3, p.21-32, 2004

5 S 2 Z, Y 1, Y 2, α S 2, β S 2 ~ Beta (a+c+ α S 2 ; b+y 1 + β S 2 ), E 1 Z, Y 1, Y 2, α E 1, β E 1 ~ Beta (g+ Y 2 + α E 1 ; e+f+ β E 1 ), e E 2 Z, Y 1, Y 2, α, β ~ Beta (f+ Y 2 + α E 2 E 2 E 2 ; e+g+ β ). E 2 O prmero passo do algortmo consste em gerar aleatoramente Y 1 de (3), dados valores arbtráros para os parâmetros do vetor θ 1. A segur, utlzando o valor Y 1 obtdo, observações de p, S 1, S 2, E 1 e E 2 são geradas aleatoramente conforme suas respectvas dstrbuções condconas (4). Os valores de p, S 1, S 2, E 1 e E 2 assm obtdos são usados para gerar aleatoramente um novo valor de Y 1, que, por sua vez, é utlzado para gerar novos valores de p, S 1, S 2, E 1 e E 2, e este cclo é assm repetdo um número grande de vezes. As amostras aleatóras geradas são usadas para estmar as densdades margnas a posteror de cada parâmetro em θ 1 e das varáves Y 1 e Y 2. 3 Presença de co-varáves Seja um vetor de co-varáves X, =1,...,n, e sejam p, S 1, S 2, E 1 e E 2 relaconados a X da forma: L exp( j= 0γ kj x j ) θ k =, (5) L 1 + exp( γ x ) j= 0 kj j onde X 0 = 1, = 1,...,n, k=1,...,5, L é o número de co-varáves e θ k genercamente denota um parâmetro de nteresse, ou seja, θ 1 = S 1, θ 2 = S 2,θ 3 = E 1,θ 4 = E 2 e θ 5 = p. Defnmos assm o vetor de parâmetros θ T 2 =(γ 1,γ 2,γ 3,γ 4,γ 5 ), onde γ T 1 =(γ 10,γ 11,...,γ 1L ), γ T 2 =(γ 20,γ 21,...,γ 2L ),..., γ T 5 =(γ 50,γ 51,...,γ 5L ). Dado T 1 =0 e T 2 =0, = 1,...,n, seja G uma varável aleatóra com dstrbução de Bernoull, com probabldade de sucesso dada por: p ( 1 S1 )( 1 S ) 2 ( 1 S )( 1 S ) + ( 1 p ) 1 2 h =. (6) p E E 1 2 Como G é uma varável observável quando T 1 =1 ou T 2 =1, ou seja, G equvale nesta stuação ao verdadero e conhecdo estado do ndvíduo (1 se doente ou 0 se não doente), e não observável quando T 1 =0 e T 2 =0, G é uma varável denomnada semlatente, segundo a termnologa de Van der Merwe e Martz (2002). A função de verossmlhança para θ 2 é dada por: Rev. Mat. Estat., São Paulo, v.22, n.3, p.21-32,

6 2 k n 4 k n k n exp ( )( ) γ ml xltm g + γ ml x 1 t m g + l xl g ( 2) 1 γ 5 L(θ 2 )= m= 1l= 0 = 1 m= 3l= 0 = 1 l= 0 = 1, g 1 g n 2 k 4 k k 1 + exp + + γ ml xl 1 exp γ m xl 1 exp γ l xl = 1m= 1 = = = = l 0 m 3 l 0 l 0 5 (7) onde g é uma observação de G. Consderando as densdades a pror (ndependentes) γ kj ~N(a kj ;b 2 kj), onde k=1,...,5, j=0,1,...,l, e a kj e b kj são hperparâmetros conhecdos, e sendo D o conjunto das observações amostras e dos valores de G, as densdades condconas a posteror são dadas por ( ) ( ) n n k 2 π γ mj θ 2 γ, D N( amj ; bmj ) exp γ mj xjt g g ln1 + exp mj m γ ml xl (8) = 1 = 1 l= 0 onde m = 1,2 e j = 0,...,L, ( γ θ, ) 2 π mj γ D N( amj; bmj ) 2 ( ) mj n expγ mj xj = 1 n k ( 1 t )( 1 g ) ( 1 g ) ln1 + expγ x, m ml = 1 l= 0 l (9) onde m = 3,4 e j = 0,...,L, e: ( γ θ, ) n n k 2 π 5 j 2( γ ) D N( a j b j j xj g + l xl j 5 ; 5 ) exp γ 5 ln 1 exp γ 5 = 1 = 1 l= 0 5 (10) onde, por exemplo, θ 2( γ 10 ) é o vetor θ 2 sem o parâmetro γ 10. Como as dstrbuções condconas (8) a (10) não possuem uma forma conhecda, utlzamos o algortmo de Metropols-Hastngs (Smth e Roberts, 1993) para smular amostras de γ kj, k=1,...,5, j=0,1,...,l. 4 Um exemplo numérco: resultados de um rastreamento do câncer de próstata Smth et al. (1997) submeteram homens brancos e 949 negros, com 50 anos de dade ou mas, a dos testes utlzados no rastreamento do câncer de próstata: o antígeno prostátco específco (PSA, sgla em nglês para prostate-specfc antgen) e o toque retal (DRE, sgla em nglês para dgtal rectal examnaton). Concentrações sércas do PSA maores que 4 ng/ml foram classfcadas como postvas. Os ndvíduos foram submetdos à bópsa somente se pelo menos um dos testes mostrou resultado sugestvo de câncer de próstata. Os resultados desse estudo são mostrados na Tabela Rev. Mat. Estat., São Paulo, v.22, n.3, p.21-32, 2004

7 Tabela 3 - Resultados dos testes PSA e DRE (Smth et al., 1997) Com câncer de Sem câncer de Todos os próstata próstata ndvíduos DRE + DRE DRE + DRE DRE + DRE PSA PSA 145? 1.002? Das densdades condconas dadas em (3) e (4), geramos amostras por meo do algortmo de amostradores de Gbbs. Para a geração dessas cadeas desenvolvemos uma rotna computaconal na lnguagem IML (Interactve Matrx Language) do programa SAS versão 8 (SAS Insttute Inc., 1999). Das cadeas geradas, descartamos as prmeras amostras e tomamos cada qünquagésma amostra, resultando em um tamanho amostral de para as nferêncas. Os resultados obtdos são mostrados na Tabela 4, em que aparecem as médas a posteror para os parâmetros, com seus respectvos ntervalos de credbldade 95%. Os lmtes nferor e superor desses ntervalos de credbldade são dados, respectvamente, pelos percents 2,5% e 97,5% das dstrbuções a posteror geradas pelo algortmo. Todos os hperparâmetros das dstrbuções a pror foram fxados em 0,5, com o objetvo de fxarmos dstrbuções não nformatvas (Box e Tao, 1973). Em uma análse de sensbldade, chegamos a resultados bastante próxmos assocando a todos os parâmetros dstrbuções a pror betas com todos os respectvos hperparâmetros guas a 1. A convergênca fo montorada grafcamente e, por meo do método de Geweke (1992), mplementado no programa CODA (Best et al., 1995). Observou-se que as cadeas correspondentes a todos os parâmetros convergram. Tabela 4 - Médas a posteror para os parâmetros, com seus respectvos ntervalos de credbldade 95% Informação a posteror Intervalo de credbldade Teste Parâmetro Dstrbução a pror Méda 95% S 1 Beta(0,5;0,5) 0,563 0,510 0,618 PSA E 1 Beta(0,5;0,5) 0,957 0,954 0,960 DRE S 2 Beta(0,5;0,5) 0,391 0,347 0,434 E 2 Beta(0,5;0,5) 0,946 0,942 0,949 p Beta(0,5;0,5) 0,039 0,035 0,043 A Tabela 5 compara estmatvas clásscas e Bayesanas dos parâmetros rtvp e rtfp. As estmatvas clásscas foram obtdas como explctado na ntrodução deste artgo, e seus respectvos ntervalos de confança 95% foram calculados pelo método assntótco delta, como proposto por Cheng e Macaluso (1997). As estmatvas Bayesanas são dervadas das amostras de Gbbs geradas para a obtenção das meddas sumarzadas na Tabela 4. Observamos que as estmatvas clásscas e Bayesanas são muto próxmas, e que os ntervalos de confança e de credbldade são bem semelhantes. Rev. Mat. Estat., São Paulo, v.22, n.3, p.21-32,

8 Tabela 5 - Estmatvas clásscas e Bayesanas dos parâmetros rtvp e rtfp Método Bayesano (méda a Método clássco posteror) Intervalo de Intervalo de Parâmetro Estmatva Méda confança 95% credbldade 95% rtvp 1,440 1,300 1,595 1,443 1,303 1,594 rtfp 0,784 0,722 0,850 0,785 0,718 0,854 Com o objetvo de demonstrar o modelo Bayesano ntroduzdo na seção 3, que possblta o estudo do desempenho de testes dagnóstcos de acordo com a observação de uma co-varável, usamos anda os dados de Smth et al. (1997), conforme apresentados na Tabela 6. Observamos nesta Tabela os mesmos dados apresentados na Tabela 3, mas agora dvddos em dos grupos dstntos, conforme a cor da pele dos ndvíduos submetdos aos testes PSA e DRE. A covarável X em questão é, portanto, a cor da pele, onde uma observação x de X, =1,...,n, é rotulada como 0 se o -ésmo ndvíduo é branco, e como 1 se o -ésmo ndvíduo é negro. Temos portanto um modelo com 10 parâmetros, γ kj, onde k=1,...,5 e j=0,1. Os hperparâmetros a kj, k=1,...,5, j=0,1, foram escolhdos de acordo com os resultados do ajuste de dos modelos prelmnares sem co-varáves (como descrto na seção 2), sendo o prmero baseado somente na amostra de homens negros e o segundo baseado somente na amostra de homens brancos. Estamos dessa manera adotando um método Bayesano empírco (Carln e Lous, 2000), em que as dstrbuções a pror são obtdas de uma análse prelmnar dos dados. Por sua vez, os hperparâmetros b kj, k=1,...,5, j=0,1, assocados aos desvos-padrão das densdades (ndependentes) a pror, foram fxados em 0,1. Tal escolha também se baseou nos resultados dos modelos prelmnares. Das densdades condconas dadas em (8) a (10), usamos uma outra rotna escrta na lnguagem IML do programa SAS para gerar amostras por meo do algortmo de Metropols-Hastngs. Tomamos cada décma amostra, após descartarmos as prmeras Tabela 6 - Resultados dos testes PSA e DRE (Smth et al., 1997), para 949 homens negros e homens brancos Negros Brancos Com câncer de Sem câncer de Todos os próstata próstata ndvíduos DRE + DRE DRE + DRE DRE + DRE PSA PSA 8? 26? PSA PSA 137? 976? A Tabela 7 mostra estmatvas Bayesanas dos parâmetros baseadas nas amostras geradas pelo algortmo. A estmatva do parâmetro γ 21 é negatva (-0,6477), com um ntervalo de credbldade 95% que não nclu o valor zero, o que sugere que o DRE é 28 Rev. Mat. Estat., São Paulo, v.22, n.3, p.21-32, 2004

9 menos sensível para os homens negros do que para os brancos. O parâmetro γ 41 é estmado em 0,7115, também com um ntervalo de credbldade que não nclu o valor zero, ndcando maor especfcdade do DRE para os ndvíduos negros. O modelo Bayesano sugere também que a prevalênca de câncer prostátco é maor para os negros, vsto que o parâmetro γ 51 é estmado em 0,5902, com um ntervalo de credbldade 95% que não nclu o valor zero. De fato, a lteratura médca ndca que a prevalênca de câncer de próstata é geralmente maor em negros do que em brancos (Crawford, 2003). Tabela 7 - Estmatvas Bayesanas para os parâmetros, com seus respectvos ntervalos de credbldade 95% Informação a posteror Parâmetro Méda Intervalo de credbldade 95% γ 10 0,2516 0,119 0,391 γ 20-0,3988-0,525-0,274 γ 30 2,9812 2,918 3,048 γ 40 2,7066 2,648 2,764 γ 50-3,1251-3,207-3,040 γ 11-0,0800-0,268 0,106 γ 21-0,6477-0,844-0,450 γ 31 0,0122-0,157 0,167 γ 41 0,7115 0,538 0,882 γ 51 0,5902 0,426 0,759 Tabela 8 - A Tabela 8 apresenta estmatvas Bayesanas de outros parâmetros que podem ser obtdas por meo daqueles estmados pelo modelo proposto. Estmatvas com seus respectvos ntervalos de credbldade 95% Informação a posteror Cor da pele Teste Parâmetro Intervalo de Méda credbldade 95% PSA S 1 0,563 0,529 0,597 E 1 0,952 0,948 0,955 S 2 0,402 0,371 0,432 DRE Brancos E 2 0,937 0,933 0,941 p 0,042 0,038 0,046 rtvp 1,402 1,288 1,524 rtfp 0,772 0,710 0,836 PSA S 1 E 1 0,543 0,952 0,486 0,943 0,596 0,959 Negros DRE S 2 0,261 0,219 0,306 E 2 0,968 0,962 0,973 p 0,074 0,061 0,086 rtvp 2,097 1,727 2,513 rtfp 1,515 1,194 1,897 Rev. Mat. Estat., São Paulo, v.22, n.3, p.21-32,

10 Essas nformações a posteror comparam explctamente as meddas de sensbldade dos testes e a prevalênca do câncer de próstata, entre os ndvíduos brancos e negros. Outra quantdade que pode ser estmada pelo modelo Bayesano é a razão de prevalêncas de câncer prostátco segundo a cor da pele. Usando as amostras de Gbbs geradas, a estmatva da razão de prevalêncas é 1,750 (com ntervalo de credbldade 95% dado por (1,496; 2,039)), ou seja, a doença sera aproxmadamente 75% mas prevalente nos ndvíduos negros. 5 Dscussão Os dados de câncer de próstata ntroduzdos por Smth et al. (1997) também foram explorados em um artgo de Pepe e Alonzo (2001), no qual fo proposto um modelo de regressão (não Bayesano) para as taxas de falsos postvos e verdaderos postvos. Por meo desse modelo, esses autores mostraram que a sensbldade do PSA é 1,40 vez a sensbldade do DRE para os homens brancos e 2,11 vezes a sensbldade do DRE para os negros. O modelo Bayesano leva a estmatvas bastante próxmas: a rtvp é estmada em 1,402 para os ndvíduos brancos e em 2,097 para os negros (Tabela 8). Pepe e Alonzo (2001) estmaram que a rtfp para os negros é 1,84 vezes a rtfp para os brancos. No modelo aqu utlzado, esta quantdade fo 1,95 (com ntervalo de credbldade 95% dado por (1,565; 2,444)). É mportante salentar que nferêncas Bayesanas mas precsas poderam ser obtdas consderando dstrbuções a pror nformatvas, as quas poderam ser justfcadas a partr de opnões de especalstas, o que geralmente é comum na área médca. Dependendo do número de testes dagnóstcos sob nvestgação, os métodos freqüentstas podem apresentar problemas de não dentfcabldade na estmação das meddas de desempenho. Esse problema se ntensfca quando temos um número de parâmetros desconhecdos superor ao número de varáves. Por outro lado, os métodos Bayesanos apresentam-se como uma alternatva vável. MARTINEZ, E. Z.; ACHCAR J. A.; LOUZADA-NETO, F. Bayesan analyss of the performance of two dagnostc tests when negatve ndvduals on both tests are not verfed by a gold standard. Rev. Mat. Estat., São Paulo, v.22, n.3, p.21-32, ABSTRACT: The performance of a dagnostc test s usually summarsed by ts senstvty and specfcty. Senstvty s the probablty of a postve result, gven that the ndvdual s truly dseased, and specfcty s the probablty of a negatve result, gven a nondseased ndvdual. These measures are obtaned by comparng the test outcomes and the results of a reference test genercally denomnated gold standard. However, n many appled problems the gold standard s not avalable for those ndvduals wth negatve results on both tests. In ths context, we develop a Bayesan nference procedure for performance measures estmaton. We also present an extenson of ths procedure, nvolvng ncluson of covarates. Ths Bayesan approach s based on Markov Chan Monte Carlo methods. As an example, we apply the proposed method to a real data set obtaned from the medcal lterature. KEYWORDS: Senstvty; specfcty; dagnostc tests; Bayesan methods. 30 Rev. Mat. Estat., São Paulo, v.22, n.3, p.21-32, 2004

11 Referêncas ALONZO, T. A.; BRAUN, T. M.; MOSKOWITZ C. S. Small sample estmaton of relatve accuracy for bnary screenng tests. Stat. Med., Chchester, v.23, n.1, p.21-34, 2004 BEST, N. G.; COWLES, M. K.; VINES, S. K. CODA: Convergence dagnoss and output analyss software for Gbbs samplng output, verson 0.3. Cambrdge: Medcal Research Councl Bostatstcs Unt, Não pagnado. BOX, G. E. P.; TIAO, G. C. Bayesan nference n statstcal analyss. Boston: Addson Wesley, p. CARLIN, B. P.; LOUIS, T. A. Bayes and emprcal Bayes methods for data analyss. 2 nd ed. London: Chapman & Hall/CRC, p. CHENG, H.; MACALUSO, M. Comparson of the accuracy of two tests wth a confrmatory procedure lmted to postve results. Epdemology, Baltmore, v.8, n.1, p , CHENG, H.; MACALUSO, M.; HARDIN, J. M. Valdty and coverage of estmates of relatve accuracy. Ann. Epdemol., Ralegh, v.10, p , CHOCK, C. et al. Comparng dchotomous screenng tests when ndvduals negatve on both tests are not verfed. J. Cln. Epdemol., New York, v.50, p , CLAEYS, P. et al. Performance of the acetc acd test when used n feld condtons as a screenng test for cervcal cancer. Trop. Med. Int. Health, Oxford, v.8, n.8, p , CRAWFORD, E. D. Epdemology of prostate cancer. Urology, Belle Mead, v.62, p.3-12, Supplement. GEWEKE, J. Evaluatng the accuracy of samplng-based approaches to calculatng posteror moments. In: BERNARDO, J. M. et al. (Ed.). Bayesan Statstcs 4. Oxford: Clarendom Press, p JOSEPH, L.; GYORKOS, T. W.; COUPAL, L. Bayesan estmaton of dsease prevalence and the parameters of dagnostc tests n the presence of a gold standard. Am. J. Epdemol., Baltmore, v.141, n.3, p , PEPE, M. S.; ALONZO, T. A. Comparng dsease screenng tests when true dsease status s ascertaned only for screen postves. Bostatstcs, Oxford, v.2, n.3, p , SAS INSTITUTE. SAS/IML user s gude, verson 8. Cary: SAS Publshng, p. SCHATZKIN, A. et al. Comparng new and old screenng tests when a reference procedure cannot be performed on all screenees. Example of automated cytometry for early detecton of cervcal cancer. Am. J. Epdemol., Baltmore, v.125, n.4, p , SMITH, A. F. M.; ROBERTS, G. Bayesan computaton va the Gbbs sampler and related Markov chan Monte Carlo methods (wth dscusson). J. R. Stat. Soc. B, Cambrdge, v.55, p.3-23, Rev. Mat. Estat., São Paulo, v.22, n.3, p.21-32,

12 SMITH, D. S.; BULLOCK, A. D.; CATALONA, W. J. Racal dfferences n operatng characterstcs of prostate cancer screenng tests. J. Urol., Baltmore, v.158, n.5, p , SOX, H. C. Probablty theory n the use of dagnostc test: an ntroducton to crtcal study of the lterature. Ann. Intern. Med., Phladelpha, v.104, n.1, p.60-66, TANNER, M. A.; WONG, W. H. The calculaton of posteror dstrbutons by data augmentaton. J. Am. Stat. Assoc., Alexandra, v.82, n.398, p , VAN DER MERWE, L.; MARITZ, S. Estmatng the condtonal false-postve rate for sem-latent data. Epdemology, Baltmore, v.13, n.4, p , WALTER, S. D. Estmaton of test senstvty and specfcty when dsease confrmaton s lmted to postve results. Epdemology, Baltmore, v.10, n.1, p.67-72, Recebdo em Aprovado após revsão em Rev. Mat. Estat., São Paulo, v.22, n.3, p.21-32, 2004