ANÁLISE DE SOBREVIVÊNCIA M Eduarda D. S. Matos Coimbra, 9 de Abril de
O que é a análise de sobrevivência? A análise de sobrevivência é um conjunto de processos estatísticos, utilizados na análise dos dados, para a qual a variável de interesse é o tempo que decorre até que um acontecimento se verifique. Calcula-se o tempo de sobrevivência iniciando-o num ponto de partida natural para o estudo (ex: data da cirurgia ou diagnóstico de uma doença) até ao ponto em que o doente alcança o limite de interesse. O tempo pode ser analisado em anos, meses, semanas ou dias, desde o início do follow-up até que o acontecimento ocorra Por acontecimento, significamos morte, incidência da doença, recaída/ remissão, cura, ou qualquer experiência de interesse que pode acontecer a uma pessoa (por ex. regresso ao trabalho) Exemplos: Doentes com leucemia/ tempo em remissão (semanas) Coorte livre de doença/ tempo até ocorrer um enfarte População idosa (+) / tempo até à morte Transplantes de coração/ tempo até à morte (meses)
Na maioria das análises existem dados truncados ou censurados (censored), quando temos informação acerca do tempo de sobrevivência, mas não temos o tempo de sobrevivência exacto, ou seja o doente durante o estudo não alcançou o limite de interesse. EXEMPLO DE DADOS TRUNCADOS OU CENSURADOS Os doentes de um ensaio de um novo medicamento para a infecção de HIV podem permanecer sem SIDA até à conclusão do estudo. Isto pode dever-se ao facto do ensaio acabar num momento em que ainda não tinham contraído SIDA, ou porque se retiraram estes indivíduos do estudo antes de contraírem a doença, ou ainda porque morreram por causas não ligadas à SIDA, antes do final do estudo. Há geralmente três razões para isto acontecer: O acontecimento não se dá antes do fim do estudo A pessoa não é seguida até ao fim A pessoa não continua no estudo porque por exemplo morre (a morte não é o que se está a analisar).
Objectivos da análise de sobrevivência Estimar e interpretar sobrevivência e/ou funções de risco (hazard) de dados de sobrevivência Comparar funções de sobrevivência e/ou de risco Avaliar a relação das variáveis explicativas (exploratórias) com o tempo de sobrevivência
REPRESENTAÇÃO DE DADOS DE SOBREVIVÊNCIA Pode ser desenhada uma linha horizontal para cada doente, sendo o seu comprimento o tempo de sobrevivência. Desenham-se as linhas da esquerda para a direita e é possível distinguir-se os doentes que alcançam o limite dos que são censurados, através de diferentes símbolos no final da linha. Contudo, estes gráficos não resumem os dados e é difícil obter-se um significado da sobrevivência global. As curvas de sobrevivência são geralmente calculadas pelo método de Kaplan- Meier Quando se desconhece o tempo exacto de sobrevivência, calculam-se as probabilidades de sobrevivência, através do método actuarial. Muitas vezes, traduz-se a sobrevivência referindo-se às probabilidades de sobrevivência (com intervalos de confiança) em determinados pontos temporais na curva, tal como por exemplo, as taxas de sobrevivência aos anos, em doentes pós tratamento ao cancro da mama. Em alternativa, pode indicar-se a mediana do tempo de sobrevivência (o tempo em que % dos indivíduos fizeram progressos).
Pode-se pretender verificar o impacto de inúmeros factores de interesse na sobrevivência, tal como por exemplo, o tratamento e a gravidade da doença. Assim podem representar-se as curvas de sobrevivência, de forma separada, para subgrupos de doentes; estas fornecem um meio de se verificar visualmente se os diferentes grupos de doentes alcançam o limite a taxas diferentes. Exemplo: Acontecimento X: morte
O indivíduo A, por exemplo é seguido desde o início do estudo até ter ocorrido o acontecimento de interesse na ª semana; o tempo de sobrevivência foi de semanas e não é truncado O indivíduo B também é observado no início do estudo mas é seguido até ao fim das semanas de estudo sem se ter verificado o acontecimento (morte); o tempo de sobrevivência é truncado, porque apenas podemos dizer que esteve vivo semanas. O indivíduo C entra no estudo entre a ª e a ª semana, e é seguido até ter desaparecido à ª semana; o tempo de sobrevivência é truncado em, semanas. O indivíduo D entra na 4ª semana, e é seguido até ao fim do estudo sem se verificar o acontecimento; o tempo de sobrevivência truncado é de 8 semanas. O indivíduo E entra no estudo na ª semana e é seguida até à 9ª semana, em que é perdido de vista; o seu tempo de sobrevivência truncado é de semanas. O indivíduo F entra na 8ª semana e é seguido até que decorre o acontecimento à semana,. Tal como o indivíduo A não é truncado, o tempo de sobrevivência é de, semanas.
Assim obteríamos a seguinte tabela Indivíduo A B C D E F Tempo de sobrevivência, 8, Morto () Truncado ()
Outro exemplo ID data do diagnostico morte mês da morte última observação follow-up / /7 /4 /9 / / 7 4 / / / /8 FUNÇÃO OU DISTRIBUIÇÃO DE SOBREVIVÊNCIA- É uma função cronológica habitualmente designada pela letra S(t), que se inicia num determinado momento no tempo, com % da população ainda viva e com saúde e nos permite calcular qual a percentagem dessa população ainda viva e com saúde noutros momentos ao longo do tempo.
DADOS COMPLETOS O tempo de sobrevivência de doentes é o seguinte,,, 4,, 7,,,,.Construa a tabela pelo método intuitivo. t i n i d i s i S i (s i /N) 9,9 9 7,7 4 7,, 7 4,4 4,,,, O tempo de sobrevivência mediano é de meses ou seja % dos doentes têm um tempo de sobrevivência de meses.
. Construa a tabela de sobrevivência pelo método produto-limite (Kaplan-Meier). n =N n i+ = n i -d i t i n i d i q i p i =- q i S i = S i- p i t = e S = 9 / /9 9/ 7/9 *9/=,9 9/*7/9=7/=,7 4 7 /7 /7 7/*/7=/=, / /, 7 / 4/,4 4 /4 /4, / /, / /, / /, t i - momento no tempo n i nº de sobreviventes até ao momento t i d i nº de mortos no instante t i w i nº de censurados no instante t i q i- probabilidade de morrer no instante t i p i probabilidade de sobreviver no instante t i s i nº de sobreviventes no instante t i S i Sobrevivência cumulativa (probabilidade de sobreviver ao ao instante t i )
A sobrevivência no final de cada intervalo é igual ao produto da sobrevivência cumulativa até ao final do intervalo anterior pela sobrevivência condicional nesse intervalo As curvas de sobrevivência geralmente calculadas pelo método de Kaplan Meier, representam a probabilidade cumulativa (a probabilidade de sobrevivência) de um indivíduo permanecer livre de doença (acontecimento) em qualquer momento posterior à altura base. A probabilidade de sobrevivência apenas se altera quando ocorre o acontecimento em estudo, sendo a curva resultante numa série de segmentos (curva em escada). Assim o modelo de Kaplan Meier baseia-se na estimativa das probabilidades condicionais, da taxa de sobrevivência em cada ponto no tempo. Um dos pressupostos para a realização das tabelas de sobrevivência pelo método produto-limite de Kaplan Meier é que os indivíduos em que os dados são incompletos têm o mesmo risco que os indivíduos em que o acontecimento se verificou.
Exemplo dados completos O tempo de aleitamento, isto é o tempo decorrido desde o nascimento até ao desmame, pode ser considerado como uma variável tempo de sobrevivência Suponha que o tempo até ao desmame, em meses, tenha sido registado para crianças: 8 8 Considerando que não se verificou censura: Represente os tempos de observação das crianças
Como representaria uma base de dados para analisar estes dados? Criança 4 7 8 9 4 tempo 8 8 status
Construa a tabela de Kaplan- Meier t i n i d i q i = d i / n i p i =- q i S i =S i- p i / -/=,8,8 / -/=,8,8*,8=,7 / -/=,9,7*,9=, 9 /9 -/9=,7,*,7=,4 / -/=,7,4*,7=,7 8 4 /4 -/4=,,7*,=, / -/=,,*,=,7 / -,7*=,
Represente a curva de Kaplan Meier
Com base na tabela que criou, responda Qual a probabilidade de uma criança ser amamentada pelo menos até ao sexto mês de vida? S() =,7 Qual a probabilidade de ser amamentada por mais de meses? S()=, Qual a probabilidade de ser amamentada por mais de meses? S()=,7 Qual foi o tempo mediano de aleitamento? O tempo mediano de aleitamento está entre e meses
EXEMPLO - Dados censurados A tabela anexa representa o tempo de sobrevivência de doentes +,, 4+,,, +, 7, 7, 7+, 8+ (+) dados incompletos Construa a tabela de sobrevivência pelo método produto-limite (Kaplan-Meier)
t i 4 n i 9 8 7 d i w i q i / /9 /8 /7 p i 8/9 /7 S i,889,889, t i - momento no tempo n i nº de sobreviventes até ao momento t i d i nº de mortos no instante t i w i nº de censurados no instante t i q i- probabilidade de morrer no instante t i p i probabilidade de sobreviver no instante t i S i Sobrevivência cumulativa /, 7 4 /4 ½,7 8 /,7 O output do software estatístico SPSS é o seguinte Kaplan-Meier Time Status Cumulative Standard Cumulative Number Survival Error Events Remaining, 9,,8889,48 8 4, 7,,,49,9, 4 7, 4 7,,7,799 7, 8, Number of Cases: Censored: (,%) Events: Survival Time Standard Error 9% Confidence Interval Mean: ( ; 7 ) Median: 7 ( ; 9 )
, CURVA DE KAPLAN-MEIER SOBREVIVÊNCIA CUMULATIVA,9,8,7,,,4,,,, 4 8 TEMPO DE SOBREVIVÊNCIA (MESES)
EXERCÍCIO Os dados seguintes apresentados de acordo com o sexo relativos ao tempo de sobrevivência (em semanas) de 4 doentes com leucemia, retirados de um estudo clínico que pretendia comparar tratamento com placebo. Preencha os espaços vazios da tabela de sobrevivência obtida pelo método produto limite só para o sexo masculino e represente a curva de Kaplan Meier Sexo masculino: +, 4+, +, +, +,,, +,,,, 8,, 4, 4,,,,, Sexo feminino: 9+, 7+,,, +,, 9+, 7, +,,,, 7,,,,,, 8, 8, 8,
EXERCÍCIO,8,9,89 = 4 4,74,8 7,94,87, 8,4 9,4,9,,,99,9 8,,97,8,,9,77,,87, 4,97,,89, 8,9,9 /=, Si pi qi w i di ni ti
MÉTODO ACTUARIAL (CUTLER-EDERER) Pode-se utilizar um método alternativo de cálculo das probabilidades de sobrevivência, mediante uma abordagem da tabela da vida, quando o tempo para se alcançar o limite apenas se conhece num determinado intervalo de tempo (ex: no espaço de um ano). Um dos pressupostos para a realização das tabelas de sobrevivência é que os censurados durante um dado intervalo ocorram aleatoriamente nesse intervalo. EXEMPLO Os dados que se seguem representam o tempo de sobrevivência (em meses) de doentes com linfoma de Hodgkin, separados em dois grupos ( A- assintomáticos; B- com febre ou sudação ou emagrecimento superior a %). GRUPO A.+, 4.4+,., 9., 9.9, 4.4,.8, 8., 7.+, 8.,.+,.+,.+, 4., 4.8+, 44.+,.+, 4.+,.,.+,.4+,.+,.7+,.8+,.+, 8.+, 8.7+, 8.8+, 7.9+, 7.+, 74.8+, 7.+, 7.7+ GRUPO B., 4., 4.,.4,.7, 7.4, 7., 7.7, 8.8,.,.4, 8., 9.7,.9, 4.7, 7., 9.7,.+,.9,.,.4+, 7.7+, 4.9+, 4.+, 4.4+, 48.+, 48.9+,.4+, 4.4+,.4+ Construa a tabela de sobrevivência pelo método actuarial só para o grupo A
Tabela de sobrevivência dos doentes com linfoma de Hodgkin assintomáticos (método actuarial) t i n i d I w i q i p i S i - -,97,9,9-8 8,7,99,89-4,8,9,8 4-,4,99,77 -,77-4,,949,74 4-48 8,74 48-4 7,74 4-,4,9,87-4,87-7 9,87 7-78,87 78+,8 Em que q = n d w/
,9,,,,,,9,,,,,,9,,,, 4,,9,,, 4, 48,,9,,,, 7 4,,9,,, 8, 9,,9,,8,7,,,9,4,8,9, 4,,9,,84, 9, 9 8,,9,,9,,,,8,7,78, 7, 7,,,9,9,,, Std. Error of Cumulative Proportion Surviving at End of Interval Cumulative Proportion Surviving at End of Interval Proportion Surviving Proportion Terminating Number of Terminal Events Number Exposed to Risk Number Withdrawing during Interval Number Entering Interval Interval Start Time Sendo o output
COMPARAÇÃO DE CURVAS DE SOBREVIVÊNCIA Como se pode avaliar se duas ou mais curvas são estatisticamente equivalentes? O teste mais utilizado é designado por teste de log-rank. Quando dizemos que duas curvas de Kaplan Meier não são estatisticamente significativas, queremos dizer, baseados no teste, que compara as duas curvas na globalidade, que não temos evidência para indicar que as curvas de sobrevivência reais (população) são diferentes. No exemplo dos doentes com linfoma de Hodgkin (exemplo ) fomos comparar as curvas de sobrevivência dos dois grupos A e B. Pelo teste de log rank (estatístico=,8, gl= p=,7), p>,, concluindo-se que as curvas não diferem significativamente, isto é são equivalentes.
Teste de Log- rankχ = ) ( ) ( E E O E E O + ) m )*(m n n n ( e j j j j j j + + = ) m )*(m n n n ( e j j j j j j + + = H : não há diferença entre as curvas de sobrevivência A estatística de Log- rank segue uma distribuição do Quiquadrado com grau de liberdade segundo H j j j n n n + Proporção em risco do grupo no total j j m m + Nº de mortes nos dois grupos No caso de apenas dois grupos
LINFOMA DE HODGIN, MÉTODO PRODUTO LIMITE DE KAPLAN MEIER,9,8 Si,7,,,4, B,, A, 8 4 4 48 4 7 78 T em po de sobrevivência (m eses)
EXERCÍCIO Complete a tabela de sobrevivência para os doentes com leucemia pertencentes ao grupo B, segundo o método actuarial. t i n i d i w i q i p i S i -,,9,9-7,,778,7,9,9, 8-4 9,8,84 4-,87,8,4 -,7,8, -4 9 4-48 7 4- - -7
BIBLIOGRAFIA Basic and Clinical Biostatistics. Chap Beth Dawson-Saunders and Robert G. Trapp 99, Prentice-Hall International Inc Survival Analysis David G. Kleinbaum 99 Springer-Verlag New-York,Inc