MODELO DE REGRESSÃO DE COX Os modelos de regressão paramétrcos vstos anterormente exgem que se suponha uma dstrbução estatístca para o tempo de sobrevvênca. Contudo esta suposção, caso não sea adequada, pode fazer com que as estmatvas seam pouco confáves. Com o obetvo de encontrar um modelo mas flexível, Cox propôs em 1972 um modelo, denomnado modelo de rsco proporconal de Cox. Esse modelo passou a ser o mas utlzado na análse de dados de sobrevvênca por sua versatldade.
Como em análse de sobrevvênca o nteresse também pode estar no rsco de falha o modelo proposto por Cox modela dretamente a função de rsco. O prncípo básco deste modelo para estmar o efeto das covaráves é a proporconaldade dos rscos ao longo de todo o tempo de observação. Suponha o caso smples em que uma únca covarável, que é um ndcador de grupo, é consderada. Consdere, por exemplo, que pacentes são aleatorzados para receber um tratamento padrão ou um novo tratamento. Sea h 1 (t) e h 0 (t) as funções de rsco no tempo t para pacentes no tratamento novo e no tratamento padrão, respectvamente.
De acordo com o prncípo da proporconaldade o rsco no tempo t para pacentes no novo tratamento é proporconal ao rsco, no mesmo tempo, para pacentes sobre o tratamento padrão. O modelo de rscos proporconas pode ser expresso na forma h1 ( t) h0 ( t) Uma mplcação da suposção de rscos proporconas é que as correspondentes funções de sobrevvênca para ndvíduos no novo e no tratamento padrão são razoavelmente paralelas ao longo de todo tempo. Um cruzamento das curvas ou uma varação nas dstâncas entre as curvas de dferentes categoras podem ndcar ausênca de proporconaldade.
O valor de é uma taxa de rsco ou rsco relatvo. Se < 1, o rsco de falha em t é menor para um ndvíduo sobre o novo tratamento, relatvo ao ndvíduo no tratamento padrão. Por outro lado, se > 1, o rsco de falha em t é maor para um ndvíduo no novo tratamento, ou sea o tratamento padrão ndca uma melhor alternatva. Consdere agora um estudo com n ndvíduos e denote a função de rsco para o -ésmo ndvíduo por h (t), = 1,2,...,n. Sea h 0 (t) a função de rsco para um tratamento padrão. A função de rsco para o novo tratamento é então h 0 (t). Como o rsco relatvo,, não pode ser negatvo é convenente consderar = exp().
O parâmetro é então o logartmo do rsco relatvo e qualquer valor de defndo em (-, +) leva a um valor postvo de. Note que valores postvos de são obtdos quando o rsco relatvo é maor do que 1, que é quando o novo tratamento é nferor ao padrão. Sea X uma varável ndcadora de grupo que assume o valor 0 para ndvíduos no tratamento padrão e 1 para ndvíduos no tratamento novo. Se x é o valor de X para o -ésmo ndvíduo no estudo, a função de rsco para este ndvíduo pode ser escrta por h ( t) h0 ( t)exp{ x} Este modelo é o modelo de rsco proporconal de Cox para a comparação de dos tratamentos.
De forma genérca, consdere p covaráves, de forma que x sea um vetor da forma x = (x 1,x 2,...,x p ). A função de rsco para o -ésmo ndvíduo é então escrta por h t) h0 ( t)exp{ 1x1 2x2... p x p} h ( t)exp{ x} ( 0 Este modelo é composto pelo produto de dos componentes, um não-paramétrco e o outro paramétrco. O componente não-paramétrco, h 0 (t), não é especfcado e é uma função não-negatva do tempo. Este componente é geralmente chamado de função de base ou função básca pos h(t) = h 0 (t) quando x = 0. O componente paramétrco, ou componente lnear é freqüentemente usado na forma multplcatva garantndo que h(t) sea sempre não-negatva.
È mportante ctar que o componente não-paramétrco absorve o termo constante, 0, presente nos modelos paramétrcos. Este modelo semparamétrco torna-se mas flexível que o modelo paramétrco devdo a presença da função de base. Exste outras formas possíves para (x ), mas essa é a mas comumente usada para modelos de dados de sobrevvênca. Este modelo é também denomnado modelo de rscos proporconas pos a razão das taxas de falha de dos ndvíduos dferentes é constante no tempo. Isto é, a razão das funções de rsco para os ndvíduos e é h ( t) h0 ( t)exp( x ) exp{ x x } h ( t) h ( t)exp( x ) 0
Esta razão de rscos não depende do tempo. Se um ndvíduo no níco do estudo tem um rsco de falha gual a duas vezes o rsco de um outro ndvíduo, esta razão de rscos será a mesma para todo o período de acompanhamento. O modelo de rscos proporconas também pode ser escrto em termos da função de rsco acumulada ou da função de sobrevvênca. H( t / x) H0( t)exp{ x} exp{ x } S( t / x) S 0 ( t) H t ( t) h0 ( s ds Sˆ ( t) exp{ Hˆ ( )} 0 ) 0 0 0 t
ESTIMAÇÃO DOS PARÂMETROS O modelo de Cox é caracterzado pelos coefcentes s, que medem os efetos das covaráves sobre a função de rsco. Para que o modelo fque determnado, estas quantdades devem ser estmadas a partr dos dados amostras. Partndo do pressuposto de proporconaldade, é possível estmar os efetos das covaráves sem ter que fazer qualquer suposção a respeto da dstrbução do tempo de vda. A função de rsco básca e os coefcentes s podem ser estmados separadamente. Os s são estmados prmero e estas estmatvas são então usadas para construr uma estmatva da função de rsco básca.
Este é um resultado mportante pos assm é possível fazer nferêncas sobre os efetos das p varáves explcatvas no rsco relatvo sem precsar estmar a função de rsco básca. Os coefcentes s podem ser estmados usando o método de máxma verossmlhança. Contudo, a presença do componente não-paramétrco (h 0 (t)) na função de verossmlhança torna esse método naproprado. A solução proposta por Cox consste em condconar a construção da função de verossmlhança ao conhecmento da hstóra passada de falhas e censuras para elmnar a função de rsco básca.
Este método é chamado de método de máxma verossmlhança parcal. Consdere que em uma amostra de n ndvíduos exstam k n falhas dstntas nos tempos t 1 t 2... t k. A déa básca deste método é consderar a probabldade condconal da -ésma observação vr a falhar no tempo t conhecendo quas observações estão sob rsco em t. Esta probabldade condconal, que é a razão entre o rsco do ndvíduo falhar em t e a soma dos rscos de falha de todos os ndvíduos em rsco, é a contrbução de cada ndvíduo no tempo de falha t. Então a verossmlhança ndvdual L será, ) ( ) ( 0 0 ) ( } exp{ } exp{ } )exp{ ( } )exp{ ( ) ( ) ( t R t R t R x x x t h x t h t h t h L
R(t ) é o conunto dos índces das observações sob rsco no tempo t. Assm, condconal a hstóra de falhas e censuras até o tempo t, o componente não paramétrco desaparece da expressão de verossmlhança. A função de verossmlhança é dada por Os estmadores de máxma verossmlhança de são obtdos a partr da verossmlhança parcal, L(). n t R k t R x x x x L 1 ) ( 1 ) ( } exp{ } exp{ } exp{ } exp{ ) (
O modelo de rsco proporconal para dados de sobrevvênca e sua função de verossmlhança parcal assumem que os tempos de sobrevvênca são contínuos. Sob esta suposção, não permtem empates nos valores observados. Como o tempo de sobrevvênca pode ser regstrado em horas, das, meses ou até anos podem ocorrer empates nos tempos de falha ou de censura. Quando ocorrem empates entre falhas e censuras, usa-se a convenção de que a censura ocorreu após a falha, defnndo assm as observações a serem ncluídas no conunto de rsco em cada tempo de falha.
Para consderar empates entre tempos de falhas, a função de verossmlhança parcal pode ser modfcada. Uma aproxmação para a função de verossmlhança fo proposta por Breslow e Peto em 1972 e é freqüentemente usada em pacotes etsatístcos pela sua forma smples. Esta aproxmação é adequada quando o número de empates em qualquer tempo não é grande. Alguns autores provaram que os estmadores de máxma verossmlhança para o modelo de Cox são consstentes e assntotcamente normas sob certas condções de regulardade.
INTERPRETAÇÃO DOS COEFICIENTES O efeto das covaráves no modelo de rscos proporconas de Cox é de acelerar ou desacelerar a função de rsco. Para nterpretar os coefcentes estmados, a propredade de rscos proporconas do modelo deve ser usada. Consdere a razão das taxas de falha de dos ndvíduos e, que têm os mesmos valores para as covaraves com exceção da l-ésma. h h ( t) ( t) exp l x l x l Consdere que x l sea uma varável dcotômca ndcando pacentes hpertensos.
O rsco de morte entre os hpertensos é exp{ l } vezes o rsco de pacentes com pressão normal, com as outras covaráves mantda fxas. Sea = exp{}, que é a taxa de falha relatva no tempo t, assm ˆ exp ˆ. Para verfcar a exstênca de dferenças sgnfcatvas entre os grupos, basta observar se o valor 1 pertence ao ntervalo de confança estmado. Caso sto ocorra não há evdêncas de que os rscos dos pacentes nos dos grupos apresentam dferenças sgnfcatvas.
EXEMPLO: Consdere uma covarável grupo com três níves, representada por x 1 : grupo 1 e x 2 : grupo 2. As estmatvas de máxma verossmlhança parcal com I.C. entre parênteses são: ˆ 2,01,5;4,1 exp ˆ 2 1,2 0,7;1,8 exp 1 Exste dferença sgnfcatva entre o grupo controle e grupo 1, mas não exste dferença entre o grupo controle e grupo 2. O rsco de falha para pacentes do grupo 1 é duas vezes o rsco dos pacentes do grupo controle. Consdere agora a covarável dade com efeto sgnfcatvo e estmatva pontual dada por exp{ ˆ} 1.05 Temos então que se aumentarmos em um ano a dade, o rsco de falha fca aumentado em 5%.
AVALIAÇÃO DA PROPORCIONALIDADE DOS RISCOS Uma avalação ncal da proporconaldade do efeto das covaráves no tempo pode ser feta através da construção das curvas de Kaplan-Meer. A suposção de proporconaldade ao longo do tempo, será aceta se não houver cruzamento entre as curvas de sobrevvênca por categoras das varáves. Uma outra forma de avalar a suposção de proporconaldade é através da análse de resíduos de Schoenfeld. Consdere que se o -ésmo ndvíduo com vetor de covaráves x =(x 1,...,x p )` é observado falhar.
Tem-se para este ndvíduo um vetor de resíduos de Schoenfeld r = (r 1,...r p ) dado por r q x q Estes resíduos são nterpretados como a dferença entre os valores observados de covaráves de um ndvíduo com tempo de ocorrênca do evento t e os valores esperados em t dado o grupo de rsco R(t ). R( t ) x R( t ) q exp exp x ˆ x ˆ Estes resíduos são defndos apenas nos tempos de falha. O número de vetores de resíduos é gual ao número de covaráves austadas no modelo.
Dessa forma, através do gráfco dos resíduos padronzados de Schoenfeld contra o tempo é possível verfcar a exstênca ou não de proporconaldade. Isto é, se a suposção de rscos proporconas for satsfeta não deverá exstr nenhuma tendênca sstemátca no gráfco. É possível realzar um teste para verfcar a hpótese de que não exste correlação entre o tempo de sobrevvênca transformado e os resíduos padronzados. Isto equvale a testar a hpótese nula de que não exste tendênca no tempo (H 0 : =0).
AVALIAÇÃO DO AJUSTE DO MODELO Os mesmos testes aplcados aos modelos paramétrcos, também podem ser utlzados no modelo de Cox. A estatístca de Wald pode ser utlzada tanto para testar a sgnfcânca do parâmetro do modelo, como verfcar o auste global do mesmo. O teste da razão de verossmlhança (análse da função desvo) compara modelos encaxados. Avala se a nclusão de uma ou mas varáves no modelo aumenta de modo sgnfcatvo a verossmlhança de um modelo em relação ao modelo com menos parâmetros. A função desvo é assntotcamente semelhante a estatístca de Wald quando o número de observações é grande. Caso esse número sea pequeno, a análse da função desvo é mas robusta.
AVALIAÇÃO DO AJUSTE DO MODELO
AVALIAÇÃO DO AJUSTE DO MODELO PERGUNTA: Qual o poder explcatvo de um modelo escolhdo para avalar os dados? Uma medda de qualdade de auste para modelos lneares é o R 2. Poucas são as meddas estatístcas dsponíves para avalar globalmente a qualdade de auste de um modelo de sobrevvênca. A mas smples delas é uma medda baseada na razão de verossmlhanças e está dsponível no R.
EXEMPLO: Aletamento materno
EXEMPLO: Aletamento materno
EXEMPLO: Aletamento materno
EXEMPLO: Leucema Pedátrca