MODELOS DE REGRESSÃO PARAMÉTRICOS Às vezes é de nteresse nclur na análse, característcas dos ndvíduos que podem estar relaconadas com o tempo de vda. Estudo de nsufcênca renal: verfcar qual o efeto da dade sobre o tempo de sobrevvênca ou se exste dferença no tempo de sobrevda conforme a doença de base causadora da nsufcênca renal. Na estmação não-paramétrcaé possível nclur covaráves a partr de uma estratfcação e realzação de testes em seguda. Contudo, desta forma, não é possível estmar o efeto da covarável, mas apenas comparar e testar a gualdade entre as curvas de sobrevvênca.
Outra questão que também não é consderada neste tpo de análse é que o efeto ndvdual dessas varáves pode ser modfcado pela presença ou nteração com as demas. A forma mas efcente de acomodar o efeto dessas covaráves é utlzar um modelo de regressão aproprado para dados censurados. O modelo de regressão lnear, onde a resposta é assocada com as varáves explcatvas por meo de um modelo lnear, é o mas conhecdo. Para a formulação do modelo é necessáro especfcar um componente determnístco e um componente aleatóro (estocástco).
Este últmo componente, geralmente, é consderado como tendo dstrbução normal. No caso de uma únca covarável, a representação desse modelo é a segunte: Y 0 1 = β + β x+ ε Y é a resposta, x é a covarável, β 0 e β 1 são os parâmetros a serem estmados e εé o erro aleatóro com dstrbução normal. Em análse de sobrevvênca utlzaremos as dstrbuções paramétrcas para o tempo de sobrevda, nclundo nas observações de cada ndvíduo, além do tempo de vda e censura, o vetor de covaráves do ndvíduo.
Para a formulação do modelo é necessáro especfcar um componente aleatóro, que descreve probablstcamente o comportamento do tempo de vda, e um componente determnístco, que descreve a relação entre os parâmetros da dstrbução de probabldade e as covaráves. Em análse de sobrevvênca, exstem duas classes de modelos propostos: os modelos paramétrcos e os semparamétrcos. Os modelos paramétrcos, também denomnados modelos de tempo de vda acelerados, são mas efcentes, porém menos flexíves do que os modelos semparamétrcos.
A combnação de um componente determnístco e uma dstrbução exponencal com méda 1 para o erro, produz o segunte modelo: Consderando o logartmo, teremos um modelo semelhante ao modelo lnear: com MODELO DE REGRESSÃO EXPONENCIAL T = exp{ x β}ε Y = log( T ) = β + β x + + β + ν 0 1 1... k xk ν = log(ε ) ν O erro segue uma dstrbução do valor extremo padrão.
MODELO DE REGRESSÃO EXPONENCIAL O modelo exponencal deve ser usado quando se assume que o rsco é constante ao longo do tempo. O parâmetro λda dstrbução exponencal depende das covaráves da segunte forma: λ(x) = exp(β0 + β1x)= exp(x β). Onde x = (1,x 1,...,x p ) e β= (β 0,β 1,...,β p ). As funções de sobrevvênca e rsco são dadas por: ( exp( x' t) S ( t / x) = exp( λ( x) t) = exp β) h ( t x) = λ( x) = exp( x' β )
Após a especfcação do modelo, segue a estmação dos seus parâmetros. Na ausênca de normaldade dos erros e, prncpalmente na presença de censuras, uma opção mas aproprada é o método de máxma verossmlhança. Consderando dados ndependentes, a função de verossmlhança para o modelo pode ser escrta, para uma amostra de tamanho n, por: Para obtenção dos estmadores de máxma verossmlhança, é necessáro substtur as funções de densdade e sobrevvênca da equação anteror, por aquelas da dstrbução exponencal. Como as equações são não-lneares nos parâmetros e não apresentam solução analítca é necessáro utlzar o método numérco de Newton-Raphson.
MODELO DE REGRESSÃO WEIBULL Devdo a smplcdade do modelo de regressão exponencal, poucas stuações na prátca são adequadamente ajustadas por este modelo. O modelo de regressão Webull tem bastante aplcação em análse de sobrevvênca. A utlzação da dstrbução Webull no contexto da modelagem de sobrevda sgnfca que o tempo T segue uma dstrbução de Webull. Como no modelo exponencal, o parâmetro de escala λ depende das covaráves (λ(x) = exp{x β}).
As funções de sobrevvênca e rsco par o modelo Webullsão dadas por S( t / x) ( ( ) ) γ λ( x) t = exp ( ( x β ) t) = exp exp ( γ ) h( t x) = γ 1 γ γ 1 γ t λ( x) = γt exp( x' β) γ O método de máxma verossmlhança é novamente utlzado e o uso do método de Newton-Raphsoné necessáro para obtenção das estmatvas de máxma verossmlhança.
MODELO DE REGRESSÃO LOGNORMAL O modelo de regressão Lognormal também tem bastante aplcação em análse de sobrevvênca. A utlzação da dstrbução Lognormal no contexto da modelagem de sobrevda sgnfca que o tempo T segue uma dstrbução de Lognormal. Como nos modelos exponencal e webull, o parâmetro µ depende das covaráves (µ(x) = exp{x β}).
As funções de sobrevvênca e rsco par o modelo Lognormal são dadas por S( t / x) ln( t) µ ( x) = 1 φ σ = ln( t) exp 1 φ σ ( x β) ( t) f ( t) S ( t ) h = O método de máxma verossmlhança é novamente utlzado e o uso do método de Newton-Raphson é necessáro para obtenção das estmatvas de máxma verossmlhança.
Interpretação dos coefcentes estmados Uma proposta de nterpretação fo proposta por Hosmer e Lemeshow (1999). É possível mostrar que a razão dos tempos medanos é dada por t0.5 ( x = 1, ˆ) β ˆ β = e t ( x = 0, ˆ) β 0.5 Os modelos apresentados garantem esta proporconaldade para todos os percents. Esta nterpretação pode ser estendda para varáves categórcas e contínuas.
Esta análse pode ser utlzada tanto para obter uma estatístca global do ajuste de modelo, como para comparar modelos. A hpótese nula de que o modelo se ajusta aos dados pode ser testada pela estatístca: D = 2(l modelo l nulo ) TESTE DA RAZÃO DE VEROSSIMILHANÇA (ANÁLISE DA FUNÇÃO DESVIO) Em que l modelo e l nulo são respectvamente, o logartmo da função de verossmlhança do modelo com as covaráves e o logartmo da função de verossmlhança do modelo nulo (sem covaráves). Esta estatístca segue uma dstrbução χ 2 com número de graus de lberdade gual ao número de covaráves do modelo.
Podemos extender essa análse para comparar um modelo com dstrbução exponencal e outro com dstrbução Webull. Isso equvale a testar a hpótese de que γ= 1. A estatístca de teste, que tem dstrbução qu-quadrado com um grau de lberdade, é dada por D = 2(lwebull lexponencal)~χ 2 1 Onde lwebull e lexponencal são os logartmos da função de verossmlhança do modelo nulo webull e do modelo nulo exponencal. Esta técnca também pode ser utlzada para seleconar varáves em um modelo de regressão paramétrco.
O modelo com maor número de varáves deve conter o modelo com menos covaráves. A estatístca de teste é dada por D = 2(lmaor lmenor)~χ2, sendo l menor o logartmo da função de verossmlhança do modelo com menos parâmetros e l maor do modelo com mas parâmetros. Esta estatístca tem dstrbução qu-quadrado com graus de lberdade gual a dferença no número de covaráves dos modelos.
Exemplo:Consdere o estudo dos pacentes em dálse. Vamos comparar os modelos com dstrbução exponencal e webull. Consdere as saídas dos dos modelos no R.
ANÁLISE GRÁFICA A análse gráfca apresentada anterormente para a escolha da dstrbução também pode ser utlzada para avalar a adequação do modelo de regressão. Para sso, são construídos gráfcos para comparar a curva de sobrevvênca gerada pelo estmador de Kaplan-Meer com as estmadas parametrcamente. No modelo de regressão lnear usual, uma análse gráfca dos resíduos é usada para avalar a adequação do modelo ajustado. A defnção de uma medda de resíduo no contexto de sobrevvênca não é tão clara e dreta como em modelos lneares.
Dversos resíduos têm sdo propostos na lteratura para avalar o ajuste do modelo. Técncas gráfcas, que fazem uso dos dferentes resíduos propostos, são, em partcular, bastante utlzadas para examnar dferentes aspectos do modelo. RESÍDUO DE COX-SNELL Este resíduo é uma medda útl para examnar o ajuste global do modelo. É defndo por eˆ Hˆ ( t / x) Para os modelos vstos anterormente os resíduos de Cox- Snell são dados por: Exponencal: [ { }] e ˆ t exp x βˆ Webull: e ˆ exp ˆ = t x β = [ { }] ˆ γ = Lognormal: eˆ logt ˆ x β = log 1 φ ˆ σ
Se o modelo for adequado e as estmatvas dos parâmetros estverem próxmas dos verdaderos valores, estes resíduos devem parecer como uma amostra censurada de uma dstrbução exponencal padrão (λ = 1). O gráfco das curvas de sobrevvênca desses resíduos, obtdas por Kaplan-Meer e pelo modelo ajustado, também auxla na verfcação da qualdade do modelo. Quanto mas próxmas elas se apresentarem, melhor é consderado o ajuste do modelo aos dados.
RESÍDUOS MARTINGALE Para os modelos de regressão paramétrcos, a defnção de resíduos martngale é dada por: Em que δ é a varável ndcadora de censura e e os resíduos de Cox-Snell. Esses resíduos, são vstos como uma estmatva do número de falhas em excesso observada nos dados mas não predto pelo modelo. São usados, em geral, para examnar a melhor forma funconal (lnear, quadrátca,...) para uma dada covarável em um modelo de regressão assumdo para os dados sob estudo. Se a curva suavzada obtda no gráfco: resíduo x varável for lnear, nenhuma transformação na varável é necessára. Mˆ = δ eˆ
RESÍDUOS DEVIANCE Este tpo de resíduo é uma tentatva de fazer com que os resíduos martngale sejam mas smétrcos em torno de zero. Os resíduos devance nos modelos de regressão paramétrcos são defndos por: dˆ [ 2( mˆ + log( mˆ ))] 1/ 2 = snal( mˆ ) δ δ Estes resíduos facltam em geral a detecção de pontos atípcos (outlers).
Se o modelo for aproprado esses resíduos devem apresentar um comportamento aleatóro em torno de zero. Gráfcos dos resíduos martngale ou devance contra o tempo, ou contra o índce da observação, fornecem uma manera de verfcar a adequação do modelo ajustado. Uma observação mportante é que estes métodos gráfcos devem ser usados para descartar modelos claramente naproprados e não para mostrar que um partcular modelo é melhor que o outro.
Exemplo:No estudo dos pacentes em dálse, consdere como covarável a presença ou ausênca de dabetes no pacente. A fgura mostra que o modelo que mas se aproxma da estmação nãoparamétrca é o modelo Webull.
Exemplo: Análse dos dados de aletamento materno.
Exemplo: Análse dos dados de aletamento materno.
Exemplo: Análse dos dados de aletamento materno.
Exemplo: Análse dos dados de aletamento materno.
Exemplo: Análse dos dados de aletamento materno.
Exemplo: Análse dos dados de aletamento materno.
Exemplo: Análse dos dados de aletamento materno.