Modelo de Regressão de Cox

Documentos relacionados
Cap 7 Modelo de Cox. Outline. 2 Cap 2 O tempo. 3 Cap 3 Funções de Sobrevida. 5 Modelo de Cox. Carvalho MS (2009) Sobrevida 1 / 22

ANÁLISE DE SOBREVIVÊNCIA Teoria e aplicações em saúde. Caderno de Respostas Capítulo 6 Modelo semiparamétrico de sobrevivência

Fernando Henrique Ferraz Pereira da Rosa Vagner Aparecido Pedro Júnior 7 de novembro de 2005

ANÁLISE DE SOBREVIVÊNCIA Teoria e aplicações em saúde. Caderno de Respostas Capítulo 7 Análise de Resíduos

Métodos Estatísticos Avançados em Epidemiologia

ANÁLISE DE SOBREVIVÊNCIA Teoria e aplicações em saúde. Caderno de Respostas Capítulo 9. Funções de suavização

ANÁLISE DE SOBREVIVÊNCIA Teoria e aplicações em saúde. Caderno de Respostas Capítulo 11. Eventos Competitivos

Análise de Sobrevivência. Exercícios - Capítulo 1

ANÁLISE DE SOBREVIVÊNCIA. Airlane P. Alencar IME-USP Alessandra C. Goulart FM-USP

ANÁLISE DE SOBREVIVÊNCIA APLICADA

Análise de Sobrevivência

Modelos de regressão paramétricos

ANÁLISE DE SOBREVIVÊNCIA Teoria e aplicações em saúde. Caderno de Respostas Capítulo 4 Estimação não-paramétrica

O passo inicial de qualquer análise estatística consiste em uma descrição dos dados através de análise descritiva (tabelas, medidas e gráficos).

ANÁLISE DE SOBREVIVÊNCIA (MÓDULO II)

UM MODELO DE FRAGILIDADE PARA DADOS DISCRETOS DE SOBREVIVÊNCIA. Eduardo Yoshio Nakano 1

Métodos Estatísticos Avançados em Epidemiologia

Análise de Sobrevida. Silvia Emiko Shimakura Marilia Sá Carvalho Valeska Andreozzi. Análise de Sobrevida p. 1

Ajuste e comparação de modelos para dados grupados e censurados

ANÁLISE DE SOBREVIVÊNCIA Teoria e aplicações em saúde. Caderno de Respostas Capítulo 10. Eventos múltiplos

UNIVERSIDADE FEDERAL DO PARANÁ SETOR CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA ANÁLISE DE SOBREVIDA EM 90 HOMENS COM CÂNCER DE LARINGE

Gabarito da Lista 2 de Análise de Sobrevivência

Análise de Sobrevivência

Métodos Avançados de Análise de Sobrevivência. Cronograma Introdução. O Tempo Capítulo 2

5 Cap 8 Análise de Resíduos. Outline. 2 Cap 2 O tempo. 3 Cap 3 Funções de Sobrevida. Carvalho MS (2009) Sobrevida 1 / 22

ANÁLISE DE SOBREVIDA DE PACIENTES COM CÂNCER Modelo de Riscos proporcionais de COX

Técnicas computacionais em probabilidade e estatística II

ANÁLISE DE SOBREVIVÊNCIA 2ª LISTA DE EXERCÍCIOS

ANÁLISE DE SOBREVIVÊNCIA APLICADA

Assume que a taxa de risco (hazard rate) é função das variáveis independentes (covariáveis)

Universidade de Brasília IE Departamento de Estatística. Análise de Diagnóstico para o Modelo de Regressão de Cox. Camila Farage de Gouveia

diferença não aleatória na distribuição dos fatores de risco entre os dois grupos

Modelos Lineares Generalizados

Análise de Dados Categóricos

Ralph S. Silva

ANÁLISE DE SOBREVIVÊNCIA APLICADA

Análise de Dados Longitudinais Aula

Análise de sobrevivência aplicada a pacientes HIV positivos

Aplicações de Análise de Sobrevivência na Área da Saúde

PROCEDIMENTO PARA A ESCOLHA DE UMA DISTRIBUIÇÃO

INFERÊNCIA EM MODELOS LINEARES GENERALIZADOS ANÁLISE DE DEVIANCE

Modelos de Análise de Sobrevivência

ESTUDO DE CONFIABILIDADE DE MOTORES DIESEL DE CAMINHÕES FORA DE ESTRADA

Modelo de Variáveis discretas. Regressão com uma variável dependente Binária. Variáveis dependentes Binárias. Modelo de Probabilidade Linear

UNIVERSIDADE FEDERAL DE MINAS GERAIS. Confiabilidade Lista 4. Professor: Enrico Colosimo Aluno: Augusto Filho Belo Horizonte - MG

Exemplos Equações de Estimação Generalizadas

MÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS

ESTATÍSTICA COMPUTACIONAL

CE071 - Análise de Regressão Linear

Alternativas à Regressão Logística para análise de dados

RESOLUÇÃO Nº 01/2016

Capítulo 6 Estatística não-paramétrica

Análise de Sobrevivência. Modelos de Regressão Paramétricos. Análise de Sobrevivência Roteiro Geral. Roteiro do Módulo

Modelo de Regressão Múltipla

Estatística stica na Pesquisa Clínica

Inferência Estatística

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Econometria. Econometria MQO MQO. Resíduos. Resíduos MQO. 1. Exemplo da técnica MQO. 2. Hipóteses do Modelo de RLM. 3.

Análise de Dados Longitudinais Modelos de Regressão - Perspecitva Histórica

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

Exemplos Modelos Binomiais de Dose-Resposta

Estimador de Máxima Verossimilhança Estudo de Caso - Regressão Poisson

Econometria. Econometria ( ) O modelo de regressão linear múltipla. O modelo de regressão linear múltipla. Aula 2-26/8/2010

ESTUDO SOBRE A EVASÃO E O TEMPO ATÉ A FORMATURA DOS ALUNOS DO CURSO DE ESTATÍSTICA DA UFPR

Capítulo 5. Modelos de Confiabilidade. Gustavo Mello Reis José Ivo Ribeiro Júnior

CE085 - Estatística Inferencial. derivadas. Prof. Wagner Hugo Bonat. 5 de setembro de Curso de Bacharelado em Estatatística

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

O teste qui-quadrado. A variável teste é: χ E. Os testes. Hipóteses e Cálculo H 0 : As variáveis são independentes H 1 : As variáveis são dependentes

O Processo de Weibull Poisson para Modelagem da Confiabilidade em Sistemas Reparáveis

Stela Adami Vayego Estatística II CE003/DEST/UFPR

7 Teste de Hipóteses

Transcrição:

MAE 514 - à Análise de Sobrevivência e Aplicações O modelo de Cox com taxas de falhas proporcionais MAE 514 - à Análise de Sobrevivência e Aplicações IME-USP MAE 514 - à Análise de Sobrevivência e Aplicações O modelo de Cox (1972,1975) Não pressupõe um modelo paramétrico para os tempos de falha Generaliza o teste log-rank Modelo de regressão (ajuste de várias covariáveis simultaneamente) Detecção de diferenças não observáveis em análises univariadas Em sua forma mais simples, é um modelo com taxas de falhas proporcionais MAE 514 - à Análise de Sobrevivência e Aplicações O modelo de Cox α(t X) = α 0 (t) exp{x β} X: vetor com p covariáveis β: vetor com p parâmetros (desconhecidos) α 0 (t): função de taxa de falha basal (referência) No modelo de Cox: α 0 (t) é arbitrária Note que α 0 (t) 0, t 0

MAE 514 - à Análise de Sobrevivência e Aplicações O modelo de Cox de parâmetros - Dummy Suponha p = 1 com Então, α(t X) = α 0 (t) exp{x β} X = { 0, se grupo A 1, se grupo B α(t X = 1) α(t X = 0) = eβ Por exemplo, se e β = 0,80, a taxa com que as falhas ocorrem para o grupo B é 80% da taxa com que as falhas ocorrem para o grupo A. MAE 514 - à Análise de Sobrevivência e Aplicações O modelo de Cox X quantitativa (ex.: idade) α(t X + 1) α(t X) = e β : não depende do tempo Para um acréscimo de 1 unidade (mês, dia, ano...) na idade, a taxa de falha é multiplicada por e β. Se e β = 1,20, então, ao aumentar a idade em uma unidade, a taxa com que as falhas ocorrem aumenta em 20%. e β muito pequeno ou muito grande escala de X MAE 514 - à Análise de Sobrevivência e Aplicações no modelo de Cox α(t X) = α 0 (t)e X β β: Parâmetro de interêsse primário α 0 ( ): Parâmetro de pertubação Verossimilhança Parcial L 1 (β) = ( ) n e X i β δi (1) l R (i) e X l β i=1 R (i) : índices das u.e. em risco na i-ésima falha Maximização de L 1 ( ) β (E.M.V.P.)

MAE 514 - à Análise de Sobrevivência e Aplicações Teste de Hipóteses H 0 : β = β 0 - Não é possível obter a distribuição exata do EMVP Distribuição assintótica do EMVP [i o (β 0 )] 1/2 ( β β 0 ) D N p (0; I p ) i o ( ): matriz de informação observada I p : matriz identidade de dimensão p p Três testes assintóticos são usualmente utilizados: 1 Teste de Wald 2 Teste de Rao ou Escore 3 Teste da Razão de Verossimilhanças (parciais) MAE 514 - à Análise de Sobrevivência e Aplicações Teste de Wald A estatística de teste é dada pela forma quadrática W = ( β β 0 ) [i o ( β)]( β β 0 ) Segue pela distribuição assintótica do EMVP que, sob Ho : β = β 0, Convergência de W Soh H 0, W D χ 2 p, n p: dimensão do espaço paramétrico associado a β MAE 514 - à Análise de Sobrevivência e Aplicações Teste de Rao - Escore R = [U(β 0 )] [i o (β 0 )] 1 [U(β 0 )] U( ): função escore Pode ser mostrado que, sob H 0 : β = β 0, Convergência de R Sob H 0, R D χ 2 p, n p: dimensão do espaço paramétrico associado a β

MAE 514 - à Análise de Sobrevivência e Aplicações Teste da razão de verossimilhanças parciais Λ = 2 {log[l 1 (β 0 )] log[l 1 ( β)]} L 1 ( ): verossimilhança parcial Convergência de Λ Sob H 0, Λ D χ 2 p, n p: diferença entre as dimensões dos espaços paramétricos irrestrito e restrito por H 0 MAE 514 - à Análise de Sobrevivência e Aplicações H 0 : β = β 0 Estatísticas de testes W = ( β β 0 ) [i o ( β)]( β β 0 ) R = [U(β 0 )] [i o (β 0 )] 1 [U(β 0 )] Λ = 2 {log[l 1 (β 0 )] log[l 1 ( β)]} Os testes são assintoticamente equivalentes O teste baseado em R não utiliza o EMVP Λ é o teste mais poderoso entre os três (deve ser escolhido em caso de discrepância dos resultados MAE 514 - à Análise de Sobrevivência e Aplicações Exemplo: Avaliação de uma droga cancerígena n = 100 ratos Z i : tempo entre inoculação de células cancerosas e aparecimento de tumor ou censura δ i : indicador de evento (aparecimento do tumor=1) X i : dummy indicando droga (1) ou placebo (0) tempo delta tratamento 101 0 1 104 0 1 104 0 1 77 0 1 89 0 1 88 1 1...

MAE 514 - à Análise de Sobrevivência e Aplicações Leitura dos dados e gráfico KM > ratos <- read.table("ratos.dat",header=t) > library(survival) > ratos.km<-survfit(surv(tempo,delta) trat,ratos) > plot(ratos.km, lty = c(1,2),lwd = c(3,3),las=1, xlab="tempo", ylab="porcentagem de animais livres de tumor") > legend(15, 0.4, c("placebo","droga"), lty=c(1, 2),lwd=c(3, 3)) MAE 514 - à Análise de Sobrevivência e Aplicações - Kaplan-Meier 1.0 0.8 Porcentagem de animais livres de tumor 0.6 0.4 Placebo Droga 0.2 0.0 0 20 40 60 80 100 Tempo MAE 514 - à Análise de Sobrevivência e Aplicações Teste log-rank > survdiff(surv(tempo,delta) trat,ratos,rho=0) Chisq= 15.2 on 1 degrees of freedom,p=9.75e-05 Teste Gehan-Wilcoxon > survdiff(surv(tempo,delta) trat,ratos,rho=1) Chisq= 14 on 1 degrees of freedom, p= 0.000182 Evidências de que a droga altera o desenvolvimento de tumores em ratos

MAE 514 - à Análise de Sobrevivência e Aplicações Ajuste do no R Função coxph coxph(formula, data=parent.frame(), weights, subset,na.action, init, control, method=c("efron","breslow","exact"), singular.ok=true, robust=false, model=false, x=false, y=true,...) Obs.: formula: Surv(tempo,delta) cov1+cov2+ data: conjunto de dados (data-frame) method: Método para lidar com observações empatadas MAE 514 - à Análise de Sobrevivência e Aplicações coxph aplicado aos dados dos ratos Comando R > coxph(surv(tempo,delta) trat, ratos) coef exp(coef) se(coef) z p trat 1.64 5.14 0.465 3.52 0.00044 Likelihood ratio test=15.3 on 1 df, p=9e-05 n= 100 Teste de Wald para efeito individual de droga p = 0,00044 Teste da razão de verossimilhanças p < 0,001 Taxa de falha relativa igual a 5,14: A taxa de ocorrência de tumores em ratos que recebem a droga é 5 vezes a taxa associada a ratos que recebem placebo MAE 514 - à Análise de Sobrevivência e Aplicações Mais informações Comando summary > summary(coxph(surv(tempo,delta) trat,ratos)) coef exp(coef) se(coef) z p trat 1.64 5.14 0.465 3.52 0.00044 exp(coef) exp(-coef) lower.95 upper.95 trat 5.14 0.195 2.06 12.8 Rsquare= 0.142 (max possible= 0.901 ) Likelihood ratio test= 15.3 on 1 df, p=9e-05 Wald test = 12.4 on 1 df, p=0.000439 Score (logrank) test = 15.2 on 1 df, p=9.43e-05 Intervalo de confiança para taxa de falha relativa de Wald global (no caso é igual ao individual) Teste de Rao-Escore (no caso igual ao log-rank)

MAE 514 - à Análise de Sobrevivência e Aplicações Lembrando que vem que S(t X) = exp α(t X) = α 0 (t) exp(xβ) S(t X) = exp { t } α(s X)ds 0 { t } α 0 (s) exp{x β}ds = [S 0 (t)] exβ 0 e assim log[ log(s(t X))] = log[a 0 (t)] + Xβ A 0 ( ): função de taxa de falha acumulada para placebo MAE 514 - à Análise de Sobrevivência e Aplicações Verificação da suposição de taxa de falha proporcional Para taxas de falhas proporcionais, Para o grupo placebo, log[ log(s(t X))] = log[a 0 (t)] + Xβ log[ log(s(t X))] = log[a 0 (t)] Para o grupo que recebe a droga, Característica esperada log[ log(s(t X))] = log[a 0 (t)] + β Curvas para placebo e droga paralelas MAE 514 - à Análise de Sobrevivência e Aplicações Averiguação para os dados dos Ratos Avaliação através do estimador Kaplan-Meier > plot(ratos.km,mark.time=f,fun= cloglog, xlim=c(30,110),las=1) 1 2 3 4 40 60 80 100

MAE 514 - à Análise de Sobrevivência e Aplicações - Arquivo anderson.dat Variáveis Coluna 1: ID - Identificação Coluna 2: tempo - Tempo (semanas) de remissão dos sintomas Coluna 3: delta - indicador de censura Coluna 4: Sexo - 0 masculino, 1 feminino Coluna 5: logcgb - log da contagem de globulos brancos Coluna 6: Rx - tratamento: 0 novo, 1 padrão MAE 514 - à Análise de Sobrevivência e Aplicações comando coxph > anderson <- read.table("anderson.dat",header=t) > coxph(surv(tempo,delta) sexo+logcgb+rx,anderson) Saída coef exp(coef) se(coef) z p sexo 0.416 1.52 0.460 0.905 3.7e-01 logcgb 1.706 5.51 0.345 4.947 7.5e-07 Rx 1.700 5.47 0.483 3.519 4.3e-04 likelihood ratio test=49.6 on 3 df, p=9.55e-11 n= 42, number of events= 30 de Wald individual: Sexo não é estat. significante Teste da razão de verossimilhanças (H 0 : todos parâmetros são nulos): rejeita-se H 0 MAE 514 - à Análise de Sobrevivência e Aplicações Modelo Final comando coxph >summary(coxph(surv(tempo,delta) logcgb+rx,anderson) Saída coef exp(coef) se(coef) z Pr(> z ) logcgb 1.717 5.566 0.344 4.99 5.96e-07 *** Rx 1.534 4.635 0.441 3.47 0.000513 *** exp(coef) exp(-coef) lower.95 upper.95 logcgb 5.566 0.1797 2.837 10.92 Rx 4.634 0.2158 1.951 11.01 Rsquare= 0.687 (max possible= 0.988 ) Likelihood ratio test= 48.8 on 2 df, p=2.50e-11 Wald test = 34 on 2 df, p=4.21e-08 Score (logrank) test = 47.2 on 2 df, p=5.66e-11

coef exp(coef) se(coef) z Pr(> z ) logcgb 1.717 5.566 0.344 4.99 5.96e-07 Rx 1.534 4.635 0.441 3.47 0.000513 O teste de Wald individual indica que os dois fatores são estatisticamente significantes Rsquare= 0.687 (max possible= 0.988 ) Likelihood ratio test= 48.8 on 2 df, p=2.50e-11 Wald test = 34 on 2 df, p=4.21e-08 Score (logrank) test = 47.2 on 2 df, p=5.66e-11 As três estatísticas globais levam à mesma conclusão MAE 514 - à Análise de Sobrevivência e Aplicações coef exp(coef) se(coef) z Pr(> z ) logcgb 1.717 5.566 0.344 4.99 5.96e-07 Rx 1.534 4.635 0.441 3.47 0.000513 Para um mesmo valor de logcgb, a taxa com que os sintomas retornam para pacientes submetidos ao tratamento tradicional é aproximadamente 4.5 vezes a taxa de pacientes submetidos ao novo tratamento. Para um mesmo tratamento, um acréscimo de uma unidade no logcgb aproximadamente multiplica por seis a taxa de retorno dos sintomas. MAE 514 - à Análise de Sobrevivência e Aplicações