Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

Documentos relacionados
MODELOS DE REGRESSÃO PARAMÉTRICOS

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

Capítulo 1. Exercício 5. Capítulo 2 Exercício

Regressão Múltipla. Parte I: Modelo Geral e Estimação

4 Critérios para Avaliação dos Cenários

Análise de Variância. Comparação de duas ou mais médias

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

REGRESSÃO NÃO LINEAR 27/06/2017

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16%

Prof. Lorí Viali, Dr.

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

3 A técnica de computação intensiva Bootstrap

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Testes não-paramétricos

O problema da superdispersão na análise de dados de contagens

Identidade dos parâmetros de modelos segmentados

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

Associação entre duas variáveis quantitativas

Análise de Regressão

Análise de Regressão Linear Múltipla IV

2 Incerteza de medição

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

1. CORRELAÇÃO E REGRESSÃO LINEAR

AULA EXTRA Análise de Regressão Logística

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall

O problema da superdispersão na análise de dados de contagens

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

Prof. Lorí Viali, Dr.

Estatística II Antonio Roque Aula 18. Regressão Linear

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária.

Análise de Regressão Linear Múltipla VII

Gabarito da Lista de Exercícios de Econometria I

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

CURSO de ESTATÍSTICA Gabarito

UM PROBLEMA ECONOMÉTRICO NO USO DE VARIÁVEIS CLIMÁTICAS EM FUNÇÕES DE PRODUÇÃO AJUSTADAS A DADOS EXPERIMENTAIS

Métodos Avançados em Epidemiologia

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

AEP FISCAL ESTATÍSTICA

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

7 - Distribuição de Freqüências

Cap. 11 Correlação e Regressão

NOTA II TABELAS E GRÁFICOS

Nome: Nº: Estatística para Economia e Gestão Licenciaturas em Economia e Gestão. 2.º Semestre de 2008/2009

Análise de influência

Algarismos Significativos Propagação de Erros ou Desvios

5 Métodos de cálculo do limite de retenção em função da ruína e do capital inicial

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

CORRELAÇÃO E REGRESSÃO

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

O que heterocedasticidade? Heterocedasticidade. Por que se preocupar com heterocedasticidade? Exemplo de heterocedasticidade.

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Avaliação do Modelo. Avaliação de Modelos. Métricas para avaliação de desempenho. Métricas para avaliação de desempenho 31/05/2017

TESTE DO QUI-QUADRADO - Ajustamento

Análise Exploratória de Dados

PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011

Teoria da Regressão Espacial Aplicada a. Sérgio Alberto Pires da Silva

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 4

Gráficos de Controle para Processos Autocorrelacionados

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental.

PRESSUPOSTOS DO MODELO DE REGRESSÃO

Equações Simultâneas

Prof. Lorí Viali, Dr.

DELINEAMENTOS EXPERIMENTAIS

Capítulo 2. APROXIMAÇÕES NUMÉRICAS 1D EM MALHAS UNIFORMES

Estatística I Licenciatura MAEG 2006/07

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 2

Estatística Aplicada II CORRELAÇÃO. AULA 21 07/11/16 Prof a Lilian M. Lima Cunha

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

ANÁLISE DA VARIÂNCIA DA REGRESSÃO

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

Introdução às Medidas em Física a Aula

Estimação Bayesiana das Fragilidades Individuais de Pacientes em Tratamento de Hemodiálise

Métodos Experimentais em Ciências Mecânicas

Tabela 1. Porcentagem de crianças imunizadas contra DPT e taxa de mortalidade de menores de 5 anos para 20 países, 1992.

Dissertação de Mestrado

Capítulo 2. Modelos de Regressão

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 1

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 3

a média populacional do i-ésimo tratamento; o efeito do i-ésimo tratamento na variável dependente Y e mede o afastamento da média µ

Estatística e Probabilidade

Experiência V (aulas 08 e 09) Curvas características

Ministério da Educação. Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Cálculo do Conceito Preliminar de Cursos de Graduação

ESTATÍSTICA MULTIVARIADA 2º SEMESTRE 2010 / 11. EXERCÍCIOS PRÁTICOS - CADERNO 4 Regressão Linear

Como Construir Modelos Empíricos

3 Algoritmos propostos

Prof. Lorí Viali, Dr.

Teoria Elementar da Probabilidade

Notas Processos estocásticos. Nestor Caticha 23 de abril de 2012

Alternativas ao modelo de Cox na análise de dados de sobrevivência com covariáveis dependentes no tempo

Estatística Espacial: Dados de Área

ECONOMETRIA Prova Intermediária PI 04/04/2014

Eletroquímica 2017/3. Professores: Renato Camargo Matos Hélio Ferreira dos Santos.

R X. X(s) Y Y(s) Variáveis aleatórias discretas bidimensionais

Cap. IV Análise estatística de incertezas aleatórias

Transcrição:

MODELO DE REGRESSÃO DE COX Os modelos de regressão paramétrcos vstos anterormente exgem que se suponha uma dstrbução estatístca para o tempo de sobrevvênca. Contudo esta suposção, caso não sea adequada, pode fazer com que as estmatvas seam pouco confáves. Com o obetvo de encontrar um modelo mas flexível, Cox propôs em 1972 um modelo, denomnado modelo de rsco proporconal de Cox. Esse modelo passou a ser o mas utlzado na análse de dados de sobrevvênca por sua versatldade.

Como em análse de sobrevvênca o nteresse também pode estar no rsco de falha o modelo proposto por Cox modela dretamente a função de rsco. O prncípo básco deste modelo para estmar o efeto das covaráves é a proporconaldade dos rscos ao longo de todo o tempo de observação. Suponha o caso smples em que uma únca covarável, que é um ndcador de grupo, é consderada. Consdere, por exemplo, que pacentes são aleatorzados para receber um tratamento padrão ou um novo tratamento. Sea h 1 (t) e h 0 (t) as funções de rsco no tempo t para pacentes no tratamento novo e no tratamento padrão, respectvamente.

De acordo com o prncípo da proporconaldade o rsco no tempo t para pacentes no novo tratamento é proporconal ao rsco, no mesmo tempo, para pacentes sobre o tratamento padrão. O modelo de rscos proporconas pode ser expresso na forma h1 ( t) h0 ( t) Uma mplcação da suposção de rscos proporconas é que as correspondentes funções de sobrevvênca para ndvíduos no novo e no tratamento padrão são razoavelmente paralelas ao longo de todo tempo. Um cruzamento das curvas ou uma varação nas dstâncas entre as curvas de dferentes categoras podem ndcar ausênca de proporconaldade.

O valor de é uma taxa de rsco ou rsco relatvo. Se < 1, o rsco de falha em t é menor para um ndvíduo sobre o novo tratamento, relatvo ao ndvíduo no tratamento padrão. Por outro lado, se > 1, o rsco de falha em t é maor para um ndvíduo no novo tratamento, ou sea o tratamento padrão ndca uma melhor alternatva. Consdere agora um estudo com n ndvíduos e denote a função de rsco para o -ésmo ndvíduo por h (t), = 1,2,...,n. Sea h 0 (t) a função de rsco para um tratamento padrão. A função de rsco para o novo tratamento é então h 0 (t). Como o rsco relatvo,, não pode ser negatvo é convenente consderar = exp().

O parâmetro é então o logartmo do rsco relatvo e qualquer valor de defndo em (-, +) leva a um valor postvo de. Note que valores postvos de são obtdos quando o rsco relatvo é maor do que 1, que é quando o novo tratamento é nferor ao padrão. Sea X uma varável ndcadora de grupo que assume o valor 0 para ndvíduos no tratamento padrão e 1 para ndvíduos no tratamento novo. Se x é o valor de X para o -ésmo ndvíduo no estudo, a função de rsco para este ndvíduo pode ser escrta por h ( t) h0 ( t)exp{ x} Este modelo é o modelo de rsco proporconal de Cox para a comparação de dos tratamentos.

De forma genérca, consdere p covaráves, de forma que x sea um vetor da forma x = (x 1,x 2,...,x p ). A função de rsco para o -ésmo ndvíduo é então escrta por h t) h0 ( t)exp{ 1x1 2x2... p x p} h ( t)exp{ x} ( 0 Este modelo é composto pelo produto de dos componentes, um não-paramétrco e o outro paramétrco. O componente não-paramétrco, h 0 (t), não é especfcado e é uma função não-negatva do tempo. Este componente é geralmente chamado de função de base ou função básca pos h(t) = h 0 (t) quando x = 0. O componente paramétrco, ou componente lnear é freqüentemente usado na forma multplcatva garantndo que h(t) sea sempre não-negatva.

È mportante ctar que o componente não-paramétrco absorve o termo constante, 0, presente nos modelos paramétrcos. Este modelo semparamétrco torna-se mas flexível que o modelo paramétrco devdo a presença da função de base. Exste outras formas possíves para (x ), mas essa é a mas comumente usada para modelos de dados de sobrevvênca. Este modelo é também denomnado modelo de rscos proporconas pos a razão das taxas de falha de dos ndvíduos dferentes é constante no tempo. Isto é, a razão das funções de rsco para os ndvíduos e é h ( t) h0 ( t)exp( x ) exp{ x x } h ( t) h ( t)exp( x ) 0

Esta razão de rscos não depende do tempo. Se um ndvíduo no níco do estudo tem um rsco de falha gual a duas vezes o rsco de um outro ndvíduo, esta razão de rscos será a mesma para todo o período de acompanhamento. O modelo de rscos proporconas também pode ser escrto em termos da função de rsco acumulada ou da função de sobrevvênca. H( t / x) H0( t)exp{ x} exp{ x } S( t / x) S 0 ( t) H t ( t) h0 ( s ds Sˆ ( t) exp{ Hˆ ( )} 0 ) 0 0 0 t

ESTIMAÇÃO DOS PARÂMETROS O modelo de Cox é caracterzado pelos coefcentes s, que medem os efetos das covaráves sobre a função de rsco. Para que o modelo fque determnado, estas quantdades devem ser estmadas a partr dos dados amostras. Partndo do pressuposto de proporconaldade, é possível estmar os efetos das covaráves sem ter que fazer qualquer suposção a respeto da dstrbução do tempo de vda. A função de rsco básca e os coefcentes s podem ser estmados separadamente. Os s são estmados prmero e estas estmatvas são então usadas para construr uma estmatva da função de rsco básca.

Este é um resultado mportante pos assm é possível fazer nferêncas sobre os efetos das p varáves explcatvas no rsco relatvo sem precsar estmar a função de rsco básca. Os coefcentes s podem ser estmados usando o método de máxma verossmlhança. Contudo, a presença do componente não-paramétrco (h 0 (t)) na função de verossmlhança torna esse método naproprado. A solução proposta por Cox consste em condconar a construção da função de verossmlhança ao conhecmento da hstóra passada de falhas e censuras para elmnar a função de rsco básca.

Este método é chamado de método de máxma verossmlhança parcal. Consdere que em uma amostra de n ndvíduos exstam k n falhas dstntas nos tempos t 1 t 2... t k. A déa básca deste método é consderar a probabldade condconal da -ésma observação vr a falhar no tempo t conhecendo quas observações estão sob rsco em t. Esta probabldade condconal, que é a razão entre o rsco do ndvíduo falhar em t e a soma dos rscos de falha de todos os ndvíduos em rsco, é a contrbução de cada ndvíduo no tempo de falha t. Então a verossmlhança ndvdual L será, ) ( ) ( 0 0 ) ( } exp{ } exp{ } )exp{ ( } )exp{ ( ) ( ) ( t R t R t R x x x t h x t h t h t h L

R(t ) é o conunto dos índces das observações sob rsco no tempo t. Assm, condconal a hstóra de falhas e censuras até o tempo t, o componente não paramétrco desaparece da expressão de verossmlhança. A função de verossmlhança é dada por Os estmadores de máxma verossmlhança de são obtdos a partr da verossmlhança parcal, L(). n t R k t R x x x x L 1 ) ( 1 ) ( } exp{ } exp{ } exp{ } exp{ ) (

O modelo de rsco proporconal para dados de sobrevvênca e sua função de verossmlhança parcal assumem que os tempos de sobrevvênca são contínuos. Sob esta suposção, não permtem empates nos valores observados. Como o tempo de sobrevvênca pode ser regstrado em horas, das, meses ou até anos podem ocorrer empates nos tempos de falha ou de censura. Quando ocorrem empates entre falhas e censuras, usa-se a convenção de que a censura ocorreu após a falha, defnndo assm as observações a serem ncluídas no conunto de rsco em cada tempo de falha.

Para consderar empates entre tempos de falhas, a função de verossmlhança parcal pode ser modfcada. Uma aproxmação para a função de verossmlhança fo proposta por Breslow e Peto em 1972 e é freqüentemente usada em pacotes etsatístcos pela sua forma smples. Esta aproxmação é adequada quando o número de empates em qualquer tempo não é grande. Alguns autores provaram que os estmadores de máxma verossmlhança para o modelo de Cox são consstentes e assntotcamente normas sob certas condções de regulardade.

INTERPRETAÇÃO DOS COEFICIENTES O efeto das covaráves no modelo de rscos proporconas de Cox é de acelerar ou desacelerar a função de rsco. Para nterpretar os coefcentes estmados, a propredade de rscos proporconas do modelo deve ser usada. Consdere a razão das taxas de falha de dos ndvíduos e, que têm os mesmos valores para as covaraves com exceção da l-ésma. h h ( t) ( t) exp l x l x l Consdere que x l sea uma varável dcotômca ndcando pacentes hpertensos.

O rsco de morte entre os hpertensos é exp{ l } vezes o rsco de pacentes com pressão normal, com as outras covaráves mantda fxas. Sea = exp{}, que é a taxa de falha relatva no tempo t, assm ˆ exp ˆ. Para verfcar a exstênca de dferenças sgnfcatvas entre os grupos, basta observar se o valor 1 pertence ao ntervalo de confança estmado. Caso sto ocorra não há evdêncas de que os rscos dos pacentes nos dos grupos apresentam dferenças sgnfcatvas.

EXEMPLO: Consdere uma covarável grupo com três níves, representada por x 1 : grupo 1 e x 2 : grupo 2. As estmatvas de máxma verossmlhança parcal com I.C. entre parênteses são: ˆ 2,01,5;4,1 exp ˆ 2 1,2 0,7;1,8 exp 1 Exste dferença sgnfcatva entre o grupo controle e grupo 1, mas não exste dferença entre o grupo controle e grupo 2. O rsco de falha para pacentes do grupo 1 é duas vezes o rsco dos pacentes do grupo controle. Consdere agora a covarável dade com efeto sgnfcatvo e estmatva pontual dada por exp{ ˆ} 1.05 Temos então que se aumentarmos em um ano a dade, o rsco de falha fca aumentado em 5%.

AVALIAÇÃO DA PROPORCIONALIDADE DOS RISCOS Uma avalação ncal da proporconaldade do efeto das covaráves no tempo pode ser feta através da construção das curvas de Kaplan-Meer. A suposção de proporconaldade ao longo do tempo, será aceta se não houver cruzamento entre as curvas de sobrevvênca por categoras das varáves. Uma outra forma de avalar a suposção de proporconaldade é através da análse de resíduos de Schoenfeld. Consdere que se o -ésmo ndvíduo com vetor de covaráves x =(x 1,...,x p )` é observado falhar.

Tem-se para este ndvíduo um vetor de resíduos de Schoenfeld r = (r 1,...r p ) dado por r q x q Estes resíduos são nterpretados como a dferença entre os valores observados de covaráves de um ndvíduo com tempo de ocorrênca do evento t e os valores esperados em t dado o grupo de rsco R(t ). R( t ) x R( t ) q exp exp x ˆ x ˆ Estes resíduos são defndos apenas nos tempos de falha. O número de vetores de resíduos é gual ao número de covaráves austadas no modelo.

Dessa forma, através do gráfco dos resíduos padronzados de Schoenfeld contra o tempo é possível verfcar a exstênca ou não de proporconaldade. Isto é, se a suposção de rscos proporconas for satsfeta não deverá exstr nenhuma tendênca sstemátca no gráfco. É possível realzar um teste para verfcar a hpótese de que não exste correlação entre o tempo de sobrevvênca transformado e os resíduos padronzados. Isto equvale a testar a hpótese nula de que não exste tendênca no tempo (H 0 : =0).

AVALIAÇÃO DO AJUSTE DO MODELO Os mesmos testes aplcados aos modelos paramétrcos, também podem ser utlzados no modelo de Cox. A estatístca de Wald pode ser utlzada tanto para testar a sgnfcânca do parâmetro do modelo, como verfcar o auste global do mesmo. O teste da razão de verossmlhança (análse da função desvo) compara modelos encaxados. Avala se a nclusão de uma ou mas varáves no modelo aumenta de modo sgnfcatvo a verossmlhança de um modelo em relação ao modelo com menos parâmetros. A função desvo é assntotcamente semelhante a estatístca de Wald quando o número de observações é grande. Caso esse número sea pequeno, a análse da função desvo é mas robusta.

AVALIAÇÃO DO AJUSTE DO MODELO

AVALIAÇÃO DO AJUSTE DO MODELO PERGUNTA: Qual o poder explcatvo de um modelo escolhdo para avalar os dados? Uma medda de qualdade de auste para modelos lneares é o R 2. Poucas são as meddas estatístcas dsponíves para avalar globalmente a qualdade de auste de um modelo de sobrevvênca. A mas smples delas é uma medda baseada na razão de verossmlhanças e está dsponível no R.

EXEMPLO: Aletamento materno

EXEMPLO: Aletamento materno

EXEMPLO: Aletamento materno

EXEMPLO: Leucema Pedátrca