MODELOS DE REGRESSÃO PARAMÉTRICOS

Documentos relacionados
Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

O problema da superdispersão na análise de dados de contagens

Regressão Múltipla. Parte I: Modelo Geral e Estimação

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

Análise de Regressão

AULA EXTRA Análise de Regressão Logística

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Análise de influência

Capítulo 1. Exercício 5. Capítulo 2 Exercício

Prof. Lorí Viali, Dr.

Associação entre duas variáveis quantitativas

Testes não-paramétricos

PRESSUPOSTOS DO MODELO DE REGRESSÃO

Análise de Regressão Linear Múltipla VII

1. CORRELAÇÃO E REGRESSÃO LINEAR

Tipo tratamento idade Tipo tratamento sexo

5 Métodos de cálculo do limite de retenção em função da ruína e do capital inicial

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

Contabilometria. Aula 8 Regressão Linear Simples

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

2 Incerteza de medição

Programa de Certificação de Medidas de um laboratório

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

Identidade dos parâmetros de modelos segmentados

Estatística II Antonio Roque Aula 18. Regressão Linear

Gabarito da Lista de Exercícios de Econometria I

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Capítulo 2. APROXIMAÇÕES NUMÉRICAS 1D EM MALHAS UNIFORMES

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

DENILSON MORAIS VAGNER AYRES LARA ESTUDO SOBRE ALEITAMENTO MATERNO ATÉ OS 60 PRIMEIROS DIAS DE VIDA: UMA APLICAÇÃO DA REGRESSÃO LOGÍSTICA

Regressão Linear Simples. Frases. Roteiro

Notas Processos estocásticos. Nestor Caticha 23 de abril de 2012

ANÁLISE DA VARIÂNCIA DA REGRESSÃO

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Modelagem do crescimento de clones de Eucalyptus via modelos não lineares

Análise Exploratória de Dados

Algarismos Significativos Propagação de Erros ou Desvios

Estatística Espacial: Dados de Área

Universidade de São Paulo Escola Superior de Agricultura Luiz de Queiroz Departamento de Ciências Exatas

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

Módulo I Ondas Planas. Reflexão e Transmissão com incidência normal Reflexão e Transmissão com incidência oblíqua

ESTUDO DE MODELOS PARA AJUSTE E PREVISÃO DE UMA SÉRIE TEMPORAL

PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011

Modelo de Regressão Simples

TESTE DO QUI-QUADRADO - Ajustamento

Teoria Elementar da Probabilidade

Tânia Lucia Hojo (UFMG) Sueli Aparecida Mingoti (UFMG)

Transcrição:

MODELOS DE REGRESSÃO PARAMÉTRICOS Às vezes é de nteresse nclur na análse, característcas dos ndvíduos que podem estar relaconadas com o tempo de vda. Estudo de nsufcênca renal: verfcar qual o efeto da dade sobre o tempo de sobrevvênca ou se exste dferença no tempo de sobrevda conforme a doença de base causadora da nsufcênca renal. Na estmação não-paramétrcaé possível nclur covaráves a partr de uma estratfcação e realzação de testes em seguda. Contudo, desta forma, não é possível estmar o efeto da covarável, mas apenas comparar e testar a gualdade entre as curvas de sobrevvênca.

Outra questão que também não é consderada neste tpo de análse é que o efeto ndvdual dessas varáves pode ser modfcado pela presença ou nteração com as demas. A forma mas efcente de acomodar o efeto dessas covaráves é utlzar um modelo de regressão aproprado para dados censurados. O modelo de regressão lnear, onde a resposta é assocada com as varáves explcatvas por meo de um modelo lnear, é o mas conhecdo. Para a formulação do modelo é necessáro especfcar um componente determnístco e um componente aleatóro (estocástco).

Este últmo componente, geralmente, é consderado como tendo dstrbução normal. No caso de uma únca covarável, a representação desse modelo é a segunte: Y 0 1 = β + β x+ ε Y é a resposta, x é a covarável, β 0 e β 1 são os parâmetros a serem estmados e εé o erro aleatóro com dstrbução normal. Em análse de sobrevvênca utlzaremos as dstrbuções paramétrcas para o tempo de sobrevda, nclundo nas observações de cada ndvíduo, além do tempo de vda e censura, o vetor de covaráves do ndvíduo.

Para a formulação do modelo é necessáro especfcar um componente aleatóro, que descreve probablstcamente o comportamento do tempo de vda, e um componente determnístco, que descreve a relação entre os parâmetros da dstrbução de probabldade e as covaráves. Em análse de sobrevvênca, exstem duas classes de modelos propostos: os modelos paramétrcos e os semparamétrcos. Os modelos paramétrcos, também denomnados modelos de tempo de vda acelerados, são mas efcentes, porém menos flexíves do que os modelos semparamétrcos.

A combnação de um componente determnístco e uma dstrbução exponencal com méda 1 para o erro, produz o segunte modelo: Consderando o logartmo, teremos um modelo semelhante ao modelo lnear: com MODELO DE REGRESSÃO EXPONENCIAL T = exp{ x β}ε Y = log( T ) = β + β x + + β + ν 0 1 1... k xk ν = log(ε ) ν O erro segue uma dstrbução do valor extremo padrão.

MODELO DE REGRESSÃO EXPONENCIAL O modelo exponencal deve ser usado quando se assume que o rsco é constante ao longo do tempo. O parâmetro λda dstrbução exponencal depende das covaráves da segunte forma: λ(x) = exp(β0 + β1x)= exp(x β). Onde x = (1,x 1,...,x p ) e β= (β 0,β 1,...,β p ). As funções de sobrevvênca e rsco são dadas por: ( exp( x' t) S ( t / x) = exp( λ( x) t) = exp β) h ( t x) = λ( x) = exp( x' β )

Após a especfcação do modelo, segue a estmação dos seus parâmetros. Na ausênca de normaldade dos erros e, prncpalmente na presença de censuras, uma opção mas aproprada é o método de máxma verossmlhança. Consderando dados ndependentes, a função de verossmlhança para o modelo pode ser escrta, para uma amostra de tamanho n, por: Para obtenção dos estmadores de máxma verossmlhança, é necessáro substtur as funções de densdade e sobrevvênca da equação anteror, por aquelas da dstrbução exponencal. Como as equações são não-lneares nos parâmetros e não apresentam solução analítca é necessáro utlzar o método numérco de Newton-Raphson.

MODELO DE REGRESSÃO WEIBULL Devdo a smplcdade do modelo de regressão exponencal, poucas stuações na prátca são adequadamente ajustadas por este modelo. O modelo de regressão Webull tem bastante aplcação em análse de sobrevvênca. A utlzação da dstrbução Webull no contexto da modelagem de sobrevda sgnfca que o tempo T segue uma dstrbução de Webull. Como no modelo exponencal, o parâmetro de escala λ depende das covaráves (λ(x) = exp{x β}).

As funções de sobrevvênca e rsco par o modelo Webullsão dadas por S( t / x) ( ( ) ) γ λ( x) t = exp ( ( x β ) t) = exp exp ( γ ) h( t x) = γ 1 γ γ 1 γ t λ( x) = γt exp( x' β) γ O método de máxma verossmlhança é novamente utlzado e o uso do método de Newton-Raphsoné necessáro para obtenção das estmatvas de máxma verossmlhança.

MODELO DE REGRESSÃO LOGNORMAL O modelo de regressão Lognormal também tem bastante aplcação em análse de sobrevvênca. A utlzação da dstrbução Lognormal no contexto da modelagem de sobrevda sgnfca que o tempo T segue uma dstrbução de Lognormal. Como nos modelos exponencal e webull, o parâmetro µ depende das covaráves (µ(x) = exp{x β}).

As funções de sobrevvênca e rsco par o modelo Lognormal são dadas por S( t / x) ln( t) µ ( x) = 1 φ σ = ln( t) exp 1 φ σ ( x β) ( t) f ( t) S ( t ) h = O método de máxma verossmlhança é novamente utlzado e o uso do método de Newton-Raphson é necessáro para obtenção das estmatvas de máxma verossmlhança.

Interpretação dos coefcentes estmados Uma proposta de nterpretação fo proposta por Hosmer e Lemeshow (1999). É possível mostrar que a razão dos tempos medanos é dada por t0.5 ( x = 1, ˆ) β ˆ β = e t ( x = 0, ˆ) β 0.5 Os modelos apresentados garantem esta proporconaldade para todos os percents. Esta nterpretação pode ser estendda para varáves categórcas e contínuas.

Esta análse pode ser utlzada tanto para obter uma estatístca global do ajuste de modelo, como para comparar modelos. A hpótese nula de que o modelo se ajusta aos dados pode ser testada pela estatístca: D = 2(l modelo l nulo ) TESTE DA RAZÃO DE VEROSSIMILHANÇA (ANÁLISE DA FUNÇÃO DESVIO) Em que l modelo e l nulo são respectvamente, o logartmo da função de verossmlhança do modelo com as covaráves e o logartmo da função de verossmlhança do modelo nulo (sem covaráves). Esta estatístca segue uma dstrbução χ 2 com número de graus de lberdade gual ao número de covaráves do modelo.

Podemos extender essa análse para comparar um modelo com dstrbução exponencal e outro com dstrbução Webull. Isso equvale a testar a hpótese de que γ= 1. A estatístca de teste, que tem dstrbução qu-quadrado com um grau de lberdade, é dada por D = 2(lwebull lexponencal)~χ 2 1 Onde lwebull e lexponencal são os logartmos da função de verossmlhança do modelo nulo webull e do modelo nulo exponencal. Esta técnca também pode ser utlzada para seleconar varáves em um modelo de regressão paramétrco.

O modelo com maor número de varáves deve conter o modelo com menos covaráves. A estatístca de teste é dada por D = 2(lmaor lmenor)~χ2, sendo l menor o logartmo da função de verossmlhança do modelo com menos parâmetros e l maor do modelo com mas parâmetros. Esta estatístca tem dstrbução qu-quadrado com graus de lberdade gual a dferença no número de covaráves dos modelos.

Exemplo:Consdere o estudo dos pacentes em dálse. Vamos comparar os modelos com dstrbução exponencal e webull. Consdere as saídas dos dos modelos no R.

ANÁLISE GRÁFICA A análse gráfca apresentada anterormente para a escolha da dstrbução também pode ser utlzada para avalar a adequação do modelo de regressão. Para sso, são construídos gráfcos para comparar a curva de sobrevvênca gerada pelo estmador de Kaplan-Meer com as estmadas parametrcamente. No modelo de regressão lnear usual, uma análse gráfca dos resíduos é usada para avalar a adequação do modelo ajustado. A defnção de uma medda de resíduo no contexto de sobrevvênca não é tão clara e dreta como em modelos lneares.

Dversos resíduos têm sdo propostos na lteratura para avalar o ajuste do modelo. Técncas gráfcas, que fazem uso dos dferentes resíduos propostos, são, em partcular, bastante utlzadas para examnar dferentes aspectos do modelo. RESÍDUO DE COX-SNELL Este resíduo é uma medda útl para examnar o ajuste global do modelo. É defndo por eˆ Hˆ ( t / x) Para os modelos vstos anterormente os resíduos de Cox- Snell são dados por: Exponencal: [ { }] e ˆ t exp x βˆ Webull: e ˆ exp ˆ = t x β = [ { }] ˆ γ = Lognormal: eˆ logt ˆ x β = log 1 φ ˆ σ

Se o modelo for adequado e as estmatvas dos parâmetros estverem próxmas dos verdaderos valores, estes resíduos devem parecer como uma amostra censurada de uma dstrbução exponencal padrão (λ = 1). O gráfco das curvas de sobrevvênca desses resíduos, obtdas por Kaplan-Meer e pelo modelo ajustado, também auxla na verfcação da qualdade do modelo. Quanto mas próxmas elas se apresentarem, melhor é consderado o ajuste do modelo aos dados.

RESÍDUOS MARTINGALE Para os modelos de regressão paramétrcos, a defnção de resíduos martngale é dada por: Em que δ é a varável ndcadora de censura e e os resíduos de Cox-Snell. Esses resíduos, são vstos como uma estmatva do número de falhas em excesso observada nos dados mas não predto pelo modelo. São usados, em geral, para examnar a melhor forma funconal (lnear, quadrátca,...) para uma dada covarável em um modelo de regressão assumdo para os dados sob estudo. Se a curva suavzada obtda no gráfco: resíduo x varável for lnear, nenhuma transformação na varável é necessára. Mˆ = δ eˆ

RESÍDUOS DEVIANCE Este tpo de resíduo é uma tentatva de fazer com que os resíduos martngale sejam mas smétrcos em torno de zero. Os resíduos devance nos modelos de regressão paramétrcos são defndos por: dˆ [ 2( mˆ + log( mˆ ))] 1/ 2 = snal( mˆ ) δ δ Estes resíduos facltam em geral a detecção de pontos atípcos (outlers).

Se o modelo for aproprado esses resíduos devem apresentar um comportamento aleatóro em torno de zero. Gráfcos dos resíduos martngale ou devance contra o tempo, ou contra o índce da observação, fornecem uma manera de verfcar a adequação do modelo ajustado. Uma observação mportante é que estes métodos gráfcos devem ser usados para descartar modelos claramente naproprados e não para mostrar que um partcular modelo é melhor que o outro.

Exemplo:No estudo dos pacentes em dálse, consdere como covarável a presença ou ausênca de dabetes no pacente. A fgura mostra que o modelo que mas se aproxma da estmação nãoparamétrca é o modelo Webull.

Exemplo: Análse dos dados de aletamento materno.

Exemplo: Análse dos dados de aletamento materno.

Exemplo: Análse dos dados de aletamento materno.

Exemplo: Análse dos dados de aletamento materno.

Exemplo: Análse dos dados de aletamento materno.

Exemplo: Análse dos dados de aletamento materno.

Exemplo: Análse dos dados de aletamento materno.