MODELOS DE REGRESSÃO PARAMÉTRICOS

Documentos relacionados
Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens

Regressão Múltipla. Parte I: Modelo Geral e Estimação

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

Análise de Regressão

4 Critérios para Avaliação dos Cenários

AULA EXTRA Análise de Regressão Logística

REGRESSÃO NÃO LINEAR 27/06/2017

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

Prof. Lorí Viali, Dr.

Análise de Regressão Linear Múltipla IV

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Análise de influência

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

Capítulo 1. Exercício 5. Capítulo 2 Exercício

Prof. Lorí Viali, Dr.

Associação entre duas variáveis quantitativas

Métodos Avançados em Epidemiologia

Prof. Lorí Viali, Dr.

3 A técnica de computação intensiva Bootstrap

Testes não-paramétricos

PRESSUPOSTOS DO MODELO DE REGRESSÃO

Análise de Variância. Comparação de duas ou mais médias

Análise de Regressão Linear Múltipla VII

1. CORRELAÇÃO E REGRESSÃO LINEAR

Tipo tratamento idade Tipo tratamento sexo

5 Métodos de cálculo do limite de retenção em função da ruína e do capital inicial

Reconhecimento Estatístico de Padrões

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

Contabilometria. Aula 8 Regressão Linear Simples

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

DELINEAMENTOS EXPERIMENTAIS

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

2 Incerteza de medição

Programa de Certificação de Medidas de um laboratório

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

Gráficos de Controle para Processos Autocorrelacionados

Identidade dos parâmetros de modelos segmentados

Estatística II Antonio Roque Aula 18. Regressão Linear

Departamento de Informática. Modelagem Analítica do Desempenho de Sistemas de Computação. Modelagem Analítica. Disciplina: Variável Aleatória

Capítulo 2. Modelos de Regressão

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall

ESTATÍSTICA APLICADA II ANO LECTIVO 2011/2012. Exame Final 26 de Julho de 2012

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária.

Cap. 11 Correlação e Regressão

Regressão Linear Simples by Estevam Martins

UNIVERSIDADE FEDERALDO PARÁ INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS FACULDADE DE ESTATÍSTICA CURSO DE BACHARELADO EM ESTATÍSTICA

Gabarito da Lista de Exercícios de Econometria I

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Capítulo 2. APROXIMAÇÕES NUMÉRICAS 1D EM MALHAS UNIFORMES

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

REGRESSÃO E CORRELAÇÃO

Estimação Bayesiana das Fragilidades Individuais de Pacientes em Tratamento de Hemodiálise

CURSO A DISTÂNCIA DE GEOESTATÍSTICA

DENILSON MORAIS VAGNER AYRES LARA ESTUDO SOBRE ALEITAMENTO MATERNO ATÉ OS 60 PRIMEIROS DIAS DE VIDA: UMA APLICAÇÃO DA REGRESSÃO LOGÍSTICA

Regressão Linear Simples. Frases. Roteiro

Notas Processos estocásticos. Nestor Caticha 23 de abril de 2012

ANÁLISE DA VARIÂNCIA DA REGRESSÃO

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Modelagem do crescimento de clones de Eucalyptus via modelos não lineares

Dissertação de Mestrado

Análise Exploratória de Dados

Nome: Nº: Estatística para Economia e Gestão Licenciaturas em Economia e Gestão. 2.º Semestre de 2008/2009

Algarismos Significativos Propagação de Erros ou Desvios

Teoria da Regressão Espacial Aplicada a. Sérgio Alberto Pires da Silva

Regressao Simples. Parte II: Anova, Estimação Intervalar e Predição

Estatística Espacial: Dados de Área

(B) Considere X = antes e Y = depois e realize um teste t para dados pareados e um teste da ANOVA de um DBC com 5 blocos. Compare os resultados.

CURSO de ESTATÍSTICA Gabarito

Aula Características dos sistemas de medição

Universidade de São Paulo Escola Superior de Agricultura Luiz de Queiroz Departamento de Ciências Exatas

Cap. IV Análise estatística de incertezas aleatórias

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira

Processamento de Sinal

ANDRÉ OLIVEIRA SOUZA TESTES ESTATÍSTICOS EM REGRESSÃO LOGÍSTICA SOB A CONDIÇÃO DE SEPARABILIDADE

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

Serão abordados nesse capítulo os modelos causais, utilizados como ferramentas para o desenvolvimento e análise desse trabalho.

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

Módulo I Ondas Planas. Reflexão e Transmissão com incidência normal Reflexão e Transmissão com incidência oblíqua

ESTUDO DE MODELOS PARA AJUSTE E PREVISÃO DE UMA SÉRIE TEMPORAL

PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011

Departamento de Produção, UNESP, Campus de Guaratinguetá Av. Ariberto Pereira da Cunha, 333, Guaratinguetá, S.P. CEP

2 Metodologia de Medição de Riscos para Projetos

Modelo de Regressão Simples

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Classificação de Padrões

5 Análise Conjunta da Média e da Dispersão

TESTE DO QUI-QUADRADO - Ajustamento

CAPÍTULO 9 REGRESSÃO LINEAR PPGEP REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES UFRGS. Regressão Linear Simples

Teoria Elementar da Probabilidade

Tânia Lucia Hojo (UFMG) Sueli Aparecida Mingoti (UFMG)

Transcrição:

MODELOS DE REGRESSÃO PARAMÉTRICOS Às vezes é de nteresse nclur na análse, característcas dos ndvíduos que podem estar relaconadas com o tempo de vda. Estudo de nsufcênca renal: verfcar qual o efeto da dade sobre o tempo de sobrevvênca ou se exste dferença no tempo de sobrevda conforme a doença de base causadora da nsufcênca renal. Na estmação não-paramétrcaé possível nclur covaráves a partr de uma estratfcação e realzação de testes em seguda. Contudo, desta forma, não é possível estmar o efeto da covarável, mas apenas comparar e testar a gualdade entre as curvas de sobrevvênca.

Outra questão que também não é consderada neste tpo de análse é que o efeto ndvdual dessas varáves pode ser modfcado pela presença ou nteração com as demas. A forma mas efcente de acomodar o efeto dessas covaráves é utlzar um modelo de regressão aproprado para dados censurados. O modelo de regressão lnear, onde a resposta é assocada com as varáves explcatvas por meo de um modelo lnear, é o mas conhecdo. Para a formulação do modelo é necessáro especfcar um componente determnístco e um componente aleatóro (estocástco).

Este últmo componente, geralmente, é consderado como tendo dstrbução normal. No caso de uma únca covarável, a representação desse modelo é a segunte: Y 0 1 = β + β x+ ε Y é a resposta, x é a covarável, β 0 e β 1 são os parâmetros a serem estmados e εé o erro aleatóro com dstrbução normal. Em análse de sobrevvênca utlzaremos as dstrbuções paramétrcas para o tempo de sobrevda, nclundo nas observações de cada ndvíduo, além do tempo de vda e censura, o vetor de covaráves do ndvíduo.

Para a formulação do modelo é necessáro especfcar um componente aleatóro, que descreve probablstcamente o comportamento do tempo de vda, e um componente determnístco, que descreve a relação entre os parâmetros da dstrbução de probabldade e as covaráves. Em análse de sobrevvênca, exstem duas classes de modelos propostos: os modelos paramétrcos e os semparamétrcos. Os modelos paramétrcos, também denomnados modelos de tempo de vda acelerados, são mas efcentes, porém menos flexíves do que os modelos semparamétrcos.

A combnação de um componente determnístco e uma dstrbução exponencal com méda 1 para o erro, produz o segunte modelo: Consderando o logartmo, teremos um modelo semelhante ao modelo lnear: com MODELO DE REGRESSÃO EXPONENCIAL T = exp{ x β}ε Y = log( T ) = β + β x + + β + ν 0 1 1... k xk ν = log(ε ) ν O erro segue uma dstrbução do valor extremo padrão.

MODELO DE REGRESSÃO EXPONENCIAL O modelo exponencal deve ser usado quando se assume que o rsco é constante ao longo do tempo. O parâmetro λda dstrbução exponencal depende das covaráves da segunte forma: λ(x) = exp(β0 + β1x)= exp(x β). Onde x = (1,x 1,...,x p ) e β= (β 0,β 1,...,β p ). As funções de sobrevvênca e rsco são dadas por: ( exp( x' t) S ( t / x) = exp( λ( x) t) = exp β) h ( t x) = λ( x) = exp( x' β )

Após a especfcação do modelo, segue a estmação dos seus parâmetros. Na ausênca de normaldade dos erros e, prncpalmente na presença de censuras, uma opção mas aproprada é o método de máxma verossmlhança. Consderando dados ndependentes, a função de verossmlhança para o modelo pode ser escrta, para uma amostra de tamanho n, por: Para obtenção dos estmadores de máxma verossmlhança, é necessáro substtur as funções de densdade e sobrevvênca da equação anteror, por aquelas da dstrbução exponencal. Como as equações são não-lneares nos parâmetros e não apresentam solução analítca é necessáro utlzar o método numérco de Newton-Raphson.

MODELO DE REGRESSÃO WEIBULL Devdo a smplcdade do modelo de regressão exponencal, poucas stuações na prátca são adequadamente ajustadas por este modelo. O modelo de regressão Webull tem bastante aplcação em análse de sobrevvênca. A utlzação da dstrbução Webull no contexto da modelagem de sobrevda sgnfca que o tempo T segue uma dstrbução de Webull. Como no modelo exponencal, o parâmetro de escala λ depende das covaráves (λ(x) = exp{x β}).

As funções de sobrevvênca e rsco par o modelo Webullsão dadas por S( t / x) ( ( ) ) γ λ( x) t = exp ( ( x β ) t) = exp exp ( γ ) h( t x) = γ 1 γ γ 1 γ t λ( x) = γt exp( x' β) γ O método de máxma verossmlhança é novamente utlzado e o uso do método de Newton-Raphsoné necessáro para obtenção das estmatvas de máxma verossmlhança.

MODELO DE REGRESSÃO LOGNORMAL O modelo de regressão Lognormal também tem bastante aplcação em análse de sobrevvênca. A utlzação da dstrbução Lognormal no contexto da modelagem de sobrevda sgnfca que o tempo T segue uma dstrbução de Lognormal. Como nos modelos exponencal e webull, o parâmetro µ depende das covaráves (µ(x) = exp{x β}).

As funções de sobrevvênca e rsco par o modelo Lognormal são dadas por S( t / x) ln( t) µ ( x) = 1 φ σ = ln( t) exp 1 φ σ ( x β) ( t) f ( t) S ( t ) h = O método de máxma verossmlhança é novamente utlzado e o uso do método de Newton-Raphson é necessáro para obtenção das estmatvas de máxma verossmlhança.

Interpretação dos coefcentes estmados Uma proposta de nterpretação fo proposta por Hosmer e Lemeshow (1999). É possível mostrar que a razão dos tempos medanos é dada por t0.5 ( x = 1, ˆ) β ˆ β = e t ( x = 0, ˆ) β 0.5 Os modelos apresentados garantem esta proporconaldade para todos os percents. Esta nterpretação pode ser estendda para varáves categórcas e contínuas.

Esta análse pode ser utlzada tanto para obter uma estatístca global do ajuste de modelo, como para comparar modelos. A hpótese nula de que o modelo se ajusta aos dados pode ser testada pela estatístca: D = 2(l modelo l nulo ) TESTE DA RAZÃO DE VEROSSIMILHANÇA (ANÁLISE DA FUNÇÃO DESVIO) Em que l modelo e l nulo são respectvamente, o logartmo da função de verossmlhança do modelo com as covaráves e o logartmo da função de verossmlhança do modelo nulo (sem covaráves). Esta estatístca segue uma dstrbução χ 2 com número de graus de lberdade gual ao número de covaráves do modelo.

Podemos extender essa análse para comparar um modelo com dstrbução exponencal e outro com dstrbução Webull. Isso equvale a testar a hpótese de que γ= 1. A estatístca de teste, que tem dstrbução qu-quadrado com um grau de lberdade, é dada por D = 2(lwebull lexponencal)~χ 2 1 Onde lwebull e lexponencal são os logartmos da função de verossmlhança do modelo nulo webull e do modelo nulo exponencal. Esta técnca também pode ser utlzada para seleconar varáves em um modelo de regressão paramétrco.

O modelo com maor número de varáves deve conter o modelo com menos covaráves. A estatístca de teste é dada por D = 2(lmaor lmenor)~χ2, sendo l menor o logartmo da função de verossmlhança do modelo com menos parâmetros e l maor do modelo com mas parâmetros. Esta estatístca tem dstrbução qu-quadrado com graus de lberdade gual a dferença no número de covaráves dos modelos.

Exemplo:Consdere o estudo dos pacentes em dálse. Vamos comparar os modelos com dstrbução exponencal e webull. Consdere as saídas dos dos modelos no R.

ANÁLISE GRÁFICA A análse gráfca apresentada anterormente para a escolha da dstrbução também pode ser utlzada para avalar a adequação do modelo de regressão. Para sso, são construídos gráfcos para comparar a curva de sobrevvênca gerada pelo estmador de Kaplan-Meer com as estmadas parametrcamente. No modelo de regressão lnear usual, uma análse gráfca dos resíduos é usada para avalar a adequação do modelo ajustado. A defnção de uma medda de resíduo no contexto de sobrevvênca não é tão clara e dreta como em modelos lneares.

Dversos resíduos têm sdo propostos na lteratura para avalar o ajuste do modelo. Técncas gráfcas, que fazem uso dos dferentes resíduos propostos, são, em partcular, bastante utlzadas para examnar dferentes aspectos do modelo. RESÍDUO DE COX-SNELL Este resíduo é uma medda útl para examnar o ajuste global do modelo. É defndo por eˆ Hˆ ( t / x) Para os modelos vstos anterormente os resíduos de Cox- Snell são dados por: Exponencal: [ { }] e ˆ t exp x βˆ Webull: e ˆ exp ˆ = t x β = [ { }] ˆ γ = Lognormal: eˆ logt ˆ x β = log 1 φ ˆ σ

Se o modelo for adequado e as estmatvas dos parâmetros estverem próxmas dos verdaderos valores, estes resíduos devem parecer como uma amostra censurada de uma dstrbução exponencal padrão (λ = 1). O gráfco das curvas de sobrevvênca desses resíduos, obtdas por Kaplan-Meer e pelo modelo ajustado, também auxla na verfcação da qualdade do modelo. Quanto mas próxmas elas se apresentarem, melhor é consderado o ajuste do modelo aos dados.

RESÍDUOS MARTINGALE Para os modelos de regressão paramétrcos, a defnção de resíduos martngale é dada por: Em que δ é a varável ndcadora de censura e e os resíduos de Cox-Snell. Esses resíduos, são vstos como uma estmatva do número de falhas em excesso observada nos dados mas não predto pelo modelo. São usados, em geral, para examnar a melhor forma funconal (lnear, quadrátca,...) para uma dada covarável em um modelo de regressão assumdo para os dados sob estudo. Se a curva suavzada obtda no gráfco: resíduo x varável for lnear, nenhuma transformação na varável é necessára. Mˆ = δ eˆ

RESÍDUOS DEVIANCE Este tpo de resíduo é uma tentatva de fazer com que os resíduos martngale sejam mas smétrcos em torno de zero. Os resíduos devance nos modelos de regressão paramétrcos são defndos por: dˆ [ 2( mˆ + log( mˆ ))] 1/ 2 = snal( mˆ ) δ δ Estes resíduos facltam em geral a detecção de pontos atípcos (outlers).

Se o modelo for aproprado esses resíduos devem apresentar um comportamento aleatóro em torno de zero. Gráfcos dos resíduos martngale ou devance contra o tempo, ou contra o índce da observação, fornecem uma manera de verfcar a adequação do modelo ajustado. Uma observação mportante é que estes métodos gráfcos devem ser usados para descartar modelos claramente naproprados e não para mostrar que um partcular modelo é melhor que o outro.

Exemplo:No estudo dos pacentes em dálse, consdere como covarável a presença ou ausênca de dabetes no pacente. A fgura mostra que o modelo que mas se aproxma da estmação nãoparamétrca é o modelo Webull.

Exemplo: Análse dos dados de aletamento materno.

Exemplo: Análse dos dados de aletamento materno.

Exemplo: Análse dos dados de aletamento materno.

Exemplo: Análse dos dados de aletamento materno.

Exemplo: Análse dos dados de aletamento materno.

Exemplo: Análse dos dados de aletamento materno.

Exemplo: Análse dos dados de aletamento materno.