Modelagem Conjunta de Dados Longitudinais e de Sobrevivência
|
|
- Daniel Sabala Lopes
- 6 Há anos
- Visualizações:
Transcrição
1 Modelagem Conjunta de Dados Longitudinais e de Sobrevivência Anna Carolina Lustosa Lima. Introdução Em estudos envolvendo análise de dados longitudinais a variável resposta é medida repetidamente, ao longo de um intervalo de tempo, para cada indivíduo. Nos estudos de análise de sobrevivência a variável resposta é o tempo até a ocorrência de um evento. Muitos estudos clínicos geram conjuntamente dados longitudinais e de sobrevivência. Por exemplo, nos estudos prospectivos de análise de sobrevivência em que, grupos de pacientes são acompanhados ao longo do tempo até a ocorrência de óbito, é comum haver visitas de acompanhamento quando são medidas variáveis relacionadas à progressão da doença. Entretanto, tratar estas medidas como covariáveis dependentes do tempo no processo de sobrevivência nem sempre é satisfatório uma vez que há ocasiões cujo interesse do pesquisador é avaliar o efeito de tratamentos tanto sobre os tempos de sobrevivência quanto sobre o marcador longitudinal. Este estudo mostra também que a inclusão do marcador longitudinal como covariável no processo de sobrevivência pode ocasionar a perda de importância de covariáveis possivelmente associadas ao tratamento. Existem modelos bem estabelecidos na literatura para analisar estes dados separadamente, mas esta forma de abordagem pode ser inadequada se a variável longitudinal for correlacionada com o tempo de sobrevivência. Por exemplo, Henserson et.al. (000) mostraram que, em detrimento do modelo conjunto, utilizar os modelos separados para o processo longitudinal e de sobrevivência acarreta um vício severo na estimação de alguns componentes de variância e no coeficiente de têndencia temporal. Guo e Carlin (00) desenvolveram uma aproximação Bayesiana para o modelo conjunto e mostraram haver significativa melhora nas estimativas dos tempos de sobrevivência e de outros parâmetros. O presente estudo pretende comparar as abordagens, separada e conjunta, aplicada ao banco de dados de um experimento biológico envolvendo camundongos, realizado com o objetivo de avaliar o efeito da co-infecção de malária e esquistossomose e da imunização induzida para malária, sobre os
2 tempos de sobrevivência e nível de parasitemia (malária) dos camundongos. Neste experimento, camundongos foram distribuídos aleatoriamente em quatro grupos experimentais. Os camundongos alocados no primeiro e segundo grupos foram ambos previamente induzidos à imunização para malária e infectados com malária e malária associada à esquistossomose, respectivamente. Os camundongos alocados nos grupos 3 e não foram imunizados e foram infectados por malária e malária associada à esquistossomose, respectivamente. O pesquisador visitou os camundongos diariamente e registrou o percentual médio de parasitemia no sangue e a ocorrência ou não de morte. Esta avaliação foi realizada num período de dias (do º ao º dia após a infecção). Observou-se que os camundongos dos grupos e (ambos imunizados) tiveram melhor prognóstico e níveis de parasitemia baixos, enquanto que nos grupos 3 e foram observados menores tempos de sobrevivência e níveis de parasitemia crescentes. Em específico pretende-se comparar em termos metodológicos e de interpretação os seguintes modelos: M: Modelos para dados longitudinais; M: Modelo de Cox para a resposta de sobrevivência; M3: Modelo de Cox com covariável dependente do tempo (variável longitudinal); M: Modelo Conjunto para dados longitudinais e de sobrevivência. A análise conjunta de dados longitudinais de sobrevivência tem sido explorada recentemente por muitos autores Wulfshon e Tsiatis (7) desenvolveram uma aproximação para o modelo conjunto que utiliza o modelo de Cox para o processo de sobrevivência e a resposta longitudinal é tratada como covariável contínua cujo valor real é dado por um modelo linear de efeitos aleatórios. A estimação dos parâmetros do modelo proposto é realizada por um algoritmo EM que também foi utilizado por Wenderson et. al. (000) estes autores formularam um modelo generalizado para a análise conjunta em que um sub-modelo linear de efeitos aleatórios é assumido para os dados longitudinais, um sub-modelo semi-paramétrico de riscos proporcionais para os dados de sobrevivência, e assume que estes dois sub-modelos podem ser ligados por um processo latente normal bivariado. Uma característica interessante do modelo proposto por estes autores é que na ausência de associação entre o marcador longitudinal e os tempos de sobrevivência, os
3 resultados da análise conjunta deverão ser os mesmos que obteríamos a partir da análise separada de cada um dos componentes através de métodos tradicionais. Outros autores também utilizaram esta forma generalizada para o modelo conjunto. Por exemplo, Wang e Taylor (00) desenvolveram uma aproximação que considera o processo latente de ligação como um processo estocástico integrado Orsntein-Uhlenbeck. Esta escolha foi motivada pela necessidade de obter um modelo mais flexível para o processo longitudinal. Brown, Ibrahim e DeGrutolla (00) também sugeriram uma alteração no modelo para a resposta longitudinal. Eles sugerem o uso do modelo B-Splines Cúbico em lugar de um modelo linear de efeitos aleatórios. Song, Davidian e Tsiatis (00) avaliaram o modelo conjunto assumindo apenas que os coeficientes aleatórios pertencem a uma família de densidades suavizadas e não estritamente a distribuição normal. Guo e Carlin (00) desenvolveram uma aproximação Bayesiana para o modelo conjunto proposto por Henderson et. al. (000). Tseng, Hsieh e Wang (00) abordaram o caso em que a suposição de riscos proporcionais no modelo de Cox não é verificada e considera o modelo de tempo de tempos de falha acelerado como alternativa para a modelagem dos dados de eventos. Ratcliffe et. al. (00) propuseram um modelo conjunto para dados em conglomerados em que os dois sub-modelos são ligados através das fragilidades no nível do grupo. Zhang e Heagerty (00) e Xu e Zerg (00) desenvolveram aproximações de modelagem conjunta mas, com o foco na estimação dos parâmetros do processo de sobrevivência. A Seção apresenta de forma resumida os conceitos de análise de sobrevivência e o modelo de Cox (7) com e sem covariáveis dependentes do tempo. A Seção 3 aborda a metodologia de análise de dados longitudinais e apresenta os modelos marginal e de efeitos aleatórios. Os modelos conjuntos propostos por Wulfsohn e Tsiatis (7) e por Henderson et. al. (000) são apresentados na Seção. A descrição detalhada do experimento e modelagem dos dados utilizando os métodos tradicionais de análise separada estão apresentados na Seção. A Seção considera o modelo de Cox com covariável dependente do tempo como uma aproximação para o modelo conjunto. 3
4 . Análise de Sobrevivência Nesta seção introduziremos os conceitos básicos de análise de sobrevivência e a notação utilizada na literatura. Os modelos de Cox, com e sem covariável dependente do tempo, e suas formas de estimação são também apresentados nesta seção. Suponha um conjunto de m indivíduos distribuídos aleatoriamente em grupos de tratamento, X i é a variável indicadora de grupo. Seja T i o tempo máximo de acompanhamento do i-ésimo indivíduo. Este tempo pode ser classificado de duas formas: T i é um tempo de falha se indica o tempo em que o evento de interesse foi observado; ou, T i é um tempo de censura se ao final do acompanhamento o evento não ocorreu. De forma geral, o vetor (T i, δ i, X i ) representa os dados de sobrevivência do i-ésimo indivíduo em que t i é o tempo máximo de acompanhamento, δ i uma função indicadora de falha e x i representa as covariáveis associadas a este indivíduo. A taxa de falha no intervalo [t, t+δt) é definida como a probabilidade de que a falha ocorra neste intervalo, dado que não ocorreu antes de t, dividida pelo comprimento do intervalo. Desta forma, se Δt 0, λ(t) representa a taxa de falha instantânea no tempo t, condicional à sobrevivência até o tempo t, e é expressa por: P t T t t T t λ t =lim t 0 t Modelos tanto paramétricos quanto semi-paramétricos estão disponíveis para modelar dados de sobrevivência (Colosimo e Giolo, 00). Os modelos paramétricos Exponencial e Weibull são comumente usados por sua simplicidade e pela fácil interpretação de seus parâmetros. Na prática, entretanto, os modelos semi-paramétricos de riscos proporcionais (modelos de Cox, 7) são amplamente usados pois, eles não impõe uma forma particular para a curva de sobrevivência.. Modelo de Riscos Proporcionais de Cox
5 No modelo semi-paramétrico de riscos proporcionais de Cox a função de risco assume a forma: λ i t =λ 0 t exp {X T i β} () em que, λ 0 (t), a função de taxa de falha básica e o vetor X i =(X i, X i,..., X pi ) T e β representam as p covariáveis medidas no i-ésimo indivíduo e seus correspondentes coeficientes de regressão. O modelo de Cox, sem covariável dependente do tempo (), assume que a razão das taxas de falha de dois indivíduos distintos na amostra é constante para todo o tempo de acompanhamento. A estimação dos parâmetros deste modelo é baseada no método da máxima verossimilhança parcial (Collet, 003; Cox, 7): L β = m exp {X T i i β} i= β} δ exp {X T j R t i j () em que, R(t i ) é o conjunto dos índices das observações sob risco no tempo t i. A função de verossimilhança parcial () assume que os tempos de sobrevivência são contínuos e, conseqüentemente, não pressupõe a possibilidade de empates nos tempos observados. Na prática, empates podem ocorrer nos tempos de falha ou de censura devido à escala de medida. Breslow (7) e Peto (7) propuseram uma modificação na função de verossimilhança parcial para acomodar as observações empatadas quando estas ocorrem. Considere s i o vetor formado pela soma das covariáveis para os indivíduos que falharam no mesmo tempo t i (i =,..., k) e d i o número de falhas neste tempo. A função de verossimilhança parcial proposta por estes autores tem a seguinte forma: k exp {s L β = T i β} i= exp {X T d j R t i j β} i (3) Esta aproximação é adequada quando o número de empates em qualquer tempo não é grande. Quando não há empates a expressão (3) se reduz à ().. Modelo de Cox com Covariáveis Dependentes do Tempo
6 Considere a possibilidade que entre as p covariáveis medidas em cada indivíduo, x,..., x p exista alguma que foi medida n vezes, em cada indivíduo, ao longo do tempo. Assim temos ( T i, δ i, X i (t j )) o vetor que representa os dados de sobrevivência observados para o i-ésimo indivíduo no j-ésimo tempo; X i (t j ) o vetor de covariáveis do i-ésimo indivíduo no tempo j (j =,..., n i ). Neste modelo a função de risco assume a forma: λ i t =λ 0 t i exp {X T i t i β} () Então, o modelo de Cox com variável dependente do tempo não supõe riscos proporcionais pois a razão das funções de risco de dois indivíduos passa a depender do tempo. Assim, a função de verosimilhança parcial para o modelo de Cox com covariável dependente do tempo pode ser escrita como: L β = m exp {X T i i t i β} i= exp {X T j R t i j t i β} δ () Andersen e Gill () mostraram que, sob certas condições de regularidade, os estimadores produzidos pela função de verossimilhança parcial (3 e ) são consistentes e assintoticamente normais. 3. Análise de Dados Longitudinais Esta seção introduz os conceitos associados à análise de dados longitudinais, a notação utilizada na literatura e apresenta os modelos marginal e de efeitos aleatórios com suas respectivas formas de estimação. Também conhecido como medidas repetidas, este tipo de estudo envolve bancos de dados em que a variável resposta, Y, é medida repetidamente em cada indivíduo da amostra, ao longo do tempo. Suponha um conjunto de m indivíduos avaliados n i vezes ao longo do tempo. Y i =(Y i,..., Y in ) é o vetor de respostas do i-ésimo indivíduo, então Y ij representa a resposta do i-ésimo indivíduo no j-ésimo tempo. Em análise de dados longitudinais assumimos que, entre indivíduos, as respostas são independentes, mas para o mesmo indivíduo elas são correlacionadas.
7 Diggle et al. () mostraram que, ao modelar dados longitudinais pelo modelo linear normal as estimativas dos coeficientes de regressão, β' s, permanecem consistentes porém, estas são ineficientes uma vez que a variância dos coeficientes de regressão estimados, Var β, fica subestimada. Uma forma de corrigir este problema é através da estimação dos componentes de variância. O modelo marginal e o modelo de efeitos aleatórios apresentam duas formas de estimação destes componentes e serão apresentados a seguir. 3. Modelo Marginal No modelo marginal a média e a variância de Y são modeladas separadamente. Assumimos que a resposta, Y i, é resultado de um processo Gaussiano n-variado com média X T i β e matriz de covariância V i. A variância de V i incorpora a estrutura de correlação das medidas do mesmo indivíduo. Portanto, é necessário atribuir forma específica à V i. As formas mais comuns de V i são: Correlação Uniforme neste caso, assumimos que a correlação entre as medidas do mesmo indivíduo é constante; Correlação Serial, esta forma assume que a correlação diminui quando as medidas se afastam no tempo; e, Não-estruturada neste caso, é especificada uma covariância diferente para cada par de observações do indivíduo. A matriz de correlação dos resíduos padronizados, obtidos pelo ajuste do modelo linear normal para a resposta longitudinal versus o tempo desconsiderando as demais variáveis, é útil para determinar a estrutura de correlação das medidas do mesmo indivíduo (Diggle et al, ). O modelo marginal pode ser escrito como: Y i =X T i β ε i () em que, Y i ~ N n X T i β,v i, e ε i ~ N 0, V i. 3. Modelo de Efeitos Aleatórios Neste modelo a resposta é assumida ser uma função linear das variáveis explicativas com coeficientes de regressão que variam entre indivíduos, isto é, 7
8 este modelo permite que os coeficientes sejam fixos ou aleatórios. Os coeficientes aleatórios explicam a dependência entre as respostas do mesmo indivíduo, esta variabilidade reflete a heterogeneidade devido a fatores não mensurados ou não mensuráveis. A premissa básica do modelo de efeitos aleatórios é que a heterogeneidade natural entre indivíduos é modelada em um subconjunto de coeficientes de regressão. O modelo de efeitos aleatórios assume a seguinte forma: Y i =X T i β Z i b i ε i, em que, X T i β : representa o componente fixo; X i são as covariáveis incluídas na análise e β s seus respectivos coeficientes de regressão, Z i b i : representa o componente aleatório; b i s são os coeficientes aleatórios que variam para cada indivíduo; e, Z i é, em geral, um subconjunto de X i de covariáveis dependentes do tempo. No modelo de efeitos aleatórios assumimos que as respostas do i-ésimo indivíduo têm distribuição Normal n-variada com média X T i β e matriz de covariância Σ= Z i V i Z T i σ I em que V i é a matriz de covariâncias das medidas do mesmo indivíduo. Os coeficientes aleatórios, b i, e os erros do modelo, ε i, são independentes e têm distribuição Normal com média zero e variâncias V i e σ I, respectivamente. 3.3 Inferência para os Modelos Marginal e de Efeitos Aleatórios Os coeficientes de regressão do modelo marginal e do modelo de efeitos aleatórios podem ser estimados através do método da máxima verossimilhança. Entretanto, este método produz um estimador viciado para a variância (Diggle et al, ). O método da máxima verossimilhança restrita corrige este problema e sua função é dada por: L R θ = X T H X L v θ (7) em que, H = σ I e L v (θ) é a função de verossimilhança usual: m n n L V θ = π V i σ i=.exp{ Y σ i X i β T V i Y i X i β } ()
9 O estimador de máxima verossimilhança restrita possui as mesmas propriedades que o estimador de máxima verossimilhança.. Modelagem Conjunta. O Modelo Conjunto por Wulfsohn e Tsiatis (7) A modelagem conjunta de dados longitudinais e de sobrevivência tem sido explorada recentemente por muitos autores. O modelo conjunto proposto por Wulfsohn e Tsiatis (7) tem sido referência para muitos deles. Estes autores utilizaram um modelo de Cox para o processo de sobrevivência e a resposta longitudinal é tratada como covariável contínua cujo valor real é dado por um modelo linear de efeitos aleatórios. Considere n indivíduos, seja Y i uma covariável dependente do tempo, e cada indivíduo tem m i medidas da covariável longitudinal nos tempos (t ij : t ij T i ). T i é o tempo máximo de acompanhamento do paciente e δ i uma função indicadora de falha. Assumimos que Y ij pode ser ajustada por um modelo linear de efeitos aleatórios. Y ij =β 0i β i t ij ε ij em que, ε ij tem distribuição Normal com média zero e variância σ ε, com cov(ε ij, ε ij ) = 0, j j. O vetor β i tem distribuição normal bivariada com vetor de médias β=(β oi, β i ) T e matriz de covariância σ. ε ij β oi e β i. O risco de falha é então ajustado pelo modelo semi-paramétrico de Cox e o valor ajustado pelo modelo linear de efeitos aleatórios utilizado como valor real do marcador longitudinal, em lugar da medida observada Y ij. λ i t β i, Y i, t i =λ 0 t i β i =λ 0 t exp {γ β 0i β i } em que, λ 0 (t) é a função de risco baseline (não-paramétrica) que é avaliada a cada tempo de falha.
10 Neste modelo, assumimos que o tempo de censura é não informativo, sendo realizado independentemente do tempo de sobrevivência e da medida do marcador longitudinal.. O Modelo Conjunto por Henderson et. al. (000) Henderson et. al. (000) propuseram um modelo generalizado para a análise conjunta que pode ser dividido em dois sub-modelos e um processo de ligação. Para as medidas longitudinais é assumido um sub-modelo linear com efeitos aleatórios, e para o processo de sobrevivência um sub-modelo semiparamétrico de riscos proporcionais. O modelo conjunto assume que dado o processo latente normal bivariado, W(t)= {W (t), W (t)}, e as covariáveis avaliadas, os processos longitudinal e de sobrevivência são condicionalmente independentes. Os sub-modelos podem ser escritos na seguinte forma: ()Sub-modelo para as medidas longitudinais: Y ij = µ i (t ij ) + W i (t ij ) + ε ij () em que, µ i (t ij ) é a resposta média e, ε ij ~N(0,σ ε) é uma seqüência de erros mutuamente independentes. Assumimos que a resposta média pode ser descrita por um modelo linear: µ i (t) = X i (t) β em que, os vetores X i (t) e β representam variáveis explicativas, que podem ser dependentes do tempo, e seus correspondentes coeficientes de regressão. ()Sub-modelo para o processo de sobrevivência no tempo t é dado pelo modelo semi-paramétrico multiplicativo: 0
11 λ i (t) = H i (t) α 0 (t) exp{x i (t) T β + W i (t)} (0) em que, o componente não-paramétrico α 0 (t) têm forma não especificada. H i (t) representa uma indicadora que é igual a se o i-ésimo indivíduo está sob risco de evento no tempo t, e 0 caso contrário. Os vetores X i (t) e β podem, ou não, ter elementos em comum com X i (t) e β. Para o processo de ligação latente assumimos que, W (t) = U + U t () em que, (U, U ) têm distribuição normal bivariada com médias zero, com respectivas variâncias σ e σ e coeficiente de correlação ρ. E, W (t) tem a forma: W (t) = γ U + γ U + γ 3 (U + U t) + U 3 () em que, U3~N(0, σ 3) é independente de (U, U ). Neste modelo, os parâmetros γ, γ e γ 3 medem a associação induzida pelo intercepto, inclinação e valor de W (t), respectivamente. U3 modela a fragilidade ortogonal do processo de medidas.
12 . Aplicação. Descrição do experimento As conseqüências da infecção conjunta da malária com a esquistossomose têm sido relatadas por alguns autores. Em modelos experimentais, utilizando o S. mansoni (esquistossomose) em associação com espécies de Plasmodium (malária) de roedores, Lewin et al () mostraram que as parasitoses mistas levaram a um aumento de parasitemia devida ao protozoário. Com o objetivo de aprofundar os conhecimentos sobre o efeito da associação da infecção do protozoário da malária P.berguei com o helminto causador da esquistossomose S.mansoni, sobre a parasitemia por P.berguei e sobre a sobrevivência dos camundongos, foi conduzido, no Instituto de Ciências Biológicas (ICB-UFMG) em parceria com o Centro de Pesquisas René Rachou (CPqRR-FIOCRUZ), um experimento em que 0 camundongos foram alocados aleatoriamente em grupos de tratamentos. Estes camundongos foram acompanhados durante dias. O tempo zero indica o tempo em que os camundongos foram infectados com P. berguei. A partir do º dia após a infecção o percentual de parasitas no sangue do camundongo torna-se grande o suficiente para ser detectado pelo teste de esfregaço sanguíneo (teste para determinar a parasitemia), este dia então foi usado como padrão para o início da contagem que foi realizada diariamente até o º dia, quando todos os camundongos que haviam sobrevivido foram sacrificados. Valores altos de parasitemia indicam alto grau de infecção do camundongo, enquanto que valores observados iguais a zero indicam a ocorrência de cura do camundongo. Os camundongos que morreram ao longo do período de acompanhamento (º ao º dia após a infecção), tiveram o dia do óbito registrado. Os 0 camundongos foram distribuídos aleatoriamente entre grupos de 0 camundongos cada, no entanto, ocorreram mortes de camundongos antes do início da medida da parasitemia devido a fatores distintos do objetivo do estudo sendo, portanto, estes eliminados do banco de dados. O banco final dispõe de camundongos assim distribuídos:
13 Grupo : Grupo : Grupo 3: Grupo : 0 camundongos infectados por P. berguei que foram previamente imunizados à malária por infecções sucessivas seguidas de tratamento. camundongos infectados cronicamente por S. mansoni e posteriormente infectados por P. berguei que foram previamente imunizados à malária por infecções sucessivas seguidas de tratamento. camundongos infectados por P. berguei. 3 camundongos infectados cronicamente por S. mansoni e posteriormente infectados por P. berguei. Indução à imunidade à P. berguei: Os camundongos dos grupos e foram imunizados contra a malária por P. berguei através de sucessivas infecções experimentais seguidas de cura utilizando tratamento com cloroquina (00mg/kg, via oral). O processo de indução de imunidade à malária iniciou-se semanas após a infecção por S. mansoni. Para comprovar o sucesso da imunização, um grupo de 0 camundongos foi posteriormente infectado com x0 hemácias parasitadas por P. berguei e acomanhado para a constatação da ausência de parasitemia.. Análise de dados Com base no banco de dados deste experimento definimos O ij = X i, X i, X3 ij,t ij,t i, δ i os valores observados das medidas do i-ésimo camundongo no j-ésimo tempo. X i e X i, representam as medidas das covariáveis indicadoras: coinfecção e imunização, respectivamente; X3 ij, representa o percentual médio de parasitemia do i-ésimo camundongo no j- ésimo dia após a infecção; t ij o tempo das medidas longitudinais, T i, representa o tempo máximo de acompanhamento do i-ésimo camundongo, T i ; e, δ i é o indicador de falha. A Figura, apresentada no Anexo A, contém os gráficos de perfis dos dados associados a cada camundongo por grupo experimental. O grupo (Figura (a)) é composto por camundongos que foram imunizados e infectados 3
14 apenas por malária, correspondendo ao grupo de melhor prognóstico uma vez que apresenta os mais baixos valores de parasitemia e, a partir do º dia após a infecção até o tempo final do estudo todos os camundongos apresentaram parasitemina zero (indicativo de cura) sendo portanto, todos censurados no º dia após a infecção. No grupo (Figura (b)) estão alocados os camundongos que foram imunizados e coinfectados. Neste grupo temos a presença de camundongos que mantiveram o percentual de parasitemia baixo até o final do experimento e foram censurados no º dia após a infecção, que morreram com níveis de parasitemia diversos e casos que tiveram óbito no º dia mas que apresentavam indicador de cura no dia anterior à morte. Os camundongos alocados nos grupos 3 e (Figura (c) e (d)) não foram imunizados e todos eles morreram antes do fim do estudo, sendo que podemos observar valores altos de parasitemia precedendo a morte. Observa-se que no grupo, em que os camundongos foram coinfectados, o tempo de sobrevivência de apenas animais foi superior a dias, enquanto que no grupo 3 (animais com infecção simples) o tempo de sobrevivência parece ter sido maior. Nos grupos experimentais 3 e as medidas de parasitemia do º dia após a infecção foram perdidas... Análise de Dados Longitudinais Primeiramente, iremos focar a análise deste banco de dados sob o aspecto da estrutura de medidas repetidas. Então, a variável resposta a ser considerada, X3 ij, é o percentual médio de parasitemia do i-ésimo camundongo no j-ésimo dia após a infecção, com i=,..., e j=,..., n i ; n i. A Figura apresenta a curva suavizada (método Lowess Cleveland, ) do percentual de parasitemia médio para cada um dos grupos experimentais. Observa-se que o nível de parasitemia dos camundongos que foram imunizados (grupos e ) é aparentemente inferior ao nível dos camundongos não imunizados (grupos 3 e ). Além disso, observa-se que os camundongos dos grupos 3 e apresentam valores de parasitemia crescentes ao longo do acompanhamento, enquanto que os camundongos alocados nos
15 grupos e, apresentaram valores mais baixos de parasitemia em todo o período de acompanhamento. Os gráficos de perfis do percentual médio de parasitemia para cada um dos grupos experimentais foram traçados e estão apresentados no Anexo A. X3 (% Parasitemia) GR Tempo (dias) Figura Gráfico da curva de alisamento (Lowess) do % médio de parasitemia para os grupos experimentais. Um modelo de regressão linear simples foi ajustado para a variável resposta: percentual de parasitemia (X3) versus o tempo após a infecção, desconsiderando-se o grupo experimental e o camundongo. Os resíduos padronizados foram calculados com o objetivo de avaliar a variabilidade da resposta no tempo (Liang, Diggle e Zeger, ). A partir destes resíduos, foi traçado um gráfico de perfis para cada grupo experimental. Estes gráficos estão apresentados no Anexo B e pode-se observar que, exceto no grupo 3 em que, a amplitude de variação dos resíduos parece constante, a variância dos resíduos parece aumentar com o tempo. A matriz de correlação dos resíduos padronizados entre os tempos distintos estão apresentados no Anexo B, estas medidas foram calculadas no intuito de avaliar a estrutura de correlação das medidas no tempo, ou seja, se a correlação entre os tempos decresce quando as medidas se afastam sugerindo uma correlação serial ou se possuem outra forma como a correlação uniforme ou não-estruturada. Com base nos resultados encontrados observamos que a correlação tende a decrescer quando as medidas se afastam no tempo, logo a forma de correlação serial parece mais adequada para ajuste dos dados.
16 O modelo marginal e o modelo de efeitos aleatórios são as principais formas de modelagem de dados longitudinais e foram apresentadas na Seção 3. Uma série de modelos, utilizando estas técnicas, foram ajustados ao banco de dados e seguem descritos a seguir: ML Modelo Marginal com Correlação Uniforme: este modelo considera que a correlação entre as medidas do mesmo indivíduo é constante no tempo. ML Modelo Marginal com Correlação Serial: este modelo considera que a correlação entre as medidas do mesmo indivíduo decresce quando estas se afastam no tempo. ML3 Modelo Marginal com Correlação Não-estruturada: este modelo considera que não há estrutura na correlação das medidas do mesmo indivíduo em relação ao tempo. ML Modelo de Efeitos Aleatórios (efeito aleatório no intercepto): este modelo considera um intercepto distinto para cada camundongo, β 0i. ML Modelo de Efeitos Aleatórios (efeito aleatório no intercepto e no Tempo): este modelo permite que tanto o intercepto, quanto a inclinação com o tempo variem entre camundongos. A Tabela apresenta um resumo destes ajustes em que são apresentados os coeficientes de regressão estimados ( β s) e os valores p associados ao teste de Wald. Nesta tabela são apresentadas duas medidas de qualidade do ajuste. São elas: AIC: Akaike Information Criterion AIC= [l θ dim θ ] BIC: Bayesian Information Criterion BIC= [ l θ N log dim θ ] em que, θ representa o conjunto de parâmetros estimados em cada modelo. Estas medidas são usadas para comparar modelos a partir da informação do quanto a função de verossimilhança foi capaz de absorver dos dados, penalizada pelo grau de complexidade do modelo. Valores menores destas medidas indicam melhores ajustes.
17 A partir dos resultados apresentados na Tabela, podemos confirmar que o modelo marginal com correlação serial (ML) é o que melhor se ajustou aos dados uma vez que, apresentou os menores valores de AIC e BIC. Neste modelo todas as covariáveis foram significativas. A coinfecção tem efeito de aumentar o grau de parasitemia em cerca de 3%, enquanto que a imunização reduz em média % o nível de parasitemia do camundongo. O efeito do tempo é de crescimento na parasitemia (em média 0,% ao dia). Model o Tabela Ajuste de modelos para Dados Longitudinais Covariávei s no modelo Estimati vas p-valor AIC BIC Intercepto β0 = 3, 0,0000 ML X: β = coinfecção 3,7 0,00 X: β = imunização -,3 0,0000,0, T: tempo β3 = 0,0 0, Intercepto β0 =, 0,0000 ML X: β = coinfecção, 0,00 X: β = imunização -3, 0,0000 0,3, T: tempo β3 = 0,3 0,03 Intercepto β0 = 3, 0,0000 ML X: β = coinfecção 3,7 0,00 X: β = imunização -,3 0,0000,0, T: tempo β3 = 0,0 0,0 Intercepto β0 = -0,7 0,7733 ML X: β = coinfecção 0,7 0,73 X: β = imunização -7, 0,0000,, T: tempo β3 =, 0,0000 * O ajuste do modelo ML3 (Modelo Marginal com correlação Não-estruturada) não é apresentado pois, devido à sua complexidade, este modelo não convergiu. 7
18 .. Análise de Sobrevivência Agora, iremos focar a estrutura deste banco de dados sob o aspecto de análise de sobrevivência. Então, a variável resposta, T, é o tempo transcorrido entre a infecção e a morte camundongo, sendo que houve censura no tempo T = dias, quando todos os camundongos que sobreviveram foram sacrificados. Com o objetivo de se obter uma idéia do efeito das covariáveis sobre o comportamento dos dados foram calculadas, inicialmente, as estimativas para a função de sobrevivência pelo método de Kaplan-Meier para as covariáveis X e X. A Figura 3 apresenta as curvas de sobrevivência estimadas para a covariável X (coinfecção). Comparando estas curvas pelo teste de Wilcoxon, observa-se que os camundongos infectados apenas com malária (infecção simples) possuem maior probabilidade de sobrevivência em relação aos que foram coinfectados (p=0,000). As curvas de sobrevivência estimadas pelo método de Kaplan-Meier para a covariável X (imunização) estão apresentadas na Figura. Observa-se que os camundongos que foram imunizados possuem maior probabilidade de sobrevivência em relação aos que não foram imunizados. O teste de Wilcoxon confirmou que há diferença significativa (p<0,000) entre as curvas de sobrevivência dos camundongos segundo a imunização Percent Percent X: Coinfecção Infecção simples Coinfecção 0 Tempo X: Imunização não imunizado imunizado 0 Tempo 0 Figura 3 Curvas de sobrevivência estimadas pelo método de Kaplan-Meier para a covariável X: Co-Infecção. Figura Curvas de sobrevivência estimadas pelo método de Kaplan-Meier para o fator Imunização.
19 O modelo de riscos proporcionais de Cox (7), apresentado na Seção, foi ajustado aos dados. A Tabela apresenta um resumo dos resultados obtidos para o ajuste de modelos de Cox para as covariáveis X e X. Tabela Ajuste do Modelo de Cox Model Covariáveis Estimativ p- exp{β IC % (exp{β}) o no modelo as valor } LI LS X: coinfecção β =, <0,00 3,3,,07 X: 0,037 0, β imunização = -, 0,37 <0,00 X: coinfecção β =,3 <0,00 3,7,,0 3 X: 0,0 0, β imunização = -,0 0, <0,00 A partir dos resultados apresentados na Tabela, observa-se que ambas as covariáveis Coinfecção (X) e Imunização (X) são significativas para explicar os tempos de sobrevivência dos camundongos. Os camundongos imunizados têm menor chance de morte e a presença de coinfecção aumenta a chance de mortalidade em cerca de 3 vezes.. Modelo de Cox com covariável depentente do tempo O modelo de Cox com covariável dependente do tempo é um método bastante conhecido e utilizado na literatura. Portanto, consideramos este ajuste como a primeira aproximação para a modelagem conjunta de dados longitudinais e de sobrevivência. A Tabela 3 apresenta um resumo dos
20 resultados obtidos através do ajuste de deste modelo para as covariáveis X, X e parasitemia, X3, que é dependente do tempo. Tabela 3 Ajuste do Modelo de Cox com covariável dependente do tempo Covariáveis Estimativ no modelo as X: coinfecção β = X: imunização X3: parasitemia p- valor,00 0,00 β = -0, 0,3 β 3 = 0,0000 0,00 0 exp{β },3 0,,0 IC % (exp{β}) LI LS,3,07 0,,7,0,0 Observa-se que a presença da covariável longitudinal no modelo acarreta a perda de significância da imunização (X). Ou seja, ao acrescentar a parasitemia (X3) como covariável no modelo, esta absorve a informação do efeito de X, tornando esta última não significativa. Como o objetivo principal do experimento é avaliar o efeito de tratamento sob a sobrevivência e sobre a parasitemia do camundongo, o modelo de Cox com covariável dependente do tempo torna-se ineficaz. 0
21 7. Referências Bibliográficas Andersen, P.K., Gill, R. (). Cox s Regression Model for Counting Processes: A Large Sample Study. Annals of Statistics, 0, Breslow, N. (7). Contribuição à Discussão do artigo de D.R. Cox. Journal of the Royal Statistical Society B, 3, -7. Brown, E.R., Ibrahim, J.G., DeGrutolla, V. (00). A Flexible B-Spline Model for Multiple Longitudinal Biomarkers and Survival. Biometrics,, -73. Collet, D. (003). Modelling Survival Data in Medical Research, ed., Chapman and Hall, London. Colosimo, E.A., Giolo, S.R. (00). Análise de Sobrevivência Aplicada. Edgard Blücher, São Paulo. Cox, D.R. (7). Regression Models and Life Tables (with discussion). Journal Royal Statistical Society, B, 3, 7-0. Cox, D.R. (7). Partial Likelihood. Biometrika,, -7. Diggle, P.J., Liang, K.Y., Zeger, S.L. (). Analysis of Longitudinal Data. Oxford University Press, New York. Guo, X., Carlin, P. (00). Separate e Joint Modeling of Longitudinal and Event Time Data Using Standard Computer Packages. The American Statistician,, -. Henderson, R., Diggle, P., Dobson, A. (000) Joint Modeling of Longitudinal Measurements and Event Time Data. Biostatistics,, -0. Lewin, M., Last, C., Targett, G., Doenhoff, M.J. (). Factors affecting the acquisition of resistance against Schistosoma mansoni in the mouse. Annals of Tropicals Medicine and Parasitology,
22 7, 7-. Peto, R. (7). Contribuição à discussão do artigo de D.R. Cox. Journal of the Royal Statistical Society B, 3, Ratcliffe, S.J., Guo, W., Have, T.R.T. (00). Joint Modeling of Longitudinal and Survival data via a Common Frailty. Biometrics, 0, -. Song, X., Davidian, M., Tsiatis, A.A. (00). A Semiparametric Likelihood Approach to Joint Modeling of Longitudinal and Time-to-Event Data. Biometrics,, Tseng, Y.K., Hsieh, F., Wang, J.L. (00). Joint Modeling of Acelerate Failure Time and Longitudinal Data. Biometrika,, Xu, J., Zeger, S.L. (00). Joint Analysis of Longitudinal Data comprising Repeated measures and Time to Events. Royal Statistical Society, 0, Wang, Y., Taylor, J.M.G. (00). Jointly Mideling Longitudinal and Event Time Data with Application to Acquired Immunodeficiency Syndrome. The American Statistical association,, -0. Zheng, Y., Heagerty, P.J. (00). Partly Conditional Survival Models for Longitudinal Data. Biometrics,, 37-3.
23 3
24 ANEXO A 3 0 X3 (% Parasitemia) 0 0 X3 (% Parasitemia) Tempo (dias) 0 0 Tempo (dias) (a) (b) X3 (% Parasitemia) X3 (% Parasitemia) Tempo (dias) 0 Tempo (dias) (c) (d) Figura Gráfico de Perfis do % médio de parasitemia para os camundongos por grupo experimental (a) grupo, (b) grupo, (c) grupo 3 e (d) grupo. 0 0
25 ANEXO B,,0 3,,0 SRES 0, SRES 0,0-0, 0 -,0-0 0 Tempo (dias) Gráfico de Perfis do resíduos padronizados para os camundongos do grupo 0 0 Tempo (dias) Gráfico de Perfis do resíduos padronizados para os camundongos do grupo SRES Tempo (dias) Gráfico de Perfis do resíduos padronizados para os camundongos do grupo 3 SRES Tempo (dias) Gráfico de Perfis do resíduos padronizados para os camundongos do grupo Matriz de correlação dos resíduos padronizados por tempo , , 7 0,0 0,0 0, 0,0 0, 0, 0,7 7 0, 0 0,3 7 0, 0, 0, 0,7 0,3 0, 0,3 0, 0, 0, 0, 7 0,7 0, 7 0,3 0,7 0,77 3 0, 3 0, 0, 0,3 0,3 0, 0,3 0, 0,7 0,0 0, 0,37 0, 0, 0,7 0,7 0,7 0,7 0,0 0, 0, 0, 3 0, 0,3 0, 0, 0, 0,0-0,0 0 0, 0,3 0, 0, 0, 0, 0,7 7 0,7 0,0 0, 7 0, 0,7 0,0 0, 0, 0,0 0,7 0, 0, 0, 0, 3 0, 0,0 0,70 0, 0, 0, 0,70 0,7 0,7 0, 0, 0, 0, 0, 0, 0,0 0,3 0,0 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 0,0 0, 0,3 0, 0, 0,7 0,7 0,7 3 0,7 0, 0,7 0, 0,7 0, 0,7 0, 0, 0,3 0, 0, 0,7 0, 0,77 0, 0,3 0,7 7 0,7 0, 7 0,0 0, 3 0,0 7 0,0 0, 0, 0, 0, 0,3 0, 0,3 0, 0,7 0, 0, 0, 0, 0, 7 0, 0, 3 0,07 0, 0, 0,3 0,3 0,3 3 0,37 0,3 0,3 0, 0, 0,3 0, 0, 0,7 0,7 0, -0,0 7 0, 3 0, 0,3 0, 0,3 0,3 0,3 0,3 0, 0, 3 0, 0, 0, 0,7 7 0,7 0, 0, -0,0-0, -0, -0, -0, -0,0-0,0-0,0-0,0-0, -0,0-0,0-0,0-0,0-0,0-0,0-0,0 0,0 0,33 0,
26 ,0-0, -0, -0, -0, -0,0-0,0-0,0-0,0-0, -0,0-0,0-0,0-0,0-0,0-0,0-0,0 0,0 0,33 0, ,0-0, -0, -0, -0, -0,0-0,0-0,0-0,0-0,0-0,0-0,0-0,0-0,0-0,0-0,0 0,0 0,33 0, 0, 7 3-0, ,0-0, -0, -0, -0, -0,0-0,0-0,0-0,0-0,0-0,0-0,0-0,0-0,0-0,0-0,0 0,0 0,33 0, 0, 7 3-0, , -0, -0, -0, -0, -0, -0,0-0,0-0,0 0, -0,0 0, 0,7 0, 0, 0, -0,0-0,0 0,0 0, 0, ,0-0, -0, -0, -0, -0,0-0,0-0,0 0,3 0,0 0,7 0, 0,0 0,33 0,7-0,0-0,0-0,0-0,0-0, * , 0, 0, 0, -0,0-0,0 0 0, -0,0 0 0,
Ajuste e comparação de modelos para dados grupados e censurados
Ajuste e comparação de modelos para dados grupados e censurados 1 Introdução José Nilton da Cruz 1 Liciana Vaz de Arruda Silveira 2 José Raimundo de Souza Passos 2 A análise de sobrevivência é um conjunto
Análise conjunta de dados longitudinais e de sobrevivência: Abordagem Bayesiana
Análise conjunta de dados longitudinais e de sobrevivência: Abordagem Bayesiana Rui Martins, Valeska Andreozzi e Giovani Silva Ericeira, 2010 Índice 1 Introdução Análise conjunta de Dados Longitudinais
Análise de Dados Longitudinais Aula
1/35 Análise de Dados Longitudinais Aula 08.08.2018 José Luiz Padilha da Silva - UFPR www.docs.ufpr.br/ jlpadilha 2/35 Sumário 1 Revisão para dados transversais 2 Como analisar dados longitudinais 3 Perspectiva
Estimadores, pontual e intervalar, para dados com censuras intervalar
Estimadores, pontual e intervalar, para dados com censuras intervalar Débora Ohara, Estela Maris Pereira Bereta, Teresa Cristina Martins Dias Resumo Dados com censura intervalar ocorrem com frequência
Análise de Sobrevivência
Análise de Sobrevivência Modelagem paramétrica Valeska Andreozzi 1 valeska.andreozzi@fc.ul.pt & Marilia Sá Carvalho 2 cavalho@fiocruz.br 1 Centro de Estatística e Aplicações da Universidade de Lisboa,
Modelo marginal de odds proporcionais para dados longitudinais: um estudo de simulação
Modelo marginal de odds proporcionais para dados longitudinais: um estudo de simulação Nívea B. da Silva 1 Enrico A. Colosimo 2 Leila A. F. Amorim 3 1 Introdução Nos últimos anos muitas metodologias têm
Métodos Estatísticos Avançados em Epidemiologia
Métodos Estatísticos Avançados em Epidemiologia Modelo de Poisson e Análise de Dados Longitudinais Enrico A. Colosimo Departamento de Estatística Universidade Federal de Minas Gerais http://www.est.ufmg.br/
UM MODELO DE FRAGILIDADE PARA DADOS DISCRETOS DE SOBREVIVÊNCIA. Eduardo Yoshio Nakano 1
1 UM MODELO DE FRAGILIDADE PARA DADOS DISCRETOS DE SOBREVIVÊNCIA Eduardo Yoshio Nakano 1 1 Professor do Departamento de Estatística da Universidade de Brasília, UnB. RESUMO. Em estudos médicos, o comportamento
Modelagem da estrutura de covariância na análise de medidas repetidas
Modelagem da estrutura de covariância na análise de medidas repetidas Marisol García Peña Sergio Arciniegas Alarcón Universidade de São Paulo Escola Superior de Agricultura Luiz de Queiroz Departamento
Métodos Estatísticos Avançados em Epidemiologia
1/43 Métodos Estatísticos Avançados em Epidemiologia Análise de Sobrevivência - Modelo de Cox Enrico A. Colosimo Departamento de Estatística Universidade Federal de Minas Gerais http://www.est.ufmg.br/
Exemplos Equações de Estimação Generalizadas
Exemplos Equações de Estimação Generalizadas Bruno R. dos Santos e Gilberto A. Paula Departamento de Estatística Universidade de São Paulo, Brasil giapaula@ime.usp.br Modelos Lineares Generalizados dos
Aula 2 Uma breve revisão sobre modelos lineares
Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar
Modelos de regressão para dados correlacionados. Cibele Russo
Modelos de regressão para dados correlacionados Cibele Russo cibele@icmc.usp.br ICMC USP Mini-curso oferecido no Workshop on Probabilistic and Statistical Methods 28 a 30 de janeiro de 2013 Cibele Russo
APLICAÇÃO DO MÉTODO DE BUCKLEY-JAMES COMO ALTERNATIVA AO MODELO DE COX NA VIOLAÇÃO DA PRESSUPOSIÇÃO DE RISCOS PROPORCIONAIS.
APLICAÇÃO DO MÉTODO DE BUCKLEY-JAMES COMO ALTERNATIVA AO MODELO DE COX NA VIOLAÇÃO DA PRESSUPOSIÇÃO DE RISCOS PROPORCIONAIS. Rogério Antonio de OLIVEIRA 1 Giovanni Faria SILVA 2 Liciana Vaz de Arruda SILVEIRA
Cap 7 Modelo de Cox. Outline. 2 Cap 2 O tempo. 3 Cap 3 Funções de Sobrevida. 5 Modelo de Cox. Carvalho MS (2009) Sobrevida 1 / 22
Outline Cap 7 Modelo de Cox 1 Cap 1 Introdução 2 Cap 2 O tempo 3 Cap 3 Funções de Sobrevida 4 Cap 4 Não-Paramétrica 5 Modelo de Cox Carvalho MS (2009) Sobrevida 1 / 22 Riscos Proporcionais Cap 7 Modelo
Métodos Estatísticos Avançados em Epidemiologia
1/42 Métodos Estatísticos Avançados em Epidemiologia Análise de Sobrevivência - Conceitos Básicos Enrico A. Colosimo Departamento de Estatística Universidade Federal de Minas Gerais http://www.est.ufmg.br/
ANÁLISE DE SOBREVIVÊNCIA. Airlane P. Alencar IME-USP Alessandra C. Goulart FM-USP
ANÁLISE DE SOBREVIVÊNCIA Airlane P. Alencar IME-USP Alessandra C. Goulart FM-USP Objetivo Estudar o tempo desde um instante inicial até a ocorrência de um evento (alha). Estudar o tempo de sobrevida de
Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9
em Econometria Departamento de Economia Pontifícia Universidade Católica do Rio de Janeiro Aula 9 Data Mining Equação básica: Amostras finitas + muitos modelos = modelo equivocado. Lovell (1983, Review
Utilização de modelos marginais na análise de dados longitudinais irregulares em relação ao tempo
Utilização de modelos marginais na análise de dados longitudinais irregulares em relação ao tempo César Gonçalves de Lima 1 Michele Barbosa 2 Valdo Rodrigues Herling 3 1. Introdução Dados longitudinais
INTRODUÇÃO AOS MODELOS DE FRAGILIDADES APLICADOS A DADOS DE LEUCEMIA LINFOBLASTÍCA
INTRODUÇÃO AOS MODELOS DE FRAGILIDADES APLICADOS A DADOS DE LEUCEMIA LINFOBLASTÍCA Roseane de Alcântara Costa (1); Manoel Joaquim Isidro (1); Tiago Almeida de Oliveira (4) Universidade Estadual da Paraíba,
ANÁLISE DE SOBREVIVÊNCIA 2ª LISTA DE EXERCÍCIOS
ANÁLISE DE SOBREVIVÊNCIA 2ª LISTA DE EXERCÍCIOS 1. A tabela a seguir apresenta o tempo, em dias, até a ocorrência dos primeiros sinais de alterações indesejadas no estado geral de saúde de 45 pacientes
CONHECIMENTOS ESPECÍFICOS
fonte de graus de soma de quadrado variação liberdade quadrados médio teste F regressão 1 1,4 1,4 46,2 resíduo 28 0,8 0,03 total 2,2 A tabela de análise de variância (ANOVA) ilustrada acima resulta de
UNIVERSIDADE FEDERAL DO PARANÁ SETOR CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA ANÁLISE DE SOBREVIDA EM 90 HOMENS COM CÂNCER DE LARINGE
UNIVERSIDADE FEDERAL DO PARANÁ SETOR CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA ANÁLISE DE SOBREVIDA EM 90 HOMENS COM CÂNCER DE LARINGE Aluna: Scheylla Calazans Orientadora: Profa. Dra. Nívea S. Matuda
Análise de Sobrevivência. Exercícios - Capítulo 1
Análise de Sobrevivência Profa. Suely Ruiz Giolo Departamento de Estatística - UFPR Exercícios - Capítulo 1 1. Suponha que seis ratos foram expostos a um material cancerígeno. Os tempos até o desenvolvimento
Métodos Estatísticos Avançados em Epidemiologia
Métodos Estatísticos Avançados em Epidemiologia Análise de Sobrevivência - Conceitos Básicos Enrico A. Colosimo Departamento de Estatística Universidade Federal de Minas Gerais http://www.est.ufmg.br/
Uma investigação de métodos para o estudo da influência da incerteza em dados experimentais de vida acelerada
Uma investigação de métodos para o estudo da influência da incerteza em dados experimentais de vida acelerada Autores Maria Celia de Oliveira Papa Orientador Alvaro Jose Abackerli 1. Introdução Uma das
Dimensionamento de amostras para regressão logística
Dimensionamento de amostras para regressão logística Arminda Lucia Siqueira 1 Flávia Komatsuzaki 1 Introdução Regressão logística é hoje padrão de análise para muitos estudos da área da saúde cuja variável
DISCRETIZADAS NA ANÁLISE DE DADOS DE SOBREVIVÊNCIA RESUMO
APLICAÇÕES DE DISTRIBUIÇÕES DISCRETIZADAS NA ANÁLISE DE DADOS DE SOBREVIVÊNCIA Danielle Peralta 1, Josmar Mazucheli 1, Isabelle Picada Emanuelli 2 e Robson Marcelo Rossi 1 1 Departamento de Estatística,
Inferência Bayesiana Exata para Processos de Cox Level-Set
Inferência Bayesiana Exata para Processos de Cox Level-Set Bárbara da Costa Campos Dias 1 Flávio Bambirra Gonçalves 2 Resumo Este trabalho propõe uma metodologia de inferência exata para processos de Cox
Anderson Garneth de Castro 1 Graziela Dutra Rocha Gouvêa 2
Identificação dos fatores que influenciam no tempo até a evasão/ retenção dos alunos do ICEB-UFOP utilizando técnicas paramétricas em Análise de Sobrevivência Anderson Garneth de Castro 1 Graziela Dutra
Análise de Dados Longitudinais Modelos de Regressão - Perspecitva Histórica
1/41 Análise de Dados Longitudinais Modelos de Regressão - Perspecitva Histórica Enrico A. Colosimo/UFMG http://www.est.ufmg.br/ enricoc/ Revisão para Dados Transversais 1 Características Informações amostrais
ANÁLISE DE SOBREVIVÊNCIA APLICADA
1/62 ANÁLISE DE SOBREVIVÊNCIA APLICADA Modelo de Regressão de Cox - Cap. 5 Enrico A. Colosimo/UFMG Depto. Estatística - ICEx - UFMG 2/62 Modelos em Análise de Sobrevivência Modelo de Tempo de Vida Acelerado
ANÁLISE DE SOBREVIVÊNCIA (MÓDULO II)
Universidade Federal do Pará Instituto de Ciências Exatas e Naturais Faculdade de Estatística Estatística Aplicada ANÁLISE DE SOBREVIVÊNCIA (MÓDULO II) Franciely Farias da Cunha (201007840014), aluna do
Modelo de Regressão Múltipla
Modelo de Regressão Múltipla Modelo de Regressão Linear Simples Última aula: Y = α + βx + i i ε i Y é a variável resposta; X é a variável independente; ε representa o erro. 2 Modelo Clássico de Regressão
Aline Campos Reis de Souza Instituto de Matemática e Estatística - Universidade de São Paulo Antonio Carlos Pedroso de Lima. 30 de abril de 2018
Modelos conjuntos para dados longitudinais e de sobrevivência: uma aplicação a dados de qualidade de vida e tempo de sobrevivência de pacientes com câncer. Aline Campos Reis de Souza Instituto de Matemática
Ralph S. Silva
ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S Silva http://wwwimufrjbr/ralph/multivariadahtml Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Revisão:
IND 1115 Inferência Estatística Aula 6
Conteúdo IND 5 Inferência Estatística Aula 6 Setembro de 004 A distribuição Lognormal A distribuição Beta e sua relação com a Uniforme(0,) Mônica Barros mbarros.com mbarros.com A distribuição Lognormal
Modelos Lineares Generalizados
Modelos Lineares Generalizados Emilly Malveira de Lima Análise de Dados Categóricos Universidade Federal de Minas Gerais - UFMG 10 de Maio de 2018 Emilly Malveira (PGEST-UFMG) 10 de Maio de 2018 1 / 20
Análise de Dados Longitudinais
1/31 Análise de Dados Longitudinais Introdução à Disciplina Enrico A. Colosimo-UFMG www.est.ufmg.br enricoc 2/31 Medidas Repetidas/Dados Longitudinais Medidas Repetidas Medidas Repetidas são obtidas quando
Universidade de Brasília
Universidade de Brasília Análise de sobrevivência e sua aplicação nas ciências sociais Juliana Betini Fachini Gomes Leylannne Nayra Figueira de Alencar Departamento de Estatística Brasília - 2018 Como
Disciplina de Modelos Lineares
Disciplina de Modelos Lineares 2012-2 Seleção de Variáveis Professora Ariane Ferreira Em modelos de regressão múltipla é necessário determinar um subconjunto de variáveis independentes que melhor explique
MODELAGEM E ESCOLHA ENTRE EMBALAGENS USANDO TÉCNICAS DE CONFIABILIDADE E ANÁLISE DE
Revista da Estatística da UFOP, Vol I, 2011 - XI Semana da Matemática e III Semana da Estatística, 2011 ISSN 2237-8111 MODELAGEM E ESCOLHA ENTRE EMBALAGENS USANDO TÉCNICAS DE CONFIABILIDADE E ANÁLISE DE
Disciplina de Modelos Lineares Professora Ariane Ferreira
Disciplina de Modelos Lineares 2012-2 Regressão Logística Professora Ariane Ferreira O modelo de regressão logístico é semelhante ao modelo de regressão linear. No entanto, no modelo logístico a variável
UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA DENNIS LEÃO GRR LUAN FIORENTIN GRR
UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA DENNIS LEÃO GRR - 20160239 LUAN FIORENTIN GRR - 20160219 MODELAGEM DE DADOS DE ÓBITOS POR AGRESSÕES NO ESTADO DE SÃO PAULO NO ANO DE 2016 CURITIBA Novembro
Comparação entre intervalos de confiança calculados com métodos bootstrap e intervalos assintóticos
Comparação entre intervalos de confiança calculados com métodos strap e intervalos assintóticos Selene Loibel Depto. de Estatística, Matemática Aplicada e Computação, IGCE, UNESP, Rio Claro, SP E-mail:sloibel@rc.unesp.br,
Filipe Ribeiro, Universidade de Évora/MPIDR Trifon I. Missov, MPIDR José Gonçalves Dias, Instituto Universitário de Lisboa (ISCTE-IUL) Maria Filomena
Filipe Ribeiro, Universidade de Évora/MPIDR Trifon I. Missov, MPIDR José Gonçalves Dias, Instituto Universitário de Lisboa (ISCTE-IUL) Maria Filomena Mendes, Universidade de Évora Introdução 1940 Frequente
4 Modelos Lineares Generalizados
4 Modelos Lineares Generalizados Neste capítulo, serão apresentados arcabouços teóricos dos modelos lineares generalizados (MLGs) e como casos particulares desses modelos são aplicáveis ao problema da
Análise de Dados Categóricos
1/43 Análise de Dados Categóricos Modelo de Regressão de Poisson Enrico A. Colosimo/UFMG http://www.est.ufmg.br/ enricoc/ Departamento de Estatística Universidade Federal de Minas Gerais 2/43 Revisão:
O uso do Modelo de Cox para estimação da probabilidade de permanência no rebanho de fêmeas da raça Nelore
O uso do Modelo de Cox para estimação da probabilidade de permanência no rebanho de fêmeas da raça Nelore Sabrina Luzia Caetano 1,2,3,5 Guilherme J. M. Rosa 3 Rodrigo Pelicioni Savegnago 1,2 Salvador Boccaletti
Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência
Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência Erica Castilho Rodrigues 12 de Agosto 3 Vimos como usar Poisson para testar independência em uma Tabela 2x2. Veremos
Universidade de Brasília IE Departamento de Estatística. Análise de Diagnóstico para o Modelo de Regressão de Cox. Camila Farage de Gouveia
Universidade de Brasília IE Departamento de Estatística Análise de Diagnóstico para o Modelo de Regressão de Cox Camila Farage de Gouveia Orientadora: Prof.ª Dra. Juliana Betini Fachini Brasília, 2013.
AULAS 14 E 15 Modelo de regressão simples
1 AULAS 14 E 15 Modelo de regressão simples Ernesto F. L. Amaral 18 e 23 de outubro de 2012 Avaliação de Políticas Públicas (DCP 046) Fonte: Wooldridge, Jeffrey M. Introdução à econometria: uma abordagem
MODELO LOG-BURR XII PARA DADOS GRUPADOS E CENSURADOS
MODELO LOG-BURR XII PARA DADOS GRUPADOS E CENSURADOS José Nilton da CRUZ 1 Liciana Vaz de Arruda SILVEIRA 2 José Raimundo de Souza PASSOS 2 RESUMO: Dados grupados é um caso particular de dados de sobrevivência
O passo inicial de qualquer análise estatística consiste em uma descrição dos dados através de análise descritiva (tabelas, medidas e gráficos).
TÉCNICAS NÃO-PARAMÉTRICAS O passo inicial de qualquer análise estatística consiste em uma descrição dos dados através de análise descritiva (tabelas, medidas e gráficos). Como a presença de censura invalida
Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência
Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência Erica Castilho Rodrigues 12 de Agosto Introdução 3 Vimos como usar Poisson para testar independência em uma Tabela 2x2.
COMPARAÇÃO DE DUAS ABORDAGENS DOS MODELOS DE TRANSIÇÃO DE MARKOV EM EXPERIMENTOS PLANEJADOS COM DADOS BINÁRIOS CORRELACIONADOS
COMPARAÇÃO DE DUAS ABORDAGENS DOS MODELOS DE TRANSIÇÃO DE MARKOV EM EXPERIMENTOS PLANEJADOS COM DADOS BINÁRIOS CORRELACIONADOS Maurício Santana LORDÊLO1 Sônia Maria De Stefano PIEDADE 2 Gilênio Borges
O EFEITO DA PRESENÇA DE CENSURAS ALEATÓRIAS NOS INTERVALOS DE CONFIANÇA PARA OS PARÂMETROS DO MODELO LOG-LOGÍSTICO DUPLO
O EFEITO DA PRESENÇA DE CENSURAS ALEATÓRIAS NOS INTERVALOS DE CONFIANÇA PARA OS PARÂMETROS DO MODELO LOG-LOGÍSTICO DUPLO Cleber Giugioli CARRASCO Francisco LOUZADA-NETO RESUMO: O modelo log-logístico duplo
i j i i Y X X X i j i i i
Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão
Modelos para dados de contagem
O modelo de Poisson Sumário 1 Introdução 2 Regressão de Poisson Taxa de Incidência Inclusão de covariáveis Interpretação dos parâmetros 3 Exemplos 4 Superdispersão Dados de Contagem Podemos estar interessados
Ensaio Clínico de Contraceptivos José Luiz Padilha da Silva 24 de outubro de 2018
Ensaio Clínico de Contraceptivos José Luiz Padilha da Silva 24 de outubro de 2018 Exemplo: Ensaio Clínico de Contraceptivos Introdução Este exemplo é de um estudo longitudinal de uso de contraceptivos
Modelo de regressão estável aplicado a econometria
Modelo de regressão estável aplicado a econometria financeira Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 81531 990, Brasil email: lucambio@ufpr.br 1 Objetivos
Econometria. Econometria MQO MQO. Resíduos. Resíduos MQO. 1. Exemplo da técnica MQO. 2. Hipóteses do Modelo de RLM. 3.
3. Ajuste do Modelo 4. Modelo Restrito Resíduos Resíduos 1 M = I- X(X X) -1 X Hipóteses do modelo Linearidade significa ser linear nos parâmetros. Identificação: Só existe um único conjunto de parâmetros
UNIVERSIDADE DE BRASÍLIA INSTITUTO DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA PROGRAMA DE MESTRADO EM ESTATÍSTICA
UNIVERSIDADE DE BRASÍLIA INSTITUTO DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA PROGRAMA DE MESTRADO EM ESTATÍSTICA Modelo Weibull discreto com fração de cura e excessos de zeros: uma aplicação sobre
Análise de Dados Longitudinais Aula
1/20 Análise de Dados Longitudinais Aula 13.08.2018 José Luiz Padilha da Silva - UFPR www.docs.ufpr.br/ jlpadilha 2/20 Sumário 1 Modelos Marginais 2 3/20 Modelos Marginais Modelos Marginais para Dados
Gabarito da Lista 2 de Análise de Sobrevivência
Gabarito da Lista 2 de Análise de Sobrevivência Monitor: Sérgio Felipe Prof a.: Marina Silva As questões são do livro: Análise de Sobrevivência Aplicada. Autores: Enrico A. Colosimo & Suely R. Giolo Editora:
Econometria IV Modelos Lineares de Séries Temporais. Fernando Chague
Econometria IV Modelos Lineares de Séries Temporais Fernando Chague 2016 Estacionariedade Estacionariedade Inferência estatística em séries temporais requer alguma forma de estacionariedade dos dados Intuição:
Análise de Sobrevivência. Modelos de Regressão Paramétricos. Análise de Sobrevivência Roteiro Geral. Roteiro do Módulo
Roteiro Geral Análise de Sobrevivência 1. Conceitos básicos 2. Técnicas não-paramétricas 3. Modelos probabilísticos 4. Modelos paramétricos de sobrevivência 5. Modelo de regressão de Cox 6. Extensões do
Multicolinariedade e Autocorrelação
Multicolinariedade e Autocorrelação Introdução Em regressão múltipla, se não existe relação linear entre as variáveis preditoras, as variáveis são ortogonais. Na maioria das aplicações os regressores não
CONHECIMENTOS ESPECÍFICOS
CONHECIMENTOS ESPECÍFICOS 2003 2004 2005 2006 2007 2008 2009 2010 X 39,0 39,5 39,5 39,0 39,5 41,5 42,0 42,0 Y 46,5 65,5 86,0 100,0 121,0 150,5 174,0 203,0 A tabela acima mostra as quantidades, em milhões
Análise de Regressão EST036
Análise de Regressão EST036 Michel Helcias Montoril Instituto de Ciências Exatas Universidade Federal de Juiz de Fora Regressão sem intercepto; Formas alternativas do modelo de regressão Regressão sem
Modelos de regressão para dados correlacionados. Cibele Russo
Modelos de regressão para dados correlacionados Cibele Russo cibele@icmc.usp.br ICMC USP Mini-curso oferecido no Workshop on Probabilistic and Statistical Methods 28 a 30 de janeiro de 2013 Cibele Russo
Modelos de Análise de Sobrevivência
1 Modelos de Análise de Sobrevivência Ernesto F. L. Amaral Magna M. Inácio 02 de dezembro de 2010 Tópicos Especiais em Teoria e Análise Política: Problema de Desenho e Análise Empírica (DCP 859B4) TAXA
Tópicos de Estatística Espacial Geoestatística
Tópicos de Estatística Espacial Geoestatística Anderson Castro Soares de Oliveira Geoestatística A geoestatística é uma análise espacial que considera que a variável em estudo se distribui continuamente
REGRESSÃO E CORRELAÇÃO
REGRESSÃO E CORRELAÇÃO A interpretação moderna da regressão A análise de regressão diz respeito ao estudo da dependência de uma variável, a variável dependente, em relação a uma ou mais variáveis explanatórias,
CE062c - GAMLSS. Silva, J.P; Taconeli, C.A. 09 de outubro, Silva, J.P; Taconeli, C.A. CE062c - GAMLSS 09 de outubro, / 42
CE062c - GAMLSS Silva, J.P; Taconeli, C.A. 09 de outubro, 2018 Silva, J.P; Taconeli, C.A. CE062c - GAMLSS 09 de outubro, 2018 1 / 42 Por que GAMLSS? Silva, J.P; Taconeli, C.A. CE062c - GAMLSS 09 de outubro,
ANÁLISE DE SÉRIES TEMPORAIS
ANÁLISE DE SÉRIES TEMPORAIS Ralph S. Silva http://www.im.ufrj.br/ralph/seriestemporais.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Estimação
Técnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios:
Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de
CONHECIMENTOS ESPECÍFICOS
CESPE/UnB FUB/03 fa 5 4 3 CONHECIMENTOS ESPECÍFICOS 60 As distribuições B e C possuem os mesmos valores para os quartis Q e Q, e o quartil superior em B corresponde ao quartil central (Q ) da distribuição
Modelos lineares mistos para análise de dados longitudinais provenientes de ensaios agronômicos
Modelos lineares mistos para análise de dados longitudinais provenientes de ensaios agronômicos Ezequiel Abraham López Bautista FAUSAC, LCE-ESALQ-USP 1, Edilan de Sant Ana Quaresma ICED/UFOPA, LCE-ESALQ-USP
Aplicações de Análise de Sobrevivência na Área da Saúde
Aplicações de Análise de Sobrevivência na Área da Saúde Prof. Lupércio França Bessegato Departamento de Estatística UFJF E-mail: lupercio.bessegato@ufjf.edu.br Site: www.ufjf.br/lupercio_bessegato Lupércio
Coeficiente de determinação R 2 no modelo de regressão linear normal
Coeficiente de determinação R 2 no modelo de regressão linear normal Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 81531 990, Brasil email: lucambio@ufpr.br
Técnicas computacionais em probabilidade e estatística II
Técnicas computacionais em probabilidade e estatística II Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco AULA 1: Problemas Computacionais em Inferência Estatística.
Modelos multi-estados markovianos com erros de problema da morte súbita do citrus. Silvia Shimakura UFPR
Modelos multi-estados markovianos com erros de classificação: aplicação ao problema da morte súbita do citrus Silvia Shimakura UFPR Caxambu 25 Julho 2006 Agradecimentos FUNDECITRUS Renato Bassanezzi (FUNDECITRUS)
Teste de % de defeituosos para 1 amostra
DOCUMENTO OFICIAL DO ASSISTENTE DO MINITAB Este documento é de uma série de papéis que explicam a pesquisa conduzida por estatísticos da Minitab para desenvolver os métodos e as verificações de dados usadas
Testes de Degradação e Testes de Degradação Acelerados
Testes de Degradação e Testes de Degradação Acelerados Magda Carvalho Pires UFMG Departamento de Estatística Métodos Estatísticos em Confiabilidade e Manutenção 12 de Novembro de 2007 Resumo Testes de
Exemplo Ataques Epilépticos
Exemplo Ataques Epilépticos Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2015 G. A. Paula (IME-USP) Ataques Epilépticos 2 o Semestre 2015 1 / 20 Ataques
UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS EXATAS E TECNOLÓGICAS
ISSN 0104-0499 UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS EXATAS E TECNOLÓGICAS RISCOS COMPETITIVOS: UMA AVALIAÇÃO DE MÉTODOS DE ESTIMAÇÃO Agatha Sacramento Rodrigues Adriano Polpo de Campos
CONHECIMENTOS ESPECÍFICOS
CONHECIMENTOS ESPECÍFICOS A distribuição dos tempos de permanência dos estudantes nos cursos de graduação de certa universidade é uma distribuição normal com média igual a 6 anos e desvio padrão igual
Estimador de Máxima Verossimilhança Estudo de Caso - Regressão Poisson
Estimador de Máxima Verossimilhança Estudo de Caso - Regressão Poisson Wagner Hugo Bonat - LEG/DEST, UFPR 1 Resumo: Este texto descreve de forma rápida o processo de estimação baseado em Verossimilhança
Inferência Estatistica
Inferência Estatistica Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Modelos e Inferência Um modelo é uma simplificação da realidade (e alguns
Modelagem de dados longitudinais
p. 1 Departamento de Epidemiologia e Métodos Quantitativos em Saúde Modelagem de dados longitudinais "Todos os modelos são errados... alguns são úteis." Marilia Sá Carvalho Coortes/2005 p. 2 Tópicos Teoria
UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski
UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA Jayme Gomes dos Santos Junior Luciana Helena Kowalski MODELAGEM DA EXPECTATIVA DE VIDA NOS MUNICÍPIOS DO PARANÁ A PARTIR DE COVARIÁVEIS DO CENSO 2010
Econometria em Finanças e Atuária
Ralph S. Silva http://www.im.ufrj.br/ralph/especializacao.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Maio-Junho/2013 Modelos condicionalmente
ESTUDO SOBRE A EVASÃO E O TEMPO ATÉ A FORMATURA DOS ALUNOS DO CURSO DE ESTATÍSTICA DA UFPR
UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA CURSO DE ESTATÍSTICA Bruno Rosevics Estevão Batista do Prado ESTUDO SOBRE A EVASÃO E O TEMPO ATÉ A FORMATURA DOS ALUNOS
Regressão Local (LOESS)
Regressão Local (LOESS) Wagner Hugo Bonat 14 de novembro de 2007 1 Regressão Local Regressão Local (Loess) é um método não paramétrico que estima curvas e superfícies através de suavização (smoothing).
Introdução Regressão linear Regressão de dados independentes Regressão não linear. Regressão. Susana Barbosa
Regressão Susana Barbosa Mestrado em Ciências Geofísicas 2012-2013 Regressão linear x : variável explanatória y : variável resposta Gráfico primeiro! Gráfico primeiro! Gráfico primeiro! Modelo linear x
Modelo de regressão log-weibull-exponenciada para dados com censura intervalar
XIII SEMANA da ESTATÍSTICA Universidade Estadual de Maringá Modelo de regressão log-weibull-exponenciada para dados com censura intervalar Elizabeth Mie Hashimoto Departamento Acadêmico de Matemática -
CONHECIMENTOS ESPECÍFICOS
CONHECIMENTOS ESPECÍFICOS Julgue os itens que se seguem, acerca da estatística descritiva. 51 Na distribuição da quantidade de horas trabalhadas por empregados de certa empresa, é sempre possível determinar
ANÁLISE DE DADOS DE SOBREVIVÊNCIA NA PRESENÇA DE RISCOS COMPETITIVOS
UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA CURSO DE ESTATÍSTICA Eliane Ribeiro Carmes ANÁLISE DE DADOS DE SOBREVIVÊNCIA NA PRESENÇA DE RISCOS COMPETITIVOS Projeto