Anna Carolina Lustosa Lima

Tamanho: px
Começar a partir da página:

Download "Anna Carolina Lustosa Lima"

Transcrição

1 Anna Carolna Lustosa Lma Modelagem Conjunta de Dados Longtudnas e de Sobrevvênca Belo Horzonte MG Outubro, 7

2 Anna Carolna Lustosa Lma Modelagem Conjunta de Dados Longtudnas e de Sobrevvênca Dssertação apresentada ao Departamento de Estatístca do Insttuto de Cêncas Exatas da Unversdade Federal de Mnas Geras como requsto parcal à obtenção do título de Mestre em Estatístca. Orentador: Prof. Enrco Antôno Colosmo MESTRADO EM ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA INSTITUTO DE CIÊNCIAS EXATAS UNIVERSIDADE FEDERAL DE MINAS GERAIS Belo Horzonte MG Outubro, 7.

3 Sumáro 1. Introdução Análse de Dados Longtudnas Modelo Margnal Modelo de Efetos Aleatóros Inferênca para os Modelos Margnal e de Efetos Aleatóros Modelo Lnear Generalzado com Efetos Aleatóros Inferênca para o Modelo Generalzado Análse de Sobrevvênca Modelo de Rscos Proporconas de Cox Modelo de Cox com Covaráves Dependentes do Tempo Modelagem Conjunta O Modelo Conjunto por Wulfsohn e Tsats (1997) O Modelo Conjunto por Henderson, Dggle e Dobson () O Modelo Conjunto por Dggle, Souza e Chetwynd (7) O Modelo em dos estágos Aplcação Descrção do expermento Análse de dados Análse de Dados Longtudnas Análse de Sobrevvênca Modelo de Cox com covarável dependente do tempo Modelo em dos estágos Conclusões Referêncas Bblográfcas ANEXOS Anexo A Anexo B... 3

4 Papa do Céu, Obrgada! Por tantas e tão rcas bênçãos! Pa Generoso que junto a cada desafo me ofereceu a força, a luz e a coragem para a conqusta. Por cada uma das pessoas maravlhosas que encontre em meu camnho e fazem parte de quem sou e de mas esta conqusta. Muto sou grata pelo aperfeçoamento de mnha mente e de mnha alma dos quas elas foram veículo e peças fundamentas. Peço, Meu Pa, que derrame suas bênçãos e espalhe sorrsos e sorte pela vda de cada uma delas: Enrco, querdo mestre e amgo, tantos ensnamentos, tantas parceras, tantas conversas... antes eu não pensava que chegara tão longe, hoje quero saber qual o próxmo passo. Seu exemplo, sua conduta, sua ntelgênca e capacdade mutas vezes foram meus combustíves para essa camnhada. Meu sncero e eterno agradecmento! Maríla Sá (FIOCRUZ) e Marcel (UFJF) que acetaram o convte de partcpar da banca de qualfcação e demonstrando um enorme nteresse pelo assunto planejaram e organzaram, juntamente com o Enrco, o WorkShop em Análse de dados Longtudnas realzado na UFJF. Uma oportundade únca que possbltou o aprmoramento deste trabalho e meu crescmento pessoal e profssonal! Rosemere (UFBA) que colaborou tão fortemente com este trabalho, debatendo-o no WorkShop de Juz de Fora, sugerndo novas propostas e formas de modelagem e generosamente ntermedou o meu contato com Inês Souza, uma das autoras das prncpas referêncas ctadas. Valeska (FIOCRUZ) que acetou o convte de debater este trabalho no WorkShop e fez sugestões relevantes que contrbuíram mutíssmo para a modelagem dos dados. Dr. Roberto que enquanto dretor do Centro de Pesqusas René Rachou (CPqRR) possbltou a conclação deste mestrado com as atvdades profssonas tão essencas para a formação da profssonal que sou hoje. Dr. Álvaro Romanha, atual dretor do CPqRR que manteve as condções ceddas pela dreção anteror, ncentvando o meu crescmento e possbltando a conclusão deste trabalho.

5 Amgos do CPqRR, conqustas precosas de quatro anos de trabalho e dedcação. Em especal, meus colegas de sala: Andréa, Beth Fleury e Aílson. Obrgada, meus querdos, pelo agradável, dvertdo e harmonoso convívo dáro! Martn, Ana Karne, Ana Carolna, Céla, Anne, Cínta, Paula, Fernando, Crstano, Vrgína, Ivanete, Solange, obrgada pela amzade, fruto de tantas horas em comum de parcera no trabalho da pesqusa e aprendzagem da estatístca! Segemar, sempre solícto, conseguu os artgos mas mpossíves sempre que precse, muto obrgada! Bráulo, Pedro, Felpe, Renato, Henrque, Gustavo, João, Rodrgo, Amgos do ICEx que foram a dose dára de refresco para a mente. Um pouco de amendade no meo da correra... Jora, uma jóa rara, amga envada de São Luz para colorr o da e me fazer companha neste mundo da estatístca. Lucano, Renata, Mchele, Paula colegas de mestrado que fzeram muta dferença. Elas que tanto me ajudou na programação de dversos dos modelos apresentados neste trabalho com sua ncrível habldade com o R. Qualquer amor já é um pouqunho de saúde, um descanso na loucura. Mamãe, presente todo o tempo em mnha alma, você que me deu coragem a me canddatar para o mestrado, você que acredtou em mm o tempo todo e desembaraçou cada nó que eu não consegu. Você, mnha mãe, é meu exemplo maor de vda, tanto a admro... Eternos são mnha gratdão, amzade, respeto e Amor por você! To Vrglo e Vovó Manha, pessoas de ouro colocadas em mnha vda para ensnar e lumnar! Suas preces acalmaram meu coração e me devolveram a razão nas horas de dfculdade. Sou grata por exstrem. Amo vocês! N, lnda ermã, seus olhos lêem mnha alma e me alcalmam... Um da dsseram que nosso amor era grande demas, dferente de tudo, ndescrtível. Eles têm razão! Impossível colocar em palavras... A sntona, o carnho, a confança, o respeto... é Amor demas!!!

6 V, meu rmão. Sempre fo para mm como um pa, nas palavras, nos gestos, nos cudados... Referênca de proteção e conforto! Obrgada por esse cantnho seguro que me reservaste em seu coração! Te amo! Lucas, mnha Luz! Meu amor transborda ao escrever essas lnhas...! Você que acompanhou cada passo tão de perto, que escutou cada novo parágrafo escrto, que me trou de tantas baxas ao longo do camnho e que sorru comgo a cada nova conqusta! A você, Mnha Vda, dedco mnha gratdão, meu carnho, mnha admração, meu respeto, meu eterno e verdadero Amor!!! Lu, chegou de mansnho, conqustou um lugar todo dela! Obrgada pelo doce Pequena, pelo carnho, pela preocupação, pela amzade e pelos Êhhhh!!! Você é muto especal!!! Ale, essa pupu é pau pra toda obra! Obrgada por abraçar essa famíla dessa forma!!! Thays, amga de verdade, pra vda toda! Obrgada pela lealdade que sempre pude contar, por me escutar e por me dexar te escutar! Te amo! Hetor, pa zeloso, que tantas notes estudou comgo e me orentou quando meus passos anda eram pequenos no mundo da matemátca. Obrgada! Lléa, mãe que adote em meu coração, é um amar que não se explca! Obrgada pelo ncentvo, pelas portas abertas, pela confança e carnho. Mnha Estrela da Sorte, sou mensamente grata por tantos presentes... por colorr mnha vda deste verde dourado... e por estar Sempre presente!!!! Mãe Pomba, mãe maor, gua e conselhera, obrgada por me fazer a cada da uma pessoa melhor! Aos sete amgos, do grupo dos 7, da Tenda da Mãe Pomba, agradeço a proteção, o carnho, os conselhos, a força! Salve! Salve a força da Cabocla Jurema! Salve a força que dá Vda! Salve, salve mnha mãe! Pelas belezas encontradas em cada sol, em cada flor, em cada sorrso... Obrgada, Meu Pa, por tornar tão suave e prazerosa a camnhada. Amém.

7 Modelagem Conjunta de Dados Longtudnas e de Sobrevvênca 1. Introdução Em estudos envolvendo análse de dados longtudnas a varável resposta é medda repetdamente, ao longo de um ntervalo de tempo, para cada ndvíduo. Nos estudos de análse de sobrevvênca a varável resposta é o tempo até a ocorrênca de um evento. Mutos estudos clíncos geram conjuntamente dados longtudnas e de sobrevvênca. Por exemplo, nos estudos prospectvos de análse de sobrevvênca em que, grupos de pacentes são acompanhados ao longo do tempo até a ocorrênca de óbto, é comum haver vstas de acompanhamento quando são meddas varáves relaconadas à progressão da doença. Entretanto, tratar estas meddas como covaráves dependentes do tempo no processo de sobrevvênca nem sempre é satsfatóro uma vez que há ocasões cujo nteresse do pesqusador é avalar o efeto de tratamentos tanto sobre os tempos de sobrevvênca quanto sobre o marcador longtudnal. Este estudo mostra também que a nclusão do marcador longtudnal como covarável no processo de sobrevvênca pode ocasonar a perda de mportânca de covaráves meddas na baselne e possvelmente assocadas ao tratamento. Exstem modelos bem estabelecdos na lteratura para analsar estes dados separadamente, mas esta forma de abordagem pode ser nadequada se a varável longtudnal for correlaconada com o tempo de sobrevvênca. Por exemplo, Henderson, Dggle e Dobson () mostraram que, em detrmento do modelo conjunto, utlzar os modelos separados para o processo longtudnal e de sobrevvênca acarreta um víco severo na estmação de alguns componentes de varânca e no coefcente de têndenca temporal. Guo e Carln (4) desenvolveram uma aproxmação Bayesana para o modelo conjunto e mostraram haver sgnfcatva melhora nas estmatvas dos tempos de sobrevvênca e de outros parâmetros. O presente estudo pretende comparar as abordagens, separada e conjunta, aplcada ao banco de dados de um expermento bológco envolvendo camundongos, realzado com o objetvo de avalar o efeto da co-nfecção de malára e esqustossomose e da munzação nduzda para malára, sobre os tempos de sobrevvênca e nível de parastema (malára) dos camundongos. Neste expermento, 64 camundongos foram dstrbuídos aleatoramente em quatro grupos expermentas. Os camundongos alocados no prmero e segundo grupos foram ambos prevamente nduzdos à munzação para malára e nfectados com malára e malára assocada à esqustossomose, respectvamente. Os camundongos alocados nos grupos 3 e 4 não foram munzados e foram nfectados por malára e malára assocada à esqustossomose, respectvamente. O pesqusador vstou os camundongos daramente e regstrou o percentual médo de parastema no sangue e a ocorrênca ou não de morte. Esta avalação fo realzada num período de 25 das (do 5º ao 3º da após a nfecção). Observou-se que os camundongos dos 1

8 grupos 1 e 2 (ambos munzados) tveram melhor prognóstco e níves de parastema baxos, enquanto que nos grupos 3 e 4 foram observados menores tempos de sobrevvênca e níves de parastema crescentes. Em específco pretende-se comparar em termos metodológcos e de nterpretação os seguntes modelos: M1: Modelos para dados longtudnas; M2: Modelo de Cox para a resposta de sobrevvênca; M3: Modelo de Cox com covarável dependente do tempo (varável longtudnal); M4: Modelo Conjunto para dados longtudnas e de sobrevvênca. A análse conjunta de dados longtudnas de sobrevvênca tem sdo explorada recentemente por alguns autores. Wulfshon e Tsats (1997) desenvolveram uma aproxmação para o modelo conjunto que utlza o modelo de Cox para o processo de sobrevvênca e a resposta longtudnal é tratada como covarável contínua cujo valor real é dado por um modelo lnear de efetos aleatóros. A estmação dos parâmetros do modelo proposto é realzada por um algortmo EM que também fo utlzado por Henderson, Dggle e Dobson (). Estes autores formularam um modelo generalzado para a análse conjunta em que um sub-modelo lnear de efetos aleatóros é assumdo para os dados longtudnas, um sub-modelo sem-paramétrco de rscos proporconas para os dados de sobrevvênca, e assume que estes dos sub-modelos podem ser lgados por um processo latente normal bvarado. Uma característca nteressante do modelo proposto por estes autores é que na ausênca de assocação entre o marcador longtudnal e os tempos de sobrevvênca, os resultados da análse conjunta deverão ser os mesmos que obteríamos a partr da análse separada de cada um dos componentes através de métodos tradconas. Outros autores também utlzaram esta forma generalzada para o modelo conjunto. Por exemplo, Wang e Taylor (1) desenvolveram uma aproxmação que consdera o processo latente de lgação como um processo estocástco ntegrado Orsnten-Uhlenbeck. Esta escolha fo motvada pela necessdade de obter um modelo mas flexível para o processo longtudnal. Brown, Ibrahm e DeGrutolla (5) também sugerram uma alteração no modelo para a resposta longtudnal, eles sugerem o uso do modelo B-Splnes Cúbco em lugar de um modelo lnear de efetos aleatóros. Song, Davdan e Tsats (2) avalaram o modelo conjunto assumndo apenas que os coefcentes aleatóros pertencem a uma famíla de densdades suavzadas e não estrtamente a dstrbução normal. Guo e Carln (4) desenvolveram uma aproxmação Bayesana para o modelo conjunto proposto por Henderson, Dggle e Dobson (). Tseng, Hseh e Wang (5) abordaram o caso em que a suposção de rscos proporconas no modelo de Cox não é verfcada e consdera o modelo de tempo de tempos de falha acelerado como alternatva para a modelagem dos dados de eventos. 2

9 Dggle, Souza e Chetwynd (7) desenvolveram uma aproxmação completamente paramétrca que consdera uma transformação logarítmca para o tempo de sobrevvênca, e que a dstrbução conjunta destes tempos de sobrevvênca transformados e as meddas longtudnas é normal multvarada. Ratclffe et. al. (4) propuseram um modelo conjunto para dados em conglomerados em que os dos sub-modelos são lgados através das fragldades no nível do grupo. Zheng e Heagerty (5) e Xu e Zeger (1) desenvolveram aproxmações de modelagem conjunta mas, com o foco na estmação dos parâmetros do processo de sobrevvênca. Este trabalho fo estruturado da segunte forma. A Seção 2 aborda a metodologa de análse de dados longtudnas e apresenta os modelos margnal, de efetos aleatóros e o modelo lnear generalzado com efetos aleatóros. A Seção 3 apresenta de forma resumda os concetos de análse de sobrevvênca e o modelo de Cox (1972) com e sem covaráves dependentes do tempo. Alguns modelos conjuntos e algumas das suas possíves formas de estmação são apresentados na Seção 4. A descrção detalhada do expermento, a modelagem dos dados utlzando os métodos tradconas de análse separada, e a análse através do modelo em dos estágos estão apresentadas na Seção 5. A Seção 6 dscorre sobre as prncpas conclusões deste trabalho. 3

10 2. Análse de Dados Longtudnas Esta seção ntroduz os concetos assocados à análse de dados longtudnas, a notação utlzada na lteratura e apresenta os modelos margnal, de efetos aleatóros e o modelo lnear generalzado com efetos aleatóros. Também conhecdo como meddas repetdas, este tpo de estudo envolve bancos de dados em que a varável resposta, Y, é medda repetdamente em cada ndvíduo da amostra, ao longo do tempo. Suponha um conjunto de m ndvíduos avalados n vezes ao longo do tempo, por smplcdade de notação assumremos que o número de observações da medda longtudnal é constante para todos os ndvíduos, embora os métodos sejam gualmente aplcáves a dados desbalanceados que ocorrem com freqüênca na prátca. Y T = ( Y 1, K, Y n ) é o vetor de respostas do -ésmo ndvíduo, então Yj representa a resposta do -ésmo ndvíduo no j-ésmo tempo. Em análse de dados longtudnas assummos que, entre ndvíduos, as respostas são ndependentes, mas para o mesmo ndvíduo elas são correlaconadas. Dggle, Lang e Zeger (1996) mostraram que, ao modelar dados longtudnas pelo modelo lnear normal as estmatvas dos coefcentes de regressão, ˆβ ' s, permanecem consstentes porém, estas são nefcentes uma vez que a varânca dos coefcentes de regressão estmados, ˆ) Var(β, fca vcada. Uma forma de corrgr este problema é através da estmação dos componentes de varânca ou seja, modelar a estrutura de covarânca dos dados. O modelo margnal e o modelo de efetos aleatóros apresentam duas formas de estmação destes componentes e serão apresentados a segur. 2.1 Modelo Margnal No modelo margnal a méda e a varânca de Y são modeladas separadamente. Assummos que X são as covaráves ncluídas na análse e β s seus respectvos coefcentes de regressão, a resposta, Y, é resultado de um processo Gaussano n-varado com méda ( X T β ) e matrz de covarânca V. A varânca de V ncorpora a estrutura de correlação das meddas do mesmo ndvíduo. Portanto, é necessáro atrbur forma específca à V. As formas mas comuns de V são: Correlação Unforme neste caso, assummos que a correlação entre as meddas do mesmo ndvíduo é constante; Correlação Seral, esta forma assume que a correlação dmnu quando as meddas se afastam no tempo; e, Não-estruturada neste caso, é especfcada uma covarânca dferente para cada par de observações do ndvíduo. A matrz de correlação dos resíduos padronzados, obtdos pelo ajuste do modelo lnear normal para a resposta 4

11 longtudnal versus o tempo, desconsderando as demas varáves, é útl para determnar a estrutura de correlação das meddas do mesmo ndvíduo (Dggle, Lang e Zeger, 1996). O modelo margnal pode ser escrto como: Y = β + ε, = 1,2, K, m T X em que, T Y N ( X β, V ), e ε N(, V ). ~ n ~ 2.2 Modelo de Efetos Aleatóros Neste modelo a resposta é assumda ser uma função lnear das varáves explcatvas com coefcentes de regressão que varam entre ndvíduos, sto é, este modelo permte que os coefcentes sejam fxos ou aleatóros. Os coefcentes aleatóros explcam a dependênca entre as respostas do mesmo ndvíduo, esta varabldade reflete a heterogenedade devdo a fatores não mensurados ou não mensuráves. A premssa básca do modelo de efetos aleatóros é que a heterogenedade natural entre ndvíduos é modelada em um subconjunto de coefcentes de regressão. O modelo de efetos aleatóros assume a segunte forma: Y = X β + Z b + ε, = 1,2, K, m (1) T em que, T X β : representa o componente fxo; X são as covaráves ncluídas na análse e β s seus respectvos coefcentes de regressão, Z b : representa o componente aleatóro; b s são os coefcentes aleatóros que varam para cada ndvíduo; e, Z é, em geral, um subconjunto de X de 2 covaráves dependentes do tempo. ε ~ N(, σ ). I n No modelo de efetos aleatóros assummos que as respostas do -ésmo ndvíduo têm T dstrbução Normal n-varada com méda ( X β ) e matrz de covarânca Σ = ( Z V Z + σ 2 I) em T que V é a matrz de covarâncas das meddas do mesmo ndvíduo. Os coefcentes aleatóros, b, são ndependentes e têm dstrbução Normal com méda zero e matrz de covarânca V. 2.3 Inferênca para os Modelos Margnal e de Efetos Aleatóros Os coefcentes de regressão do modelo margnal e do modelo de efetos aleatóros podem ser estmados através do método da máxma verossmlhança. Entretanto, este método produz um estmador vcado para os componentes de varânca (Dggle, Lang e Zeger, 1996). 5

12 O método da máxma verossmlhança restrta corrge este problema e é dada por: L R ( θ ) = X T H 1 X 1 2 L ( θ ) v em que, θ representa o conjunto de todos os parâmetros a serem estmados no modelo, X é a matrz das covaráves ncluídas na análse, H = σ 2 I e L v (θ) é a função de verossmlhança usual: L V m n 1 n T 1 ( θ ) = (2π ) V ( σ ).exp ( Y X β ) V ( Y X β ) 2 = 1 2σ O estmador de máxma verossmlhança restrta possu as mesmas propredades que o estmador de máxma verossmlhança. Maores detalhes sobre a este método podem ser encontrados em Dggle, Lang e Zeger, Modelo Lnear Generalzado com Efetos Aleatóros Um modelo lnear generalzado com efetos aleatóros é defndo a segur. Seja o vetor de n observações da varável resposta que pode ser escrto como: Y T [ Y, Y ] Y =, 1 K = μ + ε, = 1,2, K, m (2) Seja g(.) uma função monótona, um lnk, tal que g(μ) possa ser escrta como um modelo lnear: ( ) = η = X β Zb g μ + (3) Se, condconal a μ, os componentes de Y são ndependentemente dstrbuídos, e se sua dstrbução pertence à famíla exponencal, então (2) e (3) defnem um modelo lnear generalzado com efetos aleatóros. Assummos que os coefcentes aleatóros b são não correlaconados, com esperança zero ( ) q 2 e cov b = σ I, em que q é o número de coefcentes aleatóros do -ésmo ndvíduo. Estes coefcentes são ndependentes do vetor de erros, ε. No caso partcular quando Y segue uma dstrbução normal e g(.) é uma função lnk dentdade, o modelo lnear generalzado se reduz ao modelo lnear de efetos aleatóros (1) apresentado na Seção 2.2. A análse de um modelo lnear generalzado com efetos aleatóros pode ser aplcada em modelos logístcos para respostas longtudnas dcotômcas. Neste caso, assummos que os efetos aleatóros seguem uma dstrbução normal com méda zero e a dstrbução condconal de Y é bnomal. Schall (1991) apresenta este modelo aplcado a um banco de dados com resposta bnára e apresenta detalhadamente o algortmo de estmação. n 6

13 2.5 Inferênca para o Modelo Generalzado A estmação dos parâmetros, β, e dos parâmetros especfcando a dstrbução dos efetos aleatóros, b, podem ser realzadas através do método da máxma verossmlhança restrta (Schall, 1991) baseada na dstrbução margnal das observações, Y. Schall (1991), descreve dos algortmos para a estmação destes modelos. O prmero é aplcado ao caso partcular em que a resposta Y tem dstrbução Normal e o segundo para o caso generalzado. 7

14 3. Análse de Sobrevvênca Nesta seção ntroduzremos os concetos báscos de análse de sobrevvênca e a notação utlzada na lteratura. Os modelos de Cox, com e sem covarável dependente do tempo, e suas formas de estmação são também apresentados nesta seção. Suponha um conjunto de m ndvíduos dstrbuídos aleatoramente em grupos de tratamento, X é a varável ndcadora de grupo. Seja T o tempo máxmo de acompanhamento do -ésmo ndvíduo. Este tempo pode ser classfcado de duas formas: T é um tempo de falha se ndca o tempo em que o evento de nteresse fo observado; ou, T é um tempo de censura se ao fnal do acompanhamento o evento não ocorreu. De forma geral, o vetor (T, δ, X ) representa os dados de sobrevvênca do -ésmo ndvíduo em que T é o tempo máxmo de acompanhamento, δ uma função ndcadora de falha e X representa as covaráves assocadas a este ndvíduo. A taxa de falha no ntervalo [t, t+δt) é defnda como a probabldade de que a falha ocorra neste ntervalo, dado que não ocorreu antes de t, dvdda pelo comprmento do ntervalo. Desta forma, se Δt, λ(t) representa a taxa de falha nstantânea no tempo t, condconal à sobrevvênca até o tempo t, e é expressa por: P( t T < t + Δt T t) λ( t) = lm Δt Δt. Modelos tanto paramétrcos quanto sem-paramétrcos estão dsponíves para modelar dados de sobrevvênca (Colosmo e Golo, 6). Os modelos paramétrcos Exponencal e Webull são comumente usados por sua smplcdade e pela fácl nterpretação de seus parâmetros. Na prátca, entretanto, os modelos sem-paramétrcos de rscos proporconas (Cox, 1972) são amplamente usados pos, eles não mpõe uma forma partcular para a curva de sobrevvênca. 3.1 Modelo de Rscos Proporconas de Cox No modelo sem-paramétrco de rscos proporconas de Cox a função de rsco assume a forma: T λ ( t) = λ ( t) exp{ β} (4) X em que, λ (t), a função de taxa de falha básca e o vetor X =(X 1, X 2,..., X p ) T e β representam as p covaráves meddas no -ésmo ndvíduo e seus correspondentes coefcentes de regressão. O modelo de Cox, sem covarável dependente do tempo (4), assume que a razão das taxas de falha de dos ndvíduos dstntos na amostra é constante para todo o tempo de acompanhamento. 8

15 A estmação dos parâmetros deste modelo é baseada no método da máxma verossmlhança parcal (Collet, 3; Cox, 1975): δ m T exp{ X β} L( β ) =, (5) = T 1 exp{ X j R ( t j β} ) em que, R(t ) é o conjunto dos índces das observações sob rsco no tempo t. A função de verossmlhança parcal (5) assume que os tempos de sobrevvênca são contínuos e, conseqüentemente, não pressupõe a possbldade de empates nos tempos observados. Na prátca, empates podem ocorrer nos tempos de falha ou de censura devdo à escala de medda. Breslow (1972) e Peto (1972) propuseram uma modfcação na função de verossmlhança parcal para acomodar as observações empatadas quando estas ocorrem. Consdere s o vetor formado pela soma das covaráves para os ndvíduos que falharam no mesmo tempo t ( = 1,..., k) e d o número de falhas neste tempo. A função de verossmlhança parcal proposta por estes autores tem a segunte forma: k T exp{ s β} L( β ) =. (6) = 1 T ( exp{ X j β} ) j R ( t ) Esta aproxmação é adequada quando o número de empates em qualquer tempo não é grande. Quando não há empates a expressão (6) se reduz à (5). d 3.2 Modelo de Cox com Covaráves Dependentes do Tempo Consdere a possbldade que entre as p covaráves meddas em cada ndvíduo, X 1,..., X p exstam algumas que foram meddas n vezes, ao longo do tempo. Assm temos ( T, δ, X (t j )) o vetor que representa os dados de sobrevvênca do -ésmo ndvíduo no j-ésmo tempo; X (t j ) o vetor de covaráves do -ésmo ndvíduo avalado no tempo j (j = 1,..., n ). Neste modelo a função de rsco assume a forma: T λ ( t ) λ( t ) exp{ X ( t ) β}. (7) = Então, o modelo de Cox com varável dependente do tempo não supõe rscos proporconas pos a razão das funções de rsco de dos ndvíduos passa a depender do tempo. Assm, a função de verosmlhança parcal para o modelo de Cox com covarável dependente do tempo pode ser escrta como: m T exp{ X ( t ) β} L( β ) =. (8) = T 1 exp{ X j R t j ( t ( ) β} ) Andersen e Gll (1982) mostraram que, sob certas condções de regulardade, os estmadores produzdos pela função de verossmlhança parcal (6 e 8) são consstentes e assntotcamente normas. δ 9

16 4. Modelagem Conjunta Nas Seções 2 e 3 apresentamos formas de modelagem separada de dados longtudnas e de sobrevvênca, respectvamente. Nesta seção remos apresentar, de forma sucnta, algumas das propostas de modelagem conjunta encontradas na lteratura. 4.1 O Modelo Conjunto por Wulfsohn e Tsats (1997) A modelagem conjunta de dados longtudnas e de sobrevvênca tem sdo explorada recentemente por mutos autores. O modelo conjunto proposto por Wulfsohn e Tsats (1997) tem sdo referênca para mutos deles. Estes autores utlzaram um modelo de Cox para o processo de sobrevvênca e a resposta longtudnal é tratada como covarável contínua cujo valor real é dado por um modelo lnear de efetos aleatóros. Consdere m ndvíduos, seja Y uma varável dependente do tempo, e cada ndvíduo tem n meddas da covarável longtudnal nos tempos ( t : t T ; = 1, K, m; j = 1, K n) j j,. T é o tempo máxmo de acompanhamento do pacente e δ uma função ndcadora de falha. Assummos que Y pode ser ajustada por um modelo lnear de efetos aleatóros, dado pela equação (1): Y = X β + Z b + ε, = 1,2, K, m T T T em que, Y ~ ( β ; ), = ( Z V Z + σ 2 I), V é a matrz de covarâncas das meddas do X 2 mesmo ndvíduo. ε ~ N(, σ I n ), o vetor de erros ndependentes. Os coefcentes aleatóros, b, são ndependentes e têm dstrbução Normal com méda zero e matrz de covarânca V. ε b. O rsco de falha é então ajustado pelo modelo sem-paramétrco de Cox e o valor ajustado pelo modelo lnear de efetos aleatóros utlzado como valor real do marcador longtudnal, em lugar da medda observada Y j. λ ( t β, b, Y, X, Z ) = T = λ ( t ) exp{ γ ( X β + Z b )} em que, λ (t) é a função de rsco baselne (não-paramétrca) que é avalada a cada tempo de falha, γ é o parâmetro que mede a assocação entre o tempo de sobrevvênca e a varável longtudnal. Neste modelo, assummos que o tempo de censura é não nformatvo, sendo realzado ndependentemente do tempo de sobrevvênca e da medda do marcador longtudnal. 1

17 Estes autores propuseram um algortmo EM para estmar os parâmetros de nteresse maxmzando a função de verossmlhança dos dados observados. Isto é feto através da teração entre o passo E, em que se calcula a esperança da log-verossmlhança dos dados completos, condconal aos dados observados e as estmatvas atuas dos parâmetros; e o passo M, em que novas estmatvas para os parâmetros são calculadas maxmzando sua log-verossmlhança esperada. 4.2 O Modelo Conjunto por Henderson, Dggle e Dobson () Henderson, Dggle e Dobson () propuseram um modelo generalzado para a análse conjunta que pode ser dvddo em dos sub-modelos e um processo de lgação latente. Para as meddas longtudnas é assumdo um sub-modelo lnear com efetos aleatóros, e para o processo de sobrevvênca um sub-modelo sem-paramétrco de rscos proporconas. O modelo conjunto assume que dado o processo latente normal bvarado, W(t)= {W 1 (t), W 2 (t)}, e as covaráves avaladas, os processos longtudnal e de sobrevvênca são condconalmente ndependentes. Os sub-modelos podem ser escrtos na segunte forma: (1) Sub-modelo para as meddas longtudnas: Y j = μ (t j ) + W 1 (t j ) + ε j em que, μ (t j ) é a resposta méda e, ε j ~N(,σ 2 ε) é uma seqüênca de erros mutuamente ndependentes. Assummos que a resposta méda pode ser descrta por um modelo lnear: μ (t) = X 1 (t) β 1 em que, os vetores X 1 (t) e β 1 representam varáves explcatvas, que podem ser dependentes do tempo, e seus correspondentes coefcentes de regressão. (2) Sub-modelo para o processo de sobrevvênca no tempo t é dado pelo modelo semparamétrco multplcatvo: λ (t) = λ (t) exp{x 2 (t) T β 2 + W 2 (t) em que, o componente não-paramétrco λ (t) têm forma não especfcada. Os vetores X 2 (t) e β 2 podem, ou não, ter elementos em comum com X 1 (t) e β 1. 11

18 Para o processo de lgação latente assummos que, W 1 (t) = U 1 + U 2 t em que, (U 1, U 2 ) têm dstrbução normal bvarada com médas zero, com respectvas varâncas σ 2 1 e σ 2 2 e coefcente de correlação ρ. E, W 2 (t) tem a forma: W 2 (t) = γ 1 U 1 + γ 2 U 2 + γ 3 (U 1 + U 2 t) + U 3 em que, U3~N(, σ 2 3) é ndependente de (U 1, U 2 ). Neste modelo, os parâmetros γ 1, γ 2 e γ 3 medem a assocação nduzda pelo ntercepto, nclnação e valor de W 1 (t), respectvamente. U3 modela a fragldade ortogonal do processo de meddas. Estes autores descrevem uma extensão do algortmo EM proposto por Wulfsohn e Tsats (1997) para a estmação dos parâmetros do modelo através do método da máxma verossmlhança. 4.3 O Modelo Conjunto por Dggle, Souza e Chetwynd (7) Assm como nos modelos descrtos acma, consdere m ndvíduos ndependentes, seja Y uma covarável dependente do tempo, e cada ndvíduo tem n meddas da covarável longtudnal nos tempos (t j : t j T ). T é o tempo máxmo de acompanhamento do pacente e δ uma função ndcadora de falha. Estes autores desenvolveram uma versão completamente paramétrca para o modelo conjunto. O modelo proposto consdera uma transformação logarítmca para o tempo de sobrevvênca, T, e então consdera a dstrbução conjunta de S log( T ) como: em que, μ (, ) = μ y μ s, e V = g [, S] ~ NMV ( μ, ) Y, ( θ ) g( φ) '( φ) η 2. = e as meddas longtudnas, Y, Este modelo consdera que os dados de ndvíduos dferentes são ndependentes. O tempo de evento, T, pode ser observado de forma exata, censurado à drecta, ou com censura ntervalar. Além dsso, T pode, ou não, determnar o fm da sequenca de meddas longtudnas. A nferênca neste modelo é baseada no método da máxma verossmlhança, calculando a contrbução de cada ndvíduo para a verossmlhança através da fatoração da dstrbução conjunta em [Y,S] = [Y]*[S Y]. 12

19 4.4 O modelo em dos estágos As aproxmações apresentadas acma são bastante nteressantes em dversos aspectos, no entanto, a estmação dos parâmetros destes modelos é computaconalmente complexa e envolve estmação a partr de algortmos EM. Infelzmente, anda não há programas dsponíves para o ajuste destes modelos. Consderamos o modelo em dos estágos como uma aproxmação para o modelo conjunto. O prmero estágo deste modelo consste no ajuste do modelo de efetos aleatóros (1) apresentado na Seção 2.2 para os dados longtudnas e, no segundo estágo utlzamos os valores ajustados por este modelo como covarável dependente do tempo no modelo de Cox (7). A déa se assemelha àquela proposta por Wulfsohn e Tsats (1997), no entanto a stmação proposta por estes autores basea-se na função de verossmlhança da dstrbução conjunta de Y e T através da fatoração L ( Y, T ) = L ( Y ) L ( T Y ). θ θ θ 13

20 5. Aplcação 5.1 Descrção do expermento Modelos expermentas, utlzando o S. manson (esqustossomose) em assocação com espéces de Plasmodum (malára) de roedores, Lewn et. al. (1981) mostraram que as parastoses mstas levaram a um aumento de parastema devda ao protozoáro. Com o objetvo de aprofundar os conhecmentos sobre o efeto da assocação da nfecção do protozoáro da malára P.bergue com o helmnto causador da esqustossomose S.manson, sobre a parastema por P.bergue e sobre a sobrevvênca dos camundongos, fo conduzdo, no Insttuto de Cêncas Bológcas (ICB-UFMG) em parcera com o Centro de Pesqusas René Rachou (CPqRR- FIOCRUZ), um expermento em que 8 camundongos foram alocados aleatoramente em 4 grupos de tratamentos. Estes camundongos foram acompanhados durante 25 das. O tempo zero ndca o tempo em que os camundongos foram nfectados com P. bergue. A partr do 5º da após a nfecção o percentual de parastas no sangue do camundongo torna-se grande o sufcente para ser detectado pelo teste de esfregaço sanguíneo (teste para determnar a parastema), este da então fo usado como padrão para o níco da contagem que fo realzada daramente até o 3º da, quando todos os camundongos que havam sobrevvdo foram sacrfcados. Valores altos de parastema ndcam alto grau de nfecção do camundongo, enquanto que valores observados guas a zero ndcam a ocorrênca de cura do camundongo. Os camundongos que morreram ao longo do período de acompanhamento (5º ao 3º da após a nfecção), tveram o da do óbto regstrado. Os 8 camundongos foram dstrbuídos aleatoramente entre 4 grupos de camundongos cada, no entanto, ocorreram mortes de camundongos antes do níco da medda da parastema devdo a fatores dstntos do objetvo do estudo sendo, portanto, estes elmnados do banco de dados. O banco fnal dspõe de 64 camundongos assm dstrbuídos: Grupo 1: Grupo 2: Grupo 3: Grupo 4: camundongos nfectados por P. bergue que foram prevamente munzados à malára por nfecções sucessvas segudas de tratamento. 16 camundongos nfectados croncamente por S. manson e posterormente nfectados por P. bergue que foram prevamente munzados à malára por nfecções sucessvas segudas de tratamento. 15 camundongos nfectados por P. bergue. 13 camundongos nfectados croncamente por S. manson e posterormente nfectados por P. bergue. 14

21 Indução à mundade à P. bergue : Os camundongos dos grupos 1 e 2 foram munzados contra a malára por P. bergue através de sucessvas nfecções expermentas segudas de cura utlzando tratamento com cloroquna (1mg/kg, va oral). O processo de ndução de mundade à malára ncou-se 18 semanas após a nfecção por S. manson. Para comprovar o sucesso da munzação, um grupo de 1 camundongos fo posterormente nfectado com 1x1 6 hemácas parastadas por P. bergue e acomanhado para a constatação da ausênca de parastema. 5.2 Análse de dados Com base no banco de dados deste expermento defnmos O ( X1, X 2, Y, T, δ ) j = os valores observados das meddas do -ésmo camundongo no j-ésmo tempo. X1 e X2, representam as meddas das covaráves ndcadoras: confecção e munzação, respectvamente; Y j, representa o percentual médo de parastema do -ésmo camundongo no j-ésmo da após a nfecção; T, representa o tempo máxmo de acompanhamento do -ésmo camundongo, T 3; e, δ é o ndcador de falha. j 7 (a) 7 (b) 6 6 Y (% Parastema) Y (% Parastema) Tempo (das) Tempo (das) (c) 7 (d) 6 6 Y (% Parastema) Y (% Parastema) Tempo (das) Tempo (das) 25 3 Fgura 1 - Gráfco de Perfs do % médo de parastema para os camundongos por grupo expermental (a) grupo 1, (b) grupo 2, (c) grupo 3 e (d) grupo 4. 15

22 A Fgura 1, contém os gráfcos de perfs dos dados assocados a cada camundongo por grupo expermental. O grupo 1 (Fgura 1 (a)) é composto por camundongos que foram munzados e nfectados apenas por malára, correspondendo ao grupo de melhor prognóstco uma vez que apresenta os mas baxos valores de parastema e, a partr do 25º da após a nfecção até o tempo fnal do estudo todos os camundongos apresentaram parastemna zero (ndcatvo de cura) sendo portanto, todos censurados no 3º da após a nfecção. No grupo 2 (Fgura 1 (b)) estão alocados os camundongos que foram munzados e confectados. Neste grupo temos a presença de 6 camundongos que mantveram o percentual de parastema baxo até o fnal do expermento e foram censurados no 3º da após a nfecção, 8 que morreram com níves de parastema dversos e 2 casos que tveram óbto no 12º da mas que apresentavam ndcador de cura no da anteror à morte. Os camundongos alocados nos grupos 3 e 4 (Fgura 1 (c) e (d)) não foram munzados e todos eles morreram antes do fm do estudo, sendo que podemos observar valores altos de parastema precedendo a morte. Observa-se que no grupo 4, em que os camundongos foram confectados, o tempo de sobrevvênca de apenas 2 anmas fo superor a 11 das, enquanto que no grupo 3 (anmas com nfecção smples) o tempo de sobrevvênca parece ter sdo maor. Nos grupos expermentas 3 e 4 as meddas de parastema do 5º da após a nfecção foram perddas Análse de Dados Longtudnas Prmeramente, remos focar a análse deste banco de dados sob o aspecto da estrutura de meddas repetdas. Então, a varável resposta a ser consderada, Y j, é o percentual médo de parastema do -ésmo camundongo no j-ésmo da após a nfecção, com = 1,..., 64 e j= 5,..., n ; 5 n 3. A Fgura 2 apresenta a curva suavzada (método Lowess Cleveland, 1985) do percentual de parastema médo para cada um dos grupos expermentas. Observa-se que o nível de parastema dos camundongos que foram munzados (grupos 1 e 2) é aparentemente nferor ao nível dos camundongos não munzados (grupos 3 e 4). Além dsso, observa-se que os camundongos dos grupos 3 e 4 apresentam valores de parastema crescentes ao longo do acompanhamento, enquanto que os camundongos alocados nos grupos 1 e 2, apresentaram valores mas baxos de parastema em todo o período de acompanhamento. Os gráfcos de perfs do percentual médo de parastema para cada um dos grupos expermentas foram traçados e apresentados na Fgura 1. 16

23 Y (% Parastema) Grupo Tempo (das) 25 3 Fgura 2 Gráfco da curva de alsamento (Lowess) do % médo de parastema para os grupos expermentas. Um modelo de regressão lnear smples fo ajustado para a varável resposta: percentual de parastema (Y) versus o tempo após a nfecção, desconsderando-se o grupo expermental e o camundongo. Os resíduos padronzados foram calculados com o objetvo de avalar a varabldade da resposta no tempo (Dggle, Lang e Zeger, 1996). A partr destes resíduos, fo traçado um gráfco de perfs para cada grupo expermental. Estes gráfcos estão apresentados na Fgura 3, Anexo A e pode-se observar que, exceto no grupo 3 em que, a ampltude de varação dos resíduos parece constante, a varânca dos resíduos parece aumentar com o tempo. A matrz de correlação dos resíduos padronzados entre os tempos dstntos estão apresentados no Anexo A, estas meddas foram calculadas no ntuto de avalar a estrutura de correlação das meddas no tempo, ou seja, se a correlação entre os tempos decresce quando as meddas se afastam sugerndo uma correlação seral ou se possuem outra forma como a correlação unforme ou não-estruturada. Com base nos resultados encontrados observamos que a correlação tende a decrescer quando as meddas se afastam no tempo, logo a forma de correlação seral parece ser adequada para ajuste dos dados. O modelo margnal e o modelo de efetos aleatóros são as prncpas formas de modelagem de dados longtudnas e foram apresentadas na Seção 2. Uma sére de modelos, utlzando estas técncas, foram ajustados ao banco de dados e seguem descrtos a segur: ML1 Modelo Margnal com Correlação Unforme: este modelo consdera que a correlação entre as meddas do mesmo ndvíduo é constante no tempo. ML2 Modelo Margnal com Correlação Seral: este modelo consdera que a correlação entre as meddas do mesmo ndvíduo decresce quando estas se afastam no tempo. ML3 Modelo de Efetos Aleatóros (efeto aleatóro no ntercepto): este modelo consdera um ntercepto dstnto para cada camundongo, β. ML4 Modelo de Efetos Aleatóros (efeto aleatóro no ntercepto e no Tempo): este modelo permte que tanto o ntercepto, quanto a nclnação com o tempo varem entre camundongos. 17

24 O Modelo Margnal com Correlação Não-estruturada, ao ser ajustado não convergu por ser tratar de um modelo complexo devdo ao seu grande número de parâmetros a ser estmado. A Tabela 1 apresenta um resumo destes ajustes em que são apresentados os coefcentes de regressão estmados ( βˆ s) e os valores p assocados ao teste de Wald. Nesta tabela são apresentadas duas meddas de qualdade do ajuste. São elas: AIC: Akake Informaton Crteron AIC = 2[ l( ˆ) θ dm( θ )] N log(dm( θ )) BIC: Bayesan Informaton Crteron BIC = 2 l( ˆ) θ 2 em que, θ representa o conjunto de parâmetros estmados em cada modelo. Estas meddas são usadas para comparar modelos a partr da nformação do quanto a função de verossmlhança fo capaz de absorver dos dados, penalzada pelo grau de complexdade do modelo. Valores menores destas meddas ndcam melhores ajustes. A partr dos resultados apresentados na Tabela 1, podemos confrmar que o modelo margnal com correlação seral (ML2) é o que melhor se ajustou aos dados uma vez que, apresentou os menores valores de AIC e BIC. Neste modelo todas as covaráves foram sgnfcatvas. A confecção tem efeto de aumentar o grau de parastema em cerca de 3%, enquanto que a munzação reduz em méda 22% o nível de parastema do camundongo. O efeto do tempo é de crescmento na parastema (em méda,18% ao da). Tabela 1 Ajuste de modelos para Dados Longtudnas Modelo Covaráves no modelo Estmatvas se(β) p-valor AIC BIC Intercepto β = 23,16 1,8, ML1 X1: confecção β1 = 3,47 1,12,21 X2: munzação β2 = -22,39 1,15, 6592,2 6621,14 T: tempo β3 =,56,4,1181 Intercepto β = 21,69 1,5, ML2 X1: confecção β1 = 2,99 1,29,9 X2: munzação β2 = -23,45 1,42, 61, ,24 T: tempo β3 =,183,7,143 Intercepto β = 23,16 1,8, ML3 X1: confecção β1 = 3,47 1,12,3 X2: munzação β2 = -22,39 1,15, 6592,2 6621,14 T: tempo β3 =,56,4,118 Intercepto β = -,72 2,51,7733 ML4 X1: confecção β1 =,71 1,,5573 X2: munzação β2 = -7,91 1,26, 6222, ,69 T: tempo β3 = 2,18,4, 18

25 Os perfs médos ajustados a partr destes modelos estão apresentados na Fgura 4, Anexo B. A exploração destes perfs revelou, entretanto, que a aproxmação é anda muto grossera quando comparada aos perfs médos observados (Fgura 2). Modelos que consderem perfs ndvduas (efetos aleatóros) e a nteração do efeto das covaráves com o tempo são especalmente nteressantes de se avalar neste tpo de stuação clínca. Os modelos ML5, ML6 e ML7 são modelos lneares com efetos aleatóros no ntercepto e no tempo, e foram ajustados com o objetvo de avalar a presença deste possível efeto de nteração da confecção com o tempo, da munzação com o tempo, e de ambos efetos de nteração, respectvamente. O resumo dos resultados destes ajustes estão apresentados na Tabela 2, observamos que ambos os efetos de nteração são sgnfcatvos. O modelo ML7 mostrou-se então o mas efcente segundo os crtéros de AIC e BIC, apresentando os menores valores para estas meddas. Além dsso, ao observar os perfs ajustados para estes modelos apresentados na Fgura 5, Anexo B, verfcamos que este modelo é aquele que mas se aproxma da méda observada (Fgura 2). O ajuste do modelo com nteração entre as covarávers: confecção e munzação, fo consderado mas, seus resultados foram omtdos por não ter apresentado efeto sgnfcatvo. Tabela 2 Ajuste de Modelos de Efetos Aleatóros com Interações Modelo Covaráves no modelo Estmatvas se(β) p-valor AIC BIC Intercepto β = 3,52 2,81,2112 X1: confecção β1 = -11,41 4,4,119 ML5 X2: munzação β2 = -7,42 1,24, T: tempo β3 = 1,34,48, , ,38 X1*T: nteração do efeto de confecção com o tempo β4 = 2,22,79,48 Intercepto β = -1,44 2,32, X1: confecção β1 =,38 1,21,756 ML6 X2: munzação β2 = 12,42 2,66, T: tempo β3 = 4,15,37, 6174, ,37 X2*T: nteração do efeto de munzação com o tempo β4 = -3,92,45, Intercepto β = -6,66 2,5,12 X1: confecção β1 = -7,23 2,12,12 X2: munzação β2 = 11,35 2,29, T: tempo β3 = 3,39,32, ML7 6158,72 67,22 X1*T: nteração do efeto de β4 = 1,58,36, confecção com o tempo X2*T: nteração do efeto de munzação com o tempo β5 = -3,76,37, Observamos, porém, que o ajuste de um modelo lnear talvez não seja a melhor alternatva para o ajuste destas meddas longtudnas, uma vez que aqueles camundongos, que sobrevveram os trnta das de acompanhamento do expermento, tveram o nível de parastema altamente osclatóro no 19

26 níco do expermento e reduz para zero até o fnal do expermento, ndcando cura da malára. Isto ocorreu com todos os camundongos alocados no grupo de tratamento 1 (Fgura 1a) e em 6 dos 16 alocados no grupo 2, ambos os grupos munzados contra a malára (Fgura 1b). Propomos, como alternatva a estes modelos apresentados nas Tabelas 1 e 2, o ajuste de um modelo lnear generalzado com efetos aleatóros com a função de lgação bnomal, para a resposta transformada Y, em que Y j = 1(Y j = ), ou seja, Y j = 1 ndca que o percentual de parastema do - ésmo camundongo ( = 1,..., 64) no j-ésmo da de avalação (j = 5,..., n ; 5 n 3) é gual a zero. Assm, Y pode ser nterpretado como um ndcador de cura do camundongo. Os resultados do ajuste destes modelos estão apresentados na Tabela 3. Tabela 3 Ajuste de Modelos Lneares Generalzados com Efetos Aleatóros para Y Modelo Covaráves no modelo Estmatvas se(β) p-valor AIC BIC Intercepto β = 33, ,69,9995 ML8 X1: confecção β1 =,97,74,197 X2: munzação β2 = -28, ,69,9996 * * T: tempo β3 = -,34,2, Intercepto β = 3, ,8 1, ML9 X1: confecção β1 =,6 43,1,989 X2: munzação β2 = -26, ,8 1, * * T: tempo β3 = -,34 3,,9117 Intercepto β = 28, ,33,9996 X1: confecção β1 = -3,92,79, X2: munzação β2 = -21, ,33,9997 T: tempo β3 = -,5 4556,75 1, ML1 * * X1*T: nteração do efeto de β4 =,36,3, confecção com o tempo X2*T: nteração do efeto de munzação com o tempo β5 = -, ,75,9999 Intercepto β = 36, ,38,9991 X1: confecção β1 = -17,7 3,89, X2: munzação β2 = -13, ,38,9997 T: tempo β3 = -,5 2655,31,9998 ML11 * * X1*T: nteração do efeto de β4 = 1,52,36, confecção com o tempo X2*T: nteração do efeto de munzação com o tempo β5 = 1,3 2655,31,9996 Intercepto β = 7,82 1,5, X1: confecção β1 = -4,21 1,33,24 ML12 T: tempo β3 = -,48,6, 7186, 7215,2 X1*T: nteração do efeto de confecção com o tempo β4 =,33,7, Intercepto β =,47 2,77, X1: confecção β1 = -13,75 3,89,8 ML13 T: tempo β3 = -1,42,24, 11574, ,3 X1*T: nteração do efeto de confecção com o tempo β4 = 1,11,38,31

27 O ajuste dos modelos ML8, ML1 e ML12 nclu um efeto aleatóro no ntercepto e os modelos ML9, ML11 e ML13 ncluem efeto aleatóro no ntercepto e no Tempo. Os modelos ML12 e ML13 destacados apresentam como sgnfcatvos os efetos da Confecção, do Tempo e da nteração: Confecção com o Tempo. A nterpretação dos coefcentes destes efetos é bastante ntutva. Podemos observar que a Confecção dmnu sgnfcatvamente a chance de cura do camundongo e quanto maor o Tempo no estudo maor a chance de cura. Estes resultados são concordantes com o esperado, uma vez que permanecem no estudo por mas tempo justamente os camundongos que obtveram cura. Estes modelos apontam os mesmos resultados como sgnfcatvos, mas apresentam grande dscrepânca nos valores dos coefcentes estmados. Observando que os valores de AIC de BIC do modelo ML12 foram consderavelmente menores que o modelo ML13, consderados o ML12 como um melhor ajuste Análse de Sobrevvênca Agora, remos focar a estrutura deste banco de dados sob o aspecto de análse de sobrevvênca. Então, a varável resposta, T, é o tempo transcorrdo entre a nfecção e a morte camundongo, sendo que houve censura no tempo T = 3 das, quando todos os camundongos que sobrevveram foram sacrfcados. Com o objetvo de se obter uma déa do efeto das covaráves sobre o comportamento dos dados foram calculadas, ncalmente, as estmatvas para a função de sobrevvênca pelo método de Kaplan-Meer para as covaráves X1 e X2. A Fgura 6a apresenta as curvas de sobrevvênca estmadas para a covarável X1 (confecção). Comparando estas curvas pelo teste de Wlcoxon, observa-se que os camundongos nfectados apenas com malára (nfecção smples) possuem maor probabldade de sobrevvênca em relação aos que foram confectados (p<,1). As curvas de sobrevvênca estmadas pelo método de Kaplan-Meer para a covarável X2 (munzação) estão apresentadas na Fgura 6b. Observa-se que os camundongos que foram munzados possuem maor probabldade de sobrevvênca em relação aos que não foram munzados. O teste de Wlcoxon confrmou que há dferença sgnfcatva (p<,1) entre as curvas de sobrevvênca dos camundongos segundo a munzação. 21

28 1 (a) 1 (b) Probabldade de Sobrevvênca (%) X1: Confecção - Não Probabldade de Sobrevvênca (%) X2: Imunzação - Não 1 - Sm Tempo Sm Tempo 25 3 Fgura 6 Curvas de sobrevvênca estmadas pelo método de Kaplan-Meer para a covarável X1: Co-Infecção (a) e X2: Imunzação (b). O modelo de rscos proporconas de Cox (1972), apresentado na Seção 3, fo ajustado aos dados. A Tabela 4 apresenta um resumo dos resultados obtdos para o ajuste de modelos de Cox para as covaráves X1 e X2. Tabela 4 Ajuste do Modelo de Cox Covaráves no IC 95% (exp{β}) Modelo modelo Estmatvas (βˆ ) se(β) p-valor exp{β} LI LS MS1 X1: confecção 1,14,338 <,1 3,13 1,61 6,7 MS2 X2: munzação -1,99,391 <,1,137,637,295 MS3 X1: confecção 1,39,355 <,1 3,997 1,9915 8,22 X2: munzação -2,,41 <,1,111,498,249 A partr dos resultados apresentados na Tabela 4, observa-se que ambas as covaráves Confecção (X1) e Imunzação (X2) são sgnfcatvas para explcar os tempos de sobrevvênca dos camundongos. Os camundongos munzados têm menor chance de morte e a presença de confecção aumenta a chance de mortaldade em cerca de 4 vezes. A nteração entre as covaráves X1 e X2 fo também consderada, mas com a presença desta nteração o modelo não convergu. 5.3 Modelo de Cox com covarável depentente do tempo O modelo de Cox com covarável dependente do tempo é um método bastante conhecdo e utlzado na lteratura. Portanto, consderamos este ajuste como a prmera aproxmação para a modelagem conjunta de dados longtudnas e de sobrevvênca. A Tabela 5 apresenta um resumo dos resultados obtdos através do ajuste de deste modelo para as covaráves X1, X2 e parastema, Y, que é dependente do tempo. 22

29 Modelo Tabela 5 Ajuste do Modelo de Cox com covarável dependente do tempo Covaráves no modelo Estmatvas (βˆ ) se(β) p-valor exp{β} IC 95% (exp{β}) LI LS MS4 Y: parastema,72,9 <,1 1,7 1,6 1,9 X1: confecção,977,373,9 2,66 1,28 5,52 MS5 Y: parastema,69,9 <,1 1,7 1,5 1,9 X2: munzação -,146,515,78,86,32 2,37 MS6 Y: parastema,7,13 <,1 1,7 1,5 1,1 MS7 MS8 MS9 MS1 X1: confecção 1,52,383,6 2,86 1,35 6,7 X2: munzação -,481,523,38,62,21 1,79 Y: parastema,6,13 <,1 1,6 1,4 1,9 X1: confecção 2,723,796,1 15,22 3, 72,42 X2: munzação -1,237,742,95,29,7 1,24 Y: parastema,85, <,1 1,9 1,5 1,13 X1*Y -,62,24,9,94,9,99 X2*Y,42,3,16 1,4,98 1,11 X1: confecção 2,579,758,1 13,19 2,99 58,21 X2: munzação -,543,553,33,58, 1,72 Y: parastema,92,19 <,1 1,1 1,6 1,14 X1*Y -,56,22,11,95,91,99 X1: confecção 2,417,717,1 11,21 2,75 45,72 Y: parastema,11,17 <,1 1,11 1,7 1,14 X1*Y -,54,21,11,95,91,99 Observa-se que a presença da covarável longtudnal no modelo acarreta a perda de sgnfcânca da munzação (X2). Ou seja, ao nclur a parastema (Y) como covarável no modelo, esta absorve a nformação do efeto de X2, tornando esta últma não sgnfcatva. Como o objetvo prncpal do expermento é avalar o efeto de tratamento sob a sobrevvênca e sobre a parastema do camundongo, o modelo de Cox com covarável dependente do tempo torna-se aparentemente nefcaz. O modelo MS1 destacado aponta a confecção (X1), a parastema (Y) e a nteração entre estas duas como sgnfcatvas para estmar o tempo de sobrevvênca dos camundongos. O ajuste do modelo de Cox com a varável longtudnal dcotomzada, Y, como covarável dependente do tempo também fo consderado, mas essa medda não se mostrou sgnfcatva, portanto os resultados deste ajuste foram omtdos. 23

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência. MODELO DE REGRESSÃO DE COX Os modelos de regressão paramétrcos vstos anterormente exgem que se suponha uma dstrbução estatístca para o tempo de sobrevvênca. Contudo esta suposção, caso não sea adequada,

Leia mais

MODELOS DE REGRESSÃO PARAMÉTRICOS

MODELOS DE REGRESSÃO PARAMÉTRICOS MODELOS DE REGRESSÃO PARAMÉTRICOS Às vezes é de nteresse nclur na análse, característcas dos ndvíduos que podem estar relaconadas com o tempo de vda. Estudo de nsufcênca renal: verfcar qual o efeto da

Leia mais

4 Critérios para Avaliação dos Cenários

4 Critérios para Avaliação dos Cenários Crtéros para Avalação dos Cenáros É desejável que um modelo de geração de séres sntétcas preserve as prncpas característcas da sére hstórca. Isto quer dzer que a utldade de um modelo pode ser verfcada

Leia mais

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo 3 Metodologa de Avalação da Relação entre o Custo Operaconal e o Preço do Óleo Este capítulo tem como objetvo apresentar a metodologa que será empregada nesta pesqusa para avalar a dependênca entre duas

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

Regressão Múltipla. Parte I: Modelo Geral e Estimação

Regressão Múltipla. Parte I: Modelo Geral e Estimação Regressão Múltpla Parte I: Modelo Geral e Estmação Regressão lnear múltpla Exemplos: Num estudo sobre a produtvdade de trabalhadores ( em aeronave, navos) o pesqusador deseja controlar o número desses

Leia mais

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

DEFINIÇÃO - MODELO LINEAR GENERALIZADO DEFINIÇÃO - MODELO LINEAR GENERALIZADO 1 Um modelo lnear generalzado é defndo pelos seguntes três componentes: Componente aleatóro; Componente sstemátco; Função de lgação; Componente aleatóro: Um conjunto

Leia mais

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS 1 A análse de dagnóstco (ou dagnóstco do ajuste) confgura uma etapa fundamental no ajuste de modelos de regressão. O objetvo prncpal da análse de dagnóstco

Leia mais

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados Modelo lnear normal com erros heterocedástcos O método de mínmos quadrados ponderados Varâncas homogêneas Varâncas heterogêneas y y x x Fgura 1 Ilustração da dstrbução de uma varável aleatóra y (condconal

Leia mais

3 A técnica de computação intensiva Bootstrap

3 A técnica de computação intensiva Bootstrap A técnca de computação ntensva ootstrap O termo ootstrap tem orgem na expressão de língua nglesa lft oneself by pullng hs/her bootstrap, ou seja, alguém levantar-se puxando seu própro cadarço de bota.

Leia mais

Associação entre duas variáveis quantitativas

Associação entre duas variáveis quantitativas Exemplo O departamento de RH de uma empresa deseja avalar a efcáca dos testes aplcados para a seleção de funconáros. Para tanto, fo sorteada uma amostra aleatóra de 50 funconáros que fazem parte da empresa

Leia mais

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca

Leia mais

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados Modelo lnear clássco com erros heterocedástcos O método de mínmos quadrados ponderados 1 Varâncas homogêneas Varâncas heterogêneas y y x x Fgura 1 Ilustração da dstrbução de uma varável aleatóra y (condconal

Leia mais

Métodos Avançados em Epidemiologia

Métodos Avançados em Epidemiologia Unversdade Federal de Mnas Geras Insttuto de Cêncas Exatas Departamento de Estatístca Métodos Avançados em Epdemologa Aula 5-1 Regressão Lnear Smples: Estmação e Interpretação da Reta Tabela ANOVA e R

Leia mais

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária.

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária. Modelagem multvarável com varáves quanttatvas e qualtatvas, com resposta bnára. O modelo de regressão não lnear logístco ou modelo logístco é utlzado quando a varável resposta é qualtatva com dos resultados

Leia mais

REGRESSÃO NÃO LINEAR 27/06/2017

REGRESSÃO NÃO LINEAR 27/06/2017 7/06/07 REGRESSÃO NÃO LINEAR CUIABÁ, MT 07/ Os modelos de regressão não lnear dferencam-se dos modelos lneares, tanto smples como múltplos, pelo fato de suas varáves ndependentes não estarem separados

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ 1 É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral. DEFINIÇÕES ADICIONAIS: PROBABILIDADE Espaço amostral (Ω) é o conjunto de todos os possíves resultados de um expermento. Evento é qualquer subconjunto do espaço amostral. Evento combnado: Possu duas ou

Leia mais

Capítulo 1. Exercício 5. Capítulo 2 Exercício

Capítulo 1. Exercício 5. Capítulo 2 Exercício UNIVERSIDADE FEDERAL DE GOIÁS CIÊNCIAS ECONÔMICAS ECONOMETRIA (04-II) PRIMEIRA LISTA DE EXERCÍCIOS Exercícos do Gujarat Exercíco 5 Capítulo Capítulo Exercíco 3 4 5 7 0 5 Capítulo 3 As duas prmeras demonstrações

Leia mais

1. CORRELAÇÃO E REGRESSÃO LINEAR

1. CORRELAÇÃO E REGRESSÃO LINEAR 1 CORRELAÇÃO E REGREÃO LINEAR Quando deseja-se estudar se exste relação entre duas varáves quanttatvas, pode-se utlzar a ferramenta estatístca da Correlação Lnear mples de Pearson Quando essa correlação

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-4 PROJETO e ANÁLISE de EPERIMENTOS Professor: Rodrgo A. Scarpel rodrgo@ta.br www.mec.ta.br/~rodrgo Programa do curso: Semana Conteúdo Apresentação da dscplna. Prncípos de modelos lneares de regressão.

Leia mais

2 Incerteza de medição

2 Incerteza de medição 2 Incerteza de medção Toda medção envolve ensaos, ajustes, condconamentos e a observação de ndcações em um nstrumento. Este conhecmento é utlzado para obter o valor de uma grandeza (mensurando) a partr

Leia mais

Análise Exploratória de Dados

Análise Exploratória de Dados Análse Exploratóra de Dados Objetvos Análse de duas varáves quanttatvas: traçar dagramas de dspersão, para avalar possíves relações entre as duas varáves; calcular o coefcente de correlação entre as duas

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-4 PROJETO e ANÁLISE de EPERIMENTOS Professor: Rodrgo A. Scarpel rodrgo@ta.br www.mec.ta.br/~rodrgo Programa do curso: Semana Conteúdo Apresentação da dscplna. Prncípos de modelos lneares de regressão.

Leia mais

Algarismos Significativos Propagação de Erros ou Desvios

Algarismos Significativos Propagação de Erros ou Desvios Algarsmos Sgnfcatvos Propagação de Erros ou Desvos L1 = 1,35 cm; L = 1,3 cm; L3 = 1,30 cm L4 = 1,4 cm; L5 = 1,7 cm. Qual destas meddas está correta? Qual apresenta algarsmos com sgnfcado? O nstrumento

Leia mais

Análise de Regressão

Análise de Regressão Análse de Regressão método estatístco que utlza relação entre duas ou mas varáves de modo que uma varável pode ser estmada (ou predta) a partr da outra ou das outras Neter, J. et al. Appled Lnear Statstcal

Leia mais

Análise de influência

Análise de influência Análse de nfluênca Dzemos que uma observação é nfluente caso ela altere, de forma substancal, alguma propredade do modelo ajustado (como as estmatvas dos parâmetros, seus erros padrões, valores ajustados...).

Leia mais

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro. Aplcação Por exemplo, se prepararmos uma área expermental com todo cudado possível e fzermos, manualmente, o planto de 100 sementes seleconadas de um mlho híbrdo, cudando para que as sementes fquem na

Leia mais

Gráficos de Controle para Processos Autocorrelacionados

Gráficos de Controle para Processos Autocorrelacionados Gráfcos de Controle para Processos Autocorrelaconados Gráfco de controle de Shewhart: observações ndependentes e normalmente dstrbuídas. Shewhart ao crar os gráfcos de controle não exgu que os dados fossem

Leia mais

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16%

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16% Análse de Rsco 1 RISCO Rsco possbldade de perda. Quanto maor a possbldade, maor o rsco. Exemplo: Empresa X va receber $ 1.000 de uros em 30 das com títulos do governo. A empresa Y pode receber entre $

Leia mais

Capítulo 2. Modelos de Regressão

Capítulo 2. Modelos de Regressão Capítulo 2 Modelos de regressão 39 Capítulo 2 Modelos de Regressão Objetvos do Capítulo Todos os modelos são errados, mas alguns são útes George E P Box Algumas vezes fcamos assustados quando vemos engenheros

Leia mais

DELINEAMENTOS EXPERIMENTAIS

DELINEAMENTOS EXPERIMENTAIS SUMÁRIO 1 Delneamentos Expermentas 2 1.1 Delneamento Interamente Casualzado..................... 2 1.2 Delneamento Blocos Casualzados (DBC).................... 3 1.3 Delneamento Quadrado Latno (DQL)......................

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. vall@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ Em mutas stuações duas ou mas varáves estão relaconadas e surge então a necessdade de determnar a natureza deste relaconamento. A análse

Leia mais

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) UNDADE V DELNEAMENTO NTERAMENTE CASUALZADO (DC) CUABÁ, MT 015/ PROF.: RÔMULO MÔRA romulomora.webnode.com 1. NTRODUÇÃO Este delneamento apresenta como característca prncpal a necessdade de homogenedade

Leia mais

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES 1. Obtenha os estmadores dos coefcentes lnear e angular de um modelo de regressão lnear smples utlzando o método

Leia mais

7 - Distribuição de Freqüências

7 - Distribuição de Freqüências 7 - Dstrbução de Freqüêncas 7.1 Introdução Em mutas áreas há uma grande quantdade de nformações numércas que precsam ser dvulgadas de forma resumda. O método mas comum de resumr estes dados numércos consste

Leia mais

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos Curso de extensão, MMQ IFUSP, feverero/4 Alguns exercíco báscos I Exercícos (MMQ) Uma grandeza cujo valor verdadero x é desconhecdo, fo medda três vezes, com procedmentos expermentas dêntcos e, portanto,

Leia mais

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall Sstemas Intelgentes Aplcados Carlos Hall Programa do Curso Lmpeza/Integração de Dados Transformação de Dados Dscretzação de Varáves Contínuas Transformação de Varáves Dscretas em Contínuas Transformação

Leia mais

CORRELAÇÃO E REGRESSÃO

CORRELAÇÃO E REGRESSÃO CORRELAÇÃO E REGRESSÃO Constata-se, freqüentemente, a estênca de uma relação entre duas (ou mas) varáves. Se tal relação é de natureza quanttatva, a correlação é o nstrumento adequado para descobrr e medr

Leia mais

Estatística II Antonio Roque Aula 18. Regressão Linear

Estatística II Antonio Roque Aula 18. Regressão Linear Estatístca II Antono Roque Aula 18 Regressão Lnear Quando se consderam duas varáves aleatóras ao mesmo tempo, X e Y, as técncas estatístcas aplcadas são as de regressão e correlação. As duas técncas estão

Leia mais

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira UNIVERSIDADE DE PERNAMBUCO ESCOLA POLITÉCNICA DE PERNAMBUCO Físca Expermental Prof o José Wlson Vera wlson.vera@upe.br AULA 01: PROCESSOS DE ANÁLISE GRÁFICA E NUMÉRICA MODELO LINEAR Recfe, agosto de 2015

Leia mais

Modelagem do crescimento de clones de Eucalyptus via modelos não lineares

Modelagem do crescimento de clones de Eucalyptus via modelos não lineares Modelagem do crescmento de clones de Eucalyptus va modelos não lneares Joselme Fernandes Gouvea 2 Davd Venanco da Cruz 3 Máco Augusto de Albuquerque 3 José Antôno Alexo da Slva Introdução Os fenômenos

Leia mais

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES 1 O nosso objetvo é estudar a relação entre duas varáves quanttatvas. Eemplos:. Idade e altura das cranças.. v. Tempo de prátca de esportes e rtmo cardíaco

Leia mais

SELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP., NO PÓLO GESSEIRO DO ARARIPE

SELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP., NO PÓLO GESSEIRO DO ARARIPE SELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP, NO PÓLO GESSEIRO DO ARARIPE Jáder da Slva Jale Joselme Fernandes Gouvea Alne Santos de Melo Denns Marnho O R Souza Kléber Napoleão Nunes de

Leia mais

AULA EXTRA Análise de Regressão Logística

AULA EXTRA Análise de Regressão Logística 1 AULA EXTRA Análse de Regressão Logístca Ernesto F. L. Amaral 13 de dezembro de 2012 Metodologa de Pesqusa (DCP 854B) VARIÁVEL DEPENDENTE BINÁRIA 2 O modelo de regressão logístco é utlzado quando a varável

Leia mais

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EATAS DEPARTAMENTO DE ESTATÍSTICA UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

Leia mais

Regressão Logística Aplicada aos Casos de Sífilis Congênita no Estado do Pará

Regressão Logística Aplicada aos Casos de Sífilis Congênita no Estado do Pará Regressão Logístca Aplcada aos Casos de Sífls Congênta no Estado do Pará Crstane Nazaré Pamplona de Souza 1 Vanessa Ferrera Montero 1 Adrlayne dos Res Araújo 2 Edson Marcos Leal Soares Ramos 2 1 Introdução

Leia mais

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média. Estatístca Dscplna de Estatístca 0/ Curso de Admnstração em Gestão Públca Profª. Me. Valéra Espíndola Lessa e-mal: lessavalera@gmal.com Meddas de Dspersão Indcam se os dados estão, ou não, prómos uns dos

Leia mais

Regressão Linear Simples by Estevam Martins

Regressão Linear Simples by Estevam Martins Regressão Lnear Smples by Estevam Martns stvm@uol.com.br "O únco lugar onde o sucesso vem antes do trabalho, é no dconáro" Albert Ensten Introdução Mutos estudos estatístcos têm como objetvo estabelecer

Leia mais

Estimação Bayesiana das Fragilidades Individuais de Pacientes em Tratamento de Hemodiálise

Estimação Bayesiana das Fragilidades Individuais de Pacientes em Tratamento de Hemodiálise Estmação Bayesana das Fragldades Indvduas de Pacentes em Tratamento de Hemodálse Grazela Dutra Rocha Gouvêa 2 Vera Lúca Damasceno Tomazella 3 João Domngos Scalon 4 Introdução Em análse de sobrevvênca consdera-se,

Leia mais

2 Metodologia de Medição de Riscos para Projetos

2 Metodologia de Medição de Riscos para Projetos 2 Metodologa de Medção de Rscos para Projetos Neste capítulo remos aplcar os concetos apresentados na seção 1.1 ao ambente de projetos. Um projeto, por defnção, é um empreendmento com metas de prazo, margem

Leia mais

Análise de Regressão Linear Múltipla IV

Análise de Regressão Linear Múltipla IV Análse de Regressão Lnear Múltpla IV Aula 7 Guarat e Porter, 11 Capítulos 7 e 8 He et al., 4 Capítulo 3 Exemplo Tomando por base o modelo salaro 1educ anosemp exp prev log 3 a senhorta Jole, gerente do

Leia mais

Identidade dos parâmetros de modelos segmentados

Identidade dos parâmetros de modelos segmentados Identdade dos parâmetros de modelos segmentados Dana Campos de Olvera Antono Polcarpo Souza Carnero Joel Augusto Munz Fabyano Fonseca e Slva 4 Introdução No Brasl, dentre os anmas de médo porte, os ovnos

Leia mais

Análise de Regressão Linear Múltipla VII

Análise de Regressão Linear Múltipla VII Análse de Regressão Lnear Múltpla VII Aula 1 Hej et al., 4 Seções 3. e 3.4 Hpótese Lnear Geral Seja y = + 1 x 1 + x +... + k x k +, = 1,,..., n. um modelo de regressão lnear múltpla, que pode ser escrto

Leia mais

Análise de Variância. Comparação de duas ou mais médias

Análise de Variância. Comparação de duas ou mais médias Análse de Varânca Comparação de duas ou mas médas Análse de varânca com um fator Exemplo Um expermento fo realzado para se estudar dabetes gestaconal. Desejava-se avalar o comportamento da hemoglobna (HbA)

Leia mais

3 Algoritmos propostos

3 Algoritmos propostos Algortmos propostos 3 Algortmos propostos Nesse trabalho foram desenvolvdos dos algortmos que permtem classfcar documentos em categoras de forma automátca, com trenamento feto por usuáros Tas algortmos

Leia mais

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA Análse de Regressão Profa Alcone Mranda dos Santos Departamento de Saúde Públca UFMA Introdução Uma das preocupações estatístcas ao analsar dados, é a de crar modelos que explctem estruturas do fenômeno

Leia mais

3 Método Numérico. 3.1 Discretização da Equação Diferencial

3 Método Numérico. 3.1 Discretização da Equação Diferencial 3 Método Numérco O presente capítulo apresenta a dscretação da equação dferencal para o campo de pressão e a ntegração numérca da expressão obtda anterormente para a Vscosdade Newtonana Equvalente possbltando

Leia mais

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média. Estatístca Dscplna de Estatístca 0/ Curso Superor de tecnólogo em Gestão Ambental Profª. Me. Valéra Espíndola Lessa e-mal: lessavalera@gmal.com Meddas de Dspersão Indcam se os dados estão, ou não, prómos

Leia mais

Reconhecimento Estatístico de Padrões

Reconhecimento Estatístico de Padrões Reconhecmento Estatístco de Padrões X 3 O paradgma pode ser sumarzado da segunte forma: Cada padrão é representado por um vector de característcas x = x1 x2 x N (,,, ) x x1 x... x d 2 = X 1 X 2 Espaço

Leia mais

Dissertação de Mestrado

Dissertação de Mestrado Dssertação de Mestrado O Modelo Paramétrco de Webull B-varado Para Modelagem de Dados com Censura Intervalar Por Fernanda Carla Álvares Das Dnz Orentadora Marta Afonso Fretas Belo Horzonte, 9 de outubro

Leia mais

Estatística Espacial: Dados de Área

Estatística Espacial: Dados de Área Estatístca Espacal: Dados de Área Dstrbução do número observado de eventos Padronzação e SMR Mapas de Probabldades Mapas com taxas empírcas bayesanas Padronzação Para permtr comparações entre dferentes

Leia mais

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas 3.6. Análse descrtva com dados agrupados Em algumas stuações, os dados podem ser apresentados dretamente nas tabelas de frequêncas. Netas stuações devemos utlzar estratégas específcas para obter as meddas

Leia mais

Estatística I Licenciatura MAEG 2006/07

Estatística I Licenciatura MAEG 2006/07 Estatístca I Lcencatura MAEG 006/07 AMOSTRAGEM. DISTRIBUIÇÕES POR AMOSTRAGEM.. Em determnada unversdade verfca-se que 30% dos alunos têm carro. Seleccona-se uma amostra casual smples de 0 alunos. a) Qual

Leia mais

DIFERENCIANDO SÉRIES TEMPORAIS CAÓTICAS DE ALEATÓRIAS ATRAVÉS DAS TREND STRIPS

DIFERENCIANDO SÉRIES TEMPORAIS CAÓTICAS DE ALEATÓRIAS ATRAVÉS DAS TREND STRIPS 177 DIFERENCIANDO SÉRIES TEMPORAIS CAÓTICAS DE ALEATÓRIAS ATRAVÉS DAS TREND STRIPS Antôno Carlos da Slva Flho Un-FACEF Introdução Trend Strps (TS) são uma nova técnca de análse da dnâmca de um sstema,

Leia mais

Cap. 11 Correlação e Regressão

Cap. 11 Correlação e Regressão Estatístca para Cursos de Engenhara e Informátca Pedro Alberto Barbetta / Marcelo Menezes Res / Antono Cezar Borna São Paulo: Atlas, 2004 Cap. 11 Correlação e Regressão APOIO: Fundação de Apoo à Pesqusa

Leia mais

Aula Características dos sistemas de medição

Aula Características dos sistemas de medição Aula - Característcas dos sstemas de medção O comportamento funconal de um sstema de medção é descrto pelas suas característcas (parâmetros) operaconas e metrológcas. Aqu é defnda e analsada uma sére destes

Leia mais

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 014 Estatístca Descrtva e Análse Exploratóra Etapas ncas. Utlzadas para descrever e resumr os dados. A dsponbldade de uma grande quantdade de dados e de

Leia mais

Contabilometria. Aula 8 Regressão Linear Simples

Contabilometria. Aula 8 Regressão Linear Simples Contalometra Aula 8 Regressão Lnear Smples Orgem hstórca do termo Regressão Le da Regressão Unversal de Galton 1885 Galton verfcou que, apesar da tendênca de que pas altos tvessem flhos altos e pas axos

Leia mais

PRESSUPOSTOS DO MODELO DE REGRESSÃO

PRESSUPOSTOS DO MODELO DE REGRESSÃO PREUPOTO DO MODELO DE REGREÃO A aplcação do modelo de regressão lnear múltpla (bem como da smples) pressupõe a verfcação de alguns pressupostos que condensamos segudamente.. Os erros E são varáves aleatóras

Leia mais

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma Capítulo 8 Dferencação Numérca Quase todos os métodos numércos utlzados atualmente para obtenção de soluções de equações erencas ordnáras e parcas utlzam algum tpo de aproxmação para as dervadas contínuas

Leia mais

Análise Exploratória de Dados

Análise Exploratória de Dados Análse Exploratóra de Dados Objetvos Análse de duas varáves quanttatvas: obter uma reta que se ajuste aos dados segundo o crtéro de mínmos quadrados; apresentar outros crtéros para a determnação de uma

Leia mais

3. Estatística descritiva bidimensional

3. Estatística descritiva bidimensional 3. Estatístca descrtva bdmensonal (Tabelas, Gráfcos e números) Análse bvarada (ou bdmensonal): avala o comportamento de uma varável em função da outra, por exemplo: Quantas TV Phlps são venddas na regão

Leia mais

Testes não-paramétricos

Testes não-paramétricos Testes não-paramétrcos Prof. Lorí Val, Dr. http://www.mat.ufrgs.br/val/ val@mat.ufrgs.br Um teste não paramétrco testa outras stuações que não parâmetros populaconas. Estas stuações podem ser relaconamentos,

Leia mais

Universidade de São Paulo Escola Superior de Agricultura Luiz de Queiroz Departamento de Ciências Exatas

Universidade de São Paulo Escola Superior de Agricultura Luiz de Queiroz Departamento de Ciências Exatas Unversdade de São Paulo Escola Superor de Agrcultura Luz de Queroz Departamento de Cêncas Exatas Prova escrta de seleção para DOUTORADO em Estatístca e Expermentação Agronômca Nome do canddato (a): Questão

Leia mais

Regressão Linear Simples. Frases. Roteiro

Regressão Linear Simples. Frases. Roteiro Regressão Lnear Smples Frases Por serem mas precsos que as palavras, os números são partcularmente adequados para transmtr conclusões centífcas Pagano e Gauvre, 4 Rotero. Modelagem de Relação. Modelo Lnear

Leia mais

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro UNIVERIDADE DE ÃO PAULO FACULDADE DE ECONOMIA, ADMINITRAÇÃO E CONTABILIDADE DE RIBEIRÃO PRETO DEPARTAMENTO DE ADMINITRAÇÃO RAD1507 Estatístca Aplcada à Admnstração I Prof. Dr. Evandro Marcos adel Rbero

Leia mais

PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011

PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011 Instruções: PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 00/0 Cada uestão respondda corretamente vale (um) ponto. Cada uestão respondda ncorretamente vale - (menos um) ponto. Cada uestão

Leia mais

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA APLICAÇÃO NO CONTROLE DE QUALIDADE DE FÁRMACOS Prof. Dr. Marcelo Martns de Sena MÓDULO 04 Undade Unverstára de Cêncas Eatas e Tecnológcas UnUCET Anápols 1 MÓDULO 04

Leia mais

ALGORITMOS PARA DADOS AUMENTADOS

ALGORITMOS PARA DADOS AUMENTADOS ALGORITMOS PARA DADOS AUMNTADOS. INTRODUÇÃO Dos algortmos baseados na consderação de dados latentes. Temos os dados efetvamente observados e de uma manera convenente aumentamos esses dados ntroduzndo os

Leia mais

Inferência Estatística e Aplicações II. Edson Zangiacomi Martinez Departamento de Medicina Social FMRP/USP

Inferência Estatística e Aplicações II. Edson Zangiacomi Martinez Departamento de Medicina Social FMRP/USP Inferênca Estatístca e Aplcações II Edson Zangacom Martnez Departamento de Medcna Socal FMRP/USP edson@fmrp.usp.br Métodos Bayesanos Edson Zangacom Martnez Cênca Hoje, julho de 2006 Thomas Bayes Thomas

Leia mais

5 Relação entre Análise Limite e Programação Linear 5.1. Modelo Matemático para Análise Limite

5 Relação entre Análise Limite e Programação Linear 5.1. Modelo Matemático para Análise Limite 5 Relação entre Análse Lmte e Programação Lnear 5.. Modelo Matemátco para Análse Lmte Como fo explcado anterormente, a análse lmte oferece a facldade para o cálculo da carga de ruptura pelo fato de utlzar

Leia mais

Notas Processos estocásticos. Nestor Caticha 23 de abril de 2012

Notas Processos estocásticos. Nestor Caticha 23 de abril de 2012 Notas Processos estocástcos Nestor Catcha 23 de abrl de 2012 notas processos estocástcos 2 O Teorema de Perron Frobenus para matrzes de Markov Consdere um processo estocástco representado por um conunto

Leia mais

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA CAPÍTULO DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA. A MÉDIA ARITMÉTICA OU PROMÉDIO Defnção: é gual a soma dos valores do grupo de dados dvdda pelo número de valores. X x Soma dos valores de x número de

Leia mais

Alternativas ao modelo de Cox na análise de dados de sobrevivência com covariáveis dependentes no tempo

Alternativas ao modelo de Cox na análise de dados de sobrevivência com covariáveis dependentes no tempo Alternatvas ao modelo de Cox na análse de dados de sobrevvênca com covaráves dependentes no tempo Luís Machado Departamento de Matemátca para a Cênca e a Tecnologa, Unversdade do Mnho Carmen Cadarso-Suárez

Leia mais

Teoria Elementar da Probabilidade

Teoria Elementar da Probabilidade 10 Teora Elementar da Probabldade MODELOS MATEMÁTICOS DETERMINÍSTICOS PROBABILÍSTICOS PROCESSO (FENÓMENO) ALEATÓRIO - Quando o acaso nterfere na ocorrênca de um ou mas dos resultados nos quas tal processo

Leia mais

NAYARA NEGRÃO PEREIRA MODELOS NÃO LINEARES MISTOS NA ANÁLISE DE CURVAS DE CRESCIMENTO DE BOVINOS DA RAÇA TABAPUÃ

NAYARA NEGRÃO PEREIRA MODELOS NÃO LINEARES MISTOS NA ANÁLISE DE CURVAS DE CRESCIMENTO DE BOVINOS DA RAÇA TABAPUÃ NAYARA NEGRÃO PEREIRA MODELOS NÃO LINEARES MISTOS NA ANÁLISE DE CURVAS DE CRESCIMENTO DE BOVINOS DA RAÇA TABAPUÃ Dssertação apresentada à Unversdade Federal de Vçosa como parte das exgêncas do Programa

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Classificadores Lineares. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Classificadores Lineares. Luiz Eduardo S. Oliveira, Ph.D. Unversdade Federal do Paraná Departamento de Informátca Reconhecmento de Padrões Classfcadores Lneares Luz Eduardo S. Olvera, Ph.D. http://lesolvera.net Objetvos Introduzr os o conceto de classfcação lnear.

Leia mais

EXERCÍCIO: VIA EXPRESSA CONTROLADA

EXERCÍCIO: VIA EXPRESSA CONTROLADA EXERCÍCIO: VIA EXPRESSA CONTROLADA Engenhara de Tráfego Consdere o segmento de va expressa esquematzado abaxo, que apresenta problemas de congestonamento no pco, e os dados a segur apresentados: Trechos

Leia mais

Programa de Certificação de Medidas de um laboratório

Programa de Certificação de Medidas de um laboratório Programa de Certfcação de Meddas de um laboratóro Tratamento de dados Elmnação de dervas Programa de calbração entre laboratóros Programa nterno de calbração justes de meddas a curvas Tratamento dos resultados

Leia mais

INTRODUÇÃO À PROBABILIDADE. A probabilidade é uma medida da incerteza dos fenômenos. Traduz-se por um número real compreendido de 0 ( zero) e 1 ( um).

INTRODUÇÃO À PROBABILIDADE. A probabilidade é uma medida da incerteza dos fenômenos. Traduz-se por um número real compreendido de 0 ( zero) e 1 ( um). INTRODUÇÃO À PROILIDDE teora das probabldade nada mas é do que o bom senso transformado em cálculo probabldade é o suporte para os estudos de estatístca e expermentação. Exemplos: O problema da concdênca

Leia mais

UMA VALIDAÇÃO MATEMÁTICA PARA UM ALGORITMO QUE SIMULA MISTURAS DE DISTRIBUIÇÕES

UMA VALIDAÇÃO MATEMÁTICA PARA UM ALGORITMO QUE SIMULA MISTURAS DE DISTRIBUIÇÕES UMA VALIDAÇÃO MATEMÁTICA PARA UM ALGORITMO QUE SIMULA MISTURAS DE DISTRIBUIÇÕES Ana Paula Coelho MADEIRA Lucas Montero CHAVES Devanl Jaques de SOUZA Resumo: Uma valdação matemátca, utlzando o conceto de

Leia mais

5 Implementação Procedimento de segmentação

5 Implementação Procedimento de segmentação 5 Implementação O capítulo segunte apresenta uma batera de expermentos prátcos realzados com o objetvo de valdar o método proposto neste trabalho. O método envolve, contudo, alguns passos que podem ser

Leia mais

ANÁLISE DA VARIÂNCIA DA REGRESSÃO

ANÁLISE DA VARIÂNCIA DA REGRESSÃO ANÁLISE DA VARIÂNCIA DA REGRESSÃO PROCEDIMENTO GERAL DE REGRESSÃO Em um modelo de análse de varânca, como no DIA, o fator em estudo pode ser quanttatvo ou qualtatvo. FATOR QUANTITATIVO: é aquele cujos

Leia mais

5 Métodos de cálculo do limite de retenção em função da ruína e do capital inicial

5 Métodos de cálculo do limite de retenção em função da ruína e do capital inicial 5 Métodos de cálculo do lmte de retenção em função da ruína e do captal ncal Nesta dssertação serão utlzados dos métodos comparatvos de cálculo de lmte de retenção, onde ambos consderam a necessdade de

Leia mais

UM PROBLEMA ECONOMÉTRICO NO USO DE VARIÁVEIS CLIMÁTICAS EM FUNÇÕES DE PRODUÇÃO AJUSTADAS A DADOS EXPERIMENTAIS

UM PROBLEMA ECONOMÉTRICO NO USO DE VARIÁVEIS CLIMÁTICAS EM FUNÇÕES DE PRODUÇÃO AJUSTADAS A DADOS EXPERIMENTAIS UM PROBLEMA ECONOMÉTRICO NO USO DE VARIÁVEIS CLIMÁTICAS EM FUNÇÕES DE PRODUÇÃO AJUSTADAS A DADOS EXPERIMENTAIS Rodolfo Hoffmann * Vctor Hugo da Fonseca Porto ** SINOPSE Neste trabalho deduz-se qual é o

Leia mais