Exemplo Regressão Binomial Dados Emparelhados Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2013 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 1 / 27
Desenvolvimento de Diabetes Sumário 1 Desenvolvimento de Diabetes 2 Análise de Dados Preliminar 3 Modelo Condicional 4 Modelo Condicional 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 2 / 27
Desenvolvimento de Diabetes Desenvolvimento de Diabetes Descrição dos Dados Como aplicação de modelos binomiais para a análise de dados emparelhados discutimos a seguir um estudo cujo objetivo principal foi avaliar o efeito da obesidade, do histórico familiar e de atividades físicas no desenvolvimento de diabetes não dependente de insulina (Lee, 1991, p. 312). 30 indivíduos não diabéticos foram emparelhados com 30 indivíduos diabéticos não dependentes de insulina pela idade e pelo sexo. A obesidade foi medida através do índice de massa coporal (IMC). O histórico familiar com diabetes (HF) e as atividades físicas (ATF) foram tratadas como sendo variáveis binárias (=1 presença, =0 ausência). G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 3 / 27
Desenvolvimento de Diabetes Desenvolvimento de Diabetes Descrição dos Dados Casos Controles Par IMC HF ATF IMC HF ATF 1 22,1 1 1 26,7 0 1 2 31,3 0 0 24,4 0 1 3 33,8 1 0 29,4 0 0 4 33,7 1 1 26,0 0 0 5 23,1 1 1 24,2 1 0 6 26,8 1 0 29,7 0 0 7 32,3 1 0 30,2 0 1 8 31,4 1 0 23,4 0 1 9 37,6 1 0 42,4 0 0 10 32,4 1 0 25,8 0 0 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 4 / 27
Desenvolvimento de Diabetes Desenvolvimento de Diabetes Descrição dos Dados Casos Controles Par IMC HF ATF IMC HF ATF 11 29,1 0 1 39,8 0 1 12 28,6 0 1 31,6 0 0 13 35,9 0 0 21,8 1 1 14 30,4 0 0 24,2 0 1 15 39,8 0 0 27,8 1 1 16 43,3 1 0 37,5 1 1 17 32,5 0 0 27,9 1 1 18 28,7 0 1 25,3 1 0 19 30,3 0 0 31,3 0 1 20 32,5 1 0 34,5 1 1 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 5 / 27
Desenvolvimento de Diabetes Desenvolvimento de Diabetes Descrição dos Dados Casos Controles Par IMC HF ATF IMC HF ATF 21 32,5 1 0 25,4 0 1 22 21,6 1 1 27,0 1 1 23 24,4 0 1 31,1 0 0 24 46,7 1 0 27,3 0 1 25 28,6 1 1 24,0 0 0 26 29,7 0 0 33,5 0 0 27 29,6 0 1 20,7 0 0 28 22,8 0 0 29,2 1 1 29 34,8 1 0 30,0 0 1 30 37,3 1 0 26,5 0 0 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 6 / 27
Análise de Dados Preliminar Sumário 1 Desenvolvimento de Diabetes 2 Análise de Dados Preliminar 3 Modelo Condicional 4 Modelo Condicional 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 7 / 27
Análise de Dados Preliminar Histórico Familiar Descrição dos Dados HF Grupo Sim Não Total Casos 17 13 30 Controles 9 21 30 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 8 / 27
Análise de Dados Preliminar Histórico Familiar Descrição dos Dados HF Grupo Sim Não Total Casos 17 13 30 Controles 9 21 30 Descrição dos Dados HF Grupo Sim Não Total Casos 57,7% 43,3% 100% Controles 30,0% 70,0% 100% G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 8 / 27
Análise de Dados Preliminar Atividades Físicas Descrição dos Dados ATF Grupo Sim Não Total Casos 10 20 30 Controles 17 13 30 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 9 / 27
Análise de Dados Preliminar Atividades Físicas Descrição dos Dados ATF Grupo Sim Não Total Casos 10 20 30 Controles 17 13 30 Descrição dos Dados ATF Grupo Sim Não Total Casos 33,3% 66,7% 100% Controles 56,7% 43,3% 100% G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 9 / 27
Análise de Dados Preliminar Boxplots Índice de Massa Corporal Casos Controles IMC 25 30 35 40 45 IMC 20 25 30 35 40 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 10 / 27
Análise de Dados Preliminar Boxplot Diferença Índice de Massa Corporal Diferença IMC 10 5 0 5 10 15 20 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 11 / 27
Modelo Condicional Sumário 1 Desenvolvimento de Diabetes 2 Análise de Dados Preliminar 3 Modelo Condicional 4 Modelo Condicional 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 12 / 27
Modelo Condicional Modelo Condicional Descrição das Variáveis Denotaremos por x i11, x i12 e x i13, respectivamente, o valor da massa corporal (IMC) (definida como sendo o peso (em kg) dividido pela altura (em metros quadrados)), histórico familiar (HF) e atividades físicas (ATF) para o i-ésimo indivíduo diabético. Analogamente definimos por x i21, x i22 e x i23 os valores dessas variáveis para o i-ésimo indivíduo não diabético. G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 13 / 27
Modelo Condicional Sumário 1 Desenvolvimento de Diabetes 2 Análise de Dados Preliminar 3 Modelo Condicional 4 Modelo Condicional 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 14 / 27
Modelo Condicional Modelo Condicional Descrição O logaritmo da função de verossimilhança do modelo condicional pode ser expressa na seguinte forma: { } l(β) = log[π 30 exp(zi1 β 1 + z i2 β 2 + z i3 β 3 ) i=1 ]. 1+exp(z i1 β 1 + z i2 β 2 + z i3 β 3 ) em que z i1 = x i11 x i21, z i2 = x i12 x i22 e z i3 = x i13 x i23, (i = 1,...,30). G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 15 / 27
Modelo Condicional Modelo Condicional Descrição O logaritmo da função de verossimilhança do modelo condicional pode ser expressa na seguinte forma: { } l(β) = log[π 30 exp(zi1 β 1 + z i2 β 2 + z i3 β 3 ) i=1 ]. 1+exp(z i1 β 1 + z i2 β 2 + z i3 β 3 ) em que z i1 = x i11 x i21, z i2 = x i12 x i22 e z i3 = x i13 x i23, (i = 1,...,30). Interpretação l(β) coincide com o logaritmo da função de verossimilhança de uma regressão logística com 30 ensaios, 30 sucessos, valores de variáveis explicativas z i1, z i2 e z i3 e passando pela origem. Portanto, podemos ajustar essa regressão logística para encontrar ˆβ e Var(ˆβ). G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 15 / 27
Resultados Modelo Ajustado Sumário 1 Desenvolvimento de Diabetes 2 Análise de Dados Preliminar 3 Modelo Condicional 4 Modelo Condicional 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 16 / 27
Resultados Modelo Ajustado Modelo Condicional Estimativas Efeito Estimativa Valor-z Valor-P IMC 0,090 1,38 0,167 HF 0,968 1,65 0,099 ATF -0,563-1,04 0,298 Indícios de efeito significativo (ao nível de 10%) apenas para o histórico familiar. G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 17 / 27
Resultados Modelo Ajustado Diagnóstico Modelo Ajustado Distancia de Cook 0.0 0.2 0.4 0.6 18 28 Residuo Componente do Desvio 0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0 5 10 15 20 25 30 Indice 0 5 10 15 20 25 30 Indice G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 18 / 27
Resultados Modelo Ajustado Interpretações Eliminação de Grupos Efeito Sem 18 Sem 28 Sem (18,28) IMC -23,67% 39,78% 16,69% valor-z 1,03 1,70 1,40 HF 43,72% 29,05% 75,31% valor-z 2,04 1,91 2,20 ATF -69,39% 47,97% -24,42% valor-z -1,55-0,50-1,08 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 19 / 27
Resultados Modelo Ajustado Modelo Condicional Final Estimativas Efeito Estimativa Valor-z Valor-P IMC 0,111 1,78 0,074 HF 0,893 1,57 0,116 Indícios de efeito significativo (ao nível de 10%) apenas para índice de massa muscular. G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 20 / 27
Resultados Modelo Ajustado Diagnóstico Modelo Final Distancia de Cook 0.0 0.1 0.2 0.3 0.4 11 28 Residuo Componente do Desvio 0 1 2 3 0 5 10 15 20 25 30 Indice 0 5 10 15 20 25 30 Indice G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 21 / 27
Resultados Modelo Ajustado Interpretações Eliminação de Grupos Efeito Sem 11 Sem 28 Sem (11,28) IMC 34,20% 26,03% -78,24% valor-z 2,08 2,03 2,29 HF 3,35% 39,09% 54,02% valor-z 1,54 1,90 1,90 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 22 / 27
Resultados Modelo Ajustado Interpretações Razão de Chances A razão de chances entre um indíviduo com (IMC + 1) e um indivíduo com IMC é estimada por ˆψ = exp(0, 111) = 1, 12. Portanto, aumentando-se o índice de massa corporal em 1 unidade espera-se aumento da chance de diabetes não dependente de insulina em aproximadamente 12%. G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 23 / 27
Conclusões Sumário 1 Desenvolvimento de Diabetes 2 Análise de Dados Preliminar 3 Modelo Condicional 4 Modelo Condicional 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 24 / 27
Conclusões Conclusões Considerações Finais Portanto, podemos concluir que as variáveis índice de massa muscular e histórico familiar parecem estar associadas com o desenvolvimento de diabetes não dependente de insulina. Todavia, a alta sensibilidade das estimativas dos efeitos dessas duas variáveis detectada pela distância de Cook indica a necessidade do estudo ser repetido para uma amostra maior de emparelhamentos. G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 25 / 27
Referências Sumário 1 Desenvolvimento de Diabetes 2 Análise de Dados Preliminar 3 Modelo Condicional 4 Modelo Condicional 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 26 / 27
Referências Referências Referência Lee, E. T. (1991). Statistical Methods for Survival Data Analysis, Second Edition. John Wiley, New York. G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 27 / 27