Exemplo Regressão Binomial Dados Emparelhados



Documentos relacionados
Faturamento de Restaurantes

Exemplo Vida Útil de Ferramentas

Faturamento de Restaurantes

Exemplos Modelos de Quase-Verossimilhança

Exemplos Equações de Estimação Generalizadas

Exame da OAB. Gilberto A. Paula. Departamento de Estatística IME-USP, Brasil

Exemplos Modelos Binomiais de Dose-Resposta

Exemplo Preferência de Automóveis

O USO DE MODELOS DE REGRESSÃO LOGÍSTICA PARA AVALIAÇÃO DO PROBLEMA DE EVASÃO DE ALUNOS NO CURSO DE QUÍMICA INDUSTRIAL DA UNUCET-UEG

Disciplina de Modelos Lineares Professora Ariane Ferreira

Exemplo Regressão Linear Simples

INTRODUÇÃO A ECONOMETRIA

Ajuste e comparação de modelos para dados grupados e censurados

Exemplo Regressão Linear Múltipla

Introdução ao modelo de Regressão Linear

UMA ANÁLISE ECONOMÉTRICA DO ICMS *

PROGRAMA DE DISCIPLINA MÉTODOS ESTATÍSTICOS EM EPIDEMIOLOGIA

Classificação de dados em modelos com resposta binária via algoritmo boosting e regressão logística

1 z 1 1 z 2. Z =. 1 z n

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

CONHECIMENTOS ESPECÍFICOS

Aplicação da análise de regressão na contabilidade do custo de produção do milho

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

Procedimento Complementar para Validação de Métodos Analíticos e Bioanalíticos usando Análise de Regressão Linear

Comparando equações de regressão em dados de saúde

Modelos de Regressão Linear Simples - parte II

Dimensionamento de ensaios de não inferioridade para o caso de grupos paralelos e resposta binária: algumas comparações

Quantis residuais. Luziane Franciscon Acadêmica de Estatística Universidade Federal do Paraná

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Multicolinariedade e Autocorrelação

Quiz Econometria I versão 1

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

Modelos Lineares Generalizados - Regressão Logística

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti.

Aula 2 Uma breve revisão sobre modelos lineares

Dimensionamento de amostras para regressão logística

USO DE PLANEJAMENTO COMPOSTO CENTRAL NA AVALIAÇÃO DAS VARIÁVEIS TEMPERAURA E CONCENTRAÇÃO DE SOLVENTES NO ESTUDO DA SOLUBILIDADE DA UREIA

aula ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES

Esse material foi extraído de Barbetta (2007 cap 13)

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA DENNIS LEÃO GRR LUAN FIORENTIN GRR

AULA 8 - MQO em regressão múltipla:

Regressão Linear Múltipla no R MAE-0217: ESTATÍSTICA DESCRITIVA MAIO DE 2017 PROFESSORA: MÁRCIA D ELIA BRANCO

Econometria. Regressão Linear Simples Lista de Exercícios

Modelo de regressão log-weibull-exponenciada para dados com censura intervalar

PROCEDIMENTO PARA A ESCOLHA DE UMA DISTRIBUIÇÃO

Instituto Federal Goiano

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos

Probabilidades e Estatística - LEIC + LERCI + LEE 2 o semestre 2004/05

Análise de modelos lineares mistos com dois fatores longitudinais: um fator quantitativo e um qualitativo ordinal.

Análise de Regressão EST036

Modelos de Regressão Múltipla - Parte I

Análise do acidente do Titanic

Modelos de Regressão Linear Simples - parte III

Transcrição:

Exemplo Regressão Binomial Dados Emparelhados Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2013 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 1 / 27

Desenvolvimento de Diabetes Sumário 1 Desenvolvimento de Diabetes 2 Análise de Dados Preliminar 3 Modelo Condicional 4 Modelo Condicional 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 2 / 27

Desenvolvimento de Diabetes Desenvolvimento de Diabetes Descrição dos Dados Como aplicação de modelos binomiais para a análise de dados emparelhados discutimos a seguir um estudo cujo objetivo principal foi avaliar o efeito da obesidade, do histórico familiar e de atividades físicas no desenvolvimento de diabetes não dependente de insulina (Lee, 1991, p. 312). 30 indivíduos não diabéticos foram emparelhados com 30 indivíduos diabéticos não dependentes de insulina pela idade e pelo sexo. A obesidade foi medida através do índice de massa coporal (IMC). O histórico familiar com diabetes (HF) e as atividades físicas (ATF) foram tratadas como sendo variáveis binárias (=1 presença, =0 ausência). G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 3 / 27

Desenvolvimento de Diabetes Desenvolvimento de Diabetes Descrição dos Dados Casos Controles Par IMC HF ATF IMC HF ATF 1 22,1 1 1 26,7 0 1 2 31,3 0 0 24,4 0 1 3 33,8 1 0 29,4 0 0 4 33,7 1 1 26,0 0 0 5 23,1 1 1 24,2 1 0 6 26,8 1 0 29,7 0 0 7 32,3 1 0 30,2 0 1 8 31,4 1 0 23,4 0 1 9 37,6 1 0 42,4 0 0 10 32,4 1 0 25,8 0 0 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 4 / 27

Desenvolvimento de Diabetes Desenvolvimento de Diabetes Descrição dos Dados Casos Controles Par IMC HF ATF IMC HF ATF 11 29,1 0 1 39,8 0 1 12 28,6 0 1 31,6 0 0 13 35,9 0 0 21,8 1 1 14 30,4 0 0 24,2 0 1 15 39,8 0 0 27,8 1 1 16 43,3 1 0 37,5 1 1 17 32,5 0 0 27,9 1 1 18 28,7 0 1 25,3 1 0 19 30,3 0 0 31,3 0 1 20 32,5 1 0 34,5 1 1 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 5 / 27

Desenvolvimento de Diabetes Desenvolvimento de Diabetes Descrição dos Dados Casos Controles Par IMC HF ATF IMC HF ATF 21 32,5 1 0 25,4 0 1 22 21,6 1 1 27,0 1 1 23 24,4 0 1 31,1 0 0 24 46,7 1 0 27,3 0 1 25 28,6 1 1 24,0 0 0 26 29,7 0 0 33,5 0 0 27 29,6 0 1 20,7 0 0 28 22,8 0 0 29,2 1 1 29 34,8 1 0 30,0 0 1 30 37,3 1 0 26,5 0 0 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 6 / 27

Análise de Dados Preliminar Sumário 1 Desenvolvimento de Diabetes 2 Análise de Dados Preliminar 3 Modelo Condicional 4 Modelo Condicional 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 7 / 27

Análise de Dados Preliminar Histórico Familiar Descrição dos Dados HF Grupo Sim Não Total Casos 17 13 30 Controles 9 21 30 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 8 / 27

Análise de Dados Preliminar Histórico Familiar Descrição dos Dados HF Grupo Sim Não Total Casos 17 13 30 Controles 9 21 30 Descrição dos Dados HF Grupo Sim Não Total Casos 57,7% 43,3% 100% Controles 30,0% 70,0% 100% G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 8 / 27

Análise de Dados Preliminar Atividades Físicas Descrição dos Dados ATF Grupo Sim Não Total Casos 10 20 30 Controles 17 13 30 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 9 / 27

Análise de Dados Preliminar Atividades Físicas Descrição dos Dados ATF Grupo Sim Não Total Casos 10 20 30 Controles 17 13 30 Descrição dos Dados ATF Grupo Sim Não Total Casos 33,3% 66,7% 100% Controles 56,7% 43,3% 100% G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 9 / 27

Análise de Dados Preliminar Boxplots Índice de Massa Corporal Casos Controles IMC 25 30 35 40 45 IMC 20 25 30 35 40 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 10 / 27

Análise de Dados Preliminar Boxplot Diferença Índice de Massa Corporal Diferença IMC 10 5 0 5 10 15 20 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 11 / 27

Modelo Condicional Sumário 1 Desenvolvimento de Diabetes 2 Análise de Dados Preliminar 3 Modelo Condicional 4 Modelo Condicional 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 12 / 27

Modelo Condicional Modelo Condicional Descrição das Variáveis Denotaremos por x i11, x i12 e x i13, respectivamente, o valor da massa corporal (IMC) (definida como sendo o peso (em kg) dividido pela altura (em metros quadrados)), histórico familiar (HF) e atividades físicas (ATF) para o i-ésimo indivíduo diabético. Analogamente definimos por x i21, x i22 e x i23 os valores dessas variáveis para o i-ésimo indivíduo não diabético. G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 13 / 27

Modelo Condicional Sumário 1 Desenvolvimento de Diabetes 2 Análise de Dados Preliminar 3 Modelo Condicional 4 Modelo Condicional 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 14 / 27

Modelo Condicional Modelo Condicional Descrição O logaritmo da função de verossimilhança do modelo condicional pode ser expressa na seguinte forma: { } l(β) = log[π 30 exp(zi1 β 1 + z i2 β 2 + z i3 β 3 ) i=1 ]. 1+exp(z i1 β 1 + z i2 β 2 + z i3 β 3 ) em que z i1 = x i11 x i21, z i2 = x i12 x i22 e z i3 = x i13 x i23, (i = 1,...,30). G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 15 / 27

Modelo Condicional Modelo Condicional Descrição O logaritmo da função de verossimilhança do modelo condicional pode ser expressa na seguinte forma: { } l(β) = log[π 30 exp(zi1 β 1 + z i2 β 2 + z i3 β 3 ) i=1 ]. 1+exp(z i1 β 1 + z i2 β 2 + z i3 β 3 ) em que z i1 = x i11 x i21, z i2 = x i12 x i22 e z i3 = x i13 x i23, (i = 1,...,30). Interpretação l(β) coincide com o logaritmo da função de verossimilhança de uma regressão logística com 30 ensaios, 30 sucessos, valores de variáveis explicativas z i1, z i2 e z i3 e passando pela origem. Portanto, podemos ajustar essa regressão logística para encontrar ˆβ e Var(ˆβ). G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 15 / 27

Resultados Modelo Ajustado Sumário 1 Desenvolvimento de Diabetes 2 Análise de Dados Preliminar 3 Modelo Condicional 4 Modelo Condicional 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 16 / 27

Resultados Modelo Ajustado Modelo Condicional Estimativas Efeito Estimativa Valor-z Valor-P IMC 0,090 1,38 0,167 HF 0,968 1,65 0,099 ATF -0,563-1,04 0,298 Indícios de efeito significativo (ao nível de 10%) apenas para o histórico familiar. G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 17 / 27

Resultados Modelo Ajustado Diagnóstico Modelo Ajustado Distancia de Cook 0.0 0.2 0.4 0.6 18 28 Residuo Componente do Desvio 0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0 5 10 15 20 25 30 Indice 0 5 10 15 20 25 30 Indice G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 18 / 27

Resultados Modelo Ajustado Interpretações Eliminação de Grupos Efeito Sem 18 Sem 28 Sem (18,28) IMC -23,67% 39,78% 16,69% valor-z 1,03 1,70 1,40 HF 43,72% 29,05% 75,31% valor-z 2,04 1,91 2,20 ATF -69,39% 47,97% -24,42% valor-z -1,55-0,50-1,08 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 19 / 27

Resultados Modelo Ajustado Modelo Condicional Final Estimativas Efeito Estimativa Valor-z Valor-P IMC 0,111 1,78 0,074 HF 0,893 1,57 0,116 Indícios de efeito significativo (ao nível de 10%) apenas para índice de massa muscular. G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 20 / 27

Resultados Modelo Ajustado Diagnóstico Modelo Final Distancia de Cook 0.0 0.1 0.2 0.3 0.4 11 28 Residuo Componente do Desvio 0 1 2 3 0 5 10 15 20 25 30 Indice 0 5 10 15 20 25 30 Indice G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 21 / 27

Resultados Modelo Ajustado Interpretações Eliminação de Grupos Efeito Sem 11 Sem 28 Sem (11,28) IMC 34,20% 26,03% -78,24% valor-z 2,08 2,03 2,29 HF 3,35% 39,09% 54,02% valor-z 1,54 1,90 1,90 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 22 / 27

Resultados Modelo Ajustado Interpretações Razão de Chances A razão de chances entre um indíviduo com (IMC + 1) e um indivíduo com IMC é estimada por ˆψ = exp(0, 111) = 1, 12. Portanto, aumentando-se o índice de massa corporal em 1 unidade espera-se aumento da chance de diabetes não dependente de insulina em aproximadamente 12%. G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 23 / 27

Conclusões Sumário 1 Desenvolvimento de Diabetes 2 Análise de Dados Preliminar 3 Modelo Condicional 4 Modelo Condicional 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 24 / 27

Conclusões Conclusões Considerações Finais Portanto, podemos concluir que as variáveis índice de massa muscular e histórico familiar parecem estar associadas com o desenvolvimento de diabetes não dependente de insulina. Todavia, a alta sensibilidade das estimativas dos efeitos dessas duas variáveis detectada pela distância de Cook indica a necessidade do estudo ser repetido para uma amostra maior de emparelhamentos. G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 25 / 27

Referências Sumário 1 Desenvolvimento de Diabetes 2 Análise de Dados Preliminar 3 Modelo Condicional 4 Modelo Condicional 5 Resultados Modelo Ajustado 6 Conclusões 7 Referências G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 26 / 27

Referências Referências Referência Lee, E. T. (1991). Statistical Methods for Survival Data Analysis, Second Edition. John Wiley, New York. G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre 2013 27 / 27