Modelos de regressão para dados correlacionados. Cibele Russo

Documentos relacionados
Modelos de regressão para dados correlacionados. Cibele Russo

Modelos de Regressão Múltipla - Parte VIII

Modelos de Regressão Linear Simples - Análise de Resíduos

Análise de modelos lineares mistos com dois fatores longitudinais: um fator quantitativo e um qualitativo ordinal.

Faturamento de Restaurantes

Utilizando a função auto.arima em modelos de séries temporais

Disciplina de Modelos Lineares

Utilização de modelos marginais na análise de dados longitudinais irregulares em relação ao tempo

Modelo de regressão estável aplicado a econometria

CONHECIMENTOS ESPECÍFICOS

Modelos Lineares Generalizados - Introdução

MÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS

Diagnóstico do Modelo e Tratamento. Frases. Roteiro

Exemplos Equações de Estimação Generalizadas

A Metodologia de Box & Jenkins

Exemplos Modelos de Quase-Verossimilhança

Exemplos Modelos Binomiais de Dose-Resposta

Exemplos Regressão Dados de Contagem

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

CONHECIMENTOS ESPECÍFICOS

Exame da OAB. Gilberto A. Paula. Departamento de Estatística IME-USP, Brasil

REGRESSÃO LINEAR Parte II. Flávia F. Feitosa

Exemplo Placas Dentárias

Distribuição Gaussiana. Verificação da Suposição de Normalidade dos Dados

Exemplo MLG Misto. Gilberto A. Paula. Departamento de Estatística IME-USP, Brasil

Modelos ARCH e GARCH Aula 8. Morettin e Toloi, 2006, Capítulo 1 e 14 Morettin, 2011, Capítulo 1 e 5 Bueno, 2011, Capítulo 8

SCC0173 Mineração de Dados Biológicos

Recife, dezembro de Gauss M. Cordeiro Eufrásio de A. Lima Neto

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

Métodos Quantitativos Aplicados

MODELOS MATEMÁTICOS E APLICAÇÕES 2015/2016 EXERCÍCIOS DE MODELOS LINEARES MISTOS PARTE I

Ajuste da função logística a dados de crescimento

Aplicação do Modelo GAMLSS a Dados Imobiliários: Um estudo de caso de lotes urbanos na cidade de São Carlos, SP

Introdução ao modelo de Regressão Linear

Aula 2 Tópicos em Econometria I. Porque estudar econometria? Causalidade! Modelo de RLM Hipóteses

Técnicas Multivariadas em Saúde

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Vetores Auto-Regressivos (VAR) Cristian Rafael Pelizza Estágio de docência

INTRODUÇÃO A MODELOS MISTOS

Uma aplicação do modelo ARIMA para os preços do real estate nos municípios de São Paulo e Rio de Janeiro

3 Modelos Comparativos: Teoria e Metodologia

Regressão linear múltipla aplicada ao preço do leite

4 Modelos Lineares Generalizados

Econometria em Finanças e Atuária

Renda x Vulnerabilidade Ambiental

3 a. FASE DO CONCURSO VESTIBULAR DO BACHARELADO EM ESTATÍSTICA 1 a. PROVA DA DISCIPLINA: CE065 ELEMENTOS BÁSICOS PARA ESTATÍSTICA CANDIDATO:

Técnicas Computacionais em Probabilidade e Estatística I. Aula III

MAE Estatística Descritiva - 1 o semestre de 2017 Professora: Márcia D Elia Branco Monitora PAE: Simone Harnik Gabarito - Lista 4

ECONOMETRIA AVANÇADA Prova Intermediária - 09/04/2015

Influência Local Gilberto A. Paula

Modelo de efeitos aleatórios para dados pareados com observações omissas: um exemplo na área de avaliação de gestão ambiental

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa

Aplicação de modelos simétricos transformados a estimação volumétrica do Eucalyptus no Pólo Gesseiro do Araripe-PE

Revisão de Modelos de regressão. Prof. Thais C O Fonseca - DME, UFRJ

UMA PROPOSTA DE ANÁLISE EM ENSAIOS DE DEGRADABILIDADE RUMINAL IN SITU UTILIZANDO MODELOS NÃO LINEARES MISTOS

Análise Multivariada. Distribuição Normal Multivariada. Roteiro. Lupércio França Bessegato Dep. Estatística/UFJF

Métodos Quantitativos Aplicados

ANÁLISE DE VARIÂNCIA. y j = µ + τ i + e i j = µ i + e i j

Análise da Regressão. Prof. Dr. Alberto Franke (48)

UNIVERSIDADE FEDERAL FLUMINENSE. Programa de Mestrado e Doutorado em Engenharia de Produção. Disciplina: Estatística Multivariada

PESQUISA EM MERCADO DE CAPITAIS. Prof. Patricia Maria Bortolon, D. Sc.

SME0822 Análise Multivariada 2 o semestre de Prof. Cibele Russo. Sala 3-113

Técnicas Multivariadas em Saúde

Mais Informações sobre Itens do Relatório

Multicolinearidade em Modelos de Regressão

Continualizações das Distribuições Geométrica e Poisson

Aplicação de modelos lineares generalizados na captura de atum da espécie Thunnus albacares.

CC-226 Aula 05 - Teoria da Decisão Bayesiana

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Homocedasticidade? Exemplo: consumo vs peso de automóveis

Capítulo 3: Elementos de Estatística e Probabilidades aplicados à Hidrologia

Econometria em Finanças e Atuária

ANÁLISE E MODELAGEM DE DADOS LONGITUDINAIS NO R

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

Ralph S. Silva

AULAS 25 E 26 Heteroscedasticidade

REGRESSÃO ESPACIAL. Flávia F. Feitosa

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações

ANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos:

= < 5. O segundo menor valor esperado estimado corresponde à célula (3,3), com Ê33 = 29 30

Modelagem do comportamento da variação do índice IBOVESPA através da metodologia de séries temporais

WHITE PAPER SOBRE O ASSISTENTE DO MINITAB

Exemplo Cupons com Desconto

Correlação Serial e Heterocedasticidade em Regressões de Séries Temporais. Wooldridge, Cap. 12

Métodos de Diagnóstico para Modelos Lineares Mistos p.1/58

Modelagem estatística da captura da broca-do-café (Hypothenemus hampei) ao longo do tempo 1

Inferência Bayesiana - Aula 1 -

CONHECIMENTOS ESPECÍFICOS

Exercícios de programação

Capítulo 3. O Modelo de Regressão Linear Simples: Especificação e Estimação

Análise Discriminante

Curvas de crescimento de bovinos com coeficientes aleatórios para peso à maturidade

Modelos Lineares Generalizados - Regressão Logística

AULAS 14 E 15 Modelo de regressão simples

CONHECIMENTOS ESPECÍFICOS

Planejamento de Experimentos

AULA 13 Análise de Regressão Múltipla: MQO Assimptótico

Regressão Linear. Prof. Dr. Leandro Balby Marinho. Análise de Dados II. Introdução Regressão Linear Regressão Múltipla

Transcrição:

Modelos de regressão para dados correlacionados Cibele Russo cibele@icmc.usp.br ICMC USP Mini-curso oferecido no Workshop on Probabilistic and Statistical Methods 28 a 30 de janeiro de 2013 Cibele Russo (ICMC USP) Modelos para dados correlacionados 1 / 32

Conteúdo da aula Análise de diagnóstico Seleção de modelos Cibele Russo (ICMC USP) Modelos para dados correlacionados 2 / 32

Análise de diagnóstico A análise de diagnóstico em modelos estatísticos visa verificar a coerência das suposições de um modelo e avaliar a qualidade do ajuste resultante. Cibele Russo (ICMC USP) Modelos para dados correlacionados 3 / 32

Análise de diagnóstico Entre as técnicas de diagnóstico mais utilizadas, estão Análise de resíduos Diagnóstico de influência, que inclui Exclusão de casos Influência local Cibele Russo (ICMC USP) Modelos para dados correlacionados 4 / 32

Modelo de regressão linear (sem efeitos aleatórios) No modelo com p covariáveis Y = X β + ɛ com ɛ N n (0, σ 2 I n ), temos o Vetor de resíduos: e = y Ŷ em que y é o vetor observado de Y e Ŷ é o vetor ajustado pelo modelo de regressão. Podemos reescrever e como e = (I H)Y com H = X (X X ) 1 X (matriz chapéu ou hat). Cibele Russo (ICMC USP) Modelos para dados correlacionados 5 / 32

Modelo de regressão linear (sem efeitos aleatórios) Temos que E(e) = (I H)E(Y) = 0 e Var(e) = σ 2 (I H) pois Var(e) = Var((I H)Y) = (I H)Var(Y)(I H). Como (I H) é simétrica e idempotente, Var(e) = Var((I H)Y) = (I H)σ 2 I (I H) = (I H)(I H)σ 2 = (I H)σ 2. Cibele Russo (ICMC USP) Modelos para dados correlacionados 6 / 32

Modelo de regressão linear (sem efeitos aleatórios) Uma possibilidade é trabalhar com o resíduo padronizado t i = r i s(1 h ii ) 1/2 com s 2 = n i=1 r 2 i /(n p) e h ii é o i-ésimo elemento da diagonal de H. Como r i não é independente de s 2, então uma alternativa seria considerar t i = r i s (i) (1 h ii ) 1/2. Sob a suposição de normalidade dos erros, t i t (n p 1). Cibele Russo (ICMC USP) Modelos para dados correlacionados 7 / 32

Verificando a presença de padrões nos resíduos Resíduos x valores ajustados e i 3 2 1 0 1 2 3 0 5 10 15 20 25 30 Y^ Padrão desejável nos resíduos Cibele Russo (ICMC USP) Modelos para dados correlacionados 8 / 32

Verificando a presença de padrões nos resíduos Resíduos x valores ajustados e i 3 2 1 0 1 2 3 0 5 10 15 20 25 30 Y^ Indícios da presença de outliers ou caudas pesadas Cibele Russo (ICMC USP) Modelos para dados correlacionados 9 / 32

Verificando a presença de padrões nos resíduos Resíduos x valores ajustados e i 3 2 1 0 1 2 3 0 5 10 15 20 25 30 Y^ Indícios da presença de um outlier nos dados Cibele Russo (ICMC USP) Modelos para dados correlacionados 10 / 32

Verificando a presença de padrões nos resíduos Resíduos x valores ajustados e i 3 2 1 0 1 2 3 0 5 10 15 20 25 30 Y^ Indícios de heteroscedasticidade de variâncias dos erros Cibele Russo (ICMC USP) Modelos para dados correlacionados 11 / 32

Verificando a presença de padrões nos resíduos Resíduos x valores ajustados e i 3 2 1 0 1 2 3 0 5 10 15 20 25 30 Y^ Indícios de padrão crescente - adicionar termo de primeira ordem no tempo ou outra covariável omitida Cibele Russo (ICMC USP) Modelos para dados correlacionados 12 / 32

Verificando a presença de padrões nos resíduos Resíduos x valores ajustados e i 3 2 1 0 1 2 3 0 5 10 15 20 25 30 Y^ Indícios de padrão decrescente - adicionar termo de primeira ordem no tempo ou outra covariável omitida Cibele Russo (ICMC USP) Modelos para dados correlacionados 13 / 32

Verificando a presença de padrões nos resíduos Resíduos x valores ajustados e i 3 2 1 0 1 2 3 0 5 10 15 20 25 30 Y^ Indícios de padrão quadrático - adicionar termo quadrático no tempo ou outra covariável omitida Cibele Russo (ICMC USP) Modelos para dados correlacionados 14 / 32

Verificando a presença de padrões nos resíduos Resíduos x valores ajustados e i 3 2 1 0 1 2 3 0 5 10 15 20 25 30 Y^ Cibele Russo (ICMC USP) Modelos para dados correlacionados 15 / 32

Verificando a presença de padrões nos resíduos Resíduos x valores ajustados e i 3 2 1 0 1 2 3 0 5 10 15 20 25 30 Y^ Indícios de possível autocorrelação positiva Cibele Russo (ICMC USP) Modelos para dados correlacionados 16 / 32

Verificando a presença de padrões nos resíduos Resíduos x valores ajustados e i 3 2 1 0 1 2 3 0 5 10 15 20 25 30 Y^ Cibele Russo (ICMC USP) Modelos para dados correlacionados 17 / 32

Verificando a presença de padrões nos resíduos Resíduos x valores ajustados e i 3 2 1 0 1 2 3 0 5 10 15 20 25 30 Y^ Indícios de possível autocorrelação negativa Cibele Russo (ICMC USP) Modelos para dados correlacionados 18 / 32

Diagnóstico Ilustração de pontos aberrante (b), de alavanca (c) e influente (d). Paula, G. A. 2012. Modelos de Regressão com apoio computacional. IME USP. Disponível em Cibele Russo (ICMC USP) Modelos para dados correlacionados 19 / 32

Envelopes Envelopes no modelo de regressão linear sob normalidade Cibele Russo (ICMC USP) Modelos para dados correlacionados 20 / 32

Envelopes para os resíduos 2 1 0 1 2 3 2 1 0 1 2 3 Normal Q Q Plot Percentis da N(0,1) Residuo Studentizado Normal Q Q Plot Normal Q Q Plot Normal Q Q Plot Indícios de adequabilidade Cibele Russo (ICMC USP) Modelos para dados correlacionados 21 / 32

Envelopes para os resíduos Normal Q Q Plot Residuo Studentizado 4 2 0 2 2 1 0 1 2 Percentis da N(0,1) Indícios de caudas pesadas Cibele Russo (ICMC USP) Modelos para dados correlacionados 22 / 32

Envelopes para os resíduos Normal Q Q Plot Residuo Studentizado 3 2 1 0 1 2 3 4 2 1 0 1 2 Percentis da N(0,1) Indícios de assimetria Cibele Russo (ICMC USP) Modelos para dados correlacionados 23 / 32

Análise de resíduos em modelos lineares com efeitos mistos Para modelos mistos, o trabalho de Nobre e Singer (2007) propõe medidas residuais para modelos com efeitos mistos. 1 Resíduo marginal 2 Resíduo condicional e ij = Y ij Ŷij, i = 1,..., n. ec ij = y ij Ŷij Z ij b i. 3 Distância de Mahalanobis u i = [Y i Ŷ] Σ 1 i [Y i Ŷ], i = 1,..., n. (Nobre, J. S. and Singer, J. M., (2007) Residual analysis for linear mixed models. Biometrical Journal, 49, 863 875) Cibele Russo (ICMC USP) Modelos para dados correlacionados 24 / 32

Análise de resíduos em modelos lineares com efeitos mistos Resultado padronizado Uma proposta simples para padronizar resíduos em modelos lineares mistos é e ij = y ij Ŷij, i = 1,..., n; j = 1,..., m i. σ Espera-se que não haja padrões como os de modelos lineares no gráfico de resíduos e ij Ŷij. (Pinheiro and Bates (2009) Mixed-effects Models in S and S-PLUS, Springer.) Cibele Russo (ICMC USP) Modelos para dados correlacionados 25 / 32

Exercício: Dados ortodônticos Modelo linear com efeitos mistos Exercício Nos modelos ajustados para os dados ortodôntico, verifique a presença de possíveis padrões nos gráficos de resíduos e ij Ŷij. Identifique possíveis observações atípicas. Cibele Russo (ICMC USP) Modelos para dados correlacionados 26 / 32

Exemplo: Dados ortodônticos Modelo linear com efeitos mistos (1 covariável, intercepto aleatório) Comandos em R: > library(nlme) > attach(orthodont) > fit.ia<-lme(distance~ age,data=orthodont,random=~ -1+age Subject) > plot(fit.ia) > plot(augpred(fit.ia),aspect= xy,grid=t) > qqnorm(fit.ia,~ resid(.) Sex) Cibele Russo (ICMC USP) Modelos para dados correlacionados 27 / 32

Seleção de modelos: Critérios de informação Os critérios de informação mais utilizados em modelos com efeitos mistos são AIC (Critério de informação de Akaike) BIC (critério de Informação de Schwartz ou critério de informação Bayesiano) Cibele Russo (ICMC USP) Modelos para dados correlacionados 28 / 32

Critérios de informação As expressões para AIC e BIC são AIC = 2p 2 log L( θ) com p o número de parâmetros do modelo ajustado. BIC = 2p log(n) 2 log L( θ) com p o número de parâmetros do referido modelo e N o número total de observações. Quanto menor AIC e BIC, melhor o modelo. Cibele Russo (ICMC USP) Modelos para dados correlacionados 29 / 32

Análise de diagnóstico: Análise de resíduos Exercício: Nos dados ortodônticos, selecione o melhor entre os modelos ajustados. Cibele Russo (ICMC USP) Modelos para dados correlacionados 30 / 32

Discussão Outros modelos e análises possíveis: Modelos com efeitos mistos com estruturas mais gerais para a matriz de variâncias e covariâncias dos erros aleatórios Modelos mistos com distribuições mais gerais para efeitos e erros aleatórios Modelos semiparamétricos com efeitos mistos Modelos conjuntos (joint models) etc Cibele Russo (ICMC USP) Modelos para dados correlacionados 31 / 32

E aqui finalizamos nosso curso... Obrigada pela presença! Cibele Russo (ICMC USP) Modelos para dados correlacionados 32 / 32