Análise de Resíduos. investiga características que comprometem a validade do MRLS:

Documentos relacionados
Análise de Resíduos. investigar características que comprometem a validade do MRLS:

INFLUÊNCIA DE PONTOS ATÍPICOS. investigar a causa das discrepâncias

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos

Introdução aos Modelos Lineares em Ecologia

Métodos Quantitativos para Avaliação de Políticas Públicas

Falha(s) nas pressuposições da ANOVA

Exemplo 1. Conjunto de dados de uma amostra de 12 meninas da escola: y i x i

Aula 2 Uma breve revisão sobre modelos lineares

Correlação e Regressão

Modelos de regressão para dados correlacionados. Cibele Russo

MAE Estatística Descritiva - 1 o semestre de 2017 Professora: Márcia D Elia Branco Monitora PAE: Simone Harnik Gabarito - Lista 4

Modelos de Regressão Linear Simples - parte II

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR DENNIS LEÃO GRR LUAN FIORENTIN GRR

Exercícios Selecionados de Econometria para Concursos Públicos

VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO DE ANÁLISE DE VARIÂNCIA ANÁLISE DE RESÍDUOS

Análise da Regressão. Prof. Dr. Alberto Franke (48)

CONHECIMENTOS ESPECÍFICOS

Modelos de Regressão Múltipla - Parte VI

Modelos de Regressão para Dados de Contagem

Estudar a relação entre duas variáveis quantitativas.

Transformações e Ponderação para corrigir violações do modelo

Mais Informações sobre Itens do Relatório

Modelos Lineares Generalizados - Análise de Resíduos

SELEÇÃO DE VARIÁVEIS

Técnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios:

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

1 z 1 1 z 2. Z =. 1 z n

Análise de Regressão EST036

Especialização em Engenharia de Processos e de Sistemas de Produção

Verificando as pressuposições do modelo estatístico

UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski

Homocedasticidade? Exemplo: consumo vs peso de automóveis

Modelos Lineares Generalizados - Análise de Resíduos

Análise Multivariada Aplicada à Contabilidade

ANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos:

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

Introdução ao modelo de Regressão Linear

Distribuição Gaussiana. Verificação da Suposição de Normalidade dos Dados

Associação entre duas variáveis

Revisão de Modelos de regressão. Prof. Thais C O Fonseca - DME, UFRJ

Econometria em Finanças e Atuária

Estatística para Geografia. Rio, 13/09/2018

Renda x Vulnerabilidade Ambiental

CONHECIMENTOS ESPECÍFICOS

Modelos Lineares Generalizados - Introdução

Modelos Lineares Generalizados para Dados de Contagem Ananda Bordignon, Brendha Lima, Giovanna Lazzarin 28 de novembro de 2018

Modelos Lineares Generalizados - Introdução

Exemplo de Regressão Linear Simples

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.

CORRELAÇÃO E REGRESSÃO

CONHECIMENTOS ESPECÍFICOS

REGRESSÃO LINEAR SIMPLES Noções preliminares

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Medidas de Associação

Exemplo Vida Útil de Ferramentas

AULAS 14 E 15 Modelo de regressão simples

Métodos Quantitativos Aplicados

Análise de Regressão Linear Múltipla III

Análise de Dados Longitudinais Aula

Exemplo de uso da Análise de Variância na Fase de Análise. do Ciclo PDCA para Melhorar Resultados

Modelos de Regressão Linear Simples - parte III

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Óbitos por Acidentes de Transporte em Santa Catarina no ano de 2016

MÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS

Aula Prática 1. Uso do R com exemplos Adaptação: Flávia Landim/UFRJ

Diagnóstico do Modelo e Tratamento. Frases. Roteiro

Análise de Dados Longitudinais Análise Exploratória

Processos Hidrológicos CST 318 / SER 456. Tema 9 -Métodos estatísticos aplicados à hidrologia ANO 2016

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Distribuição de Probabilidade de Poisson

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.

Exemplos Regressão Dados de Contagem

Prova de Estatística

Estatística Descritiva

MRLM COM COVARIÁVEIS CATEGÓRICAS. criar uma variável dummy para representar uma categoria da variável. variável dummy: assume só dois valores: 0 ou 1

Econometria. Econometria MQO MQO. Resíduos. Resíduos MQO. 1. Exemplo da técnica MQO. 2. Hipóteses do Modelo de RLM. 3.

AULAS 14 E 15 Modelo de regressão simples

Análise de Dados Longitudinais Modelos Lineares Mistos

Gráficos de Controle para Variáveis

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

Regressão Linear Simples

Trabalho de Modelos Lineares Generalizados

Modelos de Análise de Variância

Mario de Andrade Lira Junior lira.pro.br\wordpress

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA

Aula 03 Estatística, Correlação e Regressão

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Faturamento de Restaurantes

Análise de dados em Geociências

Quantis residuais. Luziane Franciscon Acadêmica de Estatística Universidade Federal do Paraná

SELEÇÃO DE VARIÁVEIS

Análise de Dados Categóricos

Regressão linear simples

Associação entre duas variáveis

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

Universidade de São Paulo Faculdade de Filosofia, Letras e Ciências Humanas Departamento de Ciência Política

UNIVERSIDADE FEDERAL DE MINAS GERAIS FACULDADE DE FILOSOFIA E CIÊNCIAS HUMANAS DEPARTAMENTO DE CIÊNCIA POLÍTICA CURSO DE GESTÃO PÚBLICA

Transcrição:

Análise de Resíduos investiga características que comprometem a validade do MRLS: (1) relação entre X e Y não é linear (2) erros não tem variância constante (3) erros correlacionados (4) erros não são normalmente distribuídos homoscedasticidade (5) modelo não ajusta bem a uma ou mais observações prováveis dados atípicos (avaliar sua influência) (6) uma ou mais covariáveis não foram incluídas no modelo

Gráficos de Resíduos 1) diagrama de dispersão de resíduo e predito detectar heterocedasticidade de ε i detectar não-linearidade entre X e Y detectar prováveis dados atípicos modelo bem ajustado: resíduos dispersos aleatoriamente em torno de zero, com variância constante, concentrados entre -2 e 2 e pouquíssimos pontos acima de 3 ou abaixo de -3

Presença de alguns resíduos extremos (observações mal ajustadas)

Distribuição dos resíduos indica boa qualidade de ajuste

Resíduos com distribuição fortemente assimétrica

Indicação de erros heterocedásticos (variância não constante dos erros)

e i 0 ei 0 ^ Y i (a) ^ Y i (b) 0 0 e i ei ^ Y i (c) ^ Y i (d)

(a) Resíduos dispersos aleatoriamente em torno de zero, indica o comportamento esperado para distribuição dos erros (b) Dispersão dos resíduos aumenta conforme o valor do predito, configurando heterogeneidade de variâncias dos erros (erros heterocedásticos); comum quando a variável resposta refere-se a contagens solução: transformar a variável resposta ou utilizar algum modelo linear generalizado (c) Distribuição dos resíduos apresenta uma tendência não linear (no caso, quadrática) solução: incorporar novas variáveis explicativas ao modelo, ou considerar alguma transformação em X e/ou Y, ou utilizar algum modelo de regressão não linear

(d) Distribuição dos resíduos indica erros heterocedásticos; comum quando a variável reposta refere-se a proporções; há também uma observação com resíduo muito elevado, indicando que não é bem ajustada pela reta solução: transformar a variável resposta ou considerar algum modelo linear generalizado; deve-se verificar inicialmente se o valor atípico foi coletado e registrado corretamente incorreto deve ser corrigido ou, caso não seja possível, descartá-lo correto deve ser considerado na análise: investigar o motivo da discrepância e avaliar de que forma essa observação afeta os resultados (análise de influência)

2) gráfico probabilístico normal dos resíduos é um gráfico de pontos de quantis amostrais dos resíduos versus quantis teóricos da distribuição normal padrão (q-q plot normal; quantil-quantil normal) detectar não normalidade de ε i detectar dados atípicos modelo bem ajustado: pontos alinhados na reta que representa a identidade dos quantis amostrais e teóricos gráfico alternativo: histograma ou box-plot dos resíduos

resíduos com distribuição assimétrica

histograma e gráfico probabilístico normal dos resíduos evidenciam a normalidade dos erros

ocorrência de observações mal ajustadas solução: corrigir o valor atípico, se for o caso, ou fazer análise de influência

resíduos com distribuição fortemente assimétrica solução: transformar a variável resposta ou utilizar algum modelo linear generalizado

indicação de bom ajuste

Distribuição dos resíduos com caldas pesadas solução: transformar a variável resposta ou utilizar algum modelo linear generalizado

Se conhecida a ordem de coleta de dados: 3) gráfico de resíduos versus sequencia de coleta de dados (e i i) detectar ε i correlacionados com a ordem de coleta dos dados modelo bem ajustado: distribuição aleatória dos resíduos em torno do zero * a presença de algum padrão sistemático pode indicar dependência com relação à ordem de coleta gráfico alternativo: gráfico de resíduos versus posição da observação no tempo ou espaço

e i 0 e i 0 Tempo (a) Tempo (b) gráficos (a) e (b) evidenciam, em sua maneira, que os erros estão correlacionados solução: análise de séries temporais com covariáveis ou análise de dados longitudinais

4) diagrama de dispersão de resíduo e covariável detectar variação na magnitude de σ 2 em relação a X detectar não-linearidade entre X e Y detectar prováveis dados atípicos modelo bem ajustado: resíduos aleatoriamente dispersos em torno de zero * a presença de algum padrão sistemático indica que a variável em questão não foi incluída no modelo numa escala correta

Se conhecido os valores da covariável omitida: 5) diagrama de dispersão de resíduo e covariável omitida * qualquer padrão sistemático indica a necessidade de se incorporar a variável ao modelo

(a) indica que a variável x deve ser inserida de outra forma (ou deve ser incluída) no modelo; ou utilizar algum modelo de regressão não linear (b) não se tem indicativo da mudança de escala de x (ou da necessidade de inclusão)

CORREÇÃO Var (e i )=Var ( y i ^y i )=Var ( y i )+Var ( ^y i ) 2Cov( y i, ^y i ) =σ 2 +σ 2( 1 n +( x i x) 2 S xx ) =σ 2( 1 1 n (x i x) 2 S xx ) 2 [ σ 2( 1 n +( x i x) 2 S xx )]

CORREÇÃO Como h ii =( 1 n +( x i x) 2 S xx ) então: Var (e i )=σ 2 (1 h ii ) e i N(0,σ 2 (1 h ii )) ; i=1,2,..., n e i z i = σ 2 (1 h ii ) z i * = e i σ 2 (i) (1 h ii )

Análise de Resíduos do Exemplo 1 Diagrama de Dispersão Q-Q Plot Normal Residuo -10-5 0 5 10 Quantis Amostrais -10-5 0 5 10 30 35 40 45 Predito -1.5-0.5 0.5 1.5 Quantis N(0,1) Diagrama de Dispersão Diagrama de Dispersão Residuo padronizado -2-1 0 1 2 Residuo studentizado -2-1 0 1 2 6 12 30 35 40 45 Predito 30 35 40 45 Predito

###dados - Exemplo 1 x <- c(rep(1.35,4),rep(1.4,4),rep(1.5,4)) y <- c(34,34,29,27,40,25,40,34,46,42,47,59) #ajuste de MQ reta<- lm(y~x) # Análise de Resíduos predito <- reta$fit residuo <- reta$res cbind(predito,residuo) # transformacoes dos residuos z <- rstandard(reta) # residuos padronizados zstudent <- rstudent(reta) # residuos studentizados cbind(z,zstudent) # graficos de residuos par(mfrow=c(2,2)) # residuo vs predito plot(predito, residuo, pch=20, main="diagrama de Dispersão", xlab="predito", ylab="residuo") abline(h=0) #q-q plot normal envelope require(car) #para instalar o pacote use: install.packages() require(mass) qqplot(residuo, pch=20, main="q-q Plot Normal", xlab="quantis N(0,1)", ylab="quantis Amostrais") # residuo transformado vs predito plot(predito, z, pch=20, main="diagrama de Dispersão", xlab="predito", ylab="residuo padronizado") abline(h=0) abline(h=2, lty=3) abline(h=-2, lty=3) plot(predito, zstudent, pch=20, main="diagrama de Dispersão", xlab="predito", ylab="residuo studentizado") abline(h=0) abline(h=2, lty=3) abline(h=-2, lty=3) #identificar n pontos clicando próximo aos pontos identify(predito,zstudent,n=2)