Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

Documentos relacionados
Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

Análise de influência

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

MODELOS DE REGRESSÃO PARAMÉTRICOS

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

O problema da superdispersão na análise de dados de contagens

Capítulo 1. Exercício 5. Capítulo 2 Exercício

1. CORRELAÇÃO E REGRESSÃO LINEAR

Regressão Múltipla. Parte I: Modelo Geral e Estimação

Prof. Lorí Viali, Dr.

Associação entre duas variáveis quantitativas

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

O problema da superdispersão na análise de dados de contagens

O que heterocedasticidade? Heterocedasticidade. Por que se preocupar com heterocedasticidade? Exemplo de heterocedasticidade.

PRESSUPOSTOS DO MODELO DE REGRESSÃO

Prof. Lorí Viali, Dr.

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

Métodos Avançados em Epidemiologia

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Contabilometria. Aula 8 Regressão Linear Simples

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Prof. Lorí Viali, Dr.

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

4 Critérios para Avaliação dos Cenários

2 Incerteza de medição

REGRESSÃO NÃO LINEAR 27/06/2017

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

Análise de Regressão Linear Múltipla IV

UNIVERSIDADE FEDERALDO PARÁ INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS FACULDADE DE ESTATÍSTICA CURSO DE BACHARELADO EM ESTATÍSTICA

Cap. 11 Correlação e Regressão

REGRESSÃO E CORRELAÇÃO

Análise de Regressão

Regressão Linear Simples. Frases. Roteiro

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

DELINEAMENTOS EXPERIMENTAIS

CAPÍTULO 9 REGRESSÃO LINEAR PPGEP REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES UFRGS. Regressão Linear Simples

Análise de Variância. Comparação de duas ou mais médias

Análise Descritiva com Dados Agrupados

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

EXERCÍCIO: VIA EXPRESSA CONTROLADA

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall

Gráficos de Controle para Processos Autocorrelacionados

Regressão Linear Simples by Estevam Martins

Regressão Linear Múltipla. Frases. Roteiro

5 Implementação Procedimento de segmentação

ESTATÍSTICA APLICADA II ANO LECTIVO 2011/2012. Exame Final 26 de Julho de 2012

Algarismos Significativos Propagação de Erros ou Desvios

Processamento de Sinal

Classificação de Padrões

CORRELAÇÃO E REGRESSÃO

Variável discreta: X = número de divórcios por indivíduo

Estatística II Antonio Roque Aula 18. Regressão Linear

Métodos Experimentais em Ciências Mecânicas

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA

Estatística Aplicada II CORRELAÇÃO. AULA 21 07/11/16 Prof a Lilian M. Lima Cunha

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Análise Exploratória de Dados

F = O modelo de Regressão Múltipla Geral é dado por: Y i = β 1 + β 2 X 1i + β 3 X 2i + +β k X ki + U i Para testar a hipótese nula de que: H

ECONOMETRIA I Prova n.º 1

ANÁLISE DA VARIÂNCIA DA REGRESSÃO

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

Como Construir Modelos Empíricos

5 Métodos de cálculo do limite de retenção em função da ruína e do capital inicial

Tipo tratamento idade Tipo tratamento sexo

Regressao Simples. Parte II: Anova, Estimação Intervalar e Predição

Eletromagnetismo Aplicado

Gabarito da Lista de Exercícios de Econometria I

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira

Análise de Regressão Linear Múltipla VII

Experiência V (aulas 08 e 09) Curvas características

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Universidade de São Paulo Escola Superior de Agricultura Luiz de Queiroz Departamento de Ciências Exatas

1ª PROVA DE ESTATÍSTICA EXPERIMENTAL

Estudo e Previsão da Demanda de Energia Elétrica. Parte II

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

Modelagem do crescimento de clones de Eucalyptus via modelos não lineares

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Ajuste de Curvas Regressão. Computação 2º Semestre 2016/2017

ESTATÍSTICA MULTIVARIADA 2º SEMESTRE 2010 / 11. EXERCÍCIOS PRÁTICOS - CADERNO 4 Regressão Linear

Análise Exploratória de Dados

a média populacional do i-ésimo tratamento; o efeito do i-ésimo tratamento na variável dependente Y e mede o afastamento da média µ

Cléber da Costa Figueiredo Séries Temporais PAE - 2º semestre de 2007

7 Análise de covariância (ANCOVA)

AULA EXTRA Análise de Regressão Logística

PARTE Apresente as equações que descrevem o comportamento do preço de venda dos imóveis.

FACULDADE DE ECONOMIA DO PORTO. Licenciatura em Economia E C O N O M E T R I A II

Tânia Lucia Hojo (UFMG) Sueli Aparecida Mingoti (UFMG)

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

1º Exame de Mecânica Aplicada II

Exame final de Estatística 2ª Época - 24 de Junho de 2004

Método dos Mínimos Quadrados com ênfase em variâncias e com recursos matriciais (13/2/2014)

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária.

3 A técnica de computação intensiva Bootstrap

(B) Considere X = antes e Y = depois e realize um teste t para dados pareados e um teste da ANOVA de um DBC com 5 blocos. Compare os resultados.

Transcrição:

Modelo lnear normal com erros heterocedástcos O método de mínmos quadrados ponderados

Varâncas homogêneas Varâncas heterogêneas y y x x Fgura 1 Ilustração da dstrbução de uma varável aleatóra y (condconal a x), normal, com varâncas homogêneas (à esquerda) e heterogêneas (à dreta).

Uma das pressuposções dos modelos lneares é que ( ) quasquer valores das covaráves (homocedastcdade). Var x = σ, ou seja, constante para y Nem sempre a suposção de varânca constante é atendda. Em algumas stuações, é razoável admtr que as varâncas sejam proporconas de forma que: Var ( y ) σ x =, (1) onde os ' ssão constantes de proporconaldade, conhecdas e partculares a cada observação. Na sequênca são apresentadas algumas stuações prátcas em que a suposção de gualdade de varâncas não é verfcada.

Stuação 1 - Suponha que as observações sejam, na verdade, médas de amostras de n observações, ou seja: y = 1 n y j n1 j = 1, para = 1,,..., n. Adconalmente, vamos consderar que, ndvdualmente, os y j ' stêm varânca constante, ou seja, ( ) = σ Var y j x j para todo j x. Nesse caso temos: Var ( y ) σ x =, para = 1,,..., n, n de tal forma que, observando a expressão apresentada em (1), = n.

Stuação - Suponha que a análse dos resíduos do ajuste de um modelo lnear ndque que a varânca dos erros tenha alguma relação com uma varável regressora (eventualmente, com mas de uma), como por exemplo: ( y ) x σ Var x =. j Nesse partcular caso, temos que a varânca de y aumenta lnearmente conforme o valor da varável x. Observando a expressão apresentada em (1), nesse caso temos = 1 x. j De manera semelhante, se tvéssemos: ( y x ) x σ Var = j então =. 1 x j

Stuação 3 - Em alguns casos, as observações estão sujetas a erros de medda, de tal forma que a varação desses erros não seja a mesma para dferentes valores das covaráves. Como exemplo, suponha que num expermento sejam usados k dferentes aparelhos, com erros 1,, k de medda de varâncas σ σ, K σ. Uma forma de ldar com a heterocedastcdade, em stuações semelhantes às lustradas, é ncorporar pesos ao processo de ajuste do modelo, obtdos com base nas constantes de proporconaldade. Questão Como (e por que) ncorporar tas pesos ao processo de modelagem?

Método de mínmos quadrados ponderados O estmador de mínmos quadrados: 1 ( X X) X y βˆ =, na stuação em que os erros são heterocedástcos, permanece não vcado, mas já não é efcente (não tem menor varânca). Alternatva: na obtenção dos estmadores, ncorporar pesos no ajuste do modelo, de forma a penalzar observações sujetas a maor varânca.

Neste caso, a soma de quadrado dos erros fcara defnda por: SQE n y = = 1 β 0 β j xj = ( y βx) ' W( y βx), j em que 0 W = M 0 1 0 M 0 L L O 0 0 0, M n podendo ser verfcado que sso equvale à regressão de y em função de x ω (com a coluna de 1 ' s da matrz X substtuída pelos elementos ω 1, ω,..., ωn).

Os pesos podem ser determnados conforme descrto nas stuações lustradas anterormente (podem corresponder aos tamanhos de amostra correspondentes a cada méda, na stuação 1, ou ao nverso das varâncas dos erros de medda, na stuação 3). Alguns resultados da ncorporação de pesos ao processo de estmação: o Estmador de mínmos quadrados ponderados para os coefcentes do modelo: 1 ( X WX) X Wy βˆ =, ω o Estmador da varânca: ˆ σ = ( Y βx ˆ )' W( Y βx ˆ ) n p

o Matrz de varâncas e covarâncas dos estmadores: ( βˆ ) = ( X WX) 1 Var σ, que pode ser estmada por: Nota - O ésmo quadrados de β j. ( βˆ ) = ˆ ( X WX) 1 Var ˆ σ. j elemento da dagonal de Var( βˆ ) ˆ corresponde ao estmador de mínmos

No R: a ncorporação de pesos na no ajuste de um modelo lnear pode ser feta por meo do argumento eghts, da função lm. Em stuações em que não se dspõe de pesos aproprados para explcar a heterogenedade de varâncas, uma alternatva é estmar conjuntamente os parâmetros de regressão e as varâncas. No R, sso pode ser feto através da função gls do pacote nlme, que permte, além dsso, ajustar modelos para erros correlaconados (mínmos quadrados generalzados).

Exemplo Vamos utlzar o banco de dados cars, dsponível na base do R. Os dados correspondem aos resultados dos testes de frenagem de 50 automóves antgos. Duas varáves estão dsponíves: Speed: velocdade do automóvel no momento da frenagem; Dst: dstânca percorrda pelo automóvel do momento da frenagem até que ele pare completamente. O objetvo é modelar a dstânca em função da velocdade. E nós vamos ao R!