Regressão Linear Simples. Frases. Roteiro

Documentos relacionados
Métodos Avançados em Epidemiologia

Regressão Linear Múltipla. Frases. Roteiro

Análise de Regressão

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Prof. Lorí Viali, Dr.

Associação entre duas variáveis quantitativas

Cap. 11 Correlação e Regressão

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

1. CORRELAÇÃO E REGRESSÃO LINEAR

Contabilometria. Aula 8 Regressão Linear Simples

PRESSUPOSTOS DO MODELO DE REGRESSÃO

Regressão Múltipla. Parte I: Modelo Geral e Estimação

(c) 0,5; 9,5; -10,5; -0,5; 12,3; 2,3; etc. Ocorre desvio alto para o indivíduo 19 (-19,5) X (idade da casa)

O problema da superdispersão na análise de dados de contagens

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

O problema da superdispersão na análise de dados de contagens

REGRESSÃO NÃO LINEAR 27/06/2017

Capítulo 1. Exercício 5. Capítulo 2 Exercício

Análise Exploratória de Dados

MODELOS DE REGRESSÃO PARAMÉTRICOS

Análise de Variância. Comparação de duas ou mais médias

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Estatística II Antonio Roque Aula 18. Regressão Linear

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

REGRESSÃO E CORRELAÇÃO

Tabela 1. Porcentagem de crianças imunizadas contra DPT e taxa de mortalidade de menores de 5 anos para 20 países, 1992.

Gabarito da Lista de Exercícios de Econometria I

4 Critérios para Avaliação dos Cenários

Análise de Regressão Linear Múltipla IV

Modelo de Regressão Simples

CORRELAÇÃO E REGRESSÃO

3 A técnica de computação intensiva Bootstrap

Análise Exploratória de Dados

1ª PROVA DE ESTATÍSTICA EXPERIMENTAL

a média populacional do i-ésimo tratamento; o efeito do i-ésimo tratamento na variável dependente Y e mede o afastamento da média µ

Regressão Linear Simples by Estevam Martins

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

ESTATÍSTICA APLICADA II ANO LECTIVO 2011/2012. Exame Final 26 de Julho de 2012

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Correlação. Frases. Roteiro. 1. Coeficiente de Correlação 2. Interpretação de r 3. Análise de Correlação 4. Aplicação Computacional 5.

Gráficos de Controle para Processos Autocorrelacionados

Tipo tratamento idade Tipo tratamento sexo

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

DELINEAMENTOS EXPERIMENTAIS

A redução na pressão sangüínea (mm Hg) em um período de quatro semanas observadas em cães experimentais está tabulada abaixo:

ANÁLISE DA VARIÂNCIA DA REGRESSÃO

Delineamento Aleatorizado em Blocos Completos (DABC)

Redução dos Dados. Júlio Osório. Medidas Características da Distribuição. Tendência Central (Localização) Variação (Dispersão) Forma

Métodos Experimentais em Ciências Mecânicas

CAPÍTULO 9 REGRESSÃO LINEAR PPGEP REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES UFRGS. Regressão Linear Simples

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

AULA EXTRA Análise de Regressão Logística

MAE 317 Planejamento e Pesquisa I Profa. Júlia Maria Pavan Soler

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

Ajuste de Curvas Regressão. Computação 2º Semestre 2016/2017

2 Incerteza de medição

Tópicos Extras 2ª parte. Análise de Correlação e Regressão

Regressão Linear e Multilinear

Testes não-paramétricos

Algarismos Significativos Propagação de Erros ou Desvios

INSTITUTO POLITÉCNICO DE VISEU ESCOLA SUPERIOR DE TECNOLOGIA E GESTÃO

Capítulo 2. Modelos de Regressão

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

REGRESSÃO LINEAR 05/10/2016 REPRESENTAÇAO MATRICIAL. Y i = X 1i + 2 X 2i k X ni + i Y = X + INTRODUÇÃO SIMPLES MÚLTIPLA

Aula Características dos sistemas de medição

A redução na pressão sangüínea (mm Hg) em um período de quatro semanas observadas em cães experimentais está tabulada abaixo:

Regressao Simples. Parte II: Anova, Estimação Intervalar e Predição

Análise de Regressão Linear Múltipla VII

(B) Considere X = antes e Y = depois e realize um teste t para dados pareados e um teste da ANOVA de um DBC com 5 blocos. Compare os resultados.

Análise Bivariada. Frases. Roteiro. 1. Introdução

Modelagem do crescimento de clones de Eucalyptus via modelos não lineares

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Serão abordados nesse capítulo os modelos causais, utilizados como ferramentas para o desenvolvimento e análise desse trabalho.

REGRESSÃO LINEAR ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA REGRESSÃO CURVILÍNEA FUNÇÃO QUADRÁTICA

F = O modelo de Regressão Múltipla Geral é dado por: Y i = β 1 + β 2 X 1i + β 3 X 2i + +β k X ki + U i Para testar a hipótese nula de que: H

Escola Superior de Tecnologia de Viseu. Fundamentos de Estatística 2006/2007 Ficha nº 7

Prof. Lorí Viali, Dr.

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira

Universidade de São Paulo Escola Superior de Agricultura Luiz de Queiroz Departamento de Ciências Exatas

Estatística Aplicada II CORRELAÇÃO. AULA 21 07/11/16 Prof a Lilian M. Lima Cunha

Estatística Espacial: Dados de Área

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental.

PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011

UNIVERSIDADE FEDERALDO PARÁ INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS FACULDADE DE ESTATÍSTICA CURSO DE BACHARELADO EM ESTATÍSTICA

Análise de Variância (ANOVA) de 1 via

Como Construir Modelos Empíricos

ESTATÍSTICA MULTIVARIADA 2º SEMESTRE 2010 / 11. EXERCÍCIOS PRÁTICOS - CADERNO 4 Regressão Linear

Transcrição:

Regressão Lnear Smples Frases Por serem mas precsos que as palavras, os números são partcularmente adequados para transmtr conclusões centífcas Pagano e Gauvre, 4 Rotero. Modelagem de Relação. Modelo Lnear 3. Estmação dos Parâmetros 4. Inferênca sobre os Parâmetros 5. Avalação do Modelo 6. Aplcação 7. Referêncas

Modelagem de Relação Regressão e Correlação Regressão: Usa varável(es) explcatva(s) para explcar ou predzer comportamento de varável resposta (quando houver sentdo). Correlação: Trata smetrcamente duas varáves Regressão Varável resposta (Y): Varável resposta cujo comportamento se quer explcar Varável(es) explcatva(s) (X ): São de nteresse caso ajudem a entender, explcar ou predzer o comportamento de Y. O enfoque da regressão é natural quando Y é aleatóra e X é controlada ou não-aleatóra.

x Varável explcatva Varável ndependente Regressor Predtor Varável exógena Varável de controle ou estímulos Y Varável explcada Varável dependente Regreddo Predto Varável endógena Varável resposta Exemplo Vendas/Renda Varável resposta: Vendas no varejo ($) Varável explcatva: Renda dsponível ($) 7 Vendas no Varejo ($) 65 6 55 Tendênca lnear 9 3 Renda Dsponível ($) Exemplo Absorção de Oxgêno Varável resposta: Absorção de Oxgêno Varável explcatva: Ventlação 6 4 Absorção de Oxgêno 8 6 4 Tendênca exponencal 5 5 5 3 35 4 45 Ventlação

Exemplo 3 Comprmentos de Fígados Varável resposta: Comprmento do fígado (mm) Varável explcatva: Tempo de gestação (sem.) 7 Comprmento do fígado (mm) 6 5 4 3 Tendênca não-lnear 5 5 3 Tempo de Gestação (sem.) 35 4 Modelo de Regressão Relação de regressão: Tendênca + dspersão resdual Tendênca: Suavzação dos dados Explca a maor parte das dferenças de Y Valores atípcos: Observações muto dferente do restante dos dados Relações Fortes e Fracas Relação Forte: A dspersão é pequena em relação à ampltude dos valores da curva de tendênca Em dados observaconas, relações fortes não são necessaramente causas

Intervalo de Predção 7 Comprmento do fígado (mm) 6 5 4 3 Para 5 semanas: comprmento fígado entre 3 e 4 mm 5 5 3 35 4 Tempo de Gestação (sem.) Grande dspersão em torno da tendênca Relação fraca Intervalos de predção amplos Predção mprecsa Outros Padrões () Concentração de qunase de creatnna no sangue Concentração (mu/ml) 8 6 4 3 4 5 Tempo (horas) Os padrões da tendênca varam Outros Padrões () 5 45 4 Naconas Peso (. lb) 35 3 5 Importados 5 75 5 5 75 Preço ($.) Importante descobrr o que defne os grupos

Outros Padrões (3),5, Largura da pétala,5,,5, 3 4 5 6 7 Comprmento da pétala Varedades dferentes de Flores Resumo de Tendênca Abordagens Ajuste de funções matemátcas: Y = f(x) Técncas de suavzação: Lowess, núcleo-estmador, splne Ajuste de Funções Tendênca lnear: Y = β X + β Para cada mudança de uma undade em X, Y muda uma quantdade fxa. Tendênca quadrátca: Y = β + + βx β X Tendênca levemente curva

Y Tendênca exponencal: βx Y = βe 4 9 8 3 7 6 lny 5 4 3,,5,,5 3, 3,5 4,,,5,,5 3, 3,5 4, x x Cada mudança de uma undade em X, Y muda uma % fxa Se a tendênca é exponencal, o gráfco de log(y) vs X têm tendênca lnear Passos na Construção de um Modelo Estatístco Especfcar um modelo estatístco: fórmula e premssas Estmar os parâmetros do modelo a partr dos dados amostras Examnar os resíduos e testar a adequação do modelo Se modelo não for aprovado Usar o modelo Modelo Lnear

Tpos Smples: Uma varável ndependente (explcatva) Múltpla: Duas ou mas varáves ndependentes Objetvos Encontrar equação matemátca que permta: Descrever e compreender a relação entre ou mas varáves aleatóras Projetar ou estmar uma nova observação Ajustar uma reta a partr dos dados amostras Utldades Busca de relações de Causa e Efeto; Predção de valores; Estabelecer explcação sobre população a partr de uma amostra

Regressão Lnear Smples Busca-se a equação de uma reta que permta: Descrever e compreender a relação entre duas varáves Projetar e estmar uma das varáves em função da outra. Regressão Lnear Smples () A partr de valores observados de X e Y, modelar a tendênca através de uma equação do tpo: Y = β + βx Função Lnear Y = β + βx f(x) se modfca a uma taxa constante em relação à sua varável ndependente ß e ß são constantes y ß : ntercepto-y ß : coefcente angular x

Intercepto e Coefcente Angular y (x, y ) y -y =? y (x, y ) x -x =? x ß = tg α x ß = varação de y varação de x ß : ntersecção da reta com o exo y Interpretação dos Parâmetros ß : declvdade da reta defne o aumento ou dmnução da varável Y por undade de varação de X ß = ntercepto em y defne o valor médo de Y nterferênca de X (com X=). sem a Exemplo Aumento de Arrecadação (%) em relação à Redução Alíquota de ICMS (%) % Aumento de Arrecadação 9 8 7 6 5 4 3 Arrecadação = +,9373 ICMS 3 4 % Redução Alíquota de ICMS 5 ß : a cada redução de % na alíquota há,9 % de aumento de arrecadação ß =: Se não há redução na alíquota não há de aumento de arrecadação

Y A Reta de Regressão Para um mesmo valor X podem exstr um ou mas valores de Y amostrados Para esse mesmo valor X haverá um valor ^ ajustado Y Para cada valor X exstrá um dado desvo d dos valores de Y ^ Há observações que não são pontos da reta. Ajuste da Reta 9 8 7 6 5 4 3,,5,,5 X Qual a reta que se ajusta melhor aos dados? ou seja quas os valores de ß e ß? Escolher ß e ß de manera a tornar mínma a dstânca entre a reta e os pontos 3, 3,5 4, Método dos Mínmos Quadrados Crtéro: Valores dos parâmetros que mnmzam a soma dos quadrados dos desvos n ( Y ˆ Y ) =

Método dos Mínmos Quadrados () Mnmzação em relação a ß e ß : { Y ( β βx )} S = d = + S = β y d S = β x Método dos Mínmos Quadrados (3) Resultados das dervadas parcas: β ˆ = ˆβ = n. ( x y ) ( x ) ( y ) n. x ( ) x y b x n βˆ = Calculando por meddas estatístcas : S S xy xx β ˆ Y βˆ X = s ˆβ = = r s XY X XY s s Y X Estmatva de Mínmos Quadros Dadas observações (X, Y ),..., (X n, Y n ) os coefcentes da reta que melhor se ajusta aos dados são: β = βˆ e β = βˆ que são chamados estmatvas de mínmos quadrados do ntercepto e da declvdade A reta de mínmos quadrados é dada por: ˆ ˆ ˆ Y = β + βx

Exemplo Le de Consumo Keynesano Na méda, há dsposção do ndvíduo aumentar seu consumo quando sua renda aumenta, mas não tanto quanto o aumento em sua renda. A propensão margnal para consumr é maor que mas menor que Consumo Renda Famlar Famlar ($) ($) Y X X X.Y Y 7 8 6.4 5.6 4.9 65. 6.5 4.5 9 4.4.8 8. 95 4 9.6 3.3 9.5 6 5.6 7.6. 5 8 3.4.7 3.5 4. 4. 4.4 4 48.4 3.8 9.6 55 4 57.6 37. 4.5 5 6 67.6 39..5..7 3. 5.5 3. y = S xx S xy x =7 = 3. (7) = 33. = 5.5 (7)() = 6.8 6.8 β = 33. ˆ =,59 β ˆ = (,59)(7) = 4,45 Yˆ = 4,45 +, 59X Exemplo HP Entrar cada par de dados: Y Enter X S + Para determnar o ntercepto-y: Dgte g y, ˆ r βˆ = 4,45 Para determnar a nclnação: Dgte g y, ˆ r 4,9636 Subtraa o valor anteror do últmo valor obtdo β ˆ = 4,9636 4,4545 =,59

Exemplo Mntab Stat > Regresson > Ftted Lne Plot Exemplo Saída Mntab Regresson Analyss: Consumo versus Renda The regresson equaton s Consumo = 4,45 +,59 Renda S = 6,493 R-Sq = 96,% R-Sq(adj) = 95,7% 6 4 Ftted Lne Plot Consumo = 4,45 +,59 Renda S 6,493 R-Sq 96,% R-Sq(adj) 95,7% Consumo 8 6 5 Renda 5 Interpretação Yˆ = 4,45 +, 59X Inclnação: Propensão margnal ao consumo Quando a renda aumenta $, o aumento estmado no consumo médo é $,5 As estmatvas são váldas dentro da classe amostrada (renda semanal entre $8 e3 $6) Intercepto-y A reta ndca $4,45 como nível de consumo quando a renda é zero Esta nterpretação não é válda já que não há pontos amostras próxmos à renda zero

Resíduo de uma Observação Dferença entre o valor observado e o valor estmado (ponto na reta) eˆ = y yˆ Em que: ˆ ˆ ˆ y = β + βx Propredades dos EMQO A soma dos resíduos é zero; A soma dos valores observados da resposta é gual à soma dos valores ajustados y = yˆ A reta de regressão passa pelo ponto ( x, y) A soma dos resíduos ponderados pelos níves da varável ndependente é zero x e ˆ = Propredades dos EMQO () A soma dos resíduos ponderados pelos valores ajustados é zero; e ˆ y ˆ = Os resíduos não tem correlação com os valores ajustados corr( eˆ, yˆ ) = Os resíduos não tem correlação com a varável ndependente corr( eˆ, x ) =

Estmação dos Parâmetros Elaboração do Modelo Quer se encontrar um modelo para relações aproxmadamente lneares, com dos aspectos: tendênca central lnear flutuações em torno desta tendênca Hpóteses sobre as Flutuações As observações de Y em X = x são aleatóras, com alguma dstrbução com: méda µ Y pertencente a uma reta (explca padrão lnear) desvo padrão s (explca a dspersão) Suponha que esta dstrbução seja normal:

Quando X = x, Y ~ N(µ Y, s ), com µ Y = ß + ß x Apresentado de outra manera: Quando X = x, Y = ß + ß x + e, e ~ N(, s ) Modelo Clássco Hpóteses Subjacentes Modelo de regressão lnear nos parâmetros; Os valores de X são fxados em amostragem repetda (X não-estocástco); Perturbação e com méda zero; Varânca constante de e (homocedastcdade) Perturbações não correlaconadas: cov(e, e j )= Modelo Clássco Hpóteses Subjacentes Covarânca zero entre e e X ; Número de observações maor que o número de parâmetros a serem estmados; Varabldade nos valores de X (Var(X)>); Não há vés de especfcação (o modelo está corretamente especfcado)

Modelo Clássco Hpóteses Subjacentes Não exste multcolneardade perfeta: Não há relações lneares perfetas entre as varáves explcatvas Reta de Regressão Estmação Sob estas hpóteses: ˆβ e ˆβ são os melhores estmadores lneares não vcados de ß e ß. ou seja ˆ ˆ Y = β + βx é uma estmatva da relação populaconal Y = ß + ß x + e onde e representa a dspersão na população. ˆ Propredades Importantes de um Bom Estmador Consstênca: Estmatva se aproxma do verdadero valor do parâmetro à medda que o tamanho da amostra aumenta θ ˆ θ

Propredades Importantes de um Bom Estmador Exatdão: Relaconada com o víco do estmador ( ) θ Bas θ ˆ = θ ˆ Precsão: Relaconada com a varabldade do estmador Var( θˆ ) Quanto menor a varabldade, mas precso é o estmador Estmadores de Mínmos Quadrados São lneares São não-vcados São estmadores efcentes (mínma varânca) Têm varânca mínma na classe dos estmadores lneares não-vcados Propredades de amostras fntas (ndependem do tamanho da amostra) Estmador de ß É estmador não vcado: Varânca: E ( β ˆ ) = β ( ˆ ) σ Var β = S xx Quanto maor a varabldade de X, maor sua precsão

Estmador de ß É estmador não vcado: Varânca: Var E ( β ˆ ) = β x ( βˆ ) = σ + n S xx Quanto mas afastado for o centróde, menor sua precsão Covarânca entre os Estmadores É dada por Cov ( βˆ, βˆ ) xσ = S xx Se ß for superestmado, o ntercepto será subestmado (ou vce-versa) Inferênca sobre s Em geral, s é desconhecdo. A estmatva de mínmos quadrados ordnáros é dada por: SQ Re s σˆ = eˆ = n gl SQRes: Soma dos Quadrados dos Resíduos gl: graus de lberdade Quantdade de observações número parâmetros

Exemplo Le de Consumo Soma dos Quadrados dos Resíduos: 337,7 Estmatva de s : Estmatva da Varânca dos Estmadores: Var Var 337,7 σˆ = = 4,59 8 ( ˆ (7) β ) = 4,59 + = 4, 37 33. 4,59 ( β ) ˆ = =, 78 33. Erro Padrão Defndo como a raz quadrada da varânca do estmador ep ep ( β ) ˆ = 4,37 = 6, 44 ( β ) ˆ =,78 =, 357 Importantes na construção dos ntervalos de confança Exemplo Mntab Stat > Regresson > Regresson

Saída Mntab The regresson equaton s Consumo = 4,5 +,59 Renda erros padrão Predctor Coef SE Coef T P Constant 4,455 6,44 3,8,5 Renda,599,3574 4,4, σˆ S = 6,493 R-Sq = 96,% R-Sq(adj) = 95,7% Analyss of Varance Source DF SS MS F P Regresson 855,7 855,7,87, Resdual Error 8 337,3 4, Total 9 889, σˆ Soma do Quadrado dos Resíduos Inferênca sobre os Parâmetros Hpótese de Normaldade Os termos de erro estocástco são ndependentes e dentcamente dstrbuídos, com e ~ N(, s ), =,,..., n Os estmadores têm dstrbução normal e tornam-se os melhores estmadores nãovcados dos parâmetros

Normaldade Assntótca dos Estmadores Mesmo se os erros não forem normas, se a amostra for sufcentemente grande, os estmadores terão uma dstrbução aproxmadamente normal Inferênca para ß Dstrbução do estmador: βˆ t βˆ ~ N Intervalo de confança ( β, ep( βˆ ) ( βˆ ) β βˆ t ep( βˆ ) α / ;( n ) ep + α / ;( n ) Inferênca para ß contnuação Teste de sgnfcânca do parâmetro: H : ß = vs H : ß? Estatístca de teste: regressão não é sgnfcatva regressão sgnfcatva βˆ T = ep ˆ Dstrbução da estatístca de teste: T ( β ) ~ t( n )

Inferênca para ß Dstrbução do estmador: βˆ t βˆ ~ N Intervalo de confança ( β, ep( βˆ ) ( βˆ ) β βˆ t ep( βˆ ) α / ;( n ) ep + α / ;( n ) Inferênca para ß contnuação Teste de sgnfcânca do parâmetro: H : ß = vs ntercepto não é sgnfcatvo H : ß? nterecepto é sgnfcatvo Estatístca de teste: βˆ T = ep β ˆ Dstrbução da estatístca de teste: T ( ) ~ t( n ) Inferênca para Parâmetros Caso Geral Teste de Hpóteses de parâmetro: H : ß = ß vs H : ß? ß, =, Estatístca de teste: ˆ β β T =, =, ep βˆ ( ) Dstrbução da estatístca de teste: T ~ t( n )

Exemplo Le de Consumo Estmatvas: Erros padrão: βˆ = 4,454 βˆ =,59 ep ep ( βˆ ) = 6,438 ( βˆ ) =, 357 Tamanho da amostra: Intervalos com 95% de Confança Do Parâmetro ß : 4,454 (,36)(6,438) β 4,454+ (,36)(6,438) 9,664 β 39,44 Do Parâmetro ß :,59 (,36)(,357) β,59+ (,36)(,357),468 β,594 Saída Mntab The regresson equaton s Consumo = 4,5 +,59 Renda Estatístca t Predctor Coef SE Coef T P Constant 4,455 6,44 3,8,5 Renda,599,3574 4,4, S = 6,493 R-Sq = 96,% R-Sq(adj) = 95,7% Analyss of Varance Source DF SS MS F P Regresson 855,7 855,7,87, Resdual Error 8 337,3 4, Total 9 889, 4,455,599 Tβ = = 3,83 T 4, 4 β = = 6,44,3574

Avalação do Modelo Qualdade do Ajuste Ajustada uma equação de regressão entre X e Y, qual a qualdade do ajuste? Análse de varânca do modelo Análse dos resíduos Reta de Regressão e Resíduos Valores ajustados: ˆ y = β + βx Resíduos: eˆ = y yˆ y ŷ yˆ = β ˆ ˆ + βx ê x

Desvo em relação à méda artmétca: Desvos d = y y y yˆ = β ˆ ˆ + βx Desvo em relação à reta de regressão: y ê d eˆ = y yˆ x y y = y yˆ + yˆ y Soma dos Quadrados ( y y) = ( yˆ y) + ( y yˆ ) SQT varação total SQReg varação explcada pela regressão SQRes varação não explcada Somas dos Quadrados - Cálculos ( y y ) S yy SQT = = SQ Re g = ( y yˆ ) = β ˆ S xx SQ Re s = SQT SQ Re g

Análse de Varânca Objetvo: Ajustar e comparar modelos aos dados Modelo alternatvo (H ): Y = β + ε βˆ = Y Modelo de regressão smples (H ): Y = + βx β + ε Análse de Varânca Estrutura H H ( X, Y ) Y = β + ε Y = β + βx + ε Resíduos antes da regressão SQT Resíduos após da regressão SQRes SQReg: redução na SQT devdo ao modelo de regressão SQT = SQReg + SQRes Graus de Lberdade SQReg: SQRes: n SQT: n

Análse de Varânca do Modelo Fonte de varação Regressão gl SQ SQReg QM SQ Re g Razão QM Re g F = QM Re s Erro n SQRes SQ Re s n Total n SQT Hpóteses: H Estatístca de teste: F Teste de Hpóteses : Y = β + ε H : Y = β + βx + ε ~ F,( n );α No caso da regressão lnear smples T = F ~ tα / ;( n ) Exemplo Le de Consumo The regresson equaton s Consumo = 4,5 +,59 Renda Predctor Coef SE Coef T P Constant 4,455 6,44 3,8,5 Renda,599,3574 4,4, S = 6,493 R-Sq = 96,% R-Sq(adj) = 95,7% Analyss of Varance Estatístca F Source DF SS MS F P Regresson 855,7 855,7,87, Resdual Error 8 337,3 4, Total 9 889, 337,3 855,7 SQRes = = 4, F = =, 87 4,

Análse de Varânca Interpretação Se SQReg é elevada, então o modelo de regressão é melhor que o modelo da méda amostral; Equvale a ß? Coefcente de Determnação () R = Varação explcada Varação total = Σ (y ^ - y) Σ (y - y) Indca a porcentagem de varabldade que é explcada pelo modelo de regressão Coefcente de Determnação () SQReg SQRes R = = SQT SQT R

Coefcente de Determnação (3) R Sxy S xx SQReg S xx = = SQT S Matematcamente, o coefcente de determnação é o quadrado do coefcente de correlação de Pearson yy = r Exemplo Le de Consumo The regresson equaton s Consumo = 4,5 +,59 Renda Predctor Coef SE Coef T P Constant 4,455 6,44 3,8,5 Renda,599,3574 4,4, S = 6,493 R-Sq = 96,% R-Sq(adj) = 95,7% Analyss of Varance R Source DF SS MS F P Regresson 855,7 855,7,87, Resdual Error 8 337,3 4, Total 9 889, 8.55,7 R = =,96 R = (,98) =, 96 8.89 Consderações sobre R Não mede a adequação do modelo lnear Para comparação entre modelos, é mportante observar a varação do erro quadrátco médo Sua grandeza depende também do ntervalo de varação da varável regressora valor grande de R pode ser resultado de varação rrealsta de x

Abusos Comuns Deve-se tomar cudado na forma do modelo e na seleção das varáves que serão usadas. Forte assocação não mplca relação causal entre varáves Relações de regressão são váldas somente dentro da faxa dos dados orgnas de x. Modelos de regressão não são necessaramente váldos para fns de extrapolação Predção Pergos da Predção Seja cauteloso ao predzer fora do domíno de varação dos dados.

Valor Ajustado É estmador não vcado da lnha de regressão ou seja de E(Y/x ): Varânca: Var ( Yˆ ) = β + β x E x x ( Yˆ ( ) ) = σ + n Quanto mas afastado do centróde dos dados, mas mprecsa será a estmatva do valor ajustado S xx Inferênca para Y o Intervalo de ( a) % de confança em torno da lnha de regressão: Yˆ t ( ˆ ) Y Yˆ t ep( Yˆ ) α / ;( n ) ep Y + α / ;( n ) Exemplo Le de Consumo Keynesano Deseja-se determnar o ponto da reta para o nível de renda de x = $. O consumo médo estmado para nível de renda $ é: ˆ = 4,455+,599() = 75,364 Y

A varânca da méda de consumo para este nível de renda é: Var ( ˆ ( 7) Y ) = 4,59 + =, 476 33. ( ˆ ) =,476 = 3, 37 ep Y Como t,5;- =,36, então o ntervalo de 95% de confança é: 75,364 (,36)(3,37) Y 75,364 + (,36)(3,37) 67,899 Y 8,89 Cálculo do Valor Ajustado HP Entrar cada par de dados: Y Enter X S + Para determnar o valor ajustado para nível de renda $: Dgte g y, ˆ r ˆ = 75, 364 Y Intervalo de Pontos da Reta Mntab Stat > Regresson > Regresson

Mntab Saída Regresson Analyss: Consumo versus Renda The regresson equaton s Consumo = 4,5 +,59 Renda Predctor Coef SE Coef T P Constant 4,455 6,44 3,8,5 Renda,599,3574 4,4, S = 6,493 R-Sq = 96,% R-Sq(adj) = 95,7% Analyss of Varance Tabela de Ajustes e Resíduos Source DF SS MS F P Regresson 855,7 855,7,87, Resdual Error 8 337,3 4, Total 9 889, Valor ajustado Erro padrão Obs Renda Consumo Ft SE Ft Resdual St Resd 65,8 3,8 4,8,9 8 7, 65, 75,36 3,4 -,36 -,84 3 9, 85,55,7 4,45,76 4 4 95, 95,73,3 -,73 -, 5 6, 5,9,8 4,9,67 6 8 5, 6,9,8 -,9 -,8 7, 6,7,3-6,7 -,3 8 4, 36,45,7 3,55,6 9 4 55, 46,64 3,4 8,36,49 6 5, 56,8 3,8-6,8 -,3 Intervalo de Confança da Reta Mntab Stat > Regresson > Ftted Lne Plot 75 5 Banda de confança Ftted Lne Plot Consumo = 4,45 +,59 Renda Regresson 95% CI S 6,493 R-Sq 96,% R-Sq(adj) 95,7% Consumo 5 75 5 5 Renda 5

Predção de Nova Observação Predção de resposta nova ou futura para um nível x não utlzado na estmação dos parâmetros ~ Y estmação pontual de Y (resposta não observada: ~ Y = β ˆ + βˆ x Valor Ajustado É estmador não vcado da nova resposta: Varânca: Var ~ ( Y ) = β + β x E ~ ( x x) ( Y ) = σ + σ + n Fontes de varabldade:. varação dos estmadores. varação natural de Y S xx Inferênca para Y o Intervalo de predção de ( a) % para uma nova observação: ~ Y t ~ ~ ~ ( ) Y Y t ep( Y ) α / ;( n ) ep Y + α / ;( n ) O ntervalo de predção em x é sempre mas largo que o ntervalo de confança em x. A largura do ntervalo é mínma quando x = x

Le de Consumo Keynesana Predção Consumo para ndvíduo não observado com renda mensal x = $ ~ Y = 4,455+,599() 8,455 Erro padrão da predção: Var = ~ ( 7) ( Y ) = 4,59 + + = 5, 974 33. ~ ep( Y ) = 5,974 7, 4 = Intervalo de 95% de confança da predção: 8,455 ±,36(7,4) ~ 63,99 Y 96,9 Intervalo de Pontos da Reta Mntab Stat > Regresson > Regresson Pode-se entrar uma coluna de valores Saída Mntab Regresson Analyss: Consumo versus Renda The regresson equaton s Consumo = 4,5 +,59 Renda Predctor Coef SE Coef T P Constant 4,455 6,44 3,8,5 Renda,599,3574 4,4, S = 6,493 R-Sq = 96,% R-Sq(adj) = 95,7% Analyss of Varance Source DF SS MS F P Regresson 855,7 855,7,87, Resdual Error 8 337,3 4, Total 9 889, ntervalo confança Predcted Values for New Observatons New Obs Ft SE Ft 95% CI 95% PI 8,45,97 (73,6; 87,3) (63,99; 96,9) ntervalo predção Values of Predctors for New Observatons New Obs Renda

Aplcação Um Modelo Econômco Objetvo: Estudar a relação entre renda famlar e despesas com almentação. Expermento: Amostra aleatóra de resdêncas, com renda famlar semanal maor que $48 Característca de nteresse: Despesa semanal da resdênca com almentação Quanto fo gasto com almentação na semana passada? Modelo Proposto Y = ß + ß x + e Varáves: Resposta (Y ) : Despesa com almentação Explcatva(x ): Renda Famlar Semanal Erro (e ): Todos os fatores que afetam Y, exceto renda Dados: almentacao

Despesa com Almentação 3 5 Almentação 5 5 4 6 8 Renda Semanal MTB > correlaton c c3 Correlatons: Almentação; Renda Semanal Pearson correlaton of Almentação and Renda Semanal =,546 P-Value =, Há ndícos de assocação lnear entre renda e despesas com almentação Ajuste de Mínmos Quadrados Stat > Regresson > Regresson Regresson Analyss: Almentação versus Renda Semanal The regresson equaton s Almentação = 4,8 +,8 Renda Semanal Predctor Coef SE Coef T P Constant 4,77,4,84,73 Renda Semanal,89,354 4,, S = 37,854 R-Sq = 3,7% R-Sq(adj) = 9,9% Analyss of Varance Source DF SS MS F P Regresson 5 5 7,65, Resdual Error 38 543 49 Total 39 79533 Para cada aumento de $, na renda, estma-se que o consumo; Aumento de $ na renda estmatva de aumento médo de $,83 nos gastos com almentação Intercepto sem nterpretação, pos, não há observações próxmas da renda nula

Reta de Regressão Stat > Regresson > Ftted Lne Plot 3 Almentação = 4,77 +,83 Renda Semanal 5 Almentação 5 S 37,854 R-Sq 3,7% R-Sq(adj) 9,9% 5 4 6 8 Renda Semanal Dados Importantes de Saída ep( ˆβ ) ep( ˆβ ),4,354 σˆ.49 R,37 3% da varação dos gastos de almentação é explcada pela renda

Matrz de Varâncas e Covarâncas Covarânca entre ß e ß : Cov ( ˆ ˆ xσ 698(.49) β, β ) = = =, 65 S xx.53.463 Matrz de varâncas e covarâncas: 49,8,65,65,9 Correlação entre os estmadores: corr ( ˆ ˆ,65 β, β ) = =, 968 (,4)(,354) Cálculo de S xx no Mntab MTB > Let K=ssq('Renda Semanal')-(mean('Renda Semanal')**)*count('Renda Semanal') MTB > Prnt K Data Dsplay K 53463 Intervalos de 95% de Confança t,5;4- =,4 ß :,83±,4(,35),67 β,9 ß : 4,77 ±,4(,4) 4,4 β 85,58

Testes de Hpóteses - Sgnfcânca Nível de sgnfcânca: a=5% Valor crítco: t,5;4- =,4 H : ß = vs H : ß? Estatístca T (saída Mntab):,84 Comparação com valor crítco:,84 <,4 Não há evdêncas para rejetar a hpótese de que o ntercepto seja zero. H : ß = vs H : ß? Estatístca T (saída Mntab): 4, Comparação com valor crítco: 4, >,4 Há evdêncas para consderar a regressão sgnfcante. H : ß =, vs H : ß?, Estatístca T: βˆ β T = ep ( βˆ ),89, =,354 =,93 Comparação com valor crítco:,93 <,4 Não rejetamos a hpótese que ß =,

H : ß = vs H : ß > Valor crítco: t,5;4- =,686 Estatístca T (saída Mntab): 4, Comparação com valor crítco: 4, >,686 Há evdêncas para consderar a nclnação da reta regressão crescente. Predção Despesa mensal com almentação para resdênca com renda mensal x = $75 ~ Y = 4,77 +,89(75) 36,98 Erro padrão da predção: Var = ~ (75 698) ( Y ) =.49 + + =.467, 46 4.53.463 ~ ep( Y ) =.467,46 38, 35 = Intervalo de 95% de confança da predção: ~ 36,98 ±,4(38,35) 59,45 Y 4,5 Predção () O ntervalo é grande. A predção não é confável

Intervalos de Confança e de Predção Mntab Stat > Regresson > Regresson Entrando com uma coluna de níves não observados Saída Mntab ntervalo confança ntervalo predção ntervalo mas precso Análse dos Resíduos Resdual Plots for Almentação Percent Normal Probablty Plot of the Resduals 99 9 5 - - Standardzed Resdual Standardzed Resdual - - Resduals Versus the Ftted Values 5 Ftted Value Hstogram of the Resduals Resduals Versus the Order of the Data Frequency, 7,5 5,,5, - - Standardzed Resdual - - 5 5 5 3 35 4 Standardzed Resdual Observaton Order

Referêncas Bblografa Recomendada Gujarat, D. N. (Pearson) Econometra Básca Hll, R. C., Grffths, W. E. e Judge, G. (Sarava) Econometra