Regressão Lnear Smples Frases Por serem mas precsos que as palavras, os números são partcularmente adequados para transmtr conclusões centífcas Pagano e Gauvre, 4 Rotero. Modelagem de Relação. Modelo Lnear 3. Estmação dos Parâmetros 4. Inferênca sobre os Parâmetros 5. Avalação do Modelo 6. Aplcação 7. Referêncas
Modelagem de Relação Regressão e Correlação Regressão: Usa varável(es) explcatva(s) para explcar ou predzer comportamento de varável resposta (quando houver sentdo). Correlação: Trata smetrcamente duas varáves Regressão Varável resposta (Y): Varável resposta cujo comportamento se quer explcar Varável(es) explcatva(s) (X ): São de nteresse caso ajudem a entender, explcar ou predzer o comportamento de Y. O enfoque da regressão é natural quando Y é aleatóra e X é controlada ou não-aleatóra.
x Varável explcatva Varável ndependente Regressor Predtor Varável exógena Varável de controle ou estímulos Y Varável explcada Varável dependente Regreddo Predto Varável endógena Varável resposta Exemplo Vendas/Renda Varável resposta: Vendas no varejo ($) Varável explcatva: Renda dsponível ($) 7 Vendas no Varejo ($) 65 6 55 Tendênca lnear 9 3 Renda Dsponível ($) Exemplo Absorção de Oxgêno Varável resposta: Absorção de Oxgêno Varável explcatva: Ventlação 6 4 Absorção de Oxgêno 8 6 4 Tendênca exponencal 5 5 5 3 35 4 45 Ventlação
Exemplo 3 Comprmentos de Fígados Varável resposta: Comprmento do fígado (mm) Varável explcatva: Tempo de gestação (sem.) 7 Comprmento do fígado (mm) 6 5 4 3 Tendênca não-lnear 5 5 3 Tempo de Gestação (sem.) 35 4 Modelo de Regressão Relação de regressão: Tendênca + dspersão resdual Tendênca: Suavzação dos dados Explca a maor parte das dferenças de Y Valores atípcos: Observações muto dferente do restante dos dados Relações Fortes e Fracas Relação Forte: A dspersão é pequena em relação à ampltude dos valores da curva de tendênca Em dados observaconas, relações fortes não são necessaramente causas
Intervalo de Predção 7 Comprmento do fígado (mm) 6 5 4 3 Para 5 semanas: comprmento fígado entre 3 e 4 mm 5 5 3 35 4 Tempo de Gestação (sem.) Grande dspersão em torno da tendênca Relação fraca Intervalos de predção amplos Predção mprecsa Outros Padrões () Concentração de qunase de creatnna no sangue Concentração (mu/ml) 8 6 4 3 4 5 Tempo (horas) Os padrões da tendênca varam Outros Padrões () 5 45 4 Naconas Peso (. lb) 35 3 5 Importados 5 75 5 5 75 Preço ($.) Importante descobrr o que defne os grupos
Outros Padrões (3),5, Largura da pétala,5,,5, 3 4 5 6 7 Comprmento da pétala Varedades dferentes de Flores Resumo de Tendênca Abordagens Ajuste de funções matemátcas: Y = f(x) Técncas de suavzação: Lowess, núcleo-estmador, splne Ajuste de Funções Tendênca lnear: Y = β X + β Para cada mudança de uma undade em X, Y muda uma quantdade fxa. Tendênca quadrátca: Y = β + + βx β X Tendênca levemente curva
Y Tendênca exponencal: βx Y = βe 4 9 8 3 7 6 lny 5 4 3,,5,,5 3, 3,5 4,,,5,,5 3, 3,5 4, x x Cada mudança de uma undade em X, Y muda uma % fxa Se a tendênca é exponencal, o gráfco de log(y) vs X têm tendênca lnear Passos na Construção de um Modelo Estatístco Especfcar um modelo estatístco: fórmula e premssas Estmar os parâmetros do modelo a partr dos dados amostras Examnar os resíduos e testar a adequação do modelo Se modelo não for aprovado Usar o modelo Modelo Lnear
Tpos Smples: Uma varável ndependente (explcatva) Múltpla: Duas ou mas varáves ndependentes Objetvos Encontrar equação matemátca que permta: Descrever e compreender a relação entre ou mas varáves aleatóras Projetar ou estmar uma nova observação Ajustar uma reta a partr dos dados amostras Utldades Busca de relações de Causa e Efeto; Predção de valores; Estabelecer explcação sobre população a partr de uma amostra
Regressão Lnear Smples Busca-se a equação de uma reta que permta: Descrever e compreender a relação entre duas varáves Projetar e estmar uma das varáves em função da outra. Regressão Lnear Smples () A partr de valores observados de X e Y, modelar a tendênca através de uma equação do tpo: Y = β + βx Função Lnear Y = β + βx f(x) se modfca a uma taxa constante em relação à sua varável ndependente ß e ß são constantes y ß : ntercepto-y ß : coefcente angular x
Intercepto e Coefcente Angular y (x, y ) y -y =? y (x, y ) x -x =? x ß = tg α x ß = varação de y varação de x ß : ntersecção da reta com o exo y Interpretação dos Parâmetros ß : declvdade da reta defne o aumento ou dmnução da varável Y por undade de varação de X ß = ntercepto em y defne o valor médo de Y nterferênca de X (com X=). sem a Exemplo Aumento de Arrecadação (%) em relação à Redução Alíquota de ICMS (%) % Aumento de Arrecadação 9 8 7 6 5 4 3 Arrecadação = +,9373 ICMS 3 4 % Redução Alíquota de ICMS 5 ß : a cada redução de % na alíquota há,9 % de aumento de arrecadação ß =: Se não há redução na alíquota não há de aumento de arrecadação
Y A Reta de Regressão Para um mesmo valor X podem exstr um ou mas valores de Y amostrados Para esse mesmo valor X haverá um valor ^ ajustado Y Para cada valor X exstrá um dado desvo d dos valores de Y ^ Há observações que não são pontos da reta. Ajuste da Reta 9 8 7 6 5 4 3,,5,,5 X Qual a reta que se ajusta melhor aos dados? ou seja quas os valores de ß e ß? Escolher ß e ß de manera a tornar mínma a dstânca entre a reta e os pontos 3, 3,5 4, Método dos Mínmos Quadrados Crtéro: Valores dos parâmetros que mnmzam a soma dos quadrados dos desvos n ( Y ˆ Y ) =
Método dos Mínmos Quadrados () Mnmzação em relação a ß e ß : { Y ( β βx )} S = d = + S = β y d S = β x Método dos Mínmos Quadrados (3) Resultados das dervadas parcas: β ˆ = ˆβ = n. ( x y ) ( x ) ( y ) n. x ( ) x y b x n βˆ = Calculando por meddas estatístcas : S S xy xx β ˆ Y βˆ X = s ˆβ = = r s XY X XY s s Y X Estmatva de Mínmos Quadros Dadas observações (X, Y ),..., (X n, Y n ) os coefcentes da reta que melhor se ajusta aos dados são: β = βˆ e β = βˆ que são chamados estmatvas de mínmos quadrados do ntercepto e da declvdade A reta de mínmos quadrados é dada por: ˆ ˆ ˆ Y = β + βx
Exemplo Le de Consumo Keynesano Na méda, há dsposção do ndvíduo aumentar seu consumo quando sua renda aumenta, mas não tanto quanto o aumento em sua renda. A propensão margnal para consumr é maor que mas menor que Consumo Renda Famlar Famlar ($) ($) Y X X X.Y Y 7 8 6.4 5.6 4.9 65. 6.5 4.5 9 4.4.8 8. 95 4 9.6 3.3 9.5 6 5.6 7.6. 5 8 3.4.7 3.5 4. 4. 4.4 4 48.4 3.8 9.6 55 4 57.6 37. 4.5 5 6 67.6 39..5..7 3. 5.5 3. y = S xx S xy x =7 = 3. (7) = 33. = 5.5 (7)() = 6.8 6.8 β = 33. ˆ =,59 β ˆ = (,59)(7) = 4,45 Yˆ = 4,45 +, 59X Exemplo HP Entrar cada par de dados: Y Enter X S + Para determnar o ntercepto-y: Dgte g y, ˆ r βˆ = 4,45 Para determnar a nclnação: Dgte g y, ˆ r 4,9636 Subtraa o valor anteror do últmo valor obtdo β ˆ = 4,9636 4,4545 =,59
Exemplo Mntab Stat > Regresson > Ftted Lne Plot Exemplo Saída Mntab Regresson Analyss: Consumo versus Renda The regresson equaton s Consumo = 4,45 +,59 Renda S = 6,493 R-Sq = 96,% R-Sq(adj) = 95,7% 6 4 Ftted Lne Plot Consumo = 4,45 +,59 Renda S 6,493 R-Sq 96,% R-Sq(adj) 95,7% Consumo 8 6 5 Renda 5 Interpretação Yˆ = 4,45 +, 59X Inclnação: Propensão margnal ao consumo Quando a renda aumenta $, o aumento estmado no consumo médo é $,5 As estmatvas são váldas dentro da classe amostrada (renda semanal entre $8 e3 $6) Intercepto-y A reta ndca $4,45 como nível de consumo quando a renda é zero Esta nterpretação não é válda já que não há pontos amostras próxmos à renda zero
Resíduo de uma Observação Dferença entre o valor observado e o valor estmado (ponto na reta) eˆ = y yˆ Em que: ˆ ˆ ˆ y = β + βx Propredades dos EMQO A soma dos resíduos é zero; A soma dos valores observados da resposta é gual à soma dos valores ajustados y = yˆ A reta de regressão passa pelo ponto ( x, y) A soma dos resíduos ponderados pelos níves da varável ndependente é zero x e ˆ = Propredades dos EMQO () A soma dos resíduos ponderados pelos valores ajustados é zero; e ˆ y ˆ = Os resíduos não tem correlação com os valores ajustados corr( eˆ, yˆ ) = Os resíduos não tem correlação com a varável ndependente corr( eˆ, x ) =
Estmação dos Parâmetros Elaboração do Modelo Quer se encontrar um modelo para relações aproxmadamente lneares, com dos aspectos: tendênca central lnear flutuações em torno desta tendênca Hpóteses sobre as Flutuações As observações de Y em X = x são aleatóras, com alguma dstrbução com: méda µ Y pertencente a uma reta (explca padrão lnear) desvo padrão s (explca a dspersão) Suponha que esta dstrbução seja normal:
Quando X = x, Y ~ N(µ Y, s ), com µ Y = ß + ß x Apresentado de outra manera: Quando X = x, Y = ß + ß x + e, e ~ N(, s ) Modelo Clássco Hpóteses Subjacentes Modelo de regressão lnear nos parâmetros; Os valores de X são fxados em amostragem repetda (X não-estocástco); Perturbação e com méda zero; Varânca constante de e (homocedastcdade) Perturbações não correlaconadas: cov(e, e j )= Modelo Clássco Hpóteses Subjacentes Covarânca zero entre e e X ; Número de observações maor que o número de parâmetros a serem estmados; Varabldade nos valores de X (Var(X)>); Não há vés de especfcação (o modelo está corretamente especfcado)
Modelo Clássco Hpóteses Subjacentes Não exste multcolneardade perfeta: Não há relações lneares perfetas entre as varáves explcatvas Reta de Regressão Estmação Sob estas hpóteses: ˆβ e ˆβ são os melhores estmadores lneares não vcados de ß e ß. ou seja ˆ ˆ Y = β + βx é uma estmatva da relação populaconal Y = ß + ß x + e onde e representa a dspersão na população. ˆ Propredades Importantes de um Bom Estmador Consstênca: Estmatva se aproxma do verdadero valor do parâmetro à medda que o tamanho da amostra aumenta θ ˆ θ
Propredades Importantes de um Bom Estmador Exatdão: Relaconada com o víco do estmador ( ) θ Bas θ ˆ = θ ˆ Precsão: Relaconada com a varabldade do estmador Var( θˆ ) Quanto menor a varabldade, mas precso é o estmador Estmadores de Mínmos Quadrados São lneares São não-vcados São estmadores efcentes (mínma varânca) Têm varânca mínma na classe dos estmadores lneares não-vcados Propredades de amostras fntas (ndependem do tamanho da amostra) Estmador de ß É estmador não vcado: Varânca: E ( β ˆ ) = β ( ˆ ) σ Var β = S xx Quanto maor a varabldade de X, maor sua precsão
Estmador de ß É estmador não vcado: Varânca: Var E ( β ˆ ) = β x ( βˆ ) = σ + n S xx Quanto mas afastado for o centróde, menor sua precsão Covarânca entre os Estmadores É dada por Cov ( βˆ, βˆ ) xσ = S xx Se ß for superestmado, o ntercepto será subestmado (ou vce-versa) Inferênca sobre s Em geral, s é desconhecdo. A estmatva de mínmos quadrados ordnáros é dada por: SQ Re s σˆ = eˆ = n gl SQRes: Soma dos Quadrados dos Resíduos gl: graus de lberdade Quantdade de observações número parâmetros
Exemplo Le de Consumo Soma dos Quadrados dos Resíduos: 337,7 Estmatva de s : Estmatva da Varânca dos Estmadores: Var Var 337,7 σˆ = = 4,59 8 ( ˆ (7) β ) = 4,59 + = 4, 37 33. 4,59 ( β ) ˆ = =, 78 33. Erro Padrão Defndo como a raz quadrada da varânca do estmador ep ep ( β ) ˆ = 4,37 = 6, 44 ( β ) ˆ =,78 =, 357 Importantes na construção dos ntervalos de confança Exemplo Mntab Stat > Regresson > Regresson
Saída Mntab The regresson equaton s Consumo = 4,5 +,59 Renda erros padrão Predctor Coef SE Coef T P Constant 4,455 6,44 3,8,5 Renda,599,3574 4,4, σˆ S = 6,493 R-Sq = 96,% R-Sq(adj) = 95,7% Analyss of Varance Source DF SS MS F P Regresson 855,7 855,7,87, Resdual Error 8 337,3 4, Total 9 889, σˆ Soma do Quadrado dos Resíduos Inferênca sobre os Parâmetros Hpótese de Normaldade Os termos de erro estocástco são ndependentes e dentcamente dstrbuídos, com e ~ N(, s ), =,,..., n Os estmadores têm dstrbução normal e tornam-se os melhores estmadores nãovcados dos parâmetros
Normaldade Assntótca dos Estmadores Mesmo se os erros não forem normas, se a amostra for sufcentemente grande, os estmadores terão uma dstrbução aproxmadamente normal Inferênca para ß Dstrbução do estmador: βˆ t βˆ ~ N Intervalo de confança ( β, ep( βˆ ) ( βˆ ) β βˆ t ep( βˆ ) α / ;( n ) ep + α / ;( n ) Inferênca para ß contnuação Teste de sgnfcânca do parâmetro: H : ß = vs H : ß? Estatístca de teste: regressão não é sgnfcatva regressão sgnfcatva βˆ T = ep ˆ Dstrbução da estatístca de teste: T ( β ) ~ t( n )
Inferênca para ß Dstrbução do estmador: βˆ t βˆ ~ N Intervalo de confança ( β, ep( βˆ ) ( βˆ ) β βˆ t ep( βˆ ) α / ;( n ) ep + α / ;( n ) Inferênca para ß contnuação Teste de sgnfcânca do parâmetro: H : ß = vs ntercepto não é sgnfcatvo H : ß? nterecepto é sgnfcatvo Estatístca de teste: βˆ T = ep β ˆ Dstrbução da estatístca de teste: T ( ) ~ t( n ) Inferênca para Parâmetros Caso Geral Teste de Hpóteses de parâmetro: H : ß = ß vs H : ß? ß, =, Estatístca de teste: ˆ β β T =, =, ep βˆ ( ) Dstrbução da estatístca de teste: T ~ t( n )
Exemplo Le de Consumo Estmatvas: Erros padrão: βˆ = 4,454 βˆ =,59 ep ep ( βˆ ) = 6,438 ( βˆ ) =, 357 Tamanho da amostra: Intervalos com 95% de Confança Do Parâmetro ß : 4,454 (,36)(6,438) β 4,454+ (,36)(6,438) 9,664 β 39,44 Do Parâmetro ß :,59 (,36)(,357) β,59+ (,36)(,357),468 β,594 Saída Mntab The regresson equaton s Consumo = 4,5 +,59 Renda Estatístca t Predctor Coef SE Coef T P Constant 4,455 6,44 3,8,5 Renda,599,3574 4,4, S = 6,493 R-Sq = 96,% R-Sq(adj) = 95,7% Analyss of Varance Source DF SS MS F P Regresson 855,7 855,7,87, Resdual Error 8 337,3 4, Total 9 889, 4,455,599 Tβ = = 3,83 T 4, 4 β = = 6,44,3574
Avalação do Modelo Qualdade do Ajuste Ajustada uma equação de regressão entre X e Y, qual a qualdade do ajuste? Análse de varânca do modelo Análse dos resíduos Reta de Regressão e Resíduos Valores ajustados: ˆ y = β + βx Resíduos: eˆ = y yˆ y ŷ yˆ = β ˆ ˆ + βx ê x
Desvo em relação à méda artmétca: Desvos d = y y y yˆ = β ˆ ˆ + βx Desvo em relação à reta de regressão: y ê d eˆ = y yˆ x y y = y yˆ + yˆ y Soma dos Quadrados ( y y) = ( yˆ y) + ( y yˆ ) SQT varação total SQReg varação explcada pela regressão SQRes varação não explcada Somas dos Quadrados - Cálculos ( y y ) S yy SQT = = SQ Re g = ( y yˆ ) = β ˆ S xx SQ Re s = SQT SQ Re g
Análse de Varânca Objetvo: Ajustar e comparar modelos aos dados Modelo alternatvo (H ): Y = β + ε βˆ = Y Modelo de regressão smples (H ): Y = + βx β + ε Análse de Varânca Estrutura H H ( X, Y ) Y = β + ε Y = β + βx + ε Resíduos antes da regressão SQT Resíduos após da regressão SQRes SQReg: redução na SQT devdo ao modelo de regressão SQT = SQReg + SQRes Graus de Lberdade SQReg: SQRes: n SQT: n
Análse de Varânca do Modelo Fonte de varação Regressão gl SQ SQReg QM SQ Re g Razão QM Re g F = QM Re s Erro n SQRes SQ Re s n Total n SQT Hpóteses: H Estatístca de teste: F Teste de Hpóteses : Y = β + ε H : Y = β + βx + ε ~ F,( n );α No caso da regressão lnear smples T = F ~ tα / ;( n ) Exemplo Le de Consumo The regresson equaton s Consumo = 4,5 +,59 Renda Predctor Coef SE Coef T P Constant 4,455 6,44 3,8,5 Renda,599,3574 4,4, S = 6,493 R-Sq = 96,% R-Sq(adj) = 95,7% Analyss of Varance Estatístca F Source DF SS MS F P Regresson 855,7 855,7,87, Resdual Error 8 337,3 4, Total 9 889, 337,3 855,7 SQRes = = 4, F = =, 87 4,
Análse de Varânca Interpretação Se SQReg é elevada, então o modelo de regressão é melhor que o modelo da méda amostral; Equvale a ß? Coefcente de Determnação () R = Varação explcada Varação total = Σ (y ^ - y) Σ (y - y) Indca a porcentagem de varabldade que é explcada pelo modelo de regressão Coefcente de Determnação () SQReg SQRes R = = SQT SQT R
Coefcente de Determnação (3) R Sxy S xx SQReg S xx = = SQT S Matematcamente, o coefcente de determnação é o quadrado do coefcente de correlação de Pearson yy = r Exemplo Le de Consumo The regresson equaton s Consumo = 4,5 +,59 Renda Predctor Coef SE Coef T P Constant 4,455 6,44 3,8,5 Renda,599,3574 4,4, S = 6,493 R-Sq = 96,% R-Sq(adj) = 95,7% Analyss of Varance R Source DF SS MS F P Regresson 855,7 855,7,87, Resdual Error 8 337,3 4, Total 9 889, 8.55,7 R = =,96 R = (,98) =, 96 8.89 Consderações sobre R Não mede a adequação do modelo lnear Para comparação entre modelos, é mportante observar a varação do erro quadrátco médo Sua grandeza depende também do ntervalo de varação da varável regressora valor grande de R pode ser resultado de varação rrealsta de x
Abusos Comuns Deve-se tomar cudado na forma do modelo e na seleção das varáves que serão usadas. Forte assocação não mplca relação causal entre varáves Relações de regressão são váldas somente dentro da faxa dos dados orgnas de x. Modelos de regressão não são necessaramente váldos para fns de extrapolação Predção Pergos da Predção Seja cauteloso ao predzer fora do domíno de varação dos dados.
Valor Ajustado É estmador não vcado da lnha de regressão ou seja de E(Y/x ): Varânca: Var ( Yˆ ) = β + β x E x x ( Yˆ ( ) ) = σ + n Quanto mas afastado do centróde dos dados, mas mprecsa será a estmatva do valor ajustado S xx Inferênca para Y o Intervalo de ( a) % de confança em torno da lnha de regressão: Yˆ t ( ˆ ) Y Yˆ t ep( Yˆ ) α / ;( n ) ep Y + α / ;( n ) Exemplo Le de Consumo Keynesano Deseja-se determnar o ponto da reta para o nível de renda de x = $. O consumo médo estmado para nível de renda $ é: ˆ = 4,455+,599() = 75,364 Y
A varânca da méda de consumo para este nível de renda é: Var ( ˆ ( 7) Y ) = 4,59 + =, 476 33. ( ˆ ) =,476 = 3, 37 ep Y Como t,5;- =,36, então o ntervalo de 95% de confança é: 75,364 (,36)(3,37) Y 75,364 + (,36)(3,37) 67,899 Y 8,89 Cálculo do Valor Ajustado HP Entrar cada par de dados: Y Enter X S + Para determnar o valor ajustado para nível de renda $: Dgte g y, ˆ r ˆ = 75, 364 Y Intervalo de Pontos da Reta Mntab Stat > Regresson > Regresson
Mntab Saída Regresson Analyss: Consumo versus Renda The regresson equaton s Consumo = 4,5 +,59 Renda Predctor Coef SE Coef T P Constant 4,455 6,44 3,8,5 Renda,599,3574 4,4, S = 6,493 R-Sq = 96,% R-Sq(adj) = 95,7% Analyss of Varance Tabela de Ajustes e Resíduos Source DF SS MS F P Regresson 855,7 855,7,87, Resdual Error 8 337,3 4, Total 9 889, Valor ajustado Erro padrão Obs Renda Consumo Ft SE Ft Resdual St Resd 65,8 3,8 4,8,9 8 7, 65, 75,36 3,4 -,36 -,84 3 9, 85,55,7 4,45,76 4 4 95, 95,73,3 -,73 -, 5 6, 5,9,8 4,9,67 6 8 5, 6,9,8 -,9 -,8 7, 6,7,3-6,7 -,3 8 4, 36,45,7 3,55,6 9 4 55, 46,64 3,4 8,36,49 6 5, 56,8 3,8-6,8 -,3 Intervalo de Confança da Reta Mntab Stat > Regresson > Ftted Lne Plot 75 5 Banda de confança Ftted Lne Plot Consumo = 4,45 +,59 Renda Regresson 95% CI S 6,493 R-Sq 96,% R-Sq(adj) 95,7% Consumo 5 75 5 5 Renda 5
Predção de Nova Observação Predção de resposta nova ou futura para um nível x não utlzado na estmação dos parâmetros ~ Y estmação pontual de Y (resposta não observada: ~ Y = β ˆ + βˆ x Valor Ajustado É estmador não vcado da nova resposta: Varânca: Var ~ ( Y ) = β + β x E ~ ( x x) ( Y ) = σ + σ + n Fontes de varabldade:. varação dos estmadores. varação natural de Y S xx Inferênca para Y o Intervalo de predção de ( a) % para uma nova observação: ~ Y t ~ ~ ~ ( ) Y Y t ep( Y ) α / ;( n ) ep Y + α / ;( n ) O ntervalo de predção em x é sempre mas largo que o ntervalo de confança em x. A largura do ntervalo é mínma quando x = x
Le de Consumo Keynesana Predção Consumo para ndvíduo não observado com renda mensal x = $ ~ Y = 4,455+,599() 8,455 Erro padrão da predção: Var = ~ ( 7) ( Y ) = 4,59 + + = 5, 974 33. ~ ep( Y ) = 5,974 7, 4 = Intervalo de 95% de confança da predção: 8,455 ±,36(7,4) ~ 63,99 Y 96,9 Intervalo de Pontos da Reta Mntab Stat > Regresson > Regresson Pode-se entrar uma coluna de valores Saída Mntab Regresson Analyss: Consumo versus Renda The regresson equaton s Consumo = 4,5 +,59 Renda Predctor Coef SE Coef T P Constant 4,455 6,44 3,8,5 Renda,599,3574 4,4, S = 6,493 R-Sq = 96,% R-Sq(adj) = 95,7% Analyss of Varance Source DF SS MS F P Regresson 855,7 855,7,87, Resdual Error 8 337,3 4, Total 9 889, ntervalo confança Predcted Values for New Observatons New Obs Ft SE Ft 95% CI 95% PI 8,45,97 (73,6; 87,3) (63,99; 96,9) ntervalo predção Values of Predctors for New Observatons New Obs Renda
Aplcação Um Modelo Econômco Objetvo: Estudar a relação entre renda famlar e despesas com almentação. Expermento: Amostra aleatóra de resdêncas, com renda famlar semanal maor que $48 Característca de nteresse: Despesa semanal da resdênca com almentação Quanto fo gasto com almentação na semana passada? Modelo Proposto Y = ß + ß x + e Varáves: Resposta (Y ) : Despesa com almentação Explcatva(x ): Renda Famlar Semanal Erro (e ): Todos os fatores que afetam Y, exceto renda Dados: almentacao
Despesa com Almentação 3 5 Almentação 5 5 4 6 8 Renda Semanal MTB > correlaton c c3 Correlatons: Almentação; Renda Semanal Pearson correlaton of Almentação and Renda Semanal =,546 P-Value =, Há ndícos de assocação lnear entre renda e despesas com almentação Ajuste de Mínmos Quadrados Stat > Regresson > Regresson Regresson Analyss: Almentação versus Renda Semanal The regresson equaton s Almentação = 4,8 +,8 Renda Semanal Predctor Coef SE Coef T P Constant 4,77,4,84,73 Renda Semanal,89,354 4,, S = 37,854 R-Sq = 3,7% R-Sq(adj) = 9,9% Analyss of Varance Source DF SS MS F P Regresson 5 5 7,65, Resdual Error 38 543 49 Total 39 79533 Para cada aumento de $, na renda, estma-se que o consumo; Aumento de $ na renda estmatva de aumento médo de $,83 nos gastos com almentação Intercepto sem nterpretação, pos, não há observações próxmas da renda nula
Reta de Regressão Stat > Regresson > Ftted Lne Plot 3 Almentação = 4,77 +,83 Renda Semanal 5 Almentação 5 S 37,854 R-Sq 3,7% R-Sq(adj) 9,9% 5 4 6 8 Renda Semanal Dados Importantes de Saída ep( ˆβ ) ep( ˆβ ),4,354 σˆ.49 R,37 3% da varação dos gastos de almentação é explcada pela renda
Matrz de Varâncas e Covarâncas Covarânca entre ß e ß : Cov ( ˆ ˆ xσ 698(.49) β, β ) = = =, 65 S xx.53.463 Matrz de varâncas e covarâncas: 49,8,65,65,9 Correlação entre os estmadores: corr ( ˆ ˆ,65 β, β ) = =, 968 (,4)(,354) Cálculo de S xx no Mntab MTB > Let K=ssq('Renda Semanal')-(mean('Renda Semanal')**)*count('Renda Semanal') MTB > Prnt K Data Dsplay K 53463 Intervalos de 95% de Confança t,5;4- =,4 ß :,83±,4(,35),67 β,9 ß : 4,77 ±,4(,4) 4,4 β 85,58
Testes de Hpóteses - Sgnfcânca Nível de sgnfcânca: a=5% Valor crítco: t,5;4- =,4 H : ß = vs H : ß? Estatístca T (saída Mntab):,84 Comparação com valor crítco:,84 <,4 Não há evdêncas para rejetar a hpótese de que o ntercepto seja zero. H : ß = vs H : ß? Estatístca T (saída Mntab): 4, Comparação com valor crítco: 4, >,4 Há evdêncas para consderar a regressão sgnfcante. H : ß =, vs H : ß?, Estatístca T: βˆ β T = ep ( βˆ ),89, =,354 =,93 Comparação com valor crítco:,93 <,4 Não rejetamos a hpótese que ß =,
H : ß = vs H : ß > Valor crítco: t,5;4- =,686 Estatístca T (saída Mntab): 4, Comparação com valor crítco: 4, >,686 Há evdêncas para consderar a nclnação da reta regressão crescente. Predção Despesa mensal com almentação para resdênca com renda mensal x = $75 ~ Y = 4,77 +,89(75) 36,98 Erro padrão da predção: Var = ~ (75 698) ( Y ) =.49 + + =.467, 46 4.53.463 ~ ep( Y ) =.467,46 38, 35 = Intervalo de 95% de confança da predção: ~ 36,98 ±,4(38,35) 59,45 Y 4,5 Predção () O ntervalo é grande. A predção não é confável
Intervalos de Confança e de Predção Mntab Stat > Regresson > Regresson Entrando com uma coluna de níves não observados Saída Mntab ntervalo confança ntervalo predção ntervalo mas precso Análse dos Resíduos Resdual Plots for Almentação Percent Normal Probablty Plot of the Resduals 99 9 5 - - Standardzed Resdual Standardzed Resdual - - Resduals Versus the Ftted Values 5 Ftted Value Hstogram of the Resduals Resduals Versus the Order of the Data Frequency, 7,5 5,,5, - - Standardzed Resdual - - 5 5 5 3 35 4 Standardzed Resdual Observaton Order
Referêncas Bblografa Recomendada Gujarat, D. N. (Pearson) Econometra Básca Hll, R. C., Grffths, W. E. e Judge, G. (Sarava) Econometra