ESTATÍSTICA MULTIVARIADA 2º SEMESTRE 2010 / 11 EERCÍCIOS PRÁTICOS - CADERNO 4 Regressão Lnear
4. EERCÍCIOS PARA RESOLVER NAS AULAS 4.1. O gestor de marketng duma grande cadea de supermercados quer determnar o efeto do espaço de prateleras nas vendas de comda para anmas. Selecconou uma amostra de 12 lojas de dmensão muto próxma nas quas recolheu os seguntes dados: Loja Espaço de pratelera em m ( ) Vendas numa semana (x10 3 ) ( Y ) 1 5 1.6 2 5 2.2 3 5 1.4 4 10 1.9 5 10 2.4 6 10 2.6 7 15 2.3 8 15 2.7 9 15 2.8 10 20 2.6 11 20 2.9 12 20 3.1 a) Faça um dagrama que evdence a relação entre as duas varáves. b) Qual a relação entre as duas varáves? Calcule uma medda aproprada. c) Assumndo uma relação lnear entre elas, calcule os estmadores de mínmos quadrados ordnáros para os coefcentes da recta das vendas em função do espaço de pratelera. d) Interprete o valor do declve da recta. e) Qual a sua estmatva (em mlhares de euros) para as vendas semanas duma loja com 8 m de pratelera para comda de anmas? f) Qual o seu erro médo de estmatva? g) Qual o valor do coefcente de determnação. Interprete. 4.2. O gestor de um servço de lmousne entre um aeroporto e a área metropoltana envolvente está nteressado em ter uma dea da relação entre a dstânca percorrda em cada servço e o tempo que o mesmo demora. Para sso recolheu os respectvos valores para os últmos 12 clentes: Loja Dstânca em km ( ) 1 10.3 19.71 2 11.6 18.15 3 12.1 21.88 4 14.3 24.21 5 15.7 27.08 6 16.1 22.96 7 18.4 29.38 8 20.2 37.24 9 21.8 36.84 10 24.3 40.59 11 25.4 41.21 12 26.17 38.19 Tempo em mn. Y 14-03-11 4.2
a) Faça um dagrama que evdence a relação entre as duas varáves e calcule uma estatístca aproprada para a medr. b) Assumndo uma relação lnear entre elas, calcule os estmadores de mínmos quadrados ordnáros para os coefcentes da recta da duração em função da dstânca percorrda. Interprete o valor do declve. c) Qual a sua estmatva (em mnutos) para a duração dum servço em que é necessáro percorrer 20 km? d) Calcule o erro médo de estmatva? e) Calcule o coefcente de determnação e nterprete. 4.3. Consdere o modelo de regressão Y 1 2 2 3 3 ε e as seguntes ses observações para as varáves Y, 2 e 3 : Y 2 3 1 15 2 10 2 9 3 5 3 3 3 7 4 25 6 19 5 7 7 11 6 13 9 18 a) Escreva o modelo na forma matrcal e especfque qual o vector Y e a matrz b) Calcule: ) As matrzes ', 'Y e (') -1. ) As estmatvas de mínmos quadrados ordnáros para os. ) Os erros de estmação para as ses observações utlzadas. v) A estmatva da varânca dos erros; v) A matrz de varâncas/covarâncas dos estmadores; v) Os erros padrão dos. v) Mostre que a varação total é gual à soma da varação explcada com a varação resdual e calcule o coefcente de determnação R 2. Mostre anda que o coefcente de determnação é o quadrado do coefcente de correlação lnear smples entre a varável dependente e as suas estmatvas. c) Confrme os resultados obtdos em b) usando o SPSS. d) Teste a sgnfcânca dos parâmetros do modelo. e) Teste a aderênca global do modelo. f) Apresente uma estmatva para Y quando 2 = 4 e 3 = 12. Qual o respectvo ntervalo de confança a 95%? 14-03-11 4.3
4.4. Consdere o modelo de regressão Y 1 1 2 2 3 3 ε e as segunte nove observações para as varáves Y, 1, 2 e 3 : Y 1 2 3 1 1 1 0-1 2-1 -1 1 0 3 2 1 0 0 4 0 0 1 0 5 4 1 2 0 6 2 0 3 0 7 2 0 0 1 8 0 1-1 1 9 2 0 1 1 a) Escreva o modelo na forma matrcal e especfque qual o vector Y e a matrz b) Calcule: ) As matrzes ', 'Y e (') -1 (Lembre-se que a nversa de uma matrz dagonal é a dagonal com os nversos de cada elemento). ) As estmatvas de mínmos quadrados ordnáros para os. ) Os erros de estmação para as nove observações utlzadas. v) A estmatva da varânca dos erros; v) A matrz de varâncas/covarâncas dos estmadores; v) Os erros padrão dos. v) O coefcente de determnação R 2. c) Confrme os resultados obtdos em b) usando o SPSS. d) Faz sentdo manter todas as varáves no modelo? E globalmente o modelo é bom? 14-03-11 4.4
4.5. Consdere o modelo Y 1 2 2 3 3 ε que fo aplcado a 20 observações para as quas se obtveram os seguntes resultados: 0. 96587 0. 69914 1. 7769 ˆ Vˆ 0.21812 0.19195.050301 ˆ 2 2.5193 e R 2 = 0.9466. 0.19195 0.048526.031223.050301.031223 0.03712 a) Qual a varação total, a varação explcada e qual a varação não explcada. b) Apresente os ntervalos de confança a 95% para 2 e para 3. c) Teste H 0 : 2 1 contra H A : 2 < 1. d) Teste separadamente a sgnfcânca dos parâmetros. e) Utlzando os valores apresentados em a) teste a hpótese H 0 : 2 = 3 = 0. f) Escreva a hpótese 2 = 3 = 0 na forma vectoral, e calcule Vˆ teste. Que relação tem com os resultados calculados em e)? S. Usando esta nformação repta o 14-03-11 4.5
4.6. Na tabela 5.4 apresentam-se os dados das vendas semanas de uma das maores marcas de conservas de atum numa cadea de supermercados do Mdwest amercano durante um ano cvl (dados no fchero CONSERVA.SAV). As varáves apresentadas são: Sal1 = undades venddas da marca nº. 1 de conservas de atum; Apr1 = preço por lata da conserva da marca nº. 1; Apr2, 3 = preços por lata das marcas concorrentes n os. 2 3; Dsp = varável "dummy" que assume o valor 1 nas semanas em que a marca 1 teve uma exposção especal (topo, lha, caxa, etc.) mas não teve promoção outas semanas; mpressa e 0 nas DspAd = varável "dummy" que assume o valor 1 quando a marca 1 teve exposção especal e também promoção mpressa e 0 nas outras semanas. Propôs-se para explcar as vendas semanas da marca 1 de conservas de atum o segunte modelo semlogartmco: ln Sal1 1 2 Apr1 3 Apr2 4 Apr3 5 Dsp 6 DspAd a) Dscuta a forma do modelo proposto e qual a sua justfcação neste problema. b) Estme o modelo pelos mínmos quadrados ordnáros. Dscuta e nterprete o sgnfcado de 2, 3 e 4. c) Serão os snas de 5 e 6 consstentes com o esperado? Teste a contrbução das varáves "dummy" para a explcação das vendas testando alternatvamente as seguntes hpóteses: ) H 0 : 5 = 0 contra H A : 5 0. ) H 0 : 6 = 0 contra H A : 6 0. ) H 0 : 5 = 6 = 0 contra H A : 5 ou 6 0. v) H 0 : 6 5 contra H A : 6 < 5. Que conclusões são relevantes para os gestores do supermercado? 14-03-11 4.6
Tabela 5.6 - Vendas de conservas de atum Sal1 Apr1 Apr2 Apr3 Dsp DspAd 6439 0.66 0.82 0.79 1 0 3329 0.62 0.80 0.59 1 0 3415 0.62 0.77 0.63 0 0 2909 0.62 0.66 0.81 0 0 2598 0.63 0.65 0.81 0 0 3773 0.69 0.63 0.80 0 0 20383 0.63 0.65 0.78 0 1 11761 0.65 0.78 0.80 1 0 2614 0.77 0.62 0.77 1 0 2496 0.81 0.69 0.68 1 0 20811 0.68 0.85 0.70 0 1 8339 0.71 0.86 0.80 1 0 2793 0.84 0.86 0.80 1 0 2416 0.82 0.86 0.82 0 0 2837 0.84 0.86 0.81 0 0 2110 0.82 0.77 0.83 0 0 6422 0.78 0.82 0.81 1 0 4539 0.81 0.91 0.85 1 0 2493 0.89 0.91 0.82 0 0 2262 0.85 0.89 0.76 0 0 2145 0.85 0.89 0.77 0 0 11996 0.71 0.90 0.84 0 1 5847 0.78 0.92 0.83 1 0 2257 0.85 0.43 0.84 1 0 2461 0.87 0.82 0.83 0 0 2075 0.86 0.93 0.84 1 0 14044 0.77 0.90 0.82 0 1 4521 0.80 0.75 0.78 0 0 2052 0.85 0.76 0.80 0 0 1762 0.85 0.89 0.78 0 0 2375 0.87 0.91 0.78 0 0 3256 0.88 0.85 0.88 0 0 3280 0.83 0.78 0.90 0 0 27254 0.69 0.93 0.87 0 1 14129 0.69 0.92 0.90 1 0 2906 0.90 0.91 0.87 1 0 17630 0.69 0.68 0.69 0 1 9431 0.73 0.69 0.73 1 0 32820 0.61 0.73 0.87 0 1 12635 0.67 0.90 0.89 1 0 2509 0.89 0.91 0.69 1 0 2184 0.89 0.59 0.71 1 0 12485 0.70 0.65 0.87 0 1 6560 0.75 0.90 0.69 1 0 2647 0.92 0.91 0.74 1 0 2949 0.91 0.92 0.89 1 0 3016 0.91 0.91 0.90 1 0 2370 0.91 0.91 0.59 0 0 2006 0.91 0.76 0.62 0 0 2556 0.90 0.77 0.86 0 0 13808 0.69 0.76 0.88 0 1 6668 0.82 0.77 0.86 1 0 14-03-11 4.7
4.7. (Adaptado do teste de 19.Jun.99) Um amgo seu resolveu antecpar as féras e está "de servço" num restaurante de bera de estrada no Algarve. Para matar o tempo e mpressonar o patrão, resolveu explorar a possbldade de explcar as recetas mensas dos restaurantes deste tpo em função da sua capacdade e do movmento na estrada. Com o ntuto de estmar um modelo lnear, recolheu para cnco restaurantes da regão e referentes a Julho do ano passado: Y as recetas do mês em mlhares de contos; 2 o número de lugares da sala, como medda de capacdade; 3 a estmatva da JAE para o número médo de veículos que crcularam daramente nessa estrada (em mlhares); Fez já alguns cálculos prelmnares: Recetas Capacdade Tráfego Y 2 3 23.8 120 19 24.2 200 8 22.0 150 12 26.2 180 15 33.5 240 16 Y = 129.7; 2 = 890; 3 = 70; Y 2 = 3 444.77 ; 2 2 = 166 900; 2 3 = 1 050; Y 2 = 23 752; Y 3 = 1 838.8; 2 3 = 12 220; a) O seu colega sabe que um restaurante sem lugares numa estrada sem tráfego não vende nada. Mas mesmo assm resolveu estmar um modelo com constante. Escreva a respectva expressão e dga quas os pressupostos que têm de se verfcar para que seja estmável pelos mínmos quadrados ordnáros. b) Indque um ponto que satsfaça a relação que va estmar. Para lhe facltar a resolução das questões que se seguem, o seu colega construu a matrz 1 ' e nverteu-a, e ntroduzu os dados no SPSS, com os quas obteve o output que se segue, onde foram apagados mutos dos resultados que tem de apresentar, mas onde pode também recolher nformação que lhe poupa mutos cálculos nas respostas. ' 1 9.670373 0.029515 0.301194 0.029515 0.000131 0.000448 0.301194 0.000448 0.015821 14-03-11 4.8
Summary Std. Error of Durbn- R R Square the Estmate Watson 1.4768 2.532 a Predctors: (Constant), TRAFEGO, CAPACIDADE b Dependent Varable: RECEITAS ANOVA Sum of Squares df Mean Square 1 Regresson Resdual.455 2.227 Total a Predctors: (Constant), TRAFEGO, CAPACIDADE b Dependent Varable: RECEITAS c) Quas as estmatvas para os parâmetros do modelo? Qual o sgnfcado dos valores obtdos? d) Os resultados lhe permtem por em questão a decsão do seu amgo de usar uma constante no modelo 1? E as varáves explcatvas escolhdas devem ser mantdas no modelo 1? e) Calcule uma medda aproprada para avalar da qualdade do ajustamento do modelo. f) Va agora testar a aderênca global do modelo 1. Explcte a hpótese que va testar, a dstrbução da estatístca aproprada e proceda ao teste. Que conclusão tra? Como a compara com as conclusões em d)? As conclusões deste e dos testes antes realzados são sempre guas? Porquê? g) Tem razões para duvdar que os resíduos sejam não correlaconados 1? (Se, como é natural, na sua tabela não constar a possbldade de estar a trabalhar com apenas 5 observações, assuma 15.) 1 Nestes testes deve usar um nível de sgnfcânca de 5%. 14-03-11 4.9
EERCÍCIOS PARA TREINO 4.8. (Adaptado do teste modelo de 15.Jun.99) Um colega seu está nteressado em estudar o preço das casas (em contos) na zona de Benfca em função do número de assoalhadas e do número de casas de banho. Para sso recolheu os dados sobre oto apartamentos neste momento em venda: preço Assoalh. C.b. Y 1 2 39400 3 2 37150 2 1 41900 4 3 37100 2 1 39850 3 2 37450 2 2 44200 5 3 41450 4 2 Com o ntuto de estmar um modelo lnear que explque o preço das casas em função das outras duas varáves recolhdas, o seu colega fez já alguns cálculos prelmnares: Y = 318 500; 1 = 25; 2 = 16; Y 2 = 12 726 770 000 ; 2 1 = 87; 2 2 = 36; Y 1 = 1 015 550; Y 2 = 648 850; a) Baseado no prncípo de que uma casa sem assoalhadas nem casa de banho não vale nada, o seu colega quer estmar um modelo que passe pela orgem (ou seja, sem constante). Escreva a respectva expressão e dga quas os pressupostos que têm de se verfcar para que seja estmável pelos mínmos quadrados ordnáros. b) Apresente as respectvas matrzes ', 'Y e (') -1. Quas as estmatvas para os parâmetros do modelo? Qual o sgnfcado dos valores obtdos? c) Calcule os erros padrão dos estmadores e teste a hpótese de serem zero. Que conclu? d) Calcule uma medda aproprada para avalar da qualdade do modelo e teste a aderênca global do modelo. e) Quando o seu colega fo mostrar o trabalho feto até aí ao professor, este convenceu-o de que deva usar um modelo com constante. Haverá argumentos estatístcos que o justfquem, ou terá sdo apenas o seu poder de persuasão que levou o seu colega a mudar de opnão? O resultado do modelo com constante estmado pelo SPSS é apresentado no Anexo. Que letura faz dos novos resultados? 14-03-11 4.10
ANEO ao problema 4.8 (Output do SPSS) R R Square Summary b Adjusted R Square Std. Error of the Estmate Durbn- Watson 1.998 a.996.995 185.18 2.287 a Predctors: (Constant), CB, ASSOALH b Dependent Varable: PRECO ANOVA b Sum of Mean df Squares Square F Sg. 1 Regresson 46 317 291.667 2 23 158 645.833 675.343.000 a Resdual 171 458.333 5 34 291.667 Total 46 488 750.000 7 a Predctors: (Constant), CB, ASSOALH b Dependent Varable: PRECO Coeffcents a Unstandardzed Coeffcents Standardzed Coeffcents t Sg. B Std. Error Beta 1 (Constant) 32 595.833 209.000 155.961.000 ASSOALH 2 066.667 114.296.903 18.082.000 CB 379.167 170.249.111 2.227.076 a Dependent Varable: PRECO Resduals Statstcs a Mnmum Maxmum Mean Std. Devaton N Predcted Value 37 108.33 44 066.67 39 812.50 2 572.31 8 Resdual -170.83 295.83 1.82E-12 156.51 8 Std. Predcted Value -1.051 1.654.000 1.000 8 Std. Resdual -.923 1.598.000.845 8 a Dependent Varable: PRECO 14-03-11 4.11
4.9. (Adaptado do exame de 29.Jan.2001) Ao estudar a evolução de duas empresas do sector de electrónca de 1979 a 1998 (nos EUA), um seu colega procurou explcar o nvestmento em cada uma delas pelo modelo: I t 1 2 A t 3 C t onde: I t Investmento da empresa no ano t (em mlhões de dólares de 1995); A t Actvo da empresa no níco do ano t ( " " " " ); C t Captas Própros no níco do ano t ( " " " " ); t O dados recolhdos para as empresas A e B são: Empresa A Empresa B It At Ct It At Ct 12.93 191.50 1.80 33.10 1170.60 97.80 25.90 516.00 0.80 45.00 2015.80 104.40 35.05 729.00 7.40 77.20 2803.30 118.00 22.89 560.40 18.10 44.60 2039.70 156.20 18.84 519.90 23.50 48.10 2256.20 172.60 28.57 628.50 26.50 74.40 2132.20 186.60 48.51 537.10 36.20 113.00 1834.10 220.90 43.34 561.20 60.80 91.90 1588.00 287.80 37.02 617.20 84.40 61.30 1749.40 319.90 37.81 626.70 91.20 56.80 1687.20 321.30 39.27 737.20 92.40 93.60 2007.70 319.60 53.46 760.50 86.00 159.90 2208.30 346.00 55.56 581.40 111.10 147.20 1656.70 456.40 49.56 662.30 130.60 146.30 1604.40 543.40 32.04 583.80 141.80 98.30 1431.80 618.30 32.24 635.20 136.70 93.50 1610.50 647.40 54.38 723.80 129.70 135.20 1819.40 671.30 71.78 864.10 145.50 157.30 2079.70 726.10 90.08 1193.50 174.80 179.50 2371.60 800.30 68.60 1188.90 213.50 189.60 2759.90 888.90 O seu colega começou por estmar o modelo para a empresa A ("modelo A"), depos estmou o modelo para a empresa B ("modelo B") e estmou anda um modelo em que juntou as quarenta observações e acrescentou uma varável "dummy" (0 para a empresa A e 1 para a empresa B) e que desgnou por modelo AB. No Anexo apresenta-se parte do output do SPSS para a estmação destes três modelos. Para lhe facltar a resolução das questões que se seguem, o seu colega construu a matrz ' para o modelo B e nverteu-a: ' 1 0.38825218 0.00016846 0.00009758 0.00016846 0.00000013 0.00000015 0.00009758 0.00000015 0.00000092 14-03-11 4.12
a) Analse os resultados apresentados para os modelos estmados para as empresas separadamente ("modelo A" e "modelo B") nos aspectos que lhe parecerem relevantes. b) E como compara os resultados obtdos para o modelo AB com os dos outros dos modelos? c) Um seu colega dscordou da nclusão das constantes nos modelos A e B. Dsse mesmo que essas constantes deveram ser guas nos dos modelos. Tem alguma forma de, justfcando com um teste estatístco, rebater esta afrmação? d) Apresente a sua prevsão (valor esperado e ntervalo de confança a 95%) do nvestmento a realzar pela empresa B no próxmo ano (no "modelo B"), admtndo que actvo e captas própros crescem à taxa méda dos últmos três anos. No caso de usar o modelo AB os resultados seram muto dferentes? (Não necessta calcular o ntervalo de confança). e) Sabendo que as estatístcas de Durbn-Watson para os modelos A, B e AB são, respectvamente, 1.413, 1.072 e 1.101, que pode conclur? 14-03-11 4.13
ANEO ao problema 4.9 (Output do SPSS) o A Coeffcents a Unstandardzed Coeffcents B Std. Error 1 (Constant) -.509 8.015 ACTIVO 5.289E-02.016 CAP_PR 9.241E-02.056 a Dependent Varable: INVEST ANOVA b Sum of Squares 1 Regresson 5 165.553 Resdual 1 773.234 Total 6 938.787 a Predctors: (Constant), CAP_PR, ACTIVO b Dependent Varable: INVEST a o B Coeffcents a Unstandardzed Coeffcents B Std. Error 1 (Constant) -9.956 ACTIVO 2.655E-02 CAP_PR.152 a Dependent Varable: INVEST ANOVA b Sum of Squares 1 Regresson 31 632.030 a Resdual 13 216.588 Total 44 848.618 a Predctors: (Constant), CAP_PR, ACTIVO b Dependent Varable: INVEST 14-03-11 4.14
o AB Coeffcents a Unstandardzed Coeffcents B Std. Error 1 (Constant) 9.986 8.170 ACTIVO 2.974E-02.010 CAP_PR.151.019 EMPRESA -25.951 14.738 a Dependent Varable: INVEST ANOVA b Sum of Squares 1 Regresson 71 819.600 a Resdual 15 249.623 Total 87 069.223 a Predctors: (Constant), EMPRESA, CAP_PR, ACTIVO b Dependent Varable: INVEST 14-03-11 4.15