UNIVERSIDADE FEDERAL DE VIÇOSA CENTRO DE CIÊNCIAS AGRÁRIAS DEPARTAMENTO DE ECONOMIA RURAL ERU 66 - ECONOMETRIA I Segundo Semestre/010 AULA PRÁTICA N o 3- Dados em Panel Ana Carolna Campana Nascmento Fernanda Mara de Almeda 1. DADOS EM PAINEL Dados em panel consstem na combnação de sére temporal e seção cruzada, sto é, têm-se dados de váras undades meddas ao longo do tempo. Consderando um conjunto de dados com modelo geral será: Y = 1,,, N undades e t = 1,,, T períodos de tempo, o = α + X β + ε (1) em que α representa os efeos específcos, ou característcas, das undades que não varam ao longo do tempo e ε o termo de erro. Este modelo gera dos modelos típcos que são estmados de acordo com as pressuposções que fazemos a respeo da possível correlação entre o termo de erro e as varáves explcatvas a) Modelo de Efeos Fxos: Y X : modelo de efeos fxos e modelo de efeos aleatóros. = α + βx + ε () A prncpal característca deste modelo é tratar os α ' s como varáves aleatóras não observadas e correlaconadas com algum b) Modelo de Efeos Aleatóros: X. Y = α + βx + u (3) O estmador de efeos aleatóros consdera o erro combnado, sto é, u = v + ε e pressupõe que v é d com varânca σ v e que ε é d com varânca σ ε. Pode-se mostrar que V e que ( u ) = σ v + σ ε Cov ( u, u s ) σ v =, t s. Logo, σ ρu = Cor ( u, us) =, para todo t s. Assm, o modelo de EA tem como σ + v v σ ε
pressuposção correlação seral no erro (correlação gual em todos lags). O estmador de efeos aleatóros é um estmador de MQG que consdera a correlação entre os erros de cada undade. Exemplo: Consdere os dados do trabalho de Y. Grunfeld, cujo objetvo era verfcar como o nvestmento real bruto (Y) depende do valor real da empresa (x) e do estoque real do capal (x3). Os dados são do período de 1935 a 1954 e correspondem a nformações de quatro empresas (GE, US, GM e WEST), ou seja, tem-se 4 undades de corte transversal e 0 períodos. Este exemplo está na págna 514 do Gujarat. Tabela 1 Investmento de quatro empresas, 1935-1954 (p.515, Gujarat) ano d empresa y x x3 ano d empresa y x x3 1935 1 GE 33.1 1170.6 97.8 1935 3 US 09.9 136.4 53.8 1936 1 GE 45 015.8 104.4 1936 3 US 355.3 1807.1 50.5 1937 1 GE 77. 803.3 118 1937 3 US 469.9 673.3 118.1 1938 1 GE 44.6 039.7 156. 1938 3 US 6.3 1801.9 60. 1939 1 GE 48.1 56. 17.6 1939 3 US 30.4 1957.3 31.7 1940 1 GE 74.4 13. 186.6 1940 3 US 361.6 0.9 54. 1941 1 GE 113 1834.1 0.9 1941 3 US 47.8 380.5 61.4 194 1 GE 91.9 1588 87.8 194 3 US 445.6 168.6 98.7 1943 1 GE 61.3 1749.4 319.9 1943 3 US 361.6 1985.1 301.8 1944 1 GE 56.8 1687. 31.3 1944 3 US 88. 1813.9 79.1 1945 1 GE 93.6 007.7 319.6 1945 3 US 58.7 1850. 13.8 1946 1 GE 159.9 08.3 346 1946 3 US 40.3 067.7 3.6 1947 1 GE 147. 1656.7 456.4 1947 3 US 40.5 1796.7 64.8 1948 1 GE 146.3 1604.4 543.4 1948 3 US 494.5 165.8 306.9 1949 1 GE 98.3 1431.8 618.3 1949 3 US 405.1 1667 351.1 1950 1 GE 93.5 1610.5 647.4 1950 3 US 418.8 1677.4 357.8 1951 1 GE 135. 1819.4 671.3 1951 3 US 588. 89.5 341.1 195 1 GE 157.3 079.7 76.1 195 3 US 645. 159.4 444. 1953 1 GE 179.5 371.6 800.3 1953 3 US 641 031.3 63.6 1954 1 GE 189.6 759.9 888.9 1954 3 US 459.3 115.5 669.7 1935 GM 317.6 3078.5.8 1935 4 WEST 1.93 191.5 1.8 1936 GM 391.8 4661.7 5.6 1936 4 WEST 5.9 516 0.8 1937 GM 410.6 5387.1 156.9 1937 4 WEST 35.05 79 7.4 1938 GM 57.7 79. 09. 1938 4 WEST.89 560.4 18.1 1939 GM 330.8 4313. 03.4 1939 4 WEST 18.84 519.9 3.5 1940 GM 461. 4643.9 07. 1940 4 WEST 8.57 68.5 6.5 1941 GM 51 4551. 55. 1941 4 WEST 48.51 537.1 36. 194 GM 448 344.1 303.7 194 4 WEST 43.34 561. 60.8 1943 GM 499.6 4053.7 64.1 1943 4 WEST 37.0 617. 84.4 1944 GM 547.5 4379.3 01.6 1944 4 WEST 37.81 66.7 91. 1945 GM 561. 4840.9 65 1945 4 WEST 39.7 737. 9.4 1946 GM 688.1 4900 40. 1946 4 WEST 53.46 760.5 86 1947 GM 568.9 356.5 761.5 1947 4 WEST 55.56 581.4 111.1 1948 GM 59. 345.7 9.4 1948 4 WEST 49.56 66.3 130.6 1949 GM 555.1 3700. 100.1 1949 4 WEST 3.04 583.8 141.8 1950 GM 64.9 3755.6 1099 1950 4 WEST 3.4 635. 136.7 1951 GM 755.9 4833 107.7 1951 4 WEST 54.38 73.8 19.7 195 GM 891. 494.9 1430.5 195 4 WEST 71.78 864.1 145.5 1953 GM 1304.4 641.7 1777.3 1953 4 WEST 90.08 1193.5 174.8 1954 GM 1486.7 5593.6 6.3 1954 4 WEST 68.6 1188.9 13.5
PASSOS PARA ESTIMAÇÃO NO STATA: 1º) Organzação dos dados No Excel, os dados devem segur a estrutura da Tabela 1, sto é, ordena-se os dados de acordo com a sére temporal para cada undade de seção cruzada. Note que as undades de seção cruzada (empresas) são enumeradas, uma vez que o Stata não reconhece textos (nome das undades). º) Declaração dos dados no programa Após a organzação dos dados e nserção dos mesmos no programa, deve-se declarar no programa a varável referente à sére de tempo e a referente às undades. No caso do exemplo em questão, a varável tempo é ano e a varável undade é d. Para sso, temos três opções: ) Barra de ferramentas:
) Comando 1: xtset d ano, yearly O termo yearly é pra ndcar que a sére é anual. ) Comando :. ts ano. s d 3º) Modelo pool. xtset d ano, yearly panel varable: d (strongly balanced) tme varable: ano, 1935 to 1954 delta: 1 year Nesse modelo, todos os coefcentes são constantes ao longo do tempo e entre ndvíduos e a forma de estmação é o habual MQO.. reg y x x3 Source SS df MS Number of obs = 80 F(, 77) = 119.63 Model 4849457.37 4478.69 Prob > F = 0.0000 Resdual 1560689.67 77 068.697 R-squared = 0.7565 Adj R-squared = 0.750 Total 6410147.04 79 81141.1018 Root MSE = 14.37 x.1100955.013797 8.0 0.000.087563.1374348 x3.303393.049957 6.15 0.000.0538.4015535 _cons -63.30413 9.614 -.14 0.036-1.735-4.334734 4º) Modelo de regressão de efeos fxos ou de varáves bnáras de mínmos quadrados ) Caso em que coefcentes angulares são constantes, mas o ntercepto vara entre as undades, sto é: Y = β 1 + β X + β3x 3 + ε (4) No Stata, o passo ncal é a cração de dummes para cada uma das undades:. tabulate d, gen (d) d Freq. Percent Cum. 1 0 5.00 5.00 0 5.00 50.00 3 0 5.00 75.00 4 0 5.00 100.00 Total 80 100.00 Note que com o comando tabulate foram cradas quatro novas varáves, uma dummy para cada empresa: d1, d, d3 e d4.
Agora é só rodar o modelo:. reg y x x3 d d3 d4 Source SS df MS Number of obs = 80 F( 5, 74) = 11.37 Model 5990684.14 5 1198136.83 Prob > F = 0.0000 Resdual 41946.898 74 5668.41754 R-squared = 0.9346 Adj R-squared = 0.9301 Total 6410147.04 79 81141.1018 Root MSE = 75.89 x.1079481.0175089 6.17 0.000.0730608.148354 x3.3461617.066645 1.98 0.000.930315.399918 d 161.57 46.45639 3.48 0.001 69.00583 54.1386 d3 339.638 3.98633 14.16 0.000 91.839 387.466 d4 186.5665 31.50681 5.9 0.000 13.7879 49.345 _cons -45.794 35.8111-6.86 0.000-317.1476-174.4371 Obs: a varável d1 fo dexada como referênca (evar problema da multcolneardade perfea). Caso sejam utlzadas as 4 dummes, o Stata dropará uma automatcamente. ) Caso em que coefcentes angulares são constantes, mas o ntercepto vara ao longo do tempo (uma dummy para cada ano), sto é: Y 0 = + β X + β3x 3 + t= 1 β 1 α ano + ε (5) t t. tabulate ano, gen (ano) ano Freq. Percent Cum. 1935 4 5.00 5.00 1936 4 5.00 10.00 1937 4 5.00 15.00 1938 4 5.00 0.00 1939 4 5.00 5.00 1940 4 5.00 30.00 1941 4 5.00 35.00 194 4 5.00 40.00 1943 4 5.00 45.00 1944 4 5.00 50.00 1945 4 5.00 55.00 1946 4 5.00 60.00 1947 4 5.00 65.00 1948 4 5.00 70.00 1949 4 5.00 75.00 1950 4 5.00 80.00 1951 4 5.00 85.00 195 4 5.00 90.00 1953 4 5.00 95.00 1954 4 5.00 100.00 Total 80 100.00. reg y x x3 ano1-ano19 Source SS df MS Number of obs = 80 F( 1, 58) = 9.7 Model 4938658.06 1 35174.193 Prob > F = 0.0000 Resdual 1471488.98 58 5370.4997 R-squared = 0.7704 Adj R-squared = 0.6873 Total 6410147.04 79 81141.1018 Root MSE = 159.8 x.1159174.01817 6.38 0.000.079546.15886 x3.696593.0833411 3.4 0.00.108339.4364847 ano1 1.0495 19.7675 0.16 0.87-38.739 80.788 ano -14.0344 133.1953-0.11 0.916-80.6535 5.5851 ano3-58.41449 135.183-0.43 0.667-39.0113 1.183 ano4-48.66584 16.536-0.38 0.70-301.9483 04.6167 ano5-96.806 18.0009-0.76 0.453-353.043 159.4191 ano6-36.10807 19.116-0.8 0.781-94.5618.3457 ano7 1.16647 17.766 0.17 0.869-34.506 76.8391 ano8 30.9937 14.1757 0.4 0.808-18.653 78.864 ano9-1.76907 14.8506-0.10 0.919-6.6847 37.1466 ano10-17.878 15.6498-0.14 0.888-69.3431 33.6875 ano11-38.96994 16.769-0.31 0.760-9.757 14.7858 ano1 6.90836 15.7493 0.1 0.831-4.806 78.63 ano13 7.815 119.3515 0.3 0.817-11.0954 66.704 ano14 6.05879 117.371 0. 0.85-08.7969 60.9145 ano15-8.65514 116.965-0.5 0.806-61.4479 04.1376 ano16-0.3938 115.8973-0.18 0.861-5.3874 11.5998 ano17.9819593 116.576 0.01 0.993-31.733 33.6969 ano18 1.96068 114.681 0.19 0.849-07.6005 51.519 ano19 39.4319 113.441 0.35 0.79-187.6448 66.5087 _cons -56.3398 99.7587-0.56 0.574-56.0169 143.3373
) Caso em que coefcentes angulares são constantes, mas o ntercepto vara com os ndvíduos e com o tempo (uma dummy para cada empresa e para cada ano).. reg y x x3 d-d4 ano1-ano19 Source SS df MS Number of obs = 80 F( 4, 55) = 4.58 Model 608748.11 4 53447.838 Prob > F = 0.0000 Resdual 37398.98 55 595.70778 R-squared = 0.9489 Adj R-squared = 0.966 Total 6410147.04 79 81141.1018 Root MSE = 77.154 x.19307.07437 4.7 0.000.0743487.184653 x3.36749.0416591 8.8 0.000.83765.450736 d 105.457 67.68668 1.55 0.16-30.40141 40.899 d3 341.1008 4.8116 13.75 0.000 91.3773 390.844 d4 0.34 41.16781 5.35 0.000 137.819 30.86 ano1 134.3636 7.00957 1.87 0.067-9.946798 78.674 ano 87.397 66.46131 1.31 0.194-45.86174 0.511 ano3 9.5859 66.10801 0.45 0.656-10.8975 16.0693 ano4 48.115 66.8507 0.7 0.474-85.7989 18.046 ano5-7.886558 63.9173-0.1 0.90-135.9797 10.066 ano6 51.850 63.7834 0.81 0.40-75.9746 179.6751 ano7 107.741 63.458 1.70 0.095-19.43706 34.8854 ano8 118.359 64.9635 1.8 0.074-11.75613 48.4745 ano9 71.99879 63.47345 1.13 0.6-55.0486 199.04 ano10 68.4781 63.65855 1.08 0.87-59.09638 196.058 ano11 44.855 6.8316 0.70 0.484-81.6331 170.037 ano1 104.194 61.8815 1.69 0.098-19.7116 8.1006 ano13 100.1916 6.874 1.59 0.117-5.80715 6.1904 ano14 9.30316 63.1688 1.46 0.150-34.889 18.895 ano15 31.0783 6.10854 0.50 0.617-93.6046 155.6761 ano16 35.8047 61.1856 0.59 0.561-86.81396 158.434 ano17 47.84 57.53413 0.83 0.409-67.45878 163.143 ano18 57.96435 56.39349 1.03 0.309-55.05073 170.9794 ano19 54.0137 54.99911 0.98 0.330-56.0695 164.344 _cons -359.5819 8.6360-4.35 0.000-55.188-193.9756. Outras opções de modelos sera consderar que todos os coefcentes varam entre os ndvíduos, sto é, utlzar dummes de nclnação. Todava, deve-se ter cautela quanto ao uso de dummes, uma vez que um grande número delas reduz os graus de lberdade, além de aumentar a possbldade de multcolneardade. Quanto à escolha entre o modelo da equação pool e cada uma das especfcações apresentadas anterormente, utlza-se o teste F restro. 5º) Modelo de efeos fxos. xtreg y x x3, fe Fxed-effects (whn) regresson Number of obs = 80 Group var able: d Number of groups = 4 R-sq: whn = 0.8068 Obs per group: mn = 0 between = 0.7304 avg = 0.0 overall = 0.7554 max = 0 F(,74) = 154.53 corr(u_, Xb) = -0.1001 Prob > F = 0.0000 x.1079481.0175089 6.17 0.000.0730608.148354 x3.3461617.066645 1.98 0.000.930315.399918 _cons -73.84946 37.591-1.97 0.053-148.6155.9165759 sgma_u 139.05116 sgma_e 75.88894 rho.7739633 (fracton of varance due to u_) F test that all u_=0: F(3, 74) = 67.11 Prob > F = 0.0000 Os dferentes valores de R ndcam como o modelo se ajusta dentro das undades ( R ), entre undades ( R ) e no geral ( R ). O termo sgma _ u é o whn between overall
erro padrão de α e sgma _ e é o erro padrão de ε ( sgma _ e ). A expressão rho é σα uma estmatva da relação Corr ( ε ε s ) =, ou seja, a razão da varânca de α σ + σ α para a varânca do erro composto. O teste F na últma lnha é o teste utlzado para verfcar se o modelo pool é mas adequado que o modelo de efeos fxos (Ho: modelo pool é preferível ao modelo de efeos fxos). Efeos fxos para undades: ε. predct fe_d, u. lst fe_d fe_d 1. -171.949. -171.949 3. -171.949 4. -171.949 5. -171.949 6. -171.949 7. -171.949 8. -171.949 9. -171.949 10. -171.949 11. -171.949 1. -171.949 13. -171.949 14. -171.949 15. -171.949 16. -171.949 17. -171.949 18. -171.949 19. -171.949 0. -171.949 1. -10.37068. -10.37068 3. -10.37068 4. -10.37068 5. -10.37068 6. -10.37068 7. -10.37068 8. -10.37068 9. -10.37068 30. -10.37068 31. -10.37068 3. -10.37068 33. -10.37068 34. -10.37068 35. -10.37068 36. -10.37068 37. -10.37068 38. -10.37068 39. -10.37068 40. -10.37068 41. 167.6899 4. 167.6899 43. 167.6899 44. 167.6899 45. 167.6899 46. 167.6899 47. 167.6899 48. 167.6899 49. 167.6899 50. 167.6899 51. 167.6899 5. 167.6899 53. 167.6899 54. 167.6899 55. 167.6899 56. 167.6899 57. 167.6899 58. 167.6899 59. 167.6899 60. 167.6899 61. 14.6365 6. 14.6365 63. 14.6365 64. 14.6365 65. 14.6365 66. 14.6365 67. 14.6365 68. 14.6365 69. 14.6365 70. 14.6365 71. 14.6365 7. 14.6365 73. 14.6365 74. 14.6365 75. 14.6365 76. 14.6365 77. 14.6365 78. 14.6365 79. 14.6365 80. 14.6365 Efeos fxos para tempo: Para que o Stata reconheça que ele deve calcular o efeo fxo na varável de tempo, deve-se setar: s para a varável de tempo e ts para a varável cross-secton. Ou seja:
. ts d. s ano. qu xtreg y x x3, fe. predct ano_fe, u. lst ano_fe ano_fe 1. 8.87476. -6.184439 3. -50.56469 4. -40.81604 5. -88.958 6. -8.587 7. 9.0167 8. 38.14917 9. -4.91967 10. -9.97801 11. -31.1014 1. 34.75816 13. 35.663 14. 33.90859 15. -0.80534 16. -1.544 17. 8.831759 18. 9.81048 19. 47.817 0. 7.849801 1. 8.87476. -6.184439 3. -50.56469 4. -40.81604 5. -88.958 6. -8.587 7. 9.0167 8. 38.14917 9. -4.91967 30. -9.97801 31. -31.1014 3. 34.75816 33. 35.663 34. 33.90859 35. -0.80534 36. -1.544 37. 8.831759 38. 9.81048 39. 47.817 40. 7.849801 41. 8.87476 4. -6.184439 43. -50.56469 44. -40.81604 45. -88.958 46. -8.587 47. 9.0167 48. 38.14917 49. -4.91967 50. -9.97801 51. -31.1014 5. 34.75816 53. 35.663 54. 33.90859 55. -0.80534 56. -1.544 57. 8.831759 58. 9.81048 59. 47.817 60. 7.849801 61. 8.87476 6. -6.184439 63. -50.56469 64. -40.81604 65. -88.958 66. -8.587 67. 9.0167 68. 38.14917 69. -4.91967 70. -9.97801 71. -31.1014 7. 34.75816 73. 35.663 74. 33.90859 75. -0.80534 76. -1.544 77. 8.831759 78. 9.81048 79. 47.817 80. 7.849801. 6º) Modelo de efeos aleatóros. ts ano. s d. xtreg y x x3, re Random-effects GLS regresson Number of obs = 80 Group var able: d Number of groups = 4 R-sq: whn = 0.8068 Obs per group: mn = 0 between = 0.7303 avg = 0.0 overall = 0.7554 max = 0 Random effects u_ ~ Gaussan Wald ch() = 317.79 corr(u_, X) = 0 (assumed) Prob > ch = 0.0000 y Coef. Std. Err. z P> z [95% Conf. Interval] x.1076555.0168169 6.40 0.000.0746949.140616 x3.3457104.065451 13.0 0.000.93689.3977378 _cons -73.0359 83.94957-0.87 0.384-37.5734 91.5084 sgma_u 15.1583 sgma_e 75.88894 rho.803304 (fracton of varance due to u_)
7º) Escolha entre pool, efeos fxos e efeos aleatóros Para realzar a escolha entre os modelos, utlza-se os seguntes testes: TESTE DE CHOW MODELO POOL MODELO DE EFEITOS FIXOS TESTE LM DE BREUSH-PAGAN TESTE DE HAUSMAN MODELO DE EFEITOS ALEATÓRIOS ) Teste de Chow H0: modelo restro (pooled) H1: modelo rrestro (efeos fxos) A estatístca do teste F da lnha nferor da estmatva de efeos fxos, bem como seu respectvo p-valor ndca que o modelo de efeos fxos é melhor que o pool.. xtreg y x x3, fe Fxed-effects (whn) regresson Number of obs = 80 Group var able: d Number of groups = 4 R-sq: whn = 0.8068 Obs per group: mn = 0 between = 0.7304 avg = 0.0 overall = 0.7554 max = 0 F(,74) = 154.53 corr(u_, Xb) = -0.1001 Prob > F = 0.0000 x.1079481.0175089 6.17 0.000.0730608.148354 x3.3461617.066645 1.98 0.000.930315.399918 _cons -73.84946 37.591-1.97 0.053-148.6155.9165759 sgma_u 139.05116 sgma_e 75.88894 rho.7739633 (fracton of varance due to u_) F test that all u_=0: F(3, 74) = 67.11 Prob > F = 0.0000 ) Teste de Hausman H0: modelo de efeos aleatóros H1: modelo de efeos fxos. qu xtreg y x x3, fe. estmates store fe. qu xtreg y x x3, re. estmates store re. hausman fe re Coeffcents (b) (B) (b-b) sqrt(dag(v_b-v_b)) fe re Dfference S.E. x.1079481.1076555.00096.0048738 x3.3461617.3457104.0004513.00504 b = consstent under Ho and Ha; obtaned from xtreg B = nconsstent under Ha, effcent under Ho; obtaned from xtreg Test: Ho: dfference n coeffcents not systematc ch() = (b-b)'[(v_b-v_b)^(-1)](b-b) = 0.07 Prob>ch = 0.9678 Pela estatístca do teste de hausman, tem-se que o modelo de efeos aleatóros é melhor que o de efeos fxos.
) Teste LM de Breusch-Pagan H0: modelo pooled H1: modelo de efeos aleatóros. qu xtreg y x x3, re. xttest0 Breusch and Pagan Lagrangan multpler test for random effects y[d,t] = Xb + u[d] + e[d,t] Estmated results: Var sd = sqrt(var) y 81141.1 84.858 e 5668.418 75.8889 u 315.13 15.158 Test: Var(u) = 0 ch(1) = 379.08 Prob > ch = 0.0000 O resultado do teste ndca que efeos aleatóros são preferíves ao modelo pool. 8º) Detecção de autocorrelação e heterocedastcdade em panel ) autocorrelação (teste de Wooldrdge) Instalação: fnd xtseral, clcar em st0039 e depos clck here to nstall. xtseral y x x3, output Lnear reg resson Number of obs = 76 F(, 3) = 45.61 Prob > F = 0.0057 R-squared = 0.4578 Root MSE = 65.499 (Std. Err. adjusted for 4 clusters n d) Robust D. x D1..0901393.0168937 5.34 0.013.0363761.143905 x3 D1..39579.14090.60 0.080 -.071954.7178683 Wooldrdge test for autocorrelaton n panel data H0: no frst-order autocorrelaton F( 1, 3) = 1300.479 Prob > F = 0.0000 Rejea-se a hpótese nula de ausênca de autocorrelação. ) Teste de Wald para heterocedastcdade em grupo (efeos fxos) Instalação: fnd xttest3, clcar em st0004 e depos clck here to nstall. qu xtreg y x x3, fe. xttest3 Modfed Wald test for groupwse heteroskedastcy n fxed effect regresson model H0: sgma()^ = sgma^ for all ch (4) = 40.33 Prob>ch = 0.0000 Rejea-se a hpótese nula de ausênca de heterocedastcdade. A correção desses problemas pode ser fea por estmações consderando erros padrão robustos ou por bootstrap.