É o grau de assocação etre duas ou mas varáves. Pode ser: correlacoal ou Prof. Lorí Val, Dr. val@mat.ufrgs.r http://www.mat.ufrgs.r/~val/ expermetal. Numa relação expermetal os valores de uma das varáves são cotrolados. No relacoameto correlacoal, por outro lado, ão se tem ehum cotrole sore as varáves sedo estudadas. O Estoque de Moeda (M1 está relacoado com a varação dos preços. Verfque se exste correlação etre o IPC amercao com a oferta moetára, cosderado dados do período de 196 a 3. Ao M1 IPC 196 14,7 9,6 1961 145, 9,9 196 147,8 3, 1963 153,3 3,6 1964 16,3 31,5 1965 167,8 3,4......... 117,9 177,1 11,4 179,9 3 187,1 184, 1
IPC O prmero passo para determar se exste relacoameto etre as duas varáves é oter o dagrama de dspersão (scatter dagram. 18 14 1 6 M1 1 3 5 7 9 11 13 O dagrama de dspersão forece uma dea do tpo de relacoameto etre as duas varáves. Neste caso, percee-se que exste um relacoameto lear. Quado o relacoameto etre duas varáves quattatvas for do tpo lear, ele pode ser meddo através do: Oservado um relacoameto lear etre as duas varáves é possível determar a tesdade deste relacoameto. O coefcete que mede este relacoameto é deomado de Coefcete de Correlação (lear.
Quado se está traalhado com amostras o coefcete de correlação é dcado pela letra r e é uma estmatva do coefcete de correlação populacoal que é represetado por ρ (rho. Para determar o coefcete de correlação (grau de relacoameto lear etre duas varáves vamos determar calmete a varação cojuta etre elas, sto é, a covarâca. A covarâca etre duas varáves e, é represetada por Cov Cov( (; e calculada por: Cov(, ( 1 Mas ( [ + ] + + + Etão: Cov(, ( 1 1 3
A covarâca podera ser utlzada para medr o grau e o sal do relacoameto etre as duas varáves, mas ela é dfícl de terpretar por varar de - a +. Assm é mas coveete utlzar o coefcete de correlação lear de Pearso (mometo produto. O coefcete de correlação lear (de Pearso é defdo por: r Cov (, Ode: Cov(, 1 1 1 Esta expressão ão é muto prátca para calcular o coefcete de correlação. Pode-se oter uma expressão mas coveete para o cálculo maual e o cálculo de outras meddas ecessáras mas tarde. r Tem-se: Cov (, 1 1 1 ( ( F a Fazedo: z e d Tem se : r. 4
A vatagem do coefcete de correlação (de Pearso é ser admesoal e varar de 1 a + 1, que o tora de fácl terpretação. Assm se r -1, temos uma relacoameto lear egatvo perfeto, sto é, os potos estão todos alhados e quado aumeta decresce e vce-versa. 5 4 3 1 r 1 e r +1, temos uma relacoameto lear postvo perfeto, sto é, os potos estão todos alhados e quado aumeta tamém aumeta. 1 15 5 3 5 4 3 1 r +1 Assm se r, temos uma ausêca de relacoameto lear, sto é, os potos ão mostram alhameto. 1 15 5 3 5
5 4 3 1 r Assm se 1 < r <, temos uma relacoameto lear egatvo, sto é, os potos estão mas ou meos alhados e quado aumeta decresce e vce-versa. 1 15 5 3 5 4 3 1 1 < r < Assm se < r < 1, temos uma relacoameto lear postvo, sto é, os potos estão mas ou meos alhados e quado aumeta tamém aumeta. 1 15 5 3 5 4 3 1 < r < 1 1 15 5 3 Uma correlação amostral ão sgfca ecessaramete uma correlação populacoal e vce-versa. É ecessáro testar o coefcete de correlação para verfcar se a correlação amostral é tamém populacoal. 6
Oservada uma amostra de ses pares, pode-se perceer que a correlação é quase um, sto é, r 1. No etato, oserve o que ocorre quado mas potos são acrescetados, sto é, 5 4 3 r 1 quado se oserva a população! 1 ρ 1 15 5 3 Determar o grau de relacoameto lear etre as varáves Ídce de Preços ao Cosumdor versus Estoque de Moeda, para os valores da Ecooma Amercaa de 196 a 3. Ao 196 14,7 9,6 1961 145, 9,9 196 147,8 3, 1963 153,3 3,6 1964 16,3 31,5 1965 167,8 3,4......... 117,9 177,1 11,4 179,9 3 187,1 184, Total 5894,5 41,9 39576,69 1856837,1 53187,97 Vamos calcular r utlzado a expressão em destaque vsta aterormete, sto é, através das quatdades, x, e. 7
Tem-se: 44 5894,5 41,9 588,5114 93,477 139576, 69 1856837,1 53187,97 661769, 743 Etão: 881157,4161 161,8698 r. 881157,4161 661769, 743.161,8698,9863 Apesar de r ser um valor admesoal, ele ão é uma taxa. Assm o resultado ão deve ser expresso em percetagem. Em mutas stuações duas ou mas varáves estão relacoadas e surge etão a ecessdade de determar a atureza deste relacoameto. 8
A aálse de regressão é uma técca estatístca para modelar e vestgar o relacoameto etre duas ou mas varáves. De fato a regressão pode ser dvdda em dos prolemas: (o da especfcação e ( o da determação. O prolema da especfcação é descorr detre os possíves modelos (lear, quadrátco, expoecal, etc. qual o mas adequado. O prolema da determação é uma vez defdo o modelo (lear, quadrátco, expoecal, etc. estmar os parâmetros da equação. Normalmete é suposto que exsta uma varável (depedete ou resposta, que está relacoada a k varáves (depedetes ou regressoras ( 1,,..., k. A varável resposta é aleatóra, equato que as varáves regressoras são ormalmete cotroladas. O relacoameto etre elas é caracterzado por uma equação deomada de equação de regressão. 9
Quado exstr apeas uma varável regressora ( tem-se a regressão smples, se depeder de duas ou mas varáves regressoras, etão tem-se a regressão múltpla. Vamos supor que a regressão é do tpo smples e que o o modelo seja lear, sto é, vamos supor que a equação de regressão seja do tpo: α + β+ U. y α + β + U; x 1 x x x O termo U é o termo erro, sto é, U represeta outras fluêcas sore a varável, além da exercda pela varável. A varação resdual (termo U é suposto de méda zero e desvo costate e gual a σ. Ou ada pode-se admtr que o modelo forece o valor médo de, para um dado x, sto é: E(/x α + β α + β+ U; E(/x α + β, sto é, E(U V(/x σ ; Cov(U, Uj, para j; A varável permaece fxa em oservações sucessvas e os erros U são ormalmete dstruídos. 1
O modelo suposto E(/x α + β é populacoal. Vamos supor que se teha pares de oservações, dgamos: (x 1, y 1, (x, y,..., (x, y e que através deles queremos estmar o modelo acma. A reta estmada será represetada por: Ŷ a + ou a + + E Ode a é um estmador de α e é um estmador de β, sedo Ŷ um estmador de E(/x. Exstem dversos métodos para a determação da reta desejada. Um deles, deomado de MMQ (Métodos dos Mímos Quadrados, cosste em mmzar a soma dos quadrados das dstâcas da reta aos potos. Tem-se: Etão: a + x + E, E - (a + x Deve-se mmzar: φ E 1 1 Ŷ 1 a y ŷ E a + + E x 11
1 Dervado parcalmete tem-se: a ( x a ( a 1 1 φ φ Igualado as dervadas parcas a zero vem: a ( x a ( 1 1 Isolado as cógtas, tem-se: + + a Resolvedo para a e, segue: a y Lemrado que:
Cosderado os valores das varáves Oferta Moetára e Ídce de Preços ao Cosumdor, cosderadas aterormete, determar uma equação de regressão lear para prever o IPC dado um determado ível de Oferta Moetára. Ao IPC M1 196 9,6 14,7 1961 9,9 145, 196 3, 147,8 1963 3,6 153,3 1964 31,5 16,3 1965 3,4 167,8......... 177,1 117,9 179,9 11,4 3 184, 187,1 Da mesma forma que para calcular o coefcete de correlação é ecessáro a costrução de três ovas coluas. Uma para, uma para e outra para. Ao 196 14,7 9,6 1961 145, 9,9 196 147,8 3, 1963 153,3 3,6 1964 16,3 31,5 1965 167,8 3,4......... 117,9 177,1 11,4 179,9 3 187,1 184, Total 5894,5 41,9 39576,69 1856837,1 53187,97 Tem-se: 44 5894,5 41,9 588,5114 93,477 139576, 69 1856837,1 53187,97 Etão: 881157,4161 661769,743 161,8698 13
A equação de regressão, será, etão: 881157,4161,133,13 661769,743 a 93,477,133.588,5114 14,8857 14,89 ˆ 14,89 +,13 x A perguta que cae agora é: este modelo represeta em os potos dados? A resposta é dada através do erro padrão da regressão. O ojetvo do MMQ é mmzar a varação resdual em toro da reta de regressão. Uma avalação desta varação é dada por: E a O cálculo da varâca resdual, por esta expressão, é muto traalhoso, pos é ecessáro prmero determar os valores prevstos. Etretato é possível oter uma expressão que ão requera o cálculo dos valores prevstos, sto é, de Ŷ a +. Desevolvedo o umerador da expressão, vem: a [ ( ] [ + ] [ ( ] ( ( + + 14
Uma vez que: ( Mas: Deste modo, tem-se: ( a + Etão: a + + Assm: s E - ( -a - - erá, falmete: s - - - - Cosderado os valores do exemplo ateror, determar o erro padrão da regressão. Tem-se: 881157,4161 661769,743 881157,4161 661769,743,133 Etão: s - - 161,8698 -,133.881157,4161 44-8,878 8,83 15
A perguta, agora, é: este erro é razoável?, quer dzer, ele ão é muto grade? A resposta evolve o cálculo do erro relatvo, sto é, devemos comparar este resultado com a varável de teresse. A varável evolvda aqu é a, sto é, a ase moetára, etão, o erro relatvo, será: s 8,878 g s 9,47% 93,477 Ŷ Ŷ Ŷ Ŷ + Ŷ Ŷ + Ŷ VT VR + VE x (a Varação Total: VT VT ( ( Varação Resdual: VR VR ( Ŷ VT VE (c Varação Explcada: VE Uma maera de medr o grau de aderêca (adequação de um modelo é verfcar o quato da varação total de é explcada pela reta de regressão. VE ( ˆ 16
Para sto, toma-se o quocete etre a varação explcada, VE e a varação total,vt: R VE / VT Este resultado é deomado de Coefcete de Determação. R VE VT Este resultado mede o quato as varações de uma das varáves são explcadas pelas varações da outra varável. Ou ada, ele mede a parcela da varação total que é explcada pela reta de regressão, sto é: VE R A varação resdual correspode a: VR (1 R Assm 1 R é o Coefcete de Idetermação. 17