Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/
É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Numa relação expermental os valores de uma das varáves são controlados. No relaconamento correlaconal, por outro lado, não se tem nenhum controle sobre as varáves sendo estudadas. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
O Estoque de Moeda (M1) está relaconado com a varação dos preços. Verfque se exste correlação entre o IPC amercano com a oferta monetára, consderando dados do período de 1960 a 003. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Ano Y M1 X IPC 1960 140,7 9,6 1961 145, 9,9 196 147,8 30, 1963 153,3 30,6 1964 160,3 31,5 1965 167,8 3,4......... 000 117,9 177,1 00 110,4 179,9 003 187,1 184,0 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
O prmero passo para determnar se exste relaconamento entre as duas varáves é obter o dagrama de dspersão (scatter dagram). Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
IPC 180 140 100 60 M1 0 100 300 500 700 900 1100 1300 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
O dagrama de dspersão fornece uma dea do tpo de relaconamento entre as duas varáves. Neste caso, percebe-se que exste um relaconamento lnear. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Quando o relaconamento entre duas varáves quanttatvas for do tpo lnear, ele pode ser meddo através do: Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Observado um relaconamento lnear entre as duas varáves é possível determnar a ntensdade deste relaconamento. O coefcente que mede este relaconamento é denomnado de Coefcente de Correlação (lnear). Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Quando se está trabalhando com amostras o coefcente de correlação é ndcado pela letra r e é uma estmatva do coefcente de correlação populaconal que é representado por ρ (rho). Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Para determnar o coefcente de correlação (grau de relaconamento lnear entre duas varáves) vamos determnar ncalmente a varação conjunta entre elas, sto é, a covarânca. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
A covarânca entre duas varáves X e Y, é representada por Cov Cov(X (X; Y) e calculada por: Cov( X,Y ) ( X X )( Y n 1 Y ) Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca Mas + + + + nxy Y X nxy nxy nxy Y X XY X Y Y X Y X XY Y X X Y Y X XY ] Y X X Y Y X [ ) Y Y )( X X (
Então: Cov( X,Y ) ( X X )( Y n 1 Y ) X Y n 1 nxy Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
A covarânca podera ser utlzada para medr o grau e o snal do relaconamento entre as duas varáves, mas ela é dfícl de nterpretar por varar de - a +. Assm é mas convenente utlzar o coefcente de correlação lnear de Pearson (momento produto). Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
O coefcente de correlação lnear (de Pearson) é defndo por: Cov ( X,Y ) r X Y Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca Onde: 1 n ny Y 1 n X n X 1 n nxy Y X ) X,Y Cov( Y X
Esta expressão não é muto prátca para calcular o coefcente de correlação. Pode-se obter uma expressão mas convenente para o cálculo manual e o cálculo de outras meddas necessáras mas tarde. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca Tem-se: ( )( ) Y n Y X n X n X Y Y X 1 n Y n Y 1 n X n X 1 n n X Y Y X ),Y X ( Cov r Y X
F a Fazendo: z e n d 0 Tem se : XY XX YY X Y X Y r n X ny XY nxy XX. YY Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
A vantagem do coefcente de correlação (de Pearson) é ser admensonal e varar de 1 a + 1, que o torna de fácl nterpretação. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Assm se r -1, temos uma relaconamento lnear negatvo perfeto, sto é, os pontos estão todos alnhados e quando X aumenta Y decresce e vce-versa. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
50 40 r 1 30 0 10 0 10 15 0 5 30 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
e r +1, temos uma relaconamento lnear postvo perfeto, sto é, os pontos estão todos alnhados e quando X aumenta Y também aumenta. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
50 40 r +1 30 0 10 0 10 15 0 5 30 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Assm se r 0, temos uma ausênca de relaconamento lnear, sto é, os pontos não mostram alnhamento. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
50 40 r 0 30 0 10 0 10 15 0 5 30 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Assm se 1 < r < 0, temos uma relaconamento lnear negatvo, sto é, os pontos estão mas ou menos alnhados e quando X aumenta Y decresce e vce-versa. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
50 40 1 < r < 0 30 0 10 0 10 15 0 5 30 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Assm se 0 < r < 1, temos uma relaconamento lnear postvo, sto é, os pontos estão mas ou menos alnhados e quando X aumenta Y também aumenta. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
50 40 0 < r < 1 30 0 10 0 10 15 0 5 30 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Uma correlação amostral não sgnfca necessaramente uma correlação populaconal e vce-versa. É necessáro testar o coefcente de correlação para verfcar se a correlação amostral é também populaconal. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Observada uma amostra de ses pares, pode-se perceber que a correlação é quase um, sto é, r 1. No entanto, observe o que ocorre quando mas pontos são acrescentados, sto é, quando se observa a população! Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
50 40 r 1 30 0 10 0 ρ 0 10 15 0 5 30 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Determnar o grau de relaconamento lnear entre as varáves X Índce de Preços ao Consumdor versus Y Estoque de Moeda, para os valores da Economa Amercana de 1960 a 003. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Ano X Y XY X Y 1960 140,7 9,6 1961 145, 9,9 196 147,8 30, 1963 153,3 30,6 1964 160,3 31,5 1965 167,8 3,4......... 000 117,9 177,1 00 110,4 179,9 003 187,1 184,0 Total 5894,5 410,9 395760,69 1856837,1 503187,97
Vamos calcular r utlzando a expressão em destaque vsta anterormente, sto é, através das quantdades, xy, XX e YY. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Tem-se: n 44 X 5894,50 Y 410,90 X 588,5114 Y 93,477 XY 1395760,69 X 1856837,1 Y 503187,97 Então: XY X Y nxy 881157,4161 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
XX X n X 661769,7043 YY Y ny 10601,8698 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
r XY XX. YY 661769, 7043.10601,8698 0,9863 881157,4161 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Apesar de r ser um valor admensonal, ele não é uma taxa. Assm o resultado não deve ser expresso em percentagem. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Em mutas stuações duas ou mas varáves estão relaconadas e surge então a necessdade de determnar a natureza deste relaconamento. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
A análse de regressão é uma técnca estatístca para modelar e nvestgar o relaconamento entre duas ou mas varáves. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
De fato a regressão pode ser dvdda em dos problemas: () o da especfcação e ( ) o da determnação. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
O problema da especfcação é descobrr dentre os possíves modelos (lnear, quadrátco, exponencal, etc.) qual o mas adequado. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
O problema da determnação é uma vez defndo o modelo (lnear, quadrátco, exponencal, etc.) estmar os parâmetros da equação. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Normalmente é suposto que exsta uma varável Y (dependente ou resposta), que está relaconada a k varáves (ndependentes ou regressoras) X ( 1,,..., k). Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
A varável resposta Y é aleatóra, enquanto que as varáves regressoras X são normalmente controladas. O relaconamento entre elas é caracterzado por uma equação denomnada de equação de regressão. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Quando exstr apenas uma varável regressora (X) tem-se a regressão smples, se Y depender de duas ou mas varáves regressoras, então tem-se a regressão múltpla. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Vamos supor que a regressão é do tpo smples e que o o modelo seja lnear, sto é, vamos supor que a equação de regressão seja do tpo: Y α + βx + U. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
y Y α + βx + U; x 1 x x n x Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
O termo U é o termo erro, sto é, U representa outras nfluêncas sobre a varável Y, além da exercda pela varável X. A varação resdual (termo U) é suposto de méda zero e desvo constante e gual a σ. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Ou anda pode-se admtr que o modelo fornece o valor médo de Y, para um dado x, sto é: E(Y/x) α + βx Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Y α + βx + U; E(Y/x) α + βx, sto é, E(U) 0 V(Y/x) σ ; Cov(U, Uj) 0, para j; A varável X permanece fxa em observações sucessvas e os erros U são normalmente dstrbuídos. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
O modelo suposto E(Y/x) α + βx é populaconal. Vamos supor que se tenha n pares de observações, dgamos: (x 1, y 1 ), (x, y ),..., (x n, y n ) e que através deles queremos estmar o modelo acma. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
A reta estmada será representada por: Ŷ a + bx ou Y a + bx + E Onde a é um estmador de α e b é um estmador de β, sendo Ŷ um estmador de E(Y/x). Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Exstem dversos métodos para a determnação da reta desejada. Um deles, denomnado de MMQ (Métodos dos Mínmos Quadrados), consste em mnmzar a soma dos quadrados das dstâncas da reta aos pontos. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Tem-se: Y a + bx + E, Então: E Y - (a + bx ) Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca Deve-se mnmzar: φ n 1 n 1 n 1 ) bx a Y ( ) Ŷ Y ( E
Y a + b X + E y ŷ E x Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca Dervando parcalmente tem-se: ) X b a Y ( x b ) X b a Y ( a n 1 n 1 φ φ
Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca Igualando as dervadas parcas a zero vem: 0 ) X b a Y ( x 0 ) X b a Y ( n 1 n 1
Isolando as ncógntas, tem-se: Y na + b X X Y n X + b X Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Resolvendo para a e b, segue: b X X y nxy n X XY XX a Y bx Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Lembrando que: XY X Y nxy XX X n X YY Y ny Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Consderando os valores das varáves Oferta Monetára e Índce de Preços ao Consumdor, consderadas anterormente, determnar uma equação de regressão lnear para prever o IPC dado um determnado nível de Oferta Monetára. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Ano Y IPC X M1 1960 9,6 140,7 1961 9,9 145, 196 30, 147,8 1963 30,6 153,3 1964 31,5 160,3 1965 3,4 167,8......... 000 177,1 117,9 00 179,9 110,4 003 184,0 187,1 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Da mesma forma que para calcular o coefcente de correlação é necessáro a construção de três novas colunas. Uma para X, uma para Y e outra para XY. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Ano X Y XY X Y 1960 140,7 9,6 1961 145, 9,9 196 147,8 30, 1963 153,3 30,6 1964 160,3 31,5 1965 167,8 3,4......... 000 117,9 177,1 00 110,4 179,9 003 187,1 184,0 Total 5894,5 410,9 395760,69 1856837,1 503187,97 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Tem-se: n 44 X 5894,50 Y 410,90 X 588,5114 Y 93,477 XY 1395760,69 X 1856837,1 Y 503187,97 Então: XY X Y nxy 881157,4161 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
XX X n X 661769, 7043 YY Y ny 10601,8698 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
A equação de regressão, será, então: b XY XX 881157 661769,4161,7043 0,133 0,13 a Y bx 93,477 0,133.588,5114 14,8857 14,89 Yˆ 14,89 + 0,13x Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
A pergunta que cabe agora é: este modelo representa bem os pontos dados? A resposta é dada através do erro padrão da regressão. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
O objetvo do MMQ é mnmzar a varação resdual em torno da reta de regressão. Uma avalação desta varação é dada por: E ( Y a bx ) n n Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
O cálculo da varânca resdual, por esta expressão, é muto trabalhoso, pos é necessáro prmero determnar os valores prevstos. Entretanto é possível obter uma expressão que não requera o cálculo dos valores prevstos, sto Ŷ a + bx é, de. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
vem: Desenvolvendo o numerador da expressão, ( Y a bx ) [Y Y ( Y Y ) YY b [Y ( Y + bx bx] b ( X X )(Y Y ) XY + b [Y XX bx ) bx] Y b( X X )] + b ( X X ) Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Uma vez que: ( X X )( Y Y ) X Y nxy ( X X ) ( Y Y ) XY X n X Y ny XX YY Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Deste modo, tem-se: ( Y a bx ) YY b XY + b XX Mas: b XY XX XY b XX Então: ( Y a bx ) YY b XX + b YY b XX XY YY + b b XX XX Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca Assm: n b n b s XY YY XX YY - - - - n ) bx a Y ( n E s - - - - erá, fnalmente:
Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Consderando os valores do exemplo anteror, determnar o erro padrão da regressão. Tem-se: XY 881157,4161 XX 661769,7043 b XY 881157,4161 0,133 XX 661769,7043 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Então: s YY -b n - XY 10601,8698 8,878 8,83-0,133.881157 44 -,4161 Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
A pergunta, agora, é: este erro é razoável?, quer dzer, ele não é muto grande? A resposta envolve o cálculo do erro relatvo, sto é, devemos comparar este resultado com a varável de nteresse. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
A varável envolvda aqu é a Y, sto é, a base monetára, então, o erro relatvo, será: s 8,878 g s Y 93,477 9,47% Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Y Ŷ Y Y Y Y Ŷ Ŷ Y Y Y Y x Ŷ + Ŷ Y ( Y Y ) ( Y Ŷ ) + ( Ŷ Y ) VT VR + VE Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
(a) Varação Total: VT VT ( Y Y ) YY (b) Varação Resdual: VR VR ( ) Y Ŷ b YY XX VT VE (c) Varação Explcada: VE VE ( ) Yˆ Y b XX Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Uma manera de medr o grau de aderênca (adequação) de um modelo é verfcar o quanto da varação total de Y é explcada pela reta de regressão. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Para sto, toma-se o quocente entre a varação explcada, VE e a varação total,vt: R VE / VT Este resultado é denomnado de Coefcente de Determnação. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
R b VE b XX XY VT YY YY XY XX YY Este resultado mede o quanto as varações de uma das varáves são explcadas pelas varações da outra varável. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca
Ou anda, ele mede a parcela da varação total que é explcada pela reta de regressão, sto é: VE b XX R YY A varação resdual corresponde a: VR (1 R ) YY Assm 1 R é o Coefcente de Indetermnação. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca - Departamento de Estatístca