CORRELAÇÃO E REGRESSÃO Constata-se, freqüentemente, a estênca de uma relação entre duas (ou mas) varáves. Se tal relação é de natureza quanttatva, a correlação é o nstrumento adequado para descobrr e medr essa relação. Então, caracterzada a relação, procuramos descrevê-la através de uma função matemátca. A regressão é o nstrumento adequado para a determnação dos parâmetros dessa função. Coleta-se dados ebndo os valores correspondentes das varáves. Faz-se o gráfco dos pontos em sstema de coordenadas retangulares. O conjunto resultante é chamado Dagrama de Dspersão. Eemplo: X e Y representam, respectvamente, a altura e o peso de adultos do seo femnno. Uma amostra de n ndvíduos acusara alturas X 1, X,..., X n, e os correspondentes pesos Y 1, Y,..., Y n,. Os pontos a serem marcados no gráfco seram, então (X 1,Y 1 ), (X,Y ),..., (X n,y n ). Pelo dagrama de dspersão, mutas vezes, se pode vsualzar uma curva apromatva dos dados. Quando os dados parecem bem apromados por uma reta, dzemos que há uma correlação lnear entre as varáves (Fguras 1 e ). Quando este um relaconamento entre as varáves e tal relaconamento não é lnear, dz-se, então, que há uma correlação não-lnear entre as varáves (Fgura 3). Fnalmente, há os casos em que o dagrama não sugere nenhum tpo de correlação entre as varáves; neste caso dz-se que não há correlação lnear (Fgura 4). Eemplos: Fgura 1 Fgura
Fgura 3 Fgura 4 Coefcente de correlação O coefcente de correlação lnear é o nstrumento empregado para a medda da correlação lnear, ndcando o grau de ntensdade da correlação entre duas varáves e, anda, o sentdo dessa correlação (postvo Fgura 1 ou negatvo Fgura ). Pode ser utlzado o coefcente de correlação de Pearson: n [ n ( ) ] [ n ( ) ] onde n é o número de observações. Os valores lmtes de r (coefcente de correlação) são 1 e +1, sto é, o valor de r pertence ao ntervalo [-1,1]. Assm: a) se a correlação entre duas varáves é perfeta e postva, então r = 1; b) se a correlação é perfeta e negatva, então r = -1; c) se não há correlação entre as varáves, r = 0. Eemplo: Calcular o coefcente de correlação relatvo à tabela abao que apresenta as notas de Cálculo e Estatístca de dez alunos (n=10). A últma lnha contém as somas de cada coluna.
r=0,9114 Regressão Calc() Estat() 5 6 30 5 36 8 9 7 64 81 7 8 56 49 64 10 10 100 100 100 6 5 30 36 5 7 7 49 49 49 9 8 7 81 64 3 4 1 9 16 8 6 48 64 36 4 4 4 65 65 473 481 475 O problema de se determnar equações de curvas que se ajustem a determnados conjuntos de dados observados é chamado ajustamento de curvas. Na prátca, o própro dagrama de dspersão geralmente sugere o tpo de curva a ser adotada. Assm, para as Fguras 1 e poderíamos usar a reta (Y = ax + b) enquanto que, para a Fgura 3, tentaríamos uma parábola (Y = ax + bx + c). Às vezes é útl construr o dagrama em termos de varáves transformadas. Assm, por eemplo, se log Y versus X conduz a uma reta, epermentaríamos log Y = a + bx como equação apromadora. Um dos prncpas objetvos do ajustamento é estmar uma das varáves (a varável dependente) em função da outra (varável ndependente). Tal processo de estmação é denomnado regressão. Se Y for estmado em função de X por meo de uma equação, tal equação é denomnada equação de regressão de Y sobre X e a curva ajustada é a curva de regressão de Y sobre X. Vamos consderar a regressão lnear smples, utlzada quando uma reta representa de manera satsfatóra a relação entre as varáves, ou seja, Y = ax + b é a equação de regressão de Y sobre X. O método mas smples utlzado para a determnação de a e b é o método dos mínmos quadrados. Após dversas smplfcações é possível chegar a: a e b a
sendo _ a méda artmétca dos ; e _ a méda artmétca dos. Outra forma de se calcular o a é através da fórmula: a Eemplo: n n. A tabela abao apresenta as varações do custo de um certo produto em relação à quantdade produzda: Quantdade (X) 10 11 1 13 14 15 Custos (Y) 100 11 119 130 139 14 Utlzando os dados acma: a) construa o dagrama de dspersão; b) ajuste uma reta aos dados; c) trace a reta no dagrama de dspersão; d) determne o custo para 16 undades do artgo. 10 100 1000 100 a= 8,68571 11 11 13 11 b= 15,8095 1 119 148 144 para =16 = 153,8667 13 130 1690 169 14 139 1946 196 15 14 130 5 soma 75 74 946 955 Eercícos 1. Obtenha os coefcentes do modelo lnear = a + b. Dados: 0 0 1 1 1 3 4 4 4. Certa empresa, estudando a varação da demanda de seu produto em relação à varação do preço de venda, obteve a tabela abao. preço ( ) 38 4 50 56 59 63 70 80 95 110 demanda( ) 350 35 97 70 56 46 38 3 15 08
a) Estmar os parâmetros do modelo =a+b, usando o crtéro de MQ. b) Usando o modelo lnear, estmar para =60 e =10. Utlzando as epressões (9) para calcular a e b, obtemos: 3. A tabela abao apresenta os dados referentes à varação da demanda de um produto produzdo ( ) em relação à varação do preço da venda ( ): 40 45 5 58 65 70 85 90 100 10 30 305 90 80 75 70 50 45 30 10 a. construa o dagrama de dspersão; b. ajuste uma reta aos dados, ou seja, estabeleça a equação de regressão de sobre ; c. trace a reta no dagrama de dspersão; d. determne quando = 80 e quando = 130. 4. A tabela abao que apresenta as notas de Cálculo e Estatístca de catorze alunos (n=14) : Cálculo ( ) 8 7 4 9 6 4 7 6 5 8 7 3 6 Estatístca ( ) 7 9 4 7 5 6 9 6 8 9 4 6 7 a) construa o dagrama de dspersão; b) calcule o coefcente de correlação; c) estabeleça a equação de regressão de sobre ; d) trace a reta no dagrama de dspersão; 5. A tabela abao apresenta os dados referentes à varação do preço de venda do seu produto ( ) em função do preço de custo ( ): 40 50 70 75 80 95 110 10 130 140 145 160 160 170 180 00 a) construa o dagrama de dspersão; b) estabeleça a equação de regressão de sobre ; c) trace a reta no dagrama de dspersão; d) determne quando = 165 e quando = 190. 6. A tabela abao apresenta valores que mostram como o comprmento de uma barra de aço vara conforme a temperatura: Temp.(graus C) 10 15 0 5 30 Compr. (mm) 1003 1005 1010 1011 1014 a) Determne o coefcente de correlação. b) Estabeleça a equação de regressão de sobre.
c) Calcule o valor estmado do comprmento da barra para a temperatura de 18 graus C e para a temperatura de 35 graus C. 7. A tabela abao representa os pesos respectvos e de uma amostra de 1 pas e de seus flhos mas velhos. Calcule o coefcente de correlação e estme a lnha de regressão de para. 65 63 67 64 68 6 70 66 68 67 69 71 68 66 68 65 69 66 68 65 71 67 68 70 8. Num determnado país, na últma década, o aumento ( ) percentual do nível de preços e a epansão percentual dos meos de pagamentos ( ), de determnado produto de eportação, verfcaram-se conforme a tabela abao: ano 199 91 9 93 94 95 96 97 98 99 0 13 9 0 35 40 18 35 38 43 18 1 17 47 3 5 0 40 5 38 a) Estabeleça a equação de regressão de sobre ; b) Determne o coefcente de correlação c) Esboce o dagrama de dspersão.