Estatística Aplicada ao Serviço Social Módulo 7: Correlação e Regressão Linear Simples Introdução Coeficientes de Correlação entre duas Variáveis Coeficiente de Correlação Linear Introdução. Regressão linear é encontrar uma de uma reta y = ax + b que mais se aproximar dos pontos conhecidos Correlação mede e avalia o grau de relação existente entre duas variáveis. Regressão Linear Para encontrarmos a equação da regressão linear temos que calcular os parâmetros a e b da equação y = ax + b cujos valores são dados pela expressão: n. x.y x. y y x a b a. n. x² ( x)² n n Este método é conhecido dos critério dos mínimos quadrados. Exemplo: Escrever a equação da reta que aproxima o conjunto de pontos A(0;0), B(1;5), C(2;8) e D(3;9) usando o critério dos mínimos quadrados Solução: é aconselhável fazer um quadro de cálculo para melhor organização e entendimento. ponto x y x.y x² y² A 0 0 0 0 0 B 1 5 5 1 25 C 2 8 16 6 D 3 9 27 9 81 Total () 6 22 8 1 170 Substituindo nas expressões de a e b temos: a.8 6.22.1 6² 60 3 20 b 22 3. 9 1 Portanto a equação que melhor se ajusta aos pontos é y = 3x + 1 Correlação linear (r) Para medirmos o grau de correlacionamento linear entre as variáveis, existe a expressão abaixo conhecida como Coeficiente de Correlação Linear de Pearson que será representado por r xy ou simplesmente pela letra r e sua expressão é: n. x.y x. y r xy (n. x² ( x)²).(n. y² ( y)²)
Exemplo: Encontrar o correlação linear entre os pontos A(0;0), B(1;5), C(2;8) e D(3;9) usando o Coeficiente de Correlação Linear de Pearson Solução: é aconselhável fazer um quadro de cálculo para melhor organização e entendimento. Como os pontos são os mesmo do exemplo anterior vamos aproveitar os resultados ( a inclusão da coluna de y² no quadro do exemplo anterior é para será usada neste exemplo). r xy.8 6.22 (.1 6²).(.170 22 ² ) 0,96 Poder explicativo do modelo R² Indica a qualidade do ajuste da reta da regressão linear aos valores de x e y. Se R²= 1 = 100% indica que a reta da regressão linear explica 100%das variações de Y. Se R² = 0,60 = 60%, isto significa 60% das variações de Y são explicadas por X e o restante 0% são explicadas por outras variáveis. O poder explicativo é calculado fazendo-se: R² = r² xy Exemplo: Determinar o poder explicativo entre os valores de x e y para os pontos e dê o significado para os pontos A(0;0), B(1;5), C(2;8) e D(3;9). Solução: Usando os resultados encontrados nos exemplo anteriores deste módulo temos: R² = 0,96² = 0,92 ou 92% Significado: 92% das variações de Y são explicadas por X. Podemos fazer uma representação gráfica para os pontos A(0;0), B(1;5), C(2;8) e D(3;9) tratados nos exemplo deste módulo. 12 10 8 6 2 0 y = 3x + 1 R 2 = 0,92 0 2 Interpretação do coeficiente de correlação linear Correlação Linear Positiva A correlação será considerada positiva se valores crescentes de X estiverem associados a valores crescentes de Y, ou valores decrescentes de X estiverem associados a valores decrescentes da variável Y. No primeiro gráfico o valor de r está entre zero e +1, já no segundo r = 1 ( neste caso chamamos de correlação linear positiva perfeita pois todos os pontos estão alinhados) Correlação Negativa
A correlação é considerada negativa quando valores crescentes da variável X estiverem associados a valores decrescentes da variável Y, ou valores decrescentes de X associados a valores crescentes da variável Y. No primeiro gráfico o valor de r está entre zero e -1, já no segundo r = -1 (neste caso chamamos de correlação linear negativa perfeita pois todos os pontos estão alinhados Correlação Nula Quando não houver relação entre as variáveis X e ou seja, quando as variações de X e Y ocorrerem independentemente não existe correlação entre elas (r = 0). Os diagramas mostram que a correlação será tanto mais forte quanto mais próximos estiver o resultado de ±1, e será tanto mais fraca quanto mais próximo resultado estiver de zero. Exercício Resolvido - 1 Y 5 3 1 Determine a equação de regressão linear (Y = ax + b) para o resultado da pesquisa.
Solução: Primeiramente vamos montar um quadro auxiliar de cálculo. Aluno X Y X.Y x² A 2 5 10 B 1 1 C 5 3 15 25 D 3 1 3 9 Total 11 13 32 39 Calculando os parâmetros a e b da equação n. x.y x. y y x a b a. n. x² ( x)² n n.32 11.13 15 3 a 0,29.39 11² 35 7 13 b 3. 7 11 31,29 7 Portanto a equação é Y = -0,29X +,29 ou Y = (-3X + 31)/7 Exercício Resolvido - 2 Y 5 3 1 Determine o coeficiente de correlação linear de Pearson. Solução: Primeiramente vamos montar um quadro auxiliar de cálculo. Aluno X Y X.Y x² Y² A 2 5 10 25 B 1 1 1 C 5 3 15 25 9 D 3 1 3 9 1 Total 11 13 32 39 9 Calculando os parâmetros a e b da equação r r xy xy n. x.y x. y (n. x² ( x)²).(n. y² ( y)²).32 13.11 0,29 (.39 11²).(.9 13²)
Exercício Resolvido - 3 Calcule o poder explicativo R² do exercício anterior e escreva significado Solução: R² = r² xy = (-0,29)² = 0,18 ou 18,% A dependência entre os valores de x e y é de 18,% Exercícios propostos Exercício 1 Horas (X) 1 8 5 7 Determine a equação de regressão linear (Y = ax + b) de acordo com resultados obtidos. Exercício 2 Horas (X) 1 8 5 7 Determine o coeficiente de correlação linear de Pearson. Exercício 3 Horas (X) 1 8 5 7 Determine o poder explicativo e escreva o seu significado. Exercício Y 5 3 1 A correlação entre os valor de X e Y é: a) negativa b) positiva c) nula d) maior 1 e) maior que 10 Referência bibliográfica: Bibliografia básica e complementar da disciplina