Estatística Correlação e Regressão
Noções sobre correlação Existem relações entre variáveis. Responder às questões: Existe relação entre as variáveis X e Y? Que tipo de relação existe entre elas? Qual é o grau da relação?
DIAGRAMA DE DISPERSÃO Trace um sistema de eixos cartesianos e represente uma variável em cada eixo. Estabeleça as escalas para dar ao diagrama um aspecto de quadrado. Escreva os nomes das variáveis nos respectivos eixos e faça, depois, as graduações. Desenhe um ponto para representar cada par de valores das variáveis.
DIAGRAMA DE DISPERSÃO Visualizar a relação entre duas variáveis numéricas. Se X e Y crescem no mesmo sentido, existe uma correlação positiva entre as variáveis. Se X e Y variam em sentidos contrários, existe uma correlação negativa.
Valores da Variável Y Correlação Positiva Tabela 1 Conjunto de pares de duas variáveis Conjunto A X Y 1 2 2 0 3 6 4 3 5 9 6 4 7 10 8 8 9 12 10 8 14 12 10 8 6 4 2 0 0 2 4 6 8 10 12 Valores da Variável X Figura 1 Diagrama de dispersão das variáveis do conjunto A
Variável Y Correlação Negativa Tabela 2 Conjunto de pares de duas variáveis Conjunto B X Y 1 8 2 12 3 8 4 10 5 4 6 9 7 3 8 6 9 0 10 2 14 12 10 8 6 4 2 0 0 2 4 6 8 10 12 Variável X Figura 2 Diagrama de dispersão das variáveis do conjunto B
DIAGRAMA DE DISPERSÃO Quanto a dispersão dos pontos: Maior dispersão, menor grau de correlação. Correlação fraca. Correlação forte. Correlação nula. Correlação perfeita.
Variável Y Correlação Fraca Tabela 3 Conjunto de pares de duas variáveis Conjunto A X Y 1 8 2 12 3 8 4 10 5 4 6 9 7 3 8 6 9 0 10 2 12 10 8 6 4 2 0 0 2 4 6 8 10 12 Variável X Figura 3 Diagrama de dispersão das variáveis do conjunto A
Variável Y Correlação Forte Tabela 4 Conjunto de pares de duas variáveis Conjunto B X Y 1 2 2 6 3 5 4 8 5 6 6 9 7 10 8 8 9 12 10 10 14 12 10 8 6 4 2 0 0 2 4 6 8 10 12 Variável X Figura 4 Diagrama de dispersão das variáveis do conjunto B
Variável Y Correlação Perfeita Tabela 5 Conjunto de pares de duas variáveis Conjunto C X Y 1 3 2 4 3 5 4 6 5 7 6 8 7 9 8 10 9 11 10 12 14 12 10 8 6 4 2 0 0 2 4 6 8 10 12 Variável X Figura 5 Diagrama de dispersão das variáveis do conjunto C
Quanto mais próximos da reta estiverem os pontos, maior é a correlação
Valores de Y Correlação Nula Tabela 6 Conjunto de pares de duas variáveis Conjunto D X Y 1 3 2 1 3 6 4 4 5 3 6 2 7 6 8 4 9 3 10 2 7 6 5 4 3 2 1 0 0 2 4 6 8 10 12 Valores de X Figura 6 Diagrama de dispersão das variáveis do conjunto D
Valores de Y Relação Não-linear Tabela 7 Conjunto de pares de duas variáveis Conjunto E X Y 1,5 1,0 2,0 2,0 3,0 3,0 4,0 3,5 5,0 3,0 6,0 2,0 6,5 1,0 4.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 Valores de X Figura 6 Diagrama de dispersão das variáveis do conjunto E
Correlação causal Correlação Espúria Ex.: Combustível dos automóveis e km rodados Danos nas rodovias e quantidade de tráfego Correlação espúria É explicada por uma terceira variável que não foi observada, mas que modifica as duas variáveis em estudo. Ex.: velocidade de leitura e tamanho dos pés de alunos do ensino médio. * Idade.
Coeficiente de Correlação Medida para o grau de correlação entre duas variáveis numéricas. Coeficiente de Correlação de Pearson
Varia entre -1 e + 1. Coeficiente de Correlação r = 1 : Correlação perfeita positiva r = -1 : Correlação perfeita negativa r = 0 : correlação nula 0 r 1 : Correlação positiva -1 r 0 : : Correlação negativa
Coeficiente de correlação relação entre duas variáveis nas ciências físicas e nas ciências biológicas.
Como julgar a relação correlação com base no coeficiente de correlação? 0<r<0,25 ou -0,25<r<0: correlação pequena 0,25 r<0,50 ou -0,50<r -0,25: correlação fraca 0,50 r<0,75 ou -0,75<r -0,50: correlação moderada 0,75 r<1,00 ou -1,00<r -075: correlação forte
Variável Y ATENÇÃO: O r mede apenas a relação linear entre duas variáveis. No diagrama de dispersão, os pontos devem estar espalhados em torno de uma linha reta. 14 12 10 8 6 4 2 0 0 2 4 6 8 10 12 Variável X
Noções de Regressão Estudo da relação entre duas variáveis Estuda-se, desta forma, a variação da variável Y em função da variável X: Y (variável dependente) e X (variável exploratória). Ex.: altura de uma criança em relação a idade. Relações determinísticas exatas Relações probabilísticas previsão
Reta de Regressão Explica a relação funcional entre as variáveis Ajuda a entender as mudanças na variável exploratória Ajustar uma reta de regressão Estabelecer a equação da reta Coeficientes de regressão EQUAÇÃO Y = a + bx
O Coeficiente linear da reta a diz respeito à altura que a reta corta o eixo das ordenadas. Se a for um número: Positivo, a reta corta o eixo das ordenadas acima da origem; Negativo, a reta corta o eixo das ordenadas abaixo da origem; Zero, a reta passa na origem do sistema de eixos cartesianos.
EX.:
Variável Y 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 Variável X
O coeficiente angular da reta b diz respeito à inclinação da reta. Se b for um número: Positivo, a reta é ascendente; Negativo, a reta é descendente; Zero, a reta é paralela ao eixo das abscissas.
Variável Y Variável Y Variável Y 8 4 7 6 2 5 4 0 0 1 2 3 4 5 6 3-2 2 1-4 0 0 1 2 3 4 5 6-6 Variável X -8 Variáavel X 3.5 3 2.5 2 1.5 1 0.5 0 0 1 2 3 4 5 6 Variável X
Coeficiente angular da reta: Coeficiente linear da reta:
Ex.: X Y XY X² 2 3,5 7 4 3 5,7 17,1 9 5 9,9 49,5 25 8 16,3 130,4 64 10 19,3 193 100 12 25.7 308,4 144 14 28.2 394,8 196 15 32,6 498 225 Σ 69 Σ 141,2 Σ1.589,2 Σ 767
X Y XY X² Σ 69 Σ 141,2 Σ1.589,2 Σ 767