Seção 2.5 Duas Variáveis Quantitativas: Diagrama de Dispersão e Correlação
Sumário Duas variáveis quantitativas Visualização: diagrama de dispersão Estatística resumo: correlação
Direção de Associação Uma associação positiva significa que os valores de uma variável tendem a ser maiores quando os valores da outra variável são mais altos Uma associação negativa significa que os valores de uma variável tendem a ser menores quando os valores da outra variável são mais altos Duas variáveis são não associadas se conhecer o valor de uma variável não lhe dá nenhuma informação sobre o valor da outra variável
Dados sobre Carros Variáveis Quantitativas : Weight peso do carro (em libras) CityMPG milhas por galão para dirigir na cidade FuelCap tamanho do tanque de gás (em galões) Page nº pág. que o carro aparece no guia de compra QtrMile tempo para chegar a 1/4 de milha (seg.) Acc060 tempo de aceleração para ir de 0 a 60 mph Relacionamentos Weight vs. CityMPG Weight vs. FuelCapacity PageNum vs. Fuel Capacity Weight vs. QtrMile Acc060 vs. QtrMile CityMPG vs. QtrMile
Dados sobre Carros Faça estimativas iniciais para a força e direção da associação para cada um dos seguintes: 1) Weight vs. CityMPG 2) Weight vs. FuelCapacity 3) PageNum vs. Fuel Capacity 4) Weight vs. QtrMile 5) Acc060 vs. QtrMile 6) CityMPG vs. QtrMile
Diagrama de Dispersão Um diagrama de dispersão é o gráfico da relação entre duas variáveis quantitativas.
2500 3500 14 16 18 100 200 12 16 20 18 22 26 6 8 10 12 Car Associations 18 20 22 24 26 28 100 150 200 250 2500 3000 3500 4000 Acc060 CityMPG FuelCap Page QtrMile Weight 6 7 8 9 10 11 12 12 14 16 18 20 14 15 16 17 18 19
Correlação A correlação é uma medida da força e direção da associação linear entre duas variáveis quantitativas Correlação amostral: r Correlação populacional: ( rho )
Matriz de Correlações (Carros) Acc060 CityMPG FuelCap Page QtrMile Weight Acc060 1.00 0.51-0.47 0.21 0.99-0.45 CityMPG 0.51 1.00-0.77 0.33 0.51-0.89 FuelCap -0.47-0.77 1.00-0.09-0.47 0.88 Page 0.21 0.33-0.09 1.00 0.20-0.26 QtrMile 0.99 0.51-0.47 0.20 1.00-0.45 Weight -0.45-0.89 0.88-0.26-0.45 1.00 What are the properties of correlation?
1. -1 r 1 Correlação 2. O sinal indica a direção da associação 1. associação linear positiva: r > 0 2. associação linear negativa: r < 0 3. sem associação linear: r 0 3. Quanto mais próximo r for de ± 1, mais forte é a associação linear 4. r é adimensional e não depende das unidades de medida 5. A correlação entre X e Y é a mesma que a correlação entre Y e X
Jogo de Advinhação da Correlação http://istics.net/stat/correlations/ Maior pontuador da classe recebe um ponto extra no primeiro exame!
z-score for Penalty Yards -1.5-1.0-0.5 0.0 0.5 1.0 Correlação NFL Teams r = 0.43 3.0 3.5 4.0 4.5 5.0 Malevolence Rating of Uniform
Correlação z-score for Penalty Yards -0.8-0.4 0.0 0.4 r = 0.08 3.0 3.5 4.0 4.5 5.0 Malevolence Rating of Uniform Mesmo diagrama anterior, mas com Golfinhos e Raiders (outliers) removidos
Cuidados com a Correlação 1. Correlação pode ser fortemente afetada por outliers. Sempre plote seus dados!
Bala de Canhão Humana Plot Y vs. X X Y Qual é a correlação entre X e Y? r 0 X e Y estão associados? Sim!
Cuidados com a Correlação 1. Correlação pode ser fortemente afetada por outliers. Sempre plote seus dados! 2. r = 0 significa que não há associação linear. As variáveis podem ainda estar associadas. Sempre plote seus dados!
TVs e Expectativa de Vida TV and Life Expectancy Life Expectancy 40 50 60 70 80 Mexico Sri Lanka China Morocco Egypt Vietnam Iraq Pakistan Yemen Cambodia Madagascar Haiti Uganda South Africa Angola Russia France Canada Australia Japan United Kingdom United States r = 0.74 0 200 400 600 800 1000 TVs per 1000 People
Cuidados com a Correlação 1. Correlação pode ser fortemente afetada por outliers. Sempre plote seus dados! 2. r = 0 significa que não há associação linear. As variáveis podem ainda estar associadas. Sempre plote seus dados! 3. Correlação não implica necessariamente em causa! Pode haver correlação espúria!
Resumo: Duas Variáveis Quantitativas Visualização: diagram de dispersão Estatística resumo: correlação