Seção 2.6 Duas Variáveis Quantitativas: Regressão Linear
A Reta de Regressão Predições Resíduos Sumário Interpretando a Inclinação e o Intercepto Cuidados com a Regressão
Grilos e Temperatura Você pode estimar a temperatura em uma noite de verão, apenas ouvindo grilos?
Temperatura Grilos e Temperatura Variável de Resposta, y Grilos Variável Explicativa, x
A Reta de Regressão Objetivo: Encontre uma linha reta que melhor se ajuste aos dados em um diagrama de dispersão
Equação da Reta A reta de regressão estimada é y = a + bx Respostas Preditas Variável Explicativa Lock 5
Predição A equação de regressão pode ser usada para predizer y para um dado valor de x Temp = 37.7 + 0.23Grilos Se você ouvir e ouvir os grilos cricrilando cerca de 140 vezes por minuto, seu melhor palpite na temperatura externa é 37.7 + 0.23 140 = 69.9
Predição Temp = 37.7 + 0.23Grilos Qual é a temperatura prevista quando os grilos fazem 103 cricrilos por minuto? 37.7 + 0.23(103) = 61.39
Temperatura Predição A resposta prevista está na linha de regressão diretamente acima do valor de x 37.7 + 0.23 140 = 69.9 Grilos
Temperatura Predição Grilos Se os grilos estão cricrilando cerca de 180 vezes por minuto, qual das seguintes é a melhor estimativa da temperatura? (a) 60 (b) 70 (c) 80
Predição Um dos casos no conjunto de dados de críquete é 103 sons por minuto e 63.5 o F Quão distante está a temperatura predita da temperatura observada para este caso? 37.7 + 0.23(103) = 61.39 63.5 61.39 = 2.11
A Reta de Regressão Como encontramos a melhor reta de ajuste?
Valores Preditos e Reais O valor de resposta observado, y, é o valor de resposta observado para um determinado ponto de dados O valor de resposta predito, y, é o valor de resposta que seria previsto para um determinado valor x, com base em um modelo A melhor reta de ajuste (regressão) é aquela que torna os valores preditos mais próximos dos valores reais
Temperatura Valores Preditos e Reais y ŷ y = 63.5 y = 61.39 Grilos
Resíduo O resíduo para cada ponto de dados é a diferença entre valores observado previsto= y y O resíduo também é o comprimento da distância vertical de cada ponto até a reta Lock 5
Temperatura Resíduo residual { y y = 63.5 61.39 = 2.11 Quer-se fazer todos os resíduos tão pequenos quanto possível. Como você mediria isso? Grilos
Reta de Mínimos Quadrados A reta de mínimos quadrados é a reta que minimiza a soma dos resíduos ao quadrados minimize Σ(y y) 2 Confie na tecnologia para encontrar essa reta de mínimos quadrados. reta de mínimos quadrados = reta de regressão Lock 5
Temperatura Regressão de Mínimos Quadrados Minimiza a soma dos resíduos ao quadrado Grilos
Exemplos de Tecnologias The regression equation is Temperature = 37.7 + 0.231 Chirps Predictor Coef SE Coef T P Constant 37.679 1.978 19.05 0.000 Chirps 0.23067 0.01423 16.21 0.000 Minitab S = 1.52778 R-Sq = 98.1% R-Sq(adj) = 97.8% Chirps = nº de cricrilos dos grilos (Grilos) R > lm(temperature~chirps) Coefficients: (Intercept) Chirps 37.6786 0.2307 Coeficientes Erro padrão Stat t valor-p Interseção 37,68 1,98 19,05 0,00 Variável X 1 0,23 0,01 16,21 0,00 Excel Temp = 37.7 + 0.23 Grilos
Variáveis Explicativa e de Resposta Diferentemente da correlação, para a regressão linear importa qual é a variável explicativa e qual é a resposta Temp = 37.7 + 0.23Grilos Grilos = 157.8 + 4.25Temp
Inclinação e Intercepto A reta de regressão estimada é y = a + bx Intercepto Inclinação Inclinação: é o valor do aumento em y previsto para cada aumento de uma unidade em x Intercepto: é o valor de y previsto quando x = 0 Lock 5
Interpretando a Inclinação e o Intercepto Temp = 37.7 + 0.23 Grilos Inclinação = 0.23 : A temperatura prevista sobe a taxa de 0.23 o F para cada aumento de 1 na qtd. de cricrilos dos grilos. Intercepto = 37.7: Temperatura prevista quando os grilos param de cricrilar???
Unidades É útil pensar em unidades ao interpretar uma equação de regressão y = a + b x y unidades y unidades x unidades y x units units Temp = 37.7 + 0.23Chirps Graus F Graus F Graus F/ cricrilos por min cricrilos por minute
Cuidado com a Regressão 1 Não use a equação de regressão ou linha para prever fora do intervalo de valores x disponíveis em seus dados (não extrapole!) Se nenhum dos valores de x estiver perto de 0, então o intercepto não tem sentido!
Cuidado com a Regressão 2 Os computadores calcularão uma reta de regressão para quaisquer duas variáveis quantitativas, mesmo que não estejam associadas ou se a associação não for linear SEMPRE PLOTE SEUS DADOS! A reta / equação de regressão só deve ser usada se a associação for aproximadamente linear
Cuidado com a Regressão 3 Outliers (especialmente outliers em ambas as variáveis) podem ser muito influentes na reta de regressão SEMPRE PLOTE SEUS DADOS! http://illuminations.nctm.org/lessondetai l.aspx?id=l455
Expectativa de Vida e Taxa de Natalidade Coefficients: (Intercept) LifeExpectancy 83.4090-0.8895 Qual das seguintes interpretações está correta? (a) Uma diminuição de 0,89 na taxa de natalidade corresponde a um aumento de 1 ano na expectativa de vida prevista (b) Aumentar a expectativa de vida em 1 ano fará com que a taxa de natalidade diminua 0,89 (c) Ambas (d) Nenhuma (a) O modelo está prevendo taxa de natalidade com base na expectativa de vida, e não o contrário (b) Só se pode tirar conclusões sobre a causalidade através de um experimento randomizado.
Cuidado com a Regressão 4 Valores mais altos de x podem levar a valores preditos mais altos (ou mais baixos) de y, mas isso NÃO significa que a mudança de x fará com que y aumente ou diminua A causação só pode ser determinada se os valores da variável explicativa forem determinados aleatoriamente (o que raramente é o caso com uma variável explicativa contínua)
r = 0 Desafio: Se a correlação entre x e y é 0, qual seria a reta de regressão?
Resumo: Regressão de Mínimos Quadrados Para uma resposta quantitativa y e um preditor quantitativo x, a reta de mínimos quadrados é y = a + bx onde a inclinação (b) e o intercepto (a) são escolhidos para minimizar a soma dos resíduos ao quadrado. Para cada caso de dados, o resíduo é y y. Nós confiamos na tecnologia para dar a equação de predição (também conhecida como ajuste de mínimos quadrados ou reta de regressão). A inclinação é interpretada como a mudança na resposta prevista (y) quando a variável explicativa (x) aumenta em 1.
Resumo: Regressão de Mínimos Quadrados Cuidados: Não extrapole muito além de onde o modelo foi construído. Estimar uma reta de mínimos quadrados não significa que haja uma tendência linear nos dados. Cuidado com os valores discrepantes que não se encaixam no padrão ou que podem influenciar muito a reta. Mesmo um ajuste linear forte não implica (necessariamente) uma relação de causa / efeito. SEMPRE PLOTE SEUS DADOS!