Regressão Linear marcoscgarcia@gmail.com 2008). Proibida a reprodução, sob pena da lei. 1
O modelo estatístico de Regressão Linear Simples Regressão linear simples é usado para analisar o comportamento de duas variáveis ( x e y ). Identificar se existe algum grau de associação entre elas. Essa análise é feita por cálculos, mas inicialmente, pode ser feita através de um gráfico de dispersão. Consiste de um gráfico cartesiano no qual são registrados os valores correspondentes às variáveis x e y. para cada valor de y espera-se que haja um valor de x, o que formará um par. Esse gráfico nos auxilia a enxergar a tendência formada pelo comportamento de y em função de x. da lei. 2
Relações lineares entre x e y Tendência positiva y x Relação de tendência positiva entre x e y. Tanto o valor de a como b são positivos. Reta de tendência linear crescente, Quanto maior o valor de x, maior o valor de y. 2008). Proibida a reprodução, sob pena da lei. 3
Relações lineares entre x e y y Tendência negativa x Relação de tendência negativa entre x e y. O valor de b é negativo. Reta de tendência linear decrescente. Quanto maior o valor de x, menor o valor de y. 2008). Proibida a reprodução, sob pena da lei. 4
Relações lineares entre x e y y Sem Tendência x Não há relação entre x e y. O valor de b é zero. Reta sem tendência, não tem inclinação. Quanto maior o valor de x, constante será o valor de y. 2008). Proibida a reprodução, sob pena da lei. 5
Importante a) Ao avaliar um gráfico de dispersão e notar alguma tendência na disposição dos pares (x,y), assumimos que tal tendência pode ser aproximada (avaliada) por uma reta. b) Mas apenas uma análise mais criteriosa do valor do coeficiente de determinação poderá nos auxiliar na decisão se de fato a tendência encontrada pode ou não ser aproximada por uma reta. c) Caso o coeficiente de determinação nos indique que a aproximação por uma reta é satisfatória, então poderemos usar a equação do modelo de regressão linear simples (equação da reta): y = a + bx. Com essa equação pode-se fazer análises preditivas. 2008). Proibida a reprodução, sob pena da lei. 6
Análise do R múltiplo (r) Coeficiente de Correlação *Coeficiente de Correlação: Perfeita positiva ( r = 1 ) Perfeita negativa ( r = - 1 ) Ideal ( 0,8 r 0,99 ) Crítica ( 0,5 r 0,7 ) Fraca ( r < 0,5 ) * Criado com base na literatura especializada e na experiência profissional dos autores da lei. 7
Análise do R - Quadrado (R 2 ) Coeficiente de Determinação *Coeficiente de Determinação: Perfeito 100% Ideal 90% a 99% Bom 80% a 89% Crítico 60% a 79% Não usar 50% * Criado com base na literatura especializada e na experiência profissional dos autores da lei. 8
Exemplo: Uma IES pretende estudar o aproveitamento dos alunos com base nas notas finais, em relação ao número de faltas destes alunos. Nº Faltas (x) Nota Final (y) 8 78 2 92 5 90 12 58 15 43 9 74 6 81 da lei. 9
Equação da reta da Regressão y = a + bx Cálculo dos coeficientes a e b. b n xy ( x n x 2 )( = 2 ( x) y) a = y bx da lei. 10
Cálculos da equação da reta. Nº Faltas (x) b Nota Final (y) xy x 2 8 78 624 64 2 92 184 4 5 90 450 25 12 58 696 144 15 43 645 225 9 74 666 81 6 81 486 36 57 516 3751 579 = n xy ( x)( n x ( x) y) média y 516 / 7 73,7143 média x 57 / 7 8,1429 (7*3751) (57*516) 2 (7*579) (57) = = 2 2 3,924 a = y bx = 73,7143 ( 3,9241*8,1429) = 105,6679 da lei. 11
Equação da reta de regressão do exercício. y = 105,6679 + ( 3,9241x) da lei. 12
Gráfico da reta de Regressão 120 Aproveitamento dos alunos y = -3,9241x + 105,67 R² = 0,9502 100 80 Nota Final 60 40 Nota Final (y) Linear (Nota Final (y)) 20 0 0 2 4 6 8 10 12 14 16 Nº Faltas da lei. 13
Análise dos coeficientes a e b Interseção a é o ponto em que a reta cruza (intercepta) o eixo y. Quando x=0, y será igual ao valor de a Coeficiente angular (inclinação) b. Quando x aumenta uma unidade, o valor de b será um acréscimo ao valor de a, caso a reta seja crescente. Do contrário, b representará decréscimo no valor de a. da lei. 14
Coeficiente de Correlação: O valor do r será de: -0,9748 Coeficiente de Determinação: O valor do R 2 será de: 0,9502 da lei. 15
Responda: Qual será a nota do aluno com uma quantidade de faltas igual a 10. y = 105,6679 + ( 3,9241*10) = 66,4269 Resposta: 66 pontos. 66 Qual será a nota do aluno com uma quantidade de faltas igual à 20. y = 105,6679 + ( 3,9241* 20) = 27,1859 27 Resposta: 27 pontos. da lei. 16
Exercício I Abaixo estão os dados referentes ao percentual da população economicamente ativa empregada no setor primário (y) e o respectivo índice percentual de analfabetismo (x) para algumas regiões metropolitanas brasileiras. da lei. 17
Exercício II Em uma região do Brasil pretende-se implementar um programa de reforço em educação física. Uma amostra de alunos foi selecionada ao acaso, registrando a altura e o peso de cada aluno. Verificar a relação entre altura e peso. Os dados estão logo abaixo. da lei. 18