Luiz Carlos Terra Em mercadologia é importante conhecer as ferramentas existentes para estimação dos valores de vendas, de preços de produtos ou de custos de produção. A análise de regressão representa um instrumento valioso para a realização dessa tarefa. Nessa aula, você terá uma importante base teórica para o entendimento dessa técnica. (Luiz Carlos Terra) 1
Objetivo Em mercadologia é importante conhecer as ferramentas existentes para estimação dos valores de vendas, de preços de produtos ou de custos de produção. A análise de regressão representa um instrumento valioso para a realização dessa tarefa. Nessa aula, você terá uma importante base teórica para o entendimento dessa técnica. Tópicos: 1 - Regressão linear simples. 2 - Diagrama de dispersão. 3 - Ajustamento da reta. 4 - Exercício resolvido. 5 - Saiba mais. 6 - Bibliografia. 1 Regressão Linear Simples Regressão Linear Simples: Quando você estudou as medidas de posição ou de dispersão, o conjunto de dados era composto por apenas uma variável. Vimos na aula anterior que é possível verificar se existe associação entre duas ou mais variáveis, calculando o coeficiente de correlação. Agora mostraremos através da análise de regressão, como constroem-se modelos estatísticos de relações entre essas variáveis, possibilitando a previsibilidade de valores. Assim, estabelecendo um valor para a variável independente, é possível estimar o valor para a variável dependente. Na REGRESSÃO, assim como foi explicado na teoria da correlação, a variável y é chamada de variável dependente e a variável x, de variável independente. Sendo y uma variável que nos interessa estudar e cujo comportamento futuro desejamos prever, é fácil identificarmos uma série de variáveis x i (x 1, x 2, x 3,... x n ) que influenciam o comportamento de y, a variável dependente do modelo y i.(y 1, Y2, Y3,...Yn ). O modelo a ser estudado é o de regressão linear simples, representado pela fórmula da equação de reta: y = a + bx. É uma regressão linear por que supõe-se o ajustamento dos pontos de encontro das duas variáveis em torno de uma reta. Ao mesmo tempo, esse modelo é também uma regressão linear simples, pois embora a regressão possa envolver mais de uma variável, abordaremos um caso com duas variáveis apenas. Quando tratar-se do estudo da relação entre mais de duas variáveis, a regressão será chamada de regressão múltipla e embora os cálculos sejam mais complexos, o raciocínio é o mesmo. 2
2 - Diagrama de Dispersão Suponhamos que dispomos dos seguintes dados: a renda média familiar da população de várias cidades e a quantidade de carros zero quilômetro vendidos pela principal loja da cidade em um mês. Assim, observe o gráfico abaixo: Cidade Renda ($1.000) Carros 0 km vendidos (em unidades) A 5 27 B 10 46 C 20 73 D 8 40 E 4 30 F 6 28 G 12 46 H 15 59 Uma forma de verificar se há relação entre a renda e as vendas de carros é colocar os dados em um gráfico, denominado diagrama de dispersão, onde a renda é medida ao longo do eixo horizontal e as vendas de carros, medidas ao longo do eixo vertical. O cruzamento das duas observações é marcado com um ponto, conforme mostrado a seguir: Vendas Vendas em função de renda 80 60 40 20 0 0 10 20 30 Renda Observa-se nesse gráfico que há uma tendência de crescimento linear entre as variáveis, ou seja, quanto mais elevada a renda, maior será o consumo do produto. O coeficiente de correlação confirma essa tendência, pois seu índice é de 0, 98; ou seja, bem próximo de um, o que significa uma forte relação positiva entre a renda e as vendas. Quanto mais cresce a renda da população dessas cidades, maior é a procura por carros zero quilômetro. 3
3 - Ajustamento da Reta (Método dos Mínimos Quadrados) Pela equação da reta y = a + bx, é necessário identificar qual é a verdadeira reta que passa pelos pontos de cruzamento das observações. Para isso, é necessário calcular os valores de a e b, que são os coeficientes de determinação dessa reta, sendo a o coeficiente linear, ou seja, o ponto em que a reta corta o eixo dos y e b; o coeficiente angular. Essa será a reta que passa o mais próximo possível dos pontos observados no diagrama de dispersão, tornando mínima a distância entre os pontos observados e ela. O método que minimiza as discrepâncias entre os pontos e a reta, sendo o melhor para a determinação dos parâmetros a e b é o método dos mínimos quadrados, que torna possível calcular esse parâmetros com a aplicação das seguintes fórmulas: Onde: n = tamanho da amostra. = média dos x i. = média dos y i. Com os parâmetros a e b definidos, a reta de regressão que se ajusta aos dados é representada por: Y = 14,58 + 2,90 X; onde, calculando pela fórmula acima, descobre-se que 2,90 equivale ao b calculado; 14,58 ao a, X é a renda observada e Y é o número de carros vendidos. Com essa equação da reta de regressão, é possível fazer a projeção de valores para outras cidades, verificando a possibilidade de estabelecer novas lojas de carros nelas. Por exemplo, se existe a informação de que em determinada cidade a renda média mensal da população é de $ 25.000, pode-se estimar que haverá uma demanda por aproximadamente 87 carros novos. 4
O cálculo para estimar esse valor foi feito com base na equação da reta de regressão, assim: Y = 14,58 + 2,90 x 25, onde 14,58 e 2,90 são os parâmetros calculados para identificação da reta, 25 é a observação da renda dessa cidade ($ 25.000,) e Y é o valor que se quer estimar. Logo, Y = 14,58 + 72,50 = 87,08. Vale lembrar também que a complexidade dos cálculos para identificação dos parâmetros da reta é superada pela possibilidade de calculá-los através de calculadoras eletrônicas ou ainda, pelo excel. Em SAIBA MAIS, estarão os passos para os cálculos dos coeficientes da reta de regressão pela HP12C e pelo excel. 4 - Exercício Resolvido Utilizando os dados abaixo: a) Construa o diagrama de dispersão. b) Ajuste uma reta aos dados pelo método de mínimos quadrados. Trace-a no diagrama de dispersão. c) Qual é o custo para 16 unidades do artigo? Quantidade (x) Custos (y) 10 11 12 13 14 15 100 112 119 130 139 142 Solução: a) Diagrama de dispersão Custos Diagrama de dispersão 160 140 120 100 80 60 40 20 0 0 5 10 15 20 Quantidades 5
b) Ajustamento da reta Nesse item, precisamos avaliar a e b. É conveniente a construção da tabela: X Y Xy X 2 10 100 1000 100 11 112 1232 121 12 119 1428 144 13 130 1690 169 14 139 1946 196 15 142 2130 225 75 742 94 26 955 6
140 130 y= 15,79 + 8,63x Custos 120 110 100 10 11 12 13 14 Quantidades c) Custo para 16 unidades Como x = quantidade e y = custo, basta calcularmos o valor de y quando x = 16. Assim: y = 15,79 + 8,63. (16) y = 153,87 Logo o custo para dezesseis unidades será de R$ 153,87. Cálculo dos parâmetros a e b, pela HP-12C. - Após a introdução dos dados Y ENTER e X - +, para cálculo do coeficiente de correlação (lembre-se: introduzidos X e Y, tecla azul seguida de tecla 2 e tecla x<>y = - r -.), digitam-se na sequência as seguintes teclas: - Tecla 0, tecla g, tecla 2 = o valor que aparece é o valor de a. - Tecla STO, tecla 0, tecla 0, tecla g, tecla 1, tecla CHS, tecla RCL, tecla 0. - Tecla x<>y; tecla = o valor que aparece é o valor de b. Cálculo pelo Excel: saiba mais - Primeiro passo colocar os valores de X e Y em duas colunas. - Segundo passo escolha as funções: inclinação para conhecer o valor de b e a função intercepção para conhecer o valor de a. Em val, conhecidos- digita-se a primeira e a última célula tanto dos valores de Y quanto dos valores de X, separadas por dois pontos. 7
Anotações: bibliografia Spiegel, Murray R. Estatística Ed. McGraw-Hill 1993 Lopes, Paulo Afonso Probabilidade e estatística Ed. Reichmann e Affonso Editores. Stevenson, William J. Estatística aplicada à administração Editora Harbra Complementar. Braule, Ricardo Estatística aplicada com excel Editora Campus. 8