Módulo: Projeção de Vendas Aula 4: Quantitativos Regressão Linear 2015 by Ibramerc. This work is licensed under the Creative Commons. If you want to use or share, you must give appropriate credit to I Ibramerc.
Planejamento de demanda: Métodos Quantitativos Qualitativos Pipeline Média Móvel Regressão Linear Pesquisa de Mercado Analogia de Histórico Visionário Suavização Exponencial Opinião Vendedores Opinião Diretores Delphi
Planejamento de demanda: Métodos Quantitativos Qualitativos Pipeline Média Móvel Regressão Linear Pesquisa de Mercado Analogia de Histórico Visionário Suavização Exponencial Opinião Vendedores Opinião Diretores Delphi
Método Quantitativo Modelos: Previsões Quantitativas Modelos de Séries Temporais Modelos Causais Média-móvel Suavização Exponencial Box-Jenkins (SARIMA*) Regressão Linear/múltipla * SARIMA: Seasonal Autoregressive Integrated Moving Average.
Regressão linear/múltipla
Modelo causal Definição Como funciona: a previsão de uma variável é derivada a partir da interpretação de outras variáveis relacionadas (a relação causa-efeito) Alguns exemplos: As vendas de mídia BluRay aumentam à medida em que aumenta a venda de aparelhos com a tecnologia A demanda por veículos econômicos aumenta com aumento do preço dos combustíveis (ou com maior oferta de financiamento) Aumento da demanda por sorvetes à medida que a temperatura aumenta
Modelo causal Definição A Relação causa-efeito permite antecipar mudanças significativas na série temporal. Aplicabilidade: médio e longo-prazo Duas classes: Estatísticos: modelos de regressão, econométricos Descritivos: entrada/saída, simulação Dificuldades: Encontrar variáveis causais confiáveis ou que tenham relações óbvias com a variável de previsão Envolver na relação a componente tempo
Modelo de regressão simples Exemplo Renda média Vendas 1990 602 9410 1991 678 10333 1992 653 10019 1993 701 10091 1994 732 10397 1995 712 10010 1996 654 10006 1997 688 10379 1998 723 10154 1999 712 10270 2000 687 9866 2001 672 10119 2002 614 9621 2003 690 10580 2004 714 10838 2005 708 10297 2006 698 10339 2007 723 10787 2008 754 10461 2009 758 11100 2010 801 11346 2011 796 11499 2012 807 11113
Exemplo Vendas 12000 11500 11000 10500 10000 9500 9000 8500 8000 500 550 600 650 700 750 800 850 Renda média
Exemplo Vendas 12000 11500 11000 y = 8,7806x + 4178,9 R² = 0,7797 10500 10000 9500 9000 8500 8000 500 550 600 650 700 750 800 850 Renda média
Exemplo Y = 8,7806.X + 4178,9 Qual a previsão de vendas para um ano com renda média de R$900,00?
Modelo de regressão múltipla Y = a + b 1 X 1 + b 2 X 2 +... + b n X n
Exemplo Número de representantes Número de representantes do concorrente Pedidos 1990 45 60 127 1991 48 62 142 1992 52 66 192 1993 54 68 165 1994 53 64 155 1995 50 60 157 1996 44 60 141 1997 48 60 193 1998 47 62 155 1999 49 69 102 2000 58 70 201 2001 62 72 199 2002 65 71 223 2003 68 64 223 2004 57 68 137 2005 59 66 190 2006 53 62 182 2007 40 60 158 2008 38 62 94 2009 36 74 34 2010 30 63 63 2011 32 60 128 2012 35 75 61
Exemplo
Exemplo Y = 174,43 + 4,51.X 1 + 3,77.X 2 X 1 : número de representantes X 2 : número de representantes do concorrente Qual a previsão de vendas para um ano em que a empresa possua 60 representantes, enquanto o concorrente também trabalhe com 60 representantes?
Churn
Definição Quantidade de Usuários e Clientes que deixaram de ser usuário ou cliente. É importante saber quantos são, e quais os motivos porque isso aconteceu, pois aqui você descobrirá muitas informações para melhorar seu produto.
Como calcular? Churn mensal = quantidade de clientes que cancelou no mês total de clientes do último dia do mês anterior Churn anual = quantidade de clientes que cancelou no ano total de clientes do último dia do ano anterior Como projetar?
Projetando Churn Ativos Clientes Ativos no fim do mês Cancelaram Clientes que cancelaram a compra de um determinado produto ou deixaram de executar algum tipo de serviço Churn taxa de clientes fora da base Ativaram quantidade de clientes que ativaram a conta ou Novos.
Projetando Churn Dados de Novos Clientes e Cancelamentos de Assinaturas de Revistas Vamos calcular?
Como melhorar a acuracidade da previsão de vendas Utilize mais de um método. Selecione métodos apropriados, de acordo com necessidade, custo e tempo disponível. Use algumas variáveis independentes. Estabeleça uma escala de previsão de vendas mínimo, médio e máximo.
CASE CHYNEX
Avançando nos modelos de regressão
Exercício Taxa de consentimento para doação de órgãos (%) País A: 12% = Alemanha País B: 99,98% = Áustria Refinar a lista de causas.
Consentimento de doação de órgãos por país (%) "Opt-in Marque esta caixa se você quiser participar do programa de doação de órgãos. "Opt-out" Marque essa caixa se você não quiser participar do programa de doação de órgãos.
Causa X Correlação Encontramos explicações e causas razoáveis a qualquer problema que nos apareça.
Página de venda de assinatura do jornal The Economist
Página de venda de assinatura do jornal The Economist
Causa X Correlação Correlação não é causalidade. Atenção às correlações espúrias. Consumo café Câncer pulmão Fumo Câncer pulmão Consumo café
Causa X Correlação Bombeiros Intensidade do incêndio Prejuízo Prejuízo Bombeiros
Causa X Correlação? Atrasos Visitas Satisfação de clientes Volume de vendas Investimento em publicidade Satisfação de clientes Market Share Lucro
A descoberta de um gene que predispõe as pessoas tanto ao tabagismo quanto ao câncer desabonaria a relação de causaefeito entre estes dois fatores. Sir Ronald Fisher
Uma relação estatística, por mais forte e sugestiva que seja, jamais pode estabelecer uma relação causal: nossas ideias sobre causação devem vir de fora da estatística, enfim, de outra teoria. Kendall e Stuart
Transformação de dados
Transformação de dados Muitas vezes é necessário transformar os dados para modelarmos a previsão de demanda de maneira mais precisa. Apresentaremos algumas possibilidades comuns.
1) Modelo Log-Log 1) Modelo Log-Log Aplicar logaritmo natural (ln) tanto no valor Y, quanto nos valores X.
Demanda Preço 64.212,41 2,00 58.598,13 2,10 48.502,04 2,20 47.985,51 2,30 39.447,95 2,40 33.373,47 2,50 35.101,48 2,60 31.866,12 2,70 25.115,81 2,80 27.401,16 2,90 21.381,01 3,00 23.214,01 3,10 19.986,17 3,20 14.437,72 3,30 19.512,94 3,40 13.084,35 3,50 16.128,65 3,60 9.877,90 3,70 15.952,29 3,80 11.156,92 3,90 13.267,49 4,00 9.231,81 4,10 10.501,95 4,20 12.955,84 4,30 9.825,35 4,40 10.452,21 4,50 10.434,92 4,60 7.934,69 4,70 6.191,45 4,80 9.586,84 4,90 5.335,05 5,00 70.000,00 60.000,00 50.000,00 40.000,00 30.000,00 20.000,00 10.000,00-1,50 2,50 3,50 4,50 5,50 Ln (demanda) Ln (Preço) 11,07 0,69 10,98 0,74 10,79 0,79 10,78 0,83 10,58 0,88 10,42 0,92 10,47 0,96 10,37 0,99 10,13 1,03 10,22 1,06 9,97 1,10 10,05 1,13 9,90 1,16 9,58 1,19 9,88 1,22 9,48 1,25 9,69 1,28 9,20 1,31 9,68 1,34 9,32 1,36 9,49 1,39 9,13 1,41 9,26 1,44 9,47 1,46 9,19 1,48 9,25 1,50 9,25 1,53 8,98 1,55 8,73 1,57 9,17 1,59 8,58 1,61 11,50 11,00 10,50 10,00 9,50 9,00 8,50 8,00-0,50 1,00 1,50 2,00
2) Modelos Log-Lin ou Lin-Log Aplicar logaritmo natural (ln) somente nos valores Y (Log-Lin) Aplicar logaritmo natural (ln) somente nos valores X (Lin-Log)
3) Modelos Recíprocos Utilizado quando há um limite (teórico ou prático) para a demanda (Y) Aplicar 1/x das variáveis independentes (X)
Demanda X 1,8 1,4 8,5 1,1 8,4 1,5 4,5 1,5 4,3 1,2 6,9 1,0 8 1,1 5 1,3 3,6 1,8 2,6 1,9 2,6 1,5 4,2 1,4 3,6 1,8 3,7 2,1 4,8 1,5 4,3 1,3 4,6 1,4 Demanda 1/X 1,8 0,71 8,5 0,91 8,4 0,67 4,5 0,67 4,3 0,83 6,9 1,00 8 0,91 5 0,77 3,6 0,55 2,6 0,53 2,6 0,67 4,2 0,71 3,6 0,55 3,7 0,48 4,8 0,67 4,3 0,77 4,6 0,71 Y estimado X 7,30 1 2,93 2 1,48 3 0,75 4 0,32 5 0,03 6-0,18 7-0,34 8-0,46 9-0,56 10-0,64 11-0,70 12-0,76 13-0,81 14-0,85 15-0,88 16-0,92 17 10 10 8,00 8 8 6,00 6 6 4,00 4 2 0 0 1 2 3 4 2 0 0 0,5 1 1,5 y = 8,7243 (1/x) - 1,4282 R² = 0,3849 2,00 0,00-2,00 0 5 10 15 20
4) Modelos polinomiais Aplicar X 0,5, X 2, X 3, X 4,...
Y X 7.142,42 139,19 8.288,56 149,82 8.637,49 151,06 7.266,05 152,75 5.721,01 161,84 2.982,67 100,70 3.453,61 126,53 7.725,34 138,31 6.171,54 146,25 10.213,55 212,02 6.591,50 143,23 8.836,63 206,56 7.211,00 150,10 8.507,01 150,06 8.012,40 154,38 5.317,70 126,72 4.671,04 128,82 5.684,92 120,29 9.298,05 201,80 9.504,17 180,96 10.519,25 199,27 9.004,45 206,20 5.729,66 150,88 8.826,85 184,73 10.315,24 191,82 7.064,22 153,96 7.727,97 139,94 5.178,12 131,76 7.574,59 148,98 9.150,21 160,51 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,83 R-Quadrado 0,69 R-quadrado ajustado 0,68 Erro padrão 1107,67 Observações 30,00 ANOVA gl SQ MQ F F de significação 76472300,5 Regressão 1,0 76472300,56 6 62,33 0,00 Resíduo 28,0 34354068,18 1226931,01 Total 29,0 110826368,7 4 Coeficientes Erro padrão Stat t valor-p 95% inferiores 95% superiores Inferior 95,0% Interseção -1513,04 1148,30-1,32 0,20-3865,23 839,15-3865,23 X 56,85 7,20 7,89 0,00 42,10 71,60 42,10
Y X X 2 7.142,42 139,19 19.373,07 8.288,56 149,82 22.446,67 8.637,49 151,06 22.819,62 7.266,05 152,75 23.333,90 5.721,01 161,84 26.193,17 2.982,67 100,70 10.139,61 3.453,61 126,53 16.010,05 7.725,34 138,31 19.130,51 6.171,54 146,25 21.388,58 10.213,55 212,02 44.953,21 6.591,50 143,23 20.513,89 8.836,63 206,56 42.666,63 7.211,00 150,10 22.530,64 8.507,01 150,06 22.518,25 8.012,40 154,38 23.833,70 5.317,70 126,72 16.058,86 4.671,04 128,82 16.594,47 5.684,92 120,29 14.469,98 9.298,05 201,80 40.723,02 9.504,17 180,96 32.745,10 10.519,25 199,27 39.708,16 9.004,45 206,20 42.517,07 5.729,66 150,88 22.766,24 8.826,85 184,73 34.124,71 10.315,24 191,82 36.794,24 7.064,22 153,96 23.702,24 7.727,97 139,94 19.582,00 5.178,12 131,76 17.359,75 7.574,59 148,98 22.194,95 9.150,21 160,51 25.764,92 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,864 R-Quadrado 0,747 R-quadrado ajustado 0,728 Erro padrão 1019,755 Observações 30 ANOVA gl SQ MQ F F de significação 41374525,8 Regressão 2 82749051,63 1 39,79 0,00 Resíduo 27 28077317,11 1039900,63 Total 29 110826368,7 4 Coeficientes Erro padrão Stat t valor-p 95% inferiores 95% superiores Interseção -15022,34 5599,42-2,68 0,01-26511,39-3533,29 X 227,46 69,76 3,26 0,00 84,32 370,59 X 2-0,52 0,21-2,46 0,02-0,96-0,09
5) Inclusão do tempo (t) para representar tendência Trata-se de uma opção para modelos que apresentarem tendência positiva.
X Y 1425,19 108.616,86 1978,634 191.127,70 2253,317 176.399,15 1795,779 167.684,38 1472,032 139.891,59 2049,24 233.301,80 1432,819 169.427,74 1129,615 133.689,84 1543,84 229.056,71 1547,993 159.201,59 2141,188 195.212,81 1745,847 290.086,78 2865,652 266.925,29 2077,223 313.499,94 1713,861 208.353,80 2044,151 283.405,24 1482,371 234.108,78 2224,24 277.734,76 1974,663 281.237,13 1530,982 253.268,06 2182,928 324.324,32 1380,711 258.484,21 2471,467 311.535,17 2092,194 359.021,18 1518,257 375.415,80 1802,693 401.029,27 1346,767 318.212,36 2130,355 331.346,06 1555,346 369.198,18 1738,75 388.357,57 Estatística de regressão R múltiplo 0,66 R-Quadrado 0,44 R-quadrado ajustado 0,42 Erro padrão 29235,93 Observações 30 ANOVA gl SQ MQ F F de significação Regressão 1 18620563673 18620563673 21,78507913 6,88243E-05 Resíduo 28 23932700901 854739317,9 Total 29 42553264574 Coeficientes Erro padrão Stat t valor-p 95% inferiores 95% superiores Inferior 95,0% Interseção 31143,76 26098,53 1,19 0,24-22316,66 84604,18-22316,66 X 65,46 14,02 4,67 0,00 36,73 94,19 36,73
X T Y 1425,19 1 108.616,86 1978,634 2 191.127,70 2253,317 3 176.399,15 1795,779 4 167.684,38 1472,032 5 139.891,59 2049,24 6 233.301,80 1432,819 7 169.427,74 1129,615 8 133.689,84 1543,84 9 229.056,71 1547,993 10 159.201,59 2141,188 11 195.212,81 1745,847 12 290.086,78 2865,652 13 266.925,29 2077,223 14 313.499,94 1713,861 15 208.353,80 2044,151 16 283.405,24 1482,371 17 234.108,78 2224,24 18 277.734,76 1974,663 19 281.237,13 1530,982 20 253.268,06 2182,928 21 324.324,32 1380,711 22 258.484,21 2471,467 23 311.535,17 2092,194 24 359.021,18 1518,257 25 375.415,80 1802,693 26 401.029,27 1346,767 27 318.212,36 2130,355 28 331.346,06 1555,346 29 369.198,18 1738,75 30 388.357,57 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,923 R-Quadrado 0,852 R-quadrado ajustado 0,841 Erro padrão 36531,427 Observações 30,000 ANOVA gl SQ MQ F F de significação 207944676534,44 103972338267,22 Regressão 2,000 5 2 77,908 0,000 Resíduo 27,000 36032719040,396 1334545149,644 Total 29,000 243977395574,84 1 Coeficientes Erro padrão Stat t valor-p 95% inferiores 95% superiores Interseção 64367,152 34271,607 1,878 0,071-5952,376 134686,680 X 34,428 17,541 1,963 0,060-1,564 70,420 Tend 9432,075 771,338 12,228 0,000 7849,421 11014,729
6) Defasagem Eventualmente, o efeito de determinada variável X se dará em períodos subsequentes. Na existência desta hipótese, pode-se praticar defasagens para testar o modelo. Y X X (t-1) X (t-2) X (t-3) 452,43 56 573,81 58 56 484,30 53 58 56 516,70 51 53 58 56 556,27 42 51 53 58 437,39 49 42 51 53 447,87 51 49 42 51 362,70 60 51 49 42 467,13 49 60 51 49 498,69 38 49 60 51 536,14 47 38 49 60 443,78 55 47 38 49 427,37 55 55 47 38 510,64 34 55 55 47 535,55 28 34 55 55 507,56 47 28 34 55 342,68 46 47 28 34 352,79 50 46 47 28 638,27 52 50 46 47 472,38 45 52 50 46 593,14 58 45 52 50 264,93 49 58 45 52 570,74 58 49 58 45 544,08 54 58 49 58 574,93 42 54 58 49 614,46 68 42 54 58 684,27 52 68 42 54 294,16 58 52 68 42 348,38 57 58 52 68 553,74 63 57 58 52
Hipóteses da Regressão
Hipóteses associadas à Regressão 1. Tamanho da amostra (n) maior do que o número de parâmetros (x) 2. Resíduos normais com média próxima de zero 3. Ausência de multicolinearidade entre os valores X 4. Ausência de autocorrelação 5. Homocedasticidade Dependem de software específico
1. Tamanho da amostra (n) maior do que o número de parâmetros (x) Número de parâmetros Tamanho da amostra (n) Y X1 X2 X3... Xn 452,43 56 20 0... 114 573,81 58 22 1... 150 484,30 53 25 0... 132 516,70 51 28 0... 142 556,27 42 31 1... 105 437,39 49 21 0... 122
2. Resíduos normais com média próxima de zero
Y MBA EM GESTÃO COMERCIAL 2. Resíduos normais com média próxima de zero 2500 Plotagem de probabilidade normal 2000 1500 1000 500 0 0 20 40 60 80 100 120 Percentil da amostra
2. Resíduos normais com média próxima de zero
3. Multicolinearidade Definição: Relação linear entre algumas das variáveis explicativas (X) Sintomas de multicolinearidade: Coeficientes que contradizem a lógica (quanto maior o preço, maior a venda?) R2 extremamente alto
3. Multicolinearidade Y X1 X2 Para confirmar multicolinearidade: Como tratar: eliminar uma das variáveis correlacionadas 2.104,76 47,00 418,91 1.986,97 37,22 404,37 2.346,41 52,44 487,36 2.064,11 62,76 390,64 1.842,26 61,98 449,67 1.971,51 67,33 415,17 1.809,34 28,16 414,80 1.830,47 47,66 377,83 2.343,60 60,95 402,73 1.763,97 39,13 406,83 1.806,00 43,10 425,87 1.495,45 33,10 390,57 =correl(b2:b13;c2;c13) = 0,19
COPYRIGHT 2016 by Ibramerc. Este trabalho, incluindo todos os modelos, slides e textos estão sob a licença Creative Commons Atribuição-NãoComercial-CompartilhaIgual 4.0 Internacional. Para ver uma cópia desta licença, visite http://creativecommons.org/licenses/by-nc-sa/4.0/ Você pode utilizar e distribuir esse material desde que a fonte IBRAMERC seja mencionada. Autorizações adicionais podem ser concedidas no âmbito desta licença pelo e-mail abaixo: alex.leite@ibramerc.org.br 2016 by Ibramerc. This work is licensed under the Creative Commons Attribution-NonCommercial- ShareAlike 4.0 International License. To view a copy of this license, visit http://creativecommons.org/licenses/by-nc-sa/4.0/ You must give appropriate credit to Ibramerc, provide a link to the license, and indicate if changes were made. You may not use the material for commercial purposes. If you remix, transform, or build upon the material, you must distribute your contributions under the same license as the original.