Universidade de São Paulo Escola Superior de Agricultura "Luiz de Queiroz Programa de Educação Continuada em Economia e Gestão de Empresas



Documentos relacionados
Métodos Básicos de Previsão

Módulo 4 PREVISÃO DE DEMANDA

NECESSIDADES DE PREVISÃO DA CADEIA DE SUPRIMENTOS. Mayara Condé Rocha Murça TRA-53 Logística e Transportes

6 Construção de Cenários

1. Introdução. 1.1 Introdução

Opções Reais. Processos Estocásticos. Processos Estocásticos. Modelando Incerteza. Processos Estocásticos

Alisamento Exponencial (EWMA) e Holt-Winters

ESTUDO DE PREVISÃO DE DEMANDA PARA EMPRESA DE EQUIPAMENTOS MÉDICOS DE DIAGNÓSTICO

Este capítulo é divido em duas seções, a primeira seção descreve a base de

DISTRIBUIÇÃO DE WEIBULL CONCEITOS BÁSICOS APLICAÇÕES

Departamento de Matemática - UEL Ulysses Sodré. Arquivo: minimaxi.tex - Londrina-PR, 29 de Junho de 2010.

3 Previsão da demanda

PREVISÃO DE VENDAS DE CERVEJA PARA UMA INDÚSTRIA DE RIBEIRÃO PRETO

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I

ESTUDO DO EFEITO DAS AÇÕES DE MARKETING SOBRE O FATURAMENTO DE UMA INSTITUIÇÃO DE SAÚDE DO SUL DE MINAS GERAIS UTLIZANDO TÉCNICAS DE SÉRIES TEMPORAIS

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder

PREVISÃO DE DEMANDA - O QUE PREVISÃO DE DEMANDA - TIPOS E TÉCNICAS DE PREVISÃO DE DEMANDA - MÉTODOS DE PREVISÃO - EXERCÍCIOS

4 Avaliação Econômica

UTILIZAÇÃO DE RECURSOS ESTATÍSTICOS AVANÇADOS DO EXCEL PREVISÃO

PERGUNTAS MAIS FREQÜENTES SOBRE VALOR PRESENTE LÍQUIDO (VPL)

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

Qual é o risco real do Private Equity?

GESTÃO DE ESTOQUES. Gestão Pública - 1º Ano Administração de Recursos Materiais e Patrimoniais Aula 4 Prof. Rafael Roesler

COMO CALCULAR A PERFORMANCE DOS FUNDOS DE INVESTIMENTOS - PARTE II

Correlação e Regressão Linear

Modelagem da Venda de Revistas. Mônica Barros. Julho de

Dimensionamento dos Estoques

Análise de séries temporais aplicada aos valores do salário mínimo necessário do Brasil

Seção 2/E Monitoramento, Avaliação e Aprendizagem

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

COMO AVALIAR O RISCO DE UM PROJETO ATRAVÉS DA METODOLOGIA DE MONTE CARLO

PRIMAVERA RISK ANALYSIS

Tópico 11. Aula Teórica/Prática: O Método dos Mínimos Quadrados e Linearização de Funções

Métodos Matemáticos para Gestão da Informação

Resoluções comentadas das questões de Estatística da prova para. ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014

Matemática Financeira Módulo 2

Professor Severino Domingos Júnior Disciplina: Gestão de Compras e Estoques no Varejo

Organização e Arquitetura de Computadores I

TAXA DE DESCONTO, ANÁLISE DE RISCO, MODELOS DE PREDIÇÃO

APLICAÇÕES DA DERIVADA

SisDEA Home Windows Versão 1

3 Classificação Resumo do algoritmo proposto


MetrixND. especificações. MetrixND - Ferramenta de previsão de energia elétrica

Gerenciamento de Riscos do Projeto Eventos Adversos

Módulo 4. Construindo uma solução OLAP

Risco e Retorno dos Investimentos. Paulo Pereira Ferreira Miba 507

QFD: Quality Function Deployment QFD: CASA DA QUALIDADE - PASSO A PASSO

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo

IMES Catanduva. Probabilidades e Estatística. no Excel. Matemática. Bertolo, L.A.

É POSSÍVEL ATINGIR A META DO MINISTÉRIO DA SAÚDE PARA A DOAÇÃO ESPONTÂNEA?

agility made possible

PLANEJAMENTO E CONTROLE DE VENDAS

Simulação Transiente

Matemática Financeira II

Uma aplicação de Inteligência Computacional e Estatística Clássica na Previsão do Mercado de Seguros de Automóveis Brasileiro

Curso CPA-10 Certificação ANBID Módulo 4 - Princípios de Investimento

CURSO ON-LINE PROFESSOR GUILHERME NEVES

Usando o Arena em Simulação

PESQUISA OPERACIONAL: UMA ABORDAGEM À PROGRAMAÇÃO LINEAR. Rodolfo Cavalcante Pinheiro 1,3 Cleber Giugioli Carrasco 2,3 *

PRO FOR WINDOWS (FPW)

Ponto de vista. Metodologia para um índice de confiança. E expectativas das seguradoras no Brasil

Cláudio Tadeu Cristino 1. Julho, 2014

ESTUDO SOBRE CIRCULAÇÃO DE REVISTAS

Caracterização temporal de circuitos: análise de transientes e regime permanente. Condições iniciais e finais e resolução de exercícios.

Histogramas. 12 de Fevereiro de 2015

UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO CENTRO UNIVERSITÁRIO NORTE DO ESPÍRITO SANTO DISCIPLINA: ECONOMIA DA ENGENHARIA

INE Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis

RESULTADOS DE OUTUBRO DE 2013

Modelagem e Simulação Material 02 Projeto de Simulação

Capítulo 3. Avaliação de Desempenho. 3.1 Definição de Desempenho

Aula 4 Estatística Conceitos básicos

A MATEMÁTICA NO ENSINO SUPERIOR POLICIAL 1

Gestão da Qualidade Políticas. Elementos chaves da Qualidade 19/04/2009

Introdução a Avaliação de Desempenho

Prática e Gerenciamento de Projetos

Escolha de Portfólio. Professor do IE-UNICAMP

9. Derivadas de ordem superior

Logística e a Gestão da Cadeia de Suprimentos. "Uma arma verdadeiramente competitiva"

Cálculo Numérico Aula 1: Computação numérica. Tipos de Erros. Aritmética de ponto flutuante

Faculdade Pitágoras de Uberlândia Curso: Administração Disciplina: Administração de Materiais. Unidade 1 Previsão de Demanda. Revisão 0, de 07/08/2012

NECESSIDADE DE CAPITAL DE GIRO E OS PRAZOS DE ROTAÇÃO Samuel Leite Castelo Universidade Estadual do Ceará - UECE

Pindyck & Rubinfeld, Capítulo 15, Mercado de Capitais::REVISÃO

Uma análise econômica do seguro-saúde Francisco Galiza Outubro/2005

XX SNPTEE SEMINÁRIO NACIONAL DE PRODUÇÃO E TRANSMISSÃO DE ENERGIA ELÉTRICA GRUPO - X GRUPO DE ESTUDOS DE DESEMPENHO DE SISTEMAS ELÈTRICOS - GDS

LIDANDO COM SAZONALIDADES NO PROCESSO LOGÍSTICO

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

Estabilidade. Carlos Alexandre Mello. Carlos Alexandre Mello 1

ADM041 / EPR806 Sistemas de Informação

Protocolo em Rampa Manual de Referência Rápida

ANEXO 2 - INDICADORES EDUCACIONAIS 1

FLUXOS DE CAIXA A PREÇO NOMINAL E A PREÇO REAL

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE GOIÁS Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas

Modelo SARIMA: um estudo de caso sobre venda mensal de gasolina

O Custo Unitário do Trabalho na Indústria

GERAÇÃO DE VIAGENS. 1.Introdução

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

Unidade III GESTÃO EMPRESARIAL. Prof. Roberto Almeida

Prof. Dr. Koiti Egoshi

Transcrição:

Universidade de São Paulo Escola Superior de Agricultura "Luiz de Queiroz Programa de Educação Continuada em Economia e Gestão de Empresas Modelo para o Apreçamento Futuro da Caixa-Peso do Limão in natura e Planejamento Estratégico Luiz Antonio Bertolo Trabalho de Conclusão de Curso apresentado ao Programa de Educação Continuada em Economia e Gestão de Empresas para obtenção do título de Especialista em Agronegócio. Piracicaba 2013

Dedico este estudo a minha esposa Cátia que me apoiou durante esta valiosa etapa de minha vida.

AGRADECIMENTOS Aos nossos colegas de curso, pelo excelente convívio, pelas ajudas muitas vezes recebidas e por nos proporcionarem trocas de aprendizado. Ao Sr. Waldyr Promicia, Presidente da Associação Brasileira dos Produtores e Exportadores de Limão - ABPEL pelas entrevistas concedidas e apoio na execução e elaboração deste estudo. Aos pesquisadores do Centro de Estudos Avançados em Economia Aplicada (CEPEA) por facilitarem, através da divulgação dos preços da lima ácida Tahiti a realização deste trabalho e de outras tantas contribuições ao agronegócio do país. Aos professores Dr. Pedro Valentim Marques e Ricardo de Assis Perina, pela orientação quanto ao tema proposto, incentivo a continuidade e conhecimentos básicos para formulação deste estudo. Com um entusiasmo e humildade contagiantes, sempre prontos a ajudar.

SUMÁRIO RESUMO...5 ABSTRACT...6 LISTA DE FIGURAS...7 LISTA DE TABELAS...9 1 INTRODUÇÃO...10 2 REVISÃO DE LITERATURA...12 3 MATERIAL E MÉTODOS...42 4 RESULTADOS E DISCUSSÕES...76 5 CONCLUSÃO...78 5 REFERÊNCIAS BIBLIOGRÁFICAS...79

RESUMO O presente trabalho tem por finalidade apresentar aos produtores de lima ácida Tahiti um modelo para previsão de preços futuros da caixa-peso (27 kg) contribuindo para o planejamento estratégico da produção. Foram testados vários modelos de previsão, particularmente, os de análise de séries temporais, que são capazes de projetar no futuro, padrões e tendências observadas no passado dos preços. O modelo eleito, isto é, aquele que apresentou o melhor ajuste foi o SARIMA(2,1,2)(1,0,1). A pesquisa consistiu em encontrar como decompor o valor da caixa de limão nos fatores de risco do mercado e com isso orientar os usuários destas estimativas nas suas projeções econômicas. Estas informações do cenário macroeconômico de longo prazo, por meio de gráficos e análises, ajudam no gerenciamento de riscos, antecipando fatores que movimentam o mercado e acabam contribuindo para a adoção de medidas em relação à comercialização. Palavras-Chave: Limão Tahiti, Métodos de Previsão, Modelo de Box-Jenkins, Simulações de Monte Carlo.

ABSTRACT The present work aims at presenting the producers of acid lime Tahiti a model for prediction of future prices of box-weight (27 kg) contributing to the strategic planning of production. Were tested several models of forecasting, particularly, the analysis of time series, which are capable of projecting into the future, patterns and trends observed in prices passed. The model elected, that is, those who make best adjustment was the SARIMA(2,1,2)(1,0,1). The research is to find how to decompose the value box of lemon on the risk factors of the market and thus these estimates to guide users in their economic projections. This information of long-term macroeconomic scenario, through charts and analysis, assist in managing risks, anticipating factors that drive the market and end up contributing to the adoption of measures in relation to marketing. Keywords: Lemon Tahiti, Forecasting Methods, Model of Box-Jenkins, Monte Carlo Simulations

LISTA DE FIGURAS Figura 1 Metodologias mais comuns para a Previsão...13 Figura 2 Dados sazonais e dados com tendência...14 Figura 3 Os oito métodos mais comuns de série temporal...15 Figura 4 Dados sazonais e dados com tendência...16 Figura 5 Gráfico típico de dados de média móvel simples, mostrando o ajuste e a linha de previsão...17 Figura 6 Gráfico típico de dados de suavização exponencial simples, mostrando o ajuste e a linha de previsão...18 Figura 7 Gráfico típico de dados de média móvel dupla, mostrando o ajuste e a linha de previsão...20 Figura 8 Gráfico típico de dados de suavização exponencial dupla de Holt, mostrando o ajuste e a linha de previsão...21 Figura 9 Gráfico típico de dados de sazonalidade multiplicativa e sem tendência, mostrando o ajuste e a linha de previsão...25 Figura 10 Gráfico típico de dados de sazonalidade aditiva e sem tendência, mostrando o ajuste e a linha de previsão...26 Figura 11 Gráfico típico de dados de sazonalidade multiplicativa de Holt-Winters, mostrando o ajuste e a linha de previsão...28 Figura 12 Gráfico típico de dados de sazonalidade aditiva de Holt-Winters com tendência, mostrando o ajuste e a linha de previsão...30 Figura 13 Média móvel simples (3 meses)...42 Figura 14 Calculando a média móvel simples...43 Figura 15 Fazendo previsão com média móvel simples...43 Figura 16 Estimativa do erro...43 Figura 17 Valores Reais versus Valores Estimados pelo modelo MMS...44 Figura 18 Suavização exponencial simples...44 Figura 19 Otimizando parâmetros numa suavização exponencial simples...46 Figura 20 Valores Reais e Valores Estimados pelo Modelo de suavização exponencial simples...47 Figura 21 Média Móvel Dupla (3 meses)...48 Figura 22 Valores Reais e Valores Estimados pelo modelo de Média Móvel Dupla...49

Figura 23 Suavização Exponencial Dupla (SED) de Holt...50 Figura 24 Valores reais e estimados numa suavização exponencial dupla de Holt...51 Figura 25 Sazonalidade Aditiva para um período de sazonalidade s = 4 meses...52 Figura 26 Modelo de sazonalidade aditiva com período sazonal de 12 meses...53 Figura 27 Modelo de uma sazonalidade multiplicativa...54 Figura 28 Modelo de uma sazonalidade aditiva de Holt-Winter...56 Figura 29 Modelo de uma sazonalidade multiplicativa de Holt-Winter...56 Figura 30 Faixa de Opções do Excel com o Suplemento ARMA instalado...58 Figura 31 Janela inicial do ARMA...58 Figura 32 Resultados obtidos com o modelo ARMA, instalado como Suplemento...59 Figura 33 Janela para entrada de dados e seleção do modelo...60 Figura 34 Resultados obtidos com o software Risk Simulator...62 Figura 35 Ranking dos métodos testados pelo Risk Simulator...63 Figura 36 Janela para entrada de dados do Risk Simulator...64 Figura 37 Resultados obtidos com a ferramenta ARIMA do Risk Simulator...66 Figura 38 Resultados obtidos com o Risk Simulator...69 Figura 39 Resultados obtidos com a ferramenta CB-Predictor do Crystal Ball...70 Figura 40 Resultados obtidos com a ferramenta CB-Predictor do Crystal Ball e Simulações de Monte Carlo...71 Figura 41 Ranking dos métodos pelo CB-Predictor do Crystal Ball...72 Figura 42 Ranking dos métodos pelo CB-Predictor Novo para os preços Nominais do Limão...72 Figura 43 Preços projetados pelo CB-Predictor para 12 meses à frente...73 Figura 44 Relatórios e Tabela comparando os vários métodos pelo CB-Predictor...76 Figura 45 Resultados obtidos com o CB-Predictor do Crystal Ball para o modelo de previsão SARIMA(2,1,2)(1,0,1)...77

LISTA DE TABELAS Tabela 1 - Comparações dos Resultados obtidos com o CB-Predictor do Crystal Ball para o modelo de previsão SARIMA(2,1,2)(1,0,1) e os valores reais divulgados pelo CEPEA...77

1. INTRODUÇÃO A citricultura brasileira, tem sido um dos setores mais competitivos do agronegócio. O Brasil produz a metade do suco de laranja do planeta, exporta 98% da sua produção e consegue 85% de participação no mercado mundial, trazendo ao país de US$ 1,5 bilhão a US$ 2,5 bilhões por ano (NEVES, 2009). O segmento de produção de Suco de Laranja Concentrado Congelado SLCC brasileiro possui, portanto, desempenho singular dentro da economia brasileira, não existindo outro produto com a mesma fatia de produção e participação nas vendas do mercado mundial. Além da laranja, outra fruta que vem se destacando na citricultura brasileira é a lima-ácida Tahiti, também denominada de limão Tahiti, geralmente comercializada in natura, tanto no mercado interno, como no mercado externo. Os principais estados brasileiros produtores do limão Tahiti são: São Paulo, Bahia, Minas Gerais e Rio de Janeiro, sendo o Estado de São Paulo, o maior produtor. Nele os maiores municípios produtores dessa fruta localizam-se na região dos Escritórios de Desenvolvimento Rural (EDRs) de Catanduva e Jaboticabal: Itajobi, Itápolis e Taquaritinga. De acordo com SILVA (2008), as unidades de produção agropecuária (UPA), que plantam limão no estado de São Paulo, apresentam uma área entre 5 a 50 ha, enquanto o Estado de São Paulo, em si, apresenta média de 72,2 hectares nas suas UPAs, caracterizandose, portanto, como uma cultura de pequenas propriedades e, com isso, a função dos distribuidores (packing house) se destaca. Estes fazem o intermédio entre os pequenos produtores e grandes distribuidores que exportam, bem como para empresas que produzem suco industrializado. Além disso, tais packing houses responsáveis por comprar, limpar, desinfetar, secar e fazer aplicação de cera e escovação dos frutos também fazem as vendas diretamente para o mercado varejista quando o preço é mais atrativo. O IAC 5 é o principal clone tahiti nucelar plantado em São Paulo, e o porta-enxerto de limão cravo é largamente utilizado. Com a utilização desses materiais, o Estado tornou-se o principal produtor nacional de lima ácida tahiti com qualidade para exportação. A safra principal no Estado de São Paulo ocorre de Dezembro a Maio, com pico em Março e os meses de oferta mais restrita vão de Setembro a Novembro, com pico de escassez em Outubro e Novembro.

11 No mercado externo, os principais países de destino são: União Europeia (U.E.), os Estados Unidos da América (USA), Países Baixos, Reino Unido, Itália, Cingapura, Argentina, França, Alemanha, Canadá, Portugal e Suíça. O principal destino é o mercado europeu. O produtor como um investidor que aplica seu capital na atividade agrícola em busca de um rendimento e o comerciante que procura se proteger contra a alta volatilidade dos preços no mercado num mercado competitivo, ter a informação sobre o preço futuro da caixapeso (27 kg) do limão in natura é um indicador valioso para a gestão financeira daqueles que trabalham com esta fruta, auxiliando-os na tomada de decisão em sua comercialização, na administração de custos para a produção, na realização de contratos com instituições financeiras e contratos de colheita num determinado período junto ao packing house. As informações de mercado são tantas, que nunca um país, consultoria ou pessoa isolada, vai deter a sua totalidade. Entretanto, todas estas informações já estão refletidas no preço. O preço futuro do limão já não é mais nenhuma obra de ficção ou miragem econômica. Por isso, o objetivo dessa monografia é ajustar um modelo de previsão de preços futuros, baseado na análise da série temporal dos preços passados. Com este modelo será estimado mensalmente (ou diariamente) o valor da caixa-peso (27 kg) do limão, e o relatório produzido pela estimativa poderá ser divulgado no site da Associação Brasileira dos Produtores e Exportadores do Limão - ABPEL, por exemplo. Os dados históricos serão obtidos no CEPEA, a partir de 1996, e as previsões oferecidas pelo modelo escolhido servirão como sementes ou as variáveis de entrada, obedecendo às distribuições de probabilidades sugeridas pelo modelo, para análise estatística de cenários futuros, usando a ferramenta de Monte Carlo. O produtor deve se habituar a elaborar as informações e deve se proteger no mercado, assim como fazem os grandes investidores e empresas. Se o produtor ficar só no campo produzindo e não for ao banco administrar o seu negócio, não tem jeito. O que afinal é o mercado futuro, por que adivinhar um preço que vai ocorrer no futuro? Porque nós sabemos o valor do que compramos, mas nunca sabemos por quanto vamos vender. A maior riqueza é a informação. O agricultor que não se preocupar com o que ocorre da porteira para fora, não resistirá na atividade. A mídia informa a cotação dos principais produtos. Mas, geralmente o limão não está presente.

12 2. REVISÃO DE LITERATURA 2.1 O que é previsão? "Prediction is very difficult, especially if it s about the future." 1 Niels Bohr, laureado com Nobel em Física Segundo o Dicionário do Aurélio (FERREIRA, 1975) a palavra previsão é um substantivo feminino que significa ato ou efeito de prever; antevisão; estudo ou exame feito com antecedência. Uma previsão adequada deve dar suporte a uma decisão minimizadora de risco por parte dos tomadores de decisão (HARRISON e STEVENS, 1976). E é essencial para o planejamento e a administração de recursos. Existem muitas abordagens científicas para a previsão. Geralmente, elas podem ser divididas em métodos qualitativos e quantitativos. A previsão qualitativa é utilizada quando há poucos ou nenhum dado histórico confiável, contemporâneo, ou comparável. Há vários métodos qualitativos, como a abordagem Delphi ou de opinião de especialista, pressupostos gerenciais, bem como as pesquisas de mercado, dados externos ou sondagens e pesquisas (MUN, 2010). Na parte quantitativa, as abordagens de previsão geralmente caem numa dessas categorias: a) Séries Temporais Realiza a análise de séries temporais sobre a forma padrão passada dos dados para, a partir daí projetar os resultados futuros. Isto funciona bem para situações estáveis em que as condições são esperadas permanecerem as mesmas. Como exemplo, podemos citar as receitas em diferentes anos, os índices de inflação, as taxas de juros, a participação no mercado, as taxas de falhas, os preços nominais mensais da caixapeso do Limão in natura divulgados pelo CEPEA, e assim por diante. b) Regressão Prevê os resultados futuros usando relações passadas entre uma variável de interesse (variável dependente) e várias outras variáveis que podem influenciá-la (variáveis independentes). Isso funciona bem para situações em que se precisam identificar os diferentes efeitos das diferentes variáveis. Nesta categoria se inclui a regressão linear múltipla. 1 Previsão é muito difícil, especialmente se ela for acerca do futuro.

13 c) Simulação Aleatoriamente gera muitos cenários para um modelo de previsão dos resultados possíveis. Este método funciona bem onde não se tem dados históricos, mas se pode construir o modelo da situação para analisar o seu comportamento. Atualmente a simulação de Monte Carlo é usada largamente nestas situações e os suplementos do MS- Excel, Crystal Ball e Risk Simulator são popularmente conhecidos para automatizar esta tarefa. 2.2 Diferentes Tipos de Técnicas de Previsão Figura 1 Metodologias mais comuns para a Previsão. Fonte: MUN, 2010, p.261 Como mostrado na Figura 1, existem vários métodos para se realizar a previsão. Os mais comuns são: 1. ARIMA (modelo de média móvel integrada autorregressiva) de Box-Jenkins 2. AutoARIMA 3. Econometria básica 4. Autoeconometria 5. Lógica difusa combinatória 6. Distribuições personalizadas 7. GARCH (modelo autoregressivo à heteroscedasticidade condicional generalizado)

14 8. Curvas J 9. Cadeias de Markov 10. Máxima verossimilhança 11. Rede Neural 12. Regressão multivariada 13. Extrapolação não linear 14. Curvas S 15. Spline cúbico 16. Previsão estocástica 17. Análise da série temporal 18. Linhas de tendência 2.2.1 A Metodologia Clássica de Previsão por análise de séries temporais (time-series forecasting). "O tempo diz o que a razão não pode dizer." René Descartes A análise de séries temporais se aplica nos casos em que há um padrão persistente ou sistemático no comportamento da variável, que é possível de captar através de uma representação paramétrica (PINDYCK e RUBENFIELD, 1991). Alguns métodos clássicos são projetados para funcionarem melhor para certos tipos de dados: a) Dados sazonais (aumentando ou diminuindo num padrão recursivo regular no decorrer do tempo) do tempo) b) Dados com tendência (aumentando ou diminuindo consistentemente no decorrer Figura 2 Dados sazonais e dados com tendência. Fonte: CB Predictor User Manual Selecionando métodos de previsão de séries temporais. p. 3-8 Segundo (MORETTIN & TOLOI, 2004), pode-se entender a tendência (T) como o movimento persistente nos dados em uma dada direção e a sazonalidade (S) como o

15 comportamento regular assumido pela série em algum subperíodo. O erro aleatório ( ) leva em consideração movimentos esporádicos e irregulares presentes na série. A previsão de séries temporais assume que os dados históricos sejam uma combinação de um formato padrão e de algum erro aleatório. Sua meta é isolar o formato do erro entendo o nível, a tendência e a sazonalidade do formato. Pode-se medir o erro usando uma medida estatística para descrever quão bem um formato reproduz os dados históricos e estimar quão acuradamente ele projeta os dados no futuro. A Figura 3 lista os oito modelos clássicos de série temporal, separados por sazonalidade e tendência. Por exemplo, se a variável de dados não possuir tendência ou sazonalidade, um modelo de média móvel simples ou de suavização exponencial simples seria suficiente. No entanto, se existir sazonalidade, mas nenhuma tendência discernível estiver presente, um modelo sazonal aditivo ou sazonal multiplicativo seria melhor, e assim por diante. Não Sazonalidade Com Sazonalidade Nenhuma Tendência Média Móvel Simples Suavização Exponencial Simples Sazonal Aditivo Sazonal Multiplicativo Média Móvel Dupla Aditivo de Holt-Winter Com Tendência Suavização Exponencial Dupla Multiplicativo de Holt- Winter Figura 3 Os oito métodos clássicos de série temporal. Fonte: MUN, 2010. p. 264. O que se pretende sempre é testar cada um destes métodos clássicos e classificá-los de acordo com o erro. O método com o erro mais baixo é o melhor método. Existem dois tipos de métodos sazonais: aditivo e multiplicativo. A sazonalidade aditiva tem um padrão estacionário de amplitude, e a sazonalidade multiplicativa tem um padrão de amplitude crescendo ou decrescendo no decorrer do tempo. A Figura 4 mostra as diferentes curvas de sazonalidades

16 Figura 4 Dados sazonais e dados com tendência. Fonte: CB Predictor User Manual Selecionando métodos de previsão de séries temporais. p. 3-10 Existem duas técnicas principais de previsão de séries temporais: 1. Suavização de Não Sazonalidade que estima uma tendência ou não removendo dados extremos e reduzindo a aleatoriedade dos dados 2. Suavização de Sazonalidade que combina a suavização dos dados com um ajustamento para o comportamento sazonal 2.2.1.1 Métodos de Previsão através de Modelos com Nenhuma Tendência ou Sazonalidade A previsão é que os valores futuros serão constantes. Isto porque o modelo não possui tendência e assume-se que a oscilação de curto prazo é apenas ruído. Aqui a série temporal possui aleatoriedade, mas não possui sazonalidade. 2.2.1.1.1 Média Móvel Simples (MMS) O método da média móvel simples é indicado para previsões de curto prazo onde as componentes de tendência e sazonalidade são inexistentes ou possam ser desprezadas (MAKRIDAKIS et al, 1998).

17 Figura 5 Gráfico típico de dados de média móvel simples, mostrando o ajuste e a linha de previsão Fonte: CB Predictor. User Manual Selecionando métodos de previsão de séries temporais. p. 3-10 Esse modelo nada mais é do que uma técnica simples de previsão exponencial onde são considerados os k últimos dados históricos e, com estes, é realizada uma média aritmética (ou ponderada) para prever o valor do próximo dado. O número de observações p em cada cálculo da média, ou período, permanece constante e estipulado de maneira a tentar eliminar da melhor forma possível as componentes de tendência e sazonalidade. (MAKRIDAKIS et. al., 1998). Este método usa os p últimos valores da série temporal x t, como previsão para o tempo t + 1. Portanto: (1) As desvantagens desse modelo estão relacionadas à falta de acurácia ao lidar com séries históricas que apresentam tendência ou sazonalidade já que, nesse método, a previsão para o próximo período envolve sempre a adição de novos dados e a desconsideração dos anteriores. Uma alternativa para amenizar esse erro é a utilização da média ponderada para tentar construir um padrão mais próximo à realidade. A dificuldade na utilização da média móvel ponderada é a necessidade de conhecimento para se determinar os pesos a serem utilizados (DAVIS; AQUILANO; CHASE, 2001). 2.2.1.1.2 Suavização Exponencial Simples Muito usado nos dias de hoje é o modelo de suavização exponencial simples por ser extremamente simples e possuir fácil capacidade de ajustes em relação à acurácia obtida com esse método. Ele pondera todos os dados passados com pesos decrescendo exponencialmente quando se vai de volta ao passado. Em outras palavras, geralmente os dados mais recentes

18 terão maiores pesos. Dessa forma, os pesos decaem exponencialmente a partir dos dados mais novos. E supera bastante as limitações dos modelos de médias móveis. Figura 6 Gráfico típico de dados de suavização exponencial simples, mostrando o ajuste e a linha de previsão Fonte: CB Predictor. User Manual Selecionando métodos de previsão de séries temporais. p. 3-10 Caso a série temporal em estudo mantenha-se constante sobre um nível médio, uma suavização exponencial simples pode ser usada para a previsão de valores futuros dessa série. A representação matemática desse modelo é dada por (MAKRIDAKIS et al., 1998) (2) onde, é a previsão da demanda para o tempo t+1, feita no período atual t; é a constante de suavização, assumindo valores entre 0 e 1; é o valor observado (real) na série temporal para o tempo t; e, é o valor da previsão feita para o tempo t. Uma forma de medir a acurácia da previsão é calculando o erro gerado pela mesma, ou seja: (3) O valor da constante de suavização é arbitrário 2. Pode-se determinar o melhor valor para esta através de métodos iterativos para minimizar alguma medida de qualidade da previsão como, por exemplo, a média do quadrado dos erros, EQM ou a sua raiz quadrada, RMSE. Desta maneira, seleciona-se, inicialmente, um valor aleatório para a constante, a partir do qual previsões são geradas. Comparam-se os valores previstos com os reais, e calcula-se a média do quadrado das diferenças entre os mesmos; o parâmetro que minimiza essa média é utilizado no modelo final 3. A magnitude da constante determina a velocidade de resposta do modelo frente a mudanças valores da série (MONTGOMERY et al., 1990). Valores baixos 2 O CB Predictor e o Risk Simulator calculam automaticamente a constante de suavização ótima. 3 Pode-se lançar mão do Solver do Excel para realizar isto.

19 para a constante faz com que o modelo demore em reagir às mudanças no comportamento da série. Com valores altos de, o modelo responde rapidamente. Os modelos de suavização exponencial simples requerem uma estimativa inicial para. Quando dados históricos estão disponíveis, pode-se usar uma média simples das N observações mais recentes como ; caso contrário, pode-se utilizar a observação mais recente, ou fazer uma estimativa subjetiva. Uma medida de eficiência deste método pode ser obtida sob a consideração que o processo é completamente estável, assim que X 1, X 2,..., são variáveis aleatórias independentes e identicamente distribuído (IID) 4 com variância 2. Portanto, segue que (para grande t): [ ] (4) Assim que a variância 2 é estatisticamente equivalente para a média móvel com (2 - )/ = 19. Assim, em termos de variância, o Método de Suavização Exponencial com este valor de é equivalente ao Método da Média Móvel que utiliza 19 observações. Entretanto, se uma mudança no processo ocorre, a Suavização Exponencial irá reagir mais rapidamente com melhor ajuste de que o Método da Média Móvel. Uma desvantagem deste Método está na dificuldade em escolher um valor apropriado para. O Método de Suavização Exponencial pode ser visto como um processo de filtragem com um filtro estatístico cujas entradas são os dados puros a partir de um processo estocástico e a saída são estimativas suavizadas de uma média que varia com o tempo. Uma maneira de iniciar o processo recursivo é utilizar e. 2.2.1.2 Métodos de Previsão para Modelos com Tendência e Nenhuma Sazonalidade A representação matemática para o processo (que gera a série temporal) com valor constante, tendência e flutuações aleatórias pode ser dada por: (5) Com t= 1, 2,..., e onde: X t é uma variável aleatória observada no tempo t; a é a tendência do modelo; é o valor constante do modelo; 4 Duas variáveis aleatórias são independentes se P(A B) = P(A B).P(B) = P(A). P(B). Duas variáveis aleatórias são identicamente distribuídas se possuem a mesma distribuição de probabilidade.

20 t é o erro aleatório ocorrido no tempo t (geralmente assumido ter valor esperado igual a zero e variância constante). 2.2.1.2.1 Modelo de Previsão com Média Móvel Dupla Aqui a técnica de média móvel simples é aplicada duas vezes, uma nos dados originais e depois nos dados resultantes desta primeira aplicação. Define-se a média móvel dupla de tamanho p como: Onde [ ] [ ] [ ] - [ ] é a média móvel (simples) de tamanho p, calculada usando todas as observações até o instante T (inclusive). [ ] - (6) Figura 7 Gráfico típico de dados de média móvel dupla, mostrando o ajuste e a linha de previsão Fonte: CB Predictor User Manual Selecionando métodos de previsão de séries temporais. p. 3-10 Por que usar médias móveis duplas? Se os dados exibem uma tendência linear, o uso de médias móveis simples para a previsão dos valores da série induz a erros sistemáticos, pois a média móvel simples segue a tendência com certo atraso, e este efeito é amplificado quando tentamos prever valores futuros. O método de médias móveis duplas procura diminuir este efeito sistemático. A previsão é realizada por meio de uma reta inclinada, isto é, há uma expectativa de que o valor da variável será sempre crescente de modo a ser compatível com a tendência nos dados históricos. Os dados possuem aleatoriedade e tendência de crescimento, mas veja que não há sazonalidade. Atribui a todos os valores passados o mesmo peso na previsão. Veja que em previsões o analista deve se preocupar com a tendência. Por quê?

21 O modelo matemático para a previsão de k períodos com média móvel é onde: [ ] - [ ] - ( [ ] - [ ] ) (7) [ ] é a média móvel(simples) de tamanho k calculada usando as k observações anteriores ao instante t (inclusive); [ ] é a média móvel(dupla) de tamanho k calculada usando as k médias móveis simples, [ ], anteriores ao instante t (inclusive). p é o período usado no cálculo da média móvel; k é o número de períodos de previsão variando de 1 até h (horizonte de previsão). 2.2.1.2.2 Modelo de Previsão por Alisamento Exponencial Duplo de Holt 5 Quando uma determinada série apresenta aleatoriedade e uma tendência linear de crescimento (ou decrescimento), o modelo de suavização exponencial dupla de Holt pode ser usado de maneira satisfatória para a previsão, caso os outros componentes da série possam ser desprezados. Este modelo emprega duas constantes de suavização, e (com valores entre 0 e 1), sendo representado por três equações (MAKRIDAKIS et al., 1998): - - - (8) (9) (10) onde: L t é a componente de nível; T t é a componente de tendência; h é o horizonte de previsão; k = 1, 2,..., h; é a previsão;, com valores no intervalo 0< <1, é a constante de suavização da componente de nível L t ;, com valores no intervalo 0< <1, é a constante de suavização da componente tendência T t ; 5 Muito usado em Engenharia de Confiabilidade

22 Na equação 8, pode-se perceber que o valor de nível L t é a média ponderada do próprio valor da série x t e de L t-1 e T t-1 (nível e tendência previstos no tempo t-1, respectivamente). Para uma série isenta de erro aleatório, a quantidade (L t-1 + T t-1 ) é exatamente o valor de L t, uma vez que a variação de tempo entre t e t-1 é obviamente 1. Assim, a expressão (8) pode ser entendida como: - (11) onde: L t = f (L t-1, T t-1 ) (12) Em (9), a parcela L t L t-1 é a derivada discreta que representa, portanto, a tendência. Para o restante, o raciocínio é análogo ao realizado para a expressão (8). Considerando que a primeira amostra da série temporal é para t = 1, os valores L 1 e T 1 são funções de L 0 e T 0. Como não existe amostra da série para t = 0, faz-se necessário inicializar L 1 e T 1. Há várias maneiras de se inicializar estas variáveis, dentre as quais: (13) (14) ou - - ( - ) ( - ) ( - ) (15) (16) OBS:- Uma vez que a componente de tendência em uma série é representada apenas por um coeficiente (coeficiente angular da reta) as formas apresentadas em (14), (15), (16) para inicializar T 1 são possíveis representações para a derivada discreta da série calculada em t = 1. Figura 8 Gráfico típico de dados de suavização exponencial dupla de Holt, mostrando o ajuste e a linha de previsão. Fonte: CB Predictor User Manual Selecionando métodos de previsão de séries temporais. p. 3-10

23 O modelo é muito usado para modelagem de produtos na fase de divulgação quando começa a ser aceito pelo público consumidor. As equações (8) e (9) fazem uma estimativa do nível e da inclinação da série temporal, respectivamente. Já a equação (10), calcula a previsão da série para os próximos k períodos. Assim como na suavização exponencial simples, o método de Holt requer valores iniciais, neste caso, L 0 e T 0. Uma alternativa para estes cálculos iniciais é igualar L 0 ao último valor observado na série temporal e calcular uma média da declividade nas últimas observações para T 0. Outra forma de cálculo é a regressão linear simples aplicada aos dados da série temporal, onde se obtém o valor da declividade da série temporal e de L 0 em sua origem. As constantes de suavização e no modelo de Holt podem ser determinadas de maneira análoga à obtenção de na suavização exponencial simples, ou seja, através da utilização de um método iterativo que encontre a combinação de e que minimize o EQM. 2.2.1.3 Métodos de Previsão para Séries Temporais Sujeitas a Fenômenos Sazonais e Nenhuma Tendência É bastante comum existir padrões sazonais com valores maiores em dados instantes de tempo de que em outros em uma série temporal. Por exemplo, este fenômeno ocorre para o volume de vendas de panetones entre outros produtos típicos de festas natalinas na época do natal, assim como roupas de lã para o período de inverno, bronzeadores e bonés no período do verão, etc. Este fenômeno viola a consideração que o processo que gera a série é por uma componente de valor constante ou com tendência e outra componente de flutuação aleatória, cujos métodos anteriores de previsão (média móvel simples, suavização exponencial simples, média móvel dupla, suavização exponencial dupla de Holt) não podem ser utilizados para previsão. Uma maneira de realizar previsões com padrões sazonais é corrigir a série temporal do efeito da sazonalidade e, depois então, utilizar os métodos de previsão de média móvel simples ou suavização exponencial simples (para modelos de séries de valor constante 6 e sazonalidade), como veremos nas próximas duas seções, ou ainda o método de previsão com 6 Sem tendência

24 suavização exponencial dupla de Holt (para modelos de séries com tendência e sazonalidade), como veremos na seção 2.2.1.4. Considerando que o processo que gera a série temporal não tenha tendência, mas tenha sazonalidade, o modelo será dado por: (17) onde: t = 1, 2,... X t é uma variável aleatória observada no tempo t; é o valor constante do modelo; S t é a componente sazonal no tempo t; t é o erro aleatório ocorrido no tempo t (geralmente assumido ter valor esperado igual a zero e variância constante 7 ). Previsão com Correção à Priori da Sazonalidade O procedimento pode ser resumido como: 1. Corrigir a série temporal do efeito da sazonalidade através da divisão (ou subtração) dos valores da série temporal pelos seus respectivos fatores sazonais. 2. Realizar a previsão através dos métodos Método de Previsão de Média Móvel Simples ou Suavização Exponencial Simples. 3. Multiplicar (ou adicionar) a previsão pelos fatores sazonais incorporando a sazonalidade. Quando o efeito da sazonalidade é retirado e incorporado à série por meio de divisão e multiplicação, respectivamente, dos valores da série temporal pelos fatores sazonais o método é denominado multiplicativo. Quando o efeito da sazonalidade é retirado e incorporado à série por meio de subtração e adição, respectivamente, dos valores da série temporal pelos fatores sazonais o método é denominado aditivo. 2.2.1.3.1 Modelo de Previsão com Sazonalidade Multiplicativa O uso deste modelo deve ser para dados que possuam sazonalidade crescente ou decrescente, mas não possuam tendência de crescimento ou decrescimento. 7 Distribuído normalmente.

25 Figura 9 Gráfico típico de dados de sazonalidade multiplicativa e sem tendência, mostrando o ajuste e a linha de previsão. Fonte: CB Predictor User Manual Selecionando métodos de previsão de séries temporais. p.3-10 Este método utiliza a seguinte expressão: (18) (19) (20) onde: L t é a componente de nível da série no tempo t; S t é a componente de sazonalidade no tempo t; s é o período sazonal ou duração da sazonalidade h é o horizonte de previsão; k = 1, 2,..., h, isto é, o número de períodos da previsão; é a previsão;, com valores no intervalo 0< <1, é a constante de suavização da componente de nível L t ;, com valores no intervalo 0< <1, é a constante de suavização da componente de sazonalidade S t. As constantes de suavização e devem ser estimadas a partir dos dados. 2.2.1.3.2 Modelo de Previsão com Sazonalidade Aditiva Este modelo pode ser usado quando ocorre sazonalidade, mas onde não se verifica a presença de tendência. Além disso, a amplitude da sazonalidade é aproximadamente constante ao longo do tempo.

26 O modelo pode ser usado para realizar a previsão de diversas variáveis tais como a venda de sorvetes, brinquedos, preço de commodities, etc. Figura 10 Gráfico típico de dados de sazonalidade aditiva e sem tendência, mostrando o ajuste e a linha de previsão. Fonte: CB Predictor User Manual Selecionando métodos de previsão de séries temporais. p. 3-10 Este método utiliza a seguinte expressão: - - ( - ) - (21) - - - (22) - (23) onde: L t é a componente de nível da série no tempo t; S t é a componente de sazonalidade no tempo t; s é o período sazonal ou duração da sazonalidade h é o horizonte de previsão; k = 1, 2,..., h, isto é, o número de períodos da previsão; é a previsão;, com valores no intervalo 0< <1, é a constante de suavização da componente de nível L t ;, com valores no intervalo 0< <1, é a constante de suavização da componente de sazonalidade S t. As constantes de suavização e devem ser estimadas a partir dos dados 8. 8 O CB Predictor realiza isto automaticamente

27 2.2.1.4 Método de Previsão com Suavização Exponencial de Holt-Winters Os modelos de Holt-Winters são muito utilizados quando da existência de uma série temporal que apresente, além da tendência, um componente de sazonalidade. Uma série com esse componente é caracterizada pela ocorrência de padrões cíclicos de variação, que se repetem em intervalos relativamente constantes de tempo. São muito observadas em indústrias do ramo alimentícias, de vestuários, cosméticos, entre outras. Os modelos de Holt-Winters também são classificados em dois grupos: aditivo e multiplicativo. No modelo aditivo, a amplitude da variação sazonal é constante ao longo do tempo; ou seja, a diferença entre o maior e menor valor de demanda dentro das estações permanece relativamente constante no tempo. No modelo multiplicativo, a amplitude da variação sazonal aumenta ou diminui como função do tempo. Considerando que o modelo do processo que gera a série temporal seja dado por: (24) Onde: t = 1, 2,... X t é uma variável aleatória observada no tempo t; a é a tendência do modelo; é o valor constante do modelo; S t é a componente sazonal no tempo t; t é o erro aleatório ocorrido no tempo t (geralmente assumido ter valor esperado igual a zero e variância constante 9 ). 2.2.1.4.1 Modelo Sazonal Multiplicativo de Holt-Winters O modelo multiplicativo de Holt-Winters se ajusta, de maneira mais adequada, a séries com tendência e sazonalidade multiplicativa, ou seja, àquelas em que a amplitude da variação sazonal aumenta com o acréscimo no nível médio da série temporal (KOEHLER et al., 2001, p.269). Vide figura abaixo: 9 Distribuído normalmente.

28 Figura 11 Gráfico típico de dados de sazonalidade multiplicativa de Holt-Winters, mostrando o ajuste e a linha de previsão. Fonte: CB Predictor User Manual Selecionando métodos de previsão de séries temporais. p. 3-10 Este método utiliza a seguinte expressão: - - - - (25) - - - - (26) - - (27) (28) onde: L t é a componente de nível; T t é a componente de tendência; S t é a componente de sazonalidade; s é o período sazonal; h é o horizonte de previsão; k = 1, 2,..., h; mod(n,m) é o resto da divisão de n por m; é a previsão;, com valores no intervalo 0< <1, é a constante de suavização da componente de nível L t ;, com valores no intervalo 0< <1, é a constante de suavização da componente tendência T t ;, com valores no intervalo 0< <1, é a constante de suavização da componente de sazonalidade S t

29 Na equação (25), pode-se perceber que os valores da série (x t ) são divididos pelos fatores sazonais, da mesma forma anterior em para corrigir os valores da série dos efeitos da sazonalidade, as demais parcelas da expressão são análogas as da expressão de Holt: - - - (29) A expressão (26) é igual à expressão (9) no método de Holt: - - - - (30) A divisão dos valores da série (x t ) pelos valores de nível (L t ) na expressão (21) pode ser entendida como a medida de fator sazonal instantânea. Em (28) a sazonalidade é incorporada à série através da multiplicação da soma dos valores previstos para as componentes de Nível (L t ) e Tendência (T t ) pela componente sazonal S t-s+k. O método multiplicativo de Winters, como os demais modelos descritos anteriormente, funciona através da aplicação recursiva de suas equações aos dados da série. Dessa forma, tal aplicação deve iniciar em algum período no passado, onde os valores de L t, T t e S t devem ser estimados (MAKRIDAKIS et al., 1998, p.168). Uma maneira simples de se fazer essa estimativa é através da inicialização do nível e da tendência no mesmo período m: O nível é determinado através da média de primeira estação: (31) Para se inicializar a tendência, é recomendado o uso de duas estações completas, ou seja, 2s períodos: ( - - - ) (32) Por último, os índices sazonais iniciais podem ser determinados através da razão entre as primeiras observações com a média do primeiro ano:,,..., (33) Nas expressões acima, é a previsão para o período t+k. Já, e são constantes de suavização, cujos valores encontram-se entre 0 e 1, e x t é a mais recente observação. Nelas, temos: L t representa uma estimativa do nível da série no tempo t, T t, uma estimativa da declividade da série no mesmo período t e S t, o componente de sazonalidade também no período t.

30 A sazonalidade, ou seja, o número de subperíodos por ano é representada por s. A escolha dos valores para as constantes de suavização, e é condicionada a algum critério que, na maioria das vezes, consiste no mesmo citado anteriormente: a minimização pelo uso de um algoritmo de otimização não linear, do erro quadrático médio (EQM) atribuído ao desempenho do modelo usando a ferramenta Solver do MS-Excel. 2.2.1.4.2 Modelo Sazonal Aditivo de Holt-Winters Para séries que possuem tendência e sazonalidade aditiva, o modelo que apresenta maior capacidade de explicação é o aditivo de Winters. Ou seja, ele é utilizado nas séries onde o efeito sazonal não é função do nível médio corrente da série temporal e pode ser adicionado ou subtraído de uma previsão que dependa apenas de nível e tendência (KOHLER et al., 2001, p. 269). Veja figura abaixo: Figura 12 Gráfico típico de dados de sazonalidade aditiva de Holt-Winters com tendência, mostrando o ajuste e a linha de previsão. Fonte: CB Predictor User Manual Selecionando métodos de previsão de séries temporais. p. 3-10 O algoritmo de previsão do modelo sazonal aditivo de Holt-Winters é baseado nas seguintes expressões: - - - - - (34) - - - - (35) ( - ) - - (36) - (37) Estas equações são parecidas com aquelas a que se refere ao modelo multiplicativo de Holt-Winters (Eqs. 25 a 28). A diferença nos dois modelos é o fato das outras equações, agora, apresentarem os índices de sazonalidade somados e subtraídos, ao invés de multiplicados e divididos (MAKRIDAKIS et al., 1998, p.169).

31 As inicializações de L s e T s são idênticas às do modelo multiplicativo. Os valores iniciais para os índices sazonais são determinados através das seguintes expressões:,,..., (38) 2.2.2 Critérios para avaliar o desempenho de modelos em relação à série temporal Para saber se o modelo de séries temporais selecionado para realizar previsões é significativo estatisticamente devemos quantificar o ajuste do modelo escolhido aos dados históricos existentes. Para isso, há diversas estatísticas: 2.2.2.1 Medidas de erros no processo de previsão 2.2.2.1.1 MAD (Média dos Desvios Absolutos) Consiste na média da diferença (em módulo) entre os valores reais e preditos: (39) Ela mede o erro absoluto e originalmente tornou-se muito popular (anteriormente às calculadoras) porque não exige cálculos de quadrados e raiz quadrada. Por enquanto é ainda muito confiável e amplamente utilizada, é muito acurada para dados distribuídos normalmente. 2.2.2.1.2 MAPE (Média Aritmética dos Desvios Absolutos em Porcentuais) Avalia a magnitude do erro com relação à série histórica: (40) É a mais popular das formas apresentadas para medir a acurácia da previsão (KAHN, 1998). Porém, o uso desta fórmula torna-se impossível quando a série temporal contém valores iguais à zero. Por se tratar de erro relativo, ele não depende da escala, e com isso, permite comparar a acurácia da previsão entre séries de dados temporais de proporções diferentes. 2.2.2.1.3 EQD (Média Aritmética dos Quadrados dos Desvios) Destaca os grandes erros, comparados aos erros de menor magnitude: (41)

32 2.2.2.1.4 RMSE (Raiz Quadrada da Média Aritmética dos Quadrados dos Desvios) É a raiz quadrada dos EQM s: (42) Esta medida também tende a exagerar erros grandes, que podem ajudar a eliminar métodos com grandes erros. 2.2.2.1.5 R 2 Existe outro parâmetro, além dessas medidas de erro, de grande importância na análise do ajuste do modelo à série temporal. Trata-se do R 2, uma medida percentual de explicação do modelo. Ou seja, ele relata a fração da variabilidade da série que o método utilizado consegue explicar. Um valor R 2 próximo de 0 indica um modelo de ajuste pobre, enquanto um valor próximo a 1 indica um bom ajuste. Essa estatística é determinada da seguinte maneira: - ( - ) ( - ) (43) 2.2.2.2 Medidas estatísticas de qualidade de previsão 2.2.2.2.1 U de Thiel É uma estatística que permite estimar a probabilidade de que o modelo selecionado é melhor do que simplesmente uma previsão com base em uma simples média aritmética: ( ) ( ) (44) onde: N é o tamanho da amostra x(t) são os valores históricos representa os valores previstos Interpretação do U: U < 1: a previsão pelo método escolhido é melhor do que simples adivinhação ( chute ); U = 1: a previsão pelo método escolhido é tão boa ou ruim quanto uma simples adivinhação;

33 U > 1: a previsão pelo método escolhido é pior que uma adivinhação. Esta medida também exagera os erros e ajuda eliminar métodos com grandes erros. 2.2.2.2.2 Teste de Durbin-Watson É uma estatística que permite analisar a possível presença de auto-correlação da variável para uma defasagem de uma unidade (lag1). onde: n é o tamanho da amostra; e(t) se refere aos resíduos entre os valores previstos e pelo método selecionado e os valores reais. Interpretação de D-W: DW < 1: os valores da série histórica são positivamente correlacionados; DW = 2: não há auto-correlação entre os valores da série histórica; DW > 3: os valores da série são negativamente correlacionados. Os demais valores devem ser interpretados de forma proporcional. (45) 2.2.2.2.3 Estatística de Ljung-Box É uma grandeza que permite analisar se um conjunto de auto-correlações com valores diferentes de zero é significativamente diferente de um conjunto de auto-correlações com valores iguais a zero onde: n é o número de pares de pontos; - - h é o tamanho do conjunto de auto-correlações k é o tamanho das defasagens e r k são os valores das auto-correlações de ordem k. (46) 2.2.2.2.4 Intervalo de Confiança na previsão O intervalo de confiança da previsão pode ser interpretado como uma medida de precisão do modelo de previsão. O erro padrão de previsão é estimado por meio de: Erro padrão = (47)

34 É importante notar que se a série de dados históricos for N, o número máximo de intervalos a serem previstos será igual a N-1. 2.2.3 Análise avançada de previsão de séries temporais através de modelos autoregressivos. I have seen the future and it is very much like the present, only longer 10 Kehlog Albran, The Profit Dentre os modelos mais complexos de previsão de séries temporais encontram-se os modelos auto-regressivos e as médias móveis (AR, MA e ARMA), os modelos autoregressivos integrados de médias móveis (ARIMA), entre outros (MAKRIDAKIS et al., 1998). Uma característica intrínseca das séries temporais é a sua correlação temporal. Por isso, verificar a função de auto-correlação (FAC) torna-se uma tarefa essencial na análise destas séries. A FAC ( k ) é uma medida da dependência entre observações da mesma série, separadas por certo intervalo de tempo, chamado de defasagem ou retardo (lag k). A sua definição vem dada por: onde: k é a covariância entre X t e X t+k e 0 é a variância de X t. A representação gráfica do coeficiente de auto-correlação em função das diversas defasagens que podem ser atribuídas aos dados é conhecida como correlograma, e pode ser utilizado para verificar se uma série apresenta periodicidade (MORETTIN; TOLOI,2004). A FAC permite a verificação de estacionariedade da série, pois é usada para verificar a correlação da mesma. Ainda mais, possibilita um melhor entendimento do comportamento da dependência estatística entre as observações da série e, posteriormente, será útil para a determinação de um modelo adequado para o ajuste do processo. Já vimos que uma série temporal é descrita pela componente tendência, sazonalidade e pela componente aleatória. A tendência é a direção a longa distância da série, podendo (48) 10 Eu tenho visto o futuro e é muito semelhante ao presente, apenas mais distante. Filme The Profit laureado no Festival de Cannes na França em 2001.

35 apresentar um componente geral linear, ou na maioria das vezes não linear, que se altera em função do tempo e que não se repete durante a amplitude do estudo (MORETTIN & TOLOI,2004). 2.2.3.1 Estacionariedade Uma série temporal que se desenvolve aleatoriamente, no tempo, em torno de uma média constante, refletindo alguma forma de equilíbrio, sem mudanças sistemáticas (tendência), sem mudanças na variância (homocedásticas) e sem variações cíclicas é definida como estacionária (EHLERS,2007). 2.2.3.2 Tranformação Na maioria dos procedimentos de análise de séries temporais, estas são supostas estacionárias e, como a maioria das séries que se encontram na prática são não estacionárias, é necessário transformá-las até que se tornem estacionárias (MORETTIN; TOLOI, 2004). As três razões para a transformação dos dados são: estabilização da variância, tornar o efeito sazonal aditivo e fazer com que os dados sigam uma distribuição normal (CHATFIELD, 1984). Se a série apresentar um efeito sazonal multiplicativo e a variância mostrar-se aumentando com a média, a transformação apropriada é a raiz quadrada ou uma logarítmica, casos especiais de transformação de Box-Cox. Caso a série apresente tendência, uma transformação é a diferenciação, consistindo em efetuar sucessivas diferenças da série original, até se obter uma série estacionária (EHLERS, 2007). A primeira diferença de x t é definida como: x t = x t x t-1 (49) E a segunda: 2 x t = ( x t ) (50) = ( x t x t-1 ) = x t - x t-1 = x t 2 x t-1 + x t-2 (51) A d-ésima diferença: d x t = ( d-1 x t ) (52) Geralmente, em situações normais, será suficiente tomar uma ou duas diferenças para que a série se torne estacionária.

36 Aqui analisaremos também os principais métodos probabilísticos para modelagem de séries temporais, uma vez que estes proporcionam resultados melhores para as previsões de curto e médio prazo (MORETTIN; TOLOI, 2004). Destacamos os processos de médias móveis (MA), os autoregressivos (AR), os autoregressivos de médias móveis (ARMA), os autoregressivos de médias móveis integrados (ARIMA) e os ARIMA sazonais (SARIMA). Estes métodos se referem à metodologia de Box-Jenkins. 2.2.3.3 Modelo de Médias Móveis MA(q) É um modelo onde o valor presente da série é formado pela combinação linear do ruído branco, t, ocorrido no período atual e nos períodos passados. A estrutura geral de médias móveis de ordem q, ou MA(q), é dada por: X t = t + 1 t-1 +... + q t-q (53) Ou Onde: i são parâmetros da estrutura (i = 1,...,q) e para 0 = 1. q é a ordem da estrutura t é um processo discreto puramente aleatório, com média zero e variância 2 (ruído branco). O modelo é conceitualmente uma regressão linear dos valores correntes da série contra os ruídos brancos ou choques aleatórios de um ou mais valores anteriores da série. Os choques aleatórios em cada ponto são assumidos provenientes da mesma distribuição, geralmente uma distribuição normal, com média zero e variância 2, constante. A distinção deste modelo é que estes choques aleatórios são propagados para os valores futuros da série. Uma MA(q) é essencialmente a média móvel dos erros de previsão defasados e com a incorporação desses erros de previsão defasados, o modelo aprende a partir de seus erros de previsão, e os corrige por meio do cálculo de média móvel. Ajustar as estimativas MA é mais complicado que as do modelo AR porque os termos erros não são observáveis. Isto significa que os procedimentos de ajustamentos não lineares iterativos precisam ser usados no lugar dos mínimos quadráticos lineares. Os modelos MA também têm uma interpretação menos óbvia que a dos modelos AR.

37 Algumas vezes a FAC e a FACparcial sugerirão que o modelo MA seja uma melhor escolha de modelo e alguma vezes ambos os termos MA e AR deverão ser usados no mesmo modelo. O processo MA(q) pode ser expresso a partir de um operador de defasagem, denotado por B e definido como (MAKRIDAKIS et al., 1998): B j t = t-j, para todo j. Assim, a equação 53 pode ser reescrita como: X t = (1 + 1 B + 2 B 2 +... + q B q ) t = (B) t (54) onde (B) é um polinômio de ordem q em B. Construída a FAC, conforme definida na equação 48, para o modelo MA(q), verifica-se que k = 0, para k > q. Desta maneira, essa característica pode ser útil na identificação da ordem q de um modelo MA a partir da FAC de uma série temporal. 2.2.3.4 Modelo Autoregressivo AR(p) Um modelo autoregressivo, ou AR, foi criado com a ideia de que a presente observação da série X t pode ser explicada como uma função das p observações passadas, X t-1, X t-2, X t-3,..., X t-p, onde p determina o número de passos entre as observações passadas e a previsão da próxima observação. A estrutura auto-regressiva geral é expressa por: X t = 0 + 1 X t-1 +... + p X t-p + t (55) ou (56) Onde: i são parâmetros da estrutura (i = 0,...,, p) p é a ordem da estrutura t é um processo discreto puramente aleatório, com média zero e variância 2 (ruído branco 11 ). Essencialmente o modelo captura a variação dos dados históricos reais com aqueles do modelo de previsão e depois usa essa variação, ou resíduo, para criar um modelo de previsão melhor. Quando p = 1, teremos o modelo AR(1) 12 : 11 Um conceito econométrico, muito presente no estudo das séries temporais.

38 X t = 1 X t-1 + t (57) Utilizando o operador de defasagem a equação 56 fica: X t = (1-1 B - 2 B 2 -... - p B p ) X t = t (58) ou (B) X t = t em que (B) = (1-1 B - 2 B 2 -... - p B p ). O último coeficiente p mede o excesso de correlação na defasagem p que não é levada em conta por um modelo AR(p-1). Esse último coeficiente é chamado de coeficiente de auto-correlação parcial de X t, e quando plotado em função da defasagem, tem-se a função de auto-correlação parcial (FACP). Sendo assim, a FACP é importante na determinação da ordem p de um processo AR, para k > p a FACP é zero, (BOX; JENKINS, 1970). 2.2.3.5 Modelos Mistos ARMA(p,q) Os processos auto-regressivos e de médias móveis, ARMA, combinam as características de processos AR(p) e MA(q), sendo uma classe de modelos muito úteis e parcimoniosos para descrever dados de séries temporais (CHATFIELD, 1984). A estrutura geral do modelo ARMA(p,q) é dada por: X t = 1 X t-1 +... + p X t-p + t + 1 t-1 +... + q t-q (59) onde: t é um processo puramente aleatório com média zero e variância 2 t. Na equação 59, os i são os parâmetros que ajustam os valores passados de X t a partir do imediatamente anterior até o mais distante, representado por p. Os valores de representam uma sequência de choques aleatórios e independentes uns dos outros, t é uma porção não controlável do modelo, chamada normalmente de ruído branco. Os parâmetros i possibilitam escrever a série em função dos choques passados. Em geral cada t é considerado como tendo distribuição normal, média zero, variância constante e não correlacionados, isto é com covariância nula para quaisquer dois deles. Usando o operador de retardo o modelo pode ser reescrito da forma: (1-1 B - 2 B 2 -... - p B p ) X t = (1 + 1 B + 2 B 2 +... + q B q ) t (60) ou (B) X t = (B) t. 12 Caso 1 = 1, o modelo é conhecido como passeio aleatório ou random walk, cuja característica é violar a condição de estacionariedade.

39 É importante salientar que a FAC e a FACP ficam consideravelmente mais complicadas em processos ARMA. Segundo Box & Jenkins (1970), para um processo ARMA(p,q) estacionário a FAC tem um decaimento exponencial ou oscilatório após a defasagem q enquanto a FACP tem o mesmo comportamento após a defasagem p. Este resultado pode ser útil para a determinação da ordem (p, q) do processo, mas na prática pode ser muito difícil distinguir entre um decaimento exponencial e oscilatório a partir das estimativas dessas funções. 2.2.3.6 Modelos ARIMA(p,d,q) Os modelos descritos até o presente momento são apropriados para séries estacionárias, mas, na prática, muitas séries temporais não são estacionárias. Como dissemos na seção 2.2.3.2, para ajustar estes modelos a uma série temporal observada é preciso remover as fontes de variação não estacionárias. Se uma série observada for não estacionária na média, pode-se tentar a remoção da tendência tomando-se uma ou mais diferenças, como sugerido na seção 2.2.3.2. Um modelo ARMA no qual X t é substituído pela sua d-ésima diferença d X t é capaz de descrever alguns tipos de séries não estacionárias, (MUN, 2010). A série diferenciada é denotada por N t = d X t = (1 B) d X t (61) Os processos de média móvel integrada autorregressiva, chamados de ARIMA (p,d,q) é dado por: N t = 1 N t-1 +... + p N t-p + t + 1 t-1 +... + q t-q (62) ou, equivalentemente, (B)(1 B) d X t = (B) t. (63) ou (64) Um processo que se torna estacionário após d diferenças é dito ser não estacionário homogêneo, ou integrado de ordem d, I(d) (CHATFIELD,1984). O objetivo da metodologia de Box & Jenkins é determinar os três componentes que configuram qualquer estrutura que são: p (parâmetro auto-regressivo), d (processo de diferenciação ou integração) e q (parâmetro de médias móveis). De uma forma geral, a notação apresentada por Box & Jenkins é do tipo ARIMA(p, d, q). Por exemplo, a estrutura ARIMA(2,1,0) significa que esta possui dois parâmetros auto-

40 regressivos, uma diferenciação a partir da série original e nenhum parâmetro de médias móveis. Daí, temos o seguinte: ARIMA(0,1,0) = passeio aleatório (random walk) ARIMA(1,1,0) = modelo autoregressivo integrado de primeira ordem ARIMA(0,1,1) sem constante = suavização exponencial simples com crescimento ARIMA(0,1,1) com constante = suavização exponencial simples com crescimento ARIMA(0,2,0) ou (0,2,2) sem constante = suavização exponencial linear Os modelos ARIMA(p.d,q) formam, em teoria, a classe mais geral de modelos para previsão de uma série temporal que pode se tornar estacionária por transformações tais como diferenciação e logaritmização. De fato, o modo mais fácil para se pensar nos modelos ARIMA é como sendo versões afinadas dos modelos: passeio aleatório e tendência aleatória. A afinação consiste em adicionar defasagens nas séries diferenciadas e/ou defasagens de erros de previsão na equação de previsão. As defasagens das séries diferenciadas que aparecem na sua equação de previsão são chamados de termos auto-regressivos, as defasagens dos erros de previsão são chamados termos de médias móveis e uma série que precisa ser diferenciada para se tornar estacionária é dita versão integrada de uma série estacionária. 2.2.3.7 Modelos Sazonais Muitas séries temporais contém uma componente periódica sazonal que se repete por intervalos iguais de tempo, isto é, a cada s observações. Neste caso, tomar a primeira diferença X t X t-1 não é suficiente para tornar a série estacionária. A forma adequada de diferenciar dados que contenham padrões sazonais determinísticos é tomando diferenças no período sazonal. A diferença sazonal, geralmente, é denotada por s onde s é o período sazonal. A D- ésima diferença sazonal é denotada por D s. Ao se combinar os dois tipos de diferenciação obtém-se o operador d D s. Box & Jenkins (1970) generalizaram o modelo ARIMA para lidar com sazonalidade estocástica, e eles definiram um modelo ARIMA sazonal, chamado SARIMA, representado por: (B) (B s )N t = (B) (B s ) t (65)

41 em que (B) = (1-1 (B) -... - p (B p )) (B s ) = 1 - s B s -... - P B Ps N t = d D s X t (B) = 1 + 1 B +... + q B q (B s ) = 1 + s B s +... + Q B Qs Esse modelo é um SARIMA de ordem (p,d,q)x(p,d,q) s e, embora, pareça extremamente complicado, na prática os valores de d e D, em geral, não serão maiores que 1 ou 2 e um número pequeno de coeficientes será suficiente, Ehlers (2007). No entanto, ainda é necessário identificar um modelo que além de considerar a sazonalidade, também considere algum tipo de intervenção.

42 3. MATERIAIS E MÉTODOS Com os dados do CEPEA procurou-se fazer o ajuste da série histórica de preços com as metodologias clássicas de previsão de séries temporais, lançando mão do MS-Excel. Primeiramente serão feitos os testes sem utilização de softwares e suplementos para percebermos o comportamento do modelo para a série em foco e termos a liberdade de ajustar os parâmetros do modelo convenientemente. Posteriormente, os testes serão repetidos usando os softwares Risk Simulator e Crystal Ball. 3.1 Média Móvel Simples Este método foi explanado na seção 2.2.1.1.1, onde o valor da média móvel (MA 1 ) para um intervalo específico (n) é simplesmente o somatório dos dados históricos reais (Y) arranjados e indexados numa sequência temporal (i). 1 2 3 4 5 6 7 8 9 10 11 204 205 206 207 208 209 210 211 212 213 214 A B C D E F G H I J K Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Média Móvel Simples. Mês Real Ajuste de Previsão Erro Erro ^ 2 Erro jan/96 1,68 - - - - - - - - fev/96 1,2 - - - - - - - - mar/96 1,27 - - - - - - - - abr/96 1,23 1,38 0,15 0,02 12,47% 0,01 0,00 0,15 - mai/96 2,09 1,23 0,86 0,73 40,99% 0,49 0,49-0,86 1,02 jun/96 2,19 1,53 0,66 0,44 30,14% 0,10 0,00-0,66 0,04 jul/96 4,61 1,84 2,77 7,69 60,16% 1,60 1,22-2,77 4,47 ago/96 13,66 2,96 10,70 114,42 78,31% 5,38 3,85-10,70 62,78 set/12 24,08 8,70 15,38 236,65 63,88% 1,55 0,90-15,38 80,88 out/12 24,99 14,61 10,38 107,81 41,55% 0,19 0,00-10,38 25,00 nov/12 20,47 dez/12 20,47 jan/13 20,47 fev/13 RMSE 5,04 MSE 94,65 25,39 i = 1,...,N MAD 6,83 MAPE 108,49% U de Theil 1,90 Figura 13 Média móvel simples (3 meses) Aqui vemos que existem 201 meses de dados históricos reais e a média móvel, de período de 3 meses, foi calculada. Colunas adicionais de cálculos também existem neste teste, cálculos estes que são exigidos para estimar o erro das medidas ao se usar esta abordagem de média móvel. Estes erros são importantes quando puderem ser comparados com as múltiplas médias móveis (i.é., 3-meses, 4-meses, 5-meses, e assim por diante) como também com outros modelos de séries temporais (p.ex., média móvel simples, modelo sazonal aditivo, e

43 assim por diante) para encontrar o melhor ajuste que minimiza estes erros. As Figuras 14 e 15 mostram os cálculos exatos usados no modelo de média móvel. 218 219 A B C D E F G H I J Formulário 220 221 222 223 224 225 226 227 Mês Real Ajuste de Previsão Erro Erro ^ 2 Erro 1 1,68 2 1,20 3 1,27 4 1,23 1,38 0,15 0,02 12,47% 0,0146 0,00 0,15 ABS (1,38-1,23) 0,15 2 Figura 14 Calculando a média móvel simples 202 203 204 205 206 207 208 209 A B C D E F G H I J jul/12 7,39 4,99 2,40 5,76 32,48% 0,14 0,03-2,40 0,23 ago/12 12,35 5,96 6,39 40,83 51,74% 0,75 0,45-6,39 15,92 set/12 24,08 8,70 15,38 236,65 63,88% 1,55 0,90-15,38 80,88 out/12 24,99 14,61 10,38 107,81 41,55% 0,19 0,00-10,38 25,00 nov/12 20,47 dez/12 20,47 jan/13 20,47 fev/13 Figura 15 Fazendo previsão com média móvel simples RMSE 5,04 MSE 94,65 MAD 6,83 MAPE 108,49% U de Theil 1,90 RMSE Erro n i MSE MSE n n MAD Erro i i MAPE n n i n i (Erro ) n Y t Y t Y t n RMSE Figura 16 Estimativa do erro UTheil n Y t Y t t Y t n Y t Y t t Y t Note que o valor previsto ajustado no período 4 de 1,38 é uma média dos 3 meses anteriores (mês 1 até 3). O valor previsto ajustado para o período 5 seria então a média de 3 meses do mês 2 até 4. Este processo é repetido adiante até o mês out-12 (Figura 15), onde cada mês após este último, a previsão é fixada em 20,47. Claramente, esta abordagem não é adequada se houver uma tendência (para cima ou para baixo no decorrer do tempo) ou se houver sazonalidade. Assim, a estimativa do erro é importante quando escolher o modelo de previsão de séries temporais. A Figura 15 ilustra umas poucas colunas adicionais de cálculos

44 exigidas para estimar os erros de previsão. Os valores destas colunas são usados na estimativa do erro da Figura 16. Figura 17. Valores Reais e Valores Estimados pelo método da MMS. 3.2 Suavização Exponencial Simples A segunda abordagem a ser usada quando não houver tendência ou sazonalidades discerníveis é o método de suavização exponencial simples. Este método, tratado na seção 2.2.1.1.2, pondera os dados passados com pesos decrescendo exponencialmente ao voltar ao passado; isto é, quanto mais recente o valor do dado, maior seu peso. Esta ponderação supera largamente as limitações dos modelos de médias móveis ou variações porcentuais. O peso usado é chamado de medida alfa. O método está ilustrado na Figura 18. 1 2 3 4 5 6 7 8 204 205 206 207 208 209 210 211 212 213 214 A B C D E F G H I J K Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Suavização Exponencial Simples. = 0,1 Mês Real Ajuste de Previsão Erro Erro ^ 2 Erro jan/96 1,68 - =B4 =$C$2*$B5+(1-$C$2)*$C5 - - - fev/96 1,2 1,68 0,48 0,23 40,00% 0,08 0,08 0,48 mar/96 1,27 1,63 0,36 0,13 28,50% 0,09 0,00 0,36 0,01 abr/96 1,23 1,60 0,37 0,13 29,74% 0,08 0,00 0,37 0,00 mai/96 2,09 1,56 0,53 0,28 25,40% 0,19 0,49-0,53 0,80 set/12 24,08 11,85 12,23 149,63 50,80% 0,98 0,90-12,23 136,29 out/12 24,99 13,07 11,92 142,07 47,70% 0,25 0,00-11,92 0,10 nov/12 14,26 dez/12 jan/13 fev/13 RMSE 9,67 MSE 93,54 93,54 = x t-1 + (1 - ) MAD 7,33 MAPE 126,40% U de Theil 2,49 Figura 18 Suavização exponencial simples Onde a previsão suavizada exponencialmente ( ) no instante t é uma média ponderada entre o valor real um período atrás (x t-1 ) e a última previsão do período ( ),

45 ponderada pelo parâmetro ( ). Note que o primeiro valor ajustado de previsão no mês 2 ( ) é sempre o valor real do mês anterior (x 1 ). A equação matemática é usada somente no mês 3 ou iniciando no segundo período de previsão ajustada. 3.2.1 Otimização dos Parâmetros de Previsão Inicialmente, no método de suavização exponencial simples, o parâmetro foi arbitrariamente escolhido como 0,10. De fato, o alfa ótimo tem que ser obtido para o modelo fornecer uma boa previsão. No modelo da Figura 18, o suplemento Solver do Excel é usado para encontrar o parâmetro alfa ótimo que minimiza os erros de previsão. A Figura 19 ilustra a caixa de diálogo: suplemento Solver do Excel, onde C210 foi definida como célula objetivo e nomeada como a RMSE.SES, enquanto o objetivo de minimizá-la foi feito variando metodicamente o parâmetro alfa que se encontra na célula C2. Deverá ser permitido ao α variar somente entre 0,00 e 1,00 (pois o α é um peso atribuído aos dados históricos e previsões de períodos passados, e o peso nunca pode ser menor que zero ou maior que um), vínculos adicionais são também configurados. O valor ótimo resultante de que minimiza os erros projetados, calculado pelo Solver é 0,06286299. Portanto, entrar com este valor de no modelo conduzirá aos melhores valores de previsão, como é mostrado na figura 20. Figura 19 Otimizando parâmetros numa suavização exponencial simples

jan/96 ago/96 mar/97 out/97 mai/98 dez/98 jul/99 fev/00 set/00 abr/01 nov/01 jun/02 jan/03 ago/03 mar/04 out/04 mai/05 dez/05 jul/06 fev/07 set/07 abr/08 nov/08 jun/09 jan/10 ago/10 mar/11 out/11 mai/12 dez/12 46 1 2 3 4 5 6 7 8 204 205 206 207 208 209 210 211 212 213 214 A B C D E F G H I J K Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Suavização Exponencial Simples. = 0,06286299 Mês Real Ajuste de Previsão Erro Erro ^ 2 Erro jan/96 1,68 - =B4 =$C$2*$B5+(1-$C$2)*$C5 - - - fev/96 1,2 1,68 0,48 0,23 40,00% 0,08 0,08 0,48 mar/96 1,27 1,65 0,38 0,14 29,91% 0,10 0,00 0,38 0,01 abr/96 1,23 1,63 0,40 0,16 32,19% 0,10 0,00 0,40 0,00 mai/96 2,09 1,60 0,49 0,24 23,39% 0,16 0,49-0,49 0,78 set/12 24,08 13,14 10,94 119,70 45,44% 0,78 0,90-10,94 138,84 out/12 24,99 13,83 11,16 124,61 44,67% 0,21 0,00-11,16 0,05 nov/12 14,53 dez/12 jan/13 fev/13 RMSE 9,66 MSE 93,28 93,28 = x t-1 + (1 - ) MAD 7,21 MAPE 118,97% U de Theil 2,38 60 50 40 30 20 Valores Reais Valores Estimados 10 0 Figura 20 Valores Reais versus Valores Estimados pelo Modelo de suavização exponencial simples.

47 3.3 Média Móvel Dupla O método da média móvel dupla, descrito na seção 2.2.1.2.1, suaviza os dados passados realizando uma média móvel num subconjunto de dados que representa uma média móvel de um conjunto original de dados. Isto é, uma segunda média móvel é realizada na primeira média móvel. A aplicação da segunda média móvel captura o efeito de tendência dos dados. A figuras 21 ilustra o cálculo envolvido. O exemplo mostrado é uma média móvel dupla de período p de 3 meses e o valor previsto obtido no período 203. 1 2 3 4 5 6 7 8 9 10 11 204 205 206 207 208 209 210 211 212 213 214 A B C D E F G H I J K L M N Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Média Móvel Dupla. n= 3 Mês Referência MA1t - MA2t - Ajuste de Real de Célula n meses n meses Previsão Erro Erro ^ 2 Erro jan/96 1 1,68 xxxxx xxxxx xxxxx - - - fev/96 2 1,2 xxxxx xxxxx xxxxx 0,00 mar/96 3 1,27 xxxxx xxxxx xxxxx 0,00 abr/96 4 1,23 1,38 xxxxx xxxxx 0,00 mai/96 5 2,09 1,23 xxxxx xxxxx 0,00 jun/96 6 2,19 1,53 1,38 0,00 jul/96 7 4,61 1,84 1,53 1,83 2,78 7,75 60,40% 1,62 1,22-2,78 ago/96 8 13,66 2,96 2,11 2,44 11,22 125,81 82,11% 5,92 3,85-11,22 71,10 set/12 201 24,08 8,70 6,55 7,62 16,46 270,79 68,34% 1,78 0,90-16,46 96,43 out/12 202 24,99 14,61 9,75 12,99 12,00 143,95 48,01% 0,25 0,00-12,00 19,87 nov/12 24,31 dez/12 jan/13 fev/13 RMSE 14,60 MSE 213,06 213,06 MAD 10,53 MAPE 197,41% U de Theil 3,76 Figura 21 Média Móvel Dupla (3 meses) A previsão suavizada exponencialmente ( ) no instante t é uma média ponderada entre o valor real um período atrás ( ) e a última previsão do período ( ), ponderada pelo parâmetro ( ). Note que o primeiro valor ajustado de previsão no mês 2 ( ) é sempre o valor real do mês anterior ( ). A equação matemática é usada somente no mês 3 ou iniciando no segundo período de previsão ajustada. 3.3.1 Otimizando os Parâmetros de Previsão Incialmente, no método de média móvel dupla, o parâmetro número de dados a ser feita a média, isto é, o período p da média, foi arbitrariamente escolhido como 3. De fato, o período p ótimo tem que ser obtido para que o modelo forneça uma boa previsão. Usando o modelo da Figura 21, o suplemento Solver do Excel, como antes, é usado para encontrar o parâmetro período p ótimo que minimiza os erros de previsão. Aqui a célula objetivo C210 foi

48 nomeada como a RMSE. SES enquanto o objetivo é minimizá-la variando metodicamente o parâmetro período 13 p que se encontra na célula D2. O parâmetro deverá ser permitido variar somente entre 1 e 15, vínculos adicionais deverão também serem configurados. O valor p ótimo resultante que minimiza os erros projetados, calculado pelo Solver foi 3. Portanto, entrar com este valor de p no modelo conduzirá aos melhores valores de previsão que minimiza os erros. 1 2 3 4 5 6 7 8 9 10 11 204 205 206 207 208 209 210 211 212 213 214 A B C D E F G H I J K L M Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Média Móvel Dupla. n= 3 Mês Referência MA1t - MA2t - Ajuste de Real de Célula n meses n meses Previsão Erro Erro ^ 2 Erro jan/96 1 1,68 xxxxx xxxxx xxxxx - - - fev/96 2 1,2 xxxxx xxxxx xxxxx 0,00 mar/96 3 1,27 xxxxx xxxxx xxxxx 0,00 abr/96 4 1,23 1,38 xxxxx xxxxx 0,00 mai/96 5 2,09 1,23 xxxxx xxxxx 0,00 jun/96 6 2,19 1,53 1,38 0,00 jul/96 7 4,61 1,84 1,53 1,83 2,78 7,75 60,40% 1,62 1,22-2,78 ago/96 8 13,66 2,96 2,11 2,44 11,22 125,81 82,11% 5,92 3,85-11,22 71,10 set/12 201 24,08 8,70 6,55 7,62 16,46 270,79 68,34% 1,78 0,90-16,46 96,43 out/12 202 24,99 14,61 9,75 12,99 12,00 143,95 48,01% 0,25 0,00-12,00 19,87 nov/12 24,31 dez/12 jan/13 fev/13 RMSE 14,60 MSE 213,06 213,06 MAD 10,53 MAPE 197,41% U de Theil 3,76 13 Muitas vezes usamos n para caracterizar o período p

jan/96 ago/96 mar/97 out/97 mai/98 dez/98 jul/99 fev/00 set/00 abr/01 nov/01 jun/02 jan/03 ago/03 mar/04 out/04 mai/05 dez/05 jul/06 fev/07 set/07 abr/08 nov/08 jun/09 jan/10 ago/10 mar/11 out/11 mai/12 dez/12 49 80 70 60 50 40 30 20 Valores Reais Valores Estimados 10 0-10 -20-30 Figura 22 Valores Reais e Valores Estimados pelo modelo de Média Móvel Dupla. 3.4 Suavização Exponencial Dupla (SED) de Holt Quando os dados exibirem tendência, mas não sazonalidade, uma segunda abordagem pode ser usada que é o método da suavização exponencial dupla, muito usado em engenharia e tratado na seção 2.2.1.2.2. A suavização exponencial dupla aplica duas vezes a suavização exponencial simples, uma vez para os dados originais e depois para os dados da suavização exponencial simples resultante. Um parâmetro de ponderação alfa ( ) é usado na primeira ou suavização exponencial simples (SES) enquanto um parâmetro de suavização beta ( ) é usado na segunda, ou suavização exponencial dupla (SED). Esta abordagem é útil quando a série de dados históricos não for estacionária. A Figura 23 ilustra o modelo de suavização exponencial dupla.

jan/96 jun/96 nov/96 abr/97 set/97 fev/98 jul/98 dez/98 mai/99 out/99 mar/00 ago/00 jan/01 jun/01 nov/01 abr/02 set/02 fev/03 jul/03 dez/03 mai/04 out/04 mar/05 ago/05 jan/06 jun/06 nov/06 abr/07 set/07 fev/08 jul/08 dez/08 mai/09 out/09 mar/10 ago/10 jan/11 jun/11 nov/11 abr/12 set/12 fev/13 50 1 2 3 4 5 6 7 8 204 205 206 207 208 209 210 211 212 213 214 A B C D E F G H I J K L Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Suavização Exponencial Dupla de Holt. = 0,00096981 = 1,00000000 Ajuste de Mês Real L t T t Previsão Erro Erro ^ 2 Erro jan/96 1,68 1,68 0,00 - - - fev/96 1,2 1,68 0,00 mar/96 1,27 1,68 0,00 1,68 0,41 0,17 32,21% 0,12 0,00 0,41 abr/96 1,23 1,68 0,00 1,68 0,45 0,20 36,41% 0,12 0,00 0,45 0,00 mai/96 2,09 1,68 0,00 1,68 0,41 0,17 19,80% 0,11 0,49-0,41 0,74 set/12 24,08 18,39 0,00 18,38 5,70 32,48 23,67% 0,21 0,90-5,70 137,79 out/12 24,99 18,40 0,01 18,39 6,60 43,57 26,41% 0,08 0,00-6,60 0,81 nov/12 18,40 dez/12 jan/13 fev/13 RMSE 9,58 MSE 91,85 91,85 MAD 7,40 MAPE 128,61% U de Theil 2,78 Figura 23 Suavização Exponencial Dupla (SED) de Holt. 3.4.1 Otimizando os Parâmetros de Previsão Os parâmetros e foram escolhidos inicialmente de forma arbitrária. De fato, o e o ótimos tem que ser obtidos para o modelo fornecerem uma boa previsão. Usando o modelo da Figura 23, o suplemento Solver do Excel é usado para encontrar os parâmetros e, ótimos, que minimizam os erros de previsão. A célula objetivo C210 é definida como a RMSE.SED enquanto o objetivo a ser minimizado variando metodicamente os parâmetros e que se encontram nas células C2 e E2. O e o deverão ser permitidos variarem somente entre 0,00 e 1,00 (pois são pesos dados aos valores históricos e previsões de períodos passados, e o peso nunca pode ser menor que zero ou maior que um), vínculos adicionais são também configurados. O valor e o de, ótimos, resultantes que minimizam os erros projetados, calculado pelo Solver são 0,00096981 e 1,000000, respectivamente. 60 50 40 30 20 Valores Reais Valores Estimados 10 0 Figura 24 Valores reais e estimados numa suavização exponencial dupla de Holt. 3.5 - Sazonalidade Aditiva

jan/96 jun/96 nov/96 abr/97 set/97 fev/98 jul/98 dez/98 mai/99 out/99 mar/00 ago/00 jan/01 jun/01 nov/01 abr/02 set/02 fev/03 jul/03 dez/03 mai/04 out/04 mar/05 ago/05 jan/06 jun/06 nov/06 abr/07 set/07 fev/08 jul/08 dez/08 mai/09 out/09 mar/10 ago/10 jan/11 jun/11 nov/11 abr/12 set/12 fev/13 51 Se os dados da série temporal não tiverem tendência apreciável mas exibirem sazonalidade, então se aplicam os métodos da sazonalidade aditiva e da sazonalidade multiplicativa. O método da sazonalidade aditiva, descrito na seção 2.2.1.3.2, está ilustrado na Figura 25. As constantes de suavização e devem ser estimadas a partir dos dados como feito anteriormente. 1 2 3 4 5 6 7 8 204 205 206 207 208 209 210 211 212 213 214 A B C D E F G H I J K L Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Sazonalidade Aditiva. = 1,00000000 = 0,18238111 s= 4 Mês Real Nível L t Sazonalidade S t Ajuste de Previsão Erro Erro ^ 2 Erro jan/96 1,68 0,34 - - - fev/96 1,2-0,15 mar/96 1,27-0,08 1,27 1,61 100,00% 1,12 0,00-1,27 abr/96 1,23 1,35-0,12 1,23 1,51 100,00% 0,94 0,00-1,23 0,00 mai/96 2,09 1,76 0,34 1,68 0,41 0,17 19,62% 0,11 0,49-0,41 0,67 set/12 24,08 23,75 0,34 12,80 11,28 127,24 46,84% 0,83 0,90-11,28 39,44 out/12 24,99 25,14-0,15 23,60 1,39 1,93 5,56% 0,00 0,00-1,39 97,81 nov/12 24,99 dez/12 jan/13 fev/13 RMSE 6,72 MSE 45,15 45,15 MAD 4,34 MAPE 51,13% U de Theil 1,01 60 50 40 30 20 Valores Reais Valores Estimados 10 0 Figura 25 Sazonalidade Aditiva para um período de sazonalidade s = 4 meses. 3.5.1 Otimizando os Parâmetros de Previsão Os parâmetros e são, escolhidos arbitrariamente no início. De fato, o e o ótimos tem que ser obtidos por otimização para o modelo fornecerem uma boa previsão. Usando o modelo da Figura 25 e o suplemento Solver do Excel pode-se encontrar os parâmetros e ótimos que minimizam os erros de previsão. A célula objetivo C210 é definida como a RMSE.SA enquanto o objetivo a ser minimizado variando metodicamente os parâmetros e que se encontram nas células C2 e E2. O e o deverão ser permitidos variarem, como antes, somente entre 0,00 e 1,00 e vínculos adicionais são também configurados. O valor de e o de, ótimos, resultantes que minimizam os erros projetados, calculado pelo Solver são 1,000000 e 0,182338111, respectivamente.

35065 35186 35309 35431 35551 35674 35796 35916 36039 36161 36281 36404 36526 36647 36770 36892 37012 37135 37257 37377 37500 37622 37742 37865 37987 38108 38231 38353 38473 38596 38718 38838 38961 39083 39203 39326 39448 39569 39692 39814 39934 40057 40179 40299 40422 40544 40664 40787 40909 41030 41153 41275 52 Para um período sazonal de 12 meses, depois de feita a otimização dos parâmetros pelo Solver, teremos: 1 2 3 4 5 6 7 8 204 205 206 207 208 209 210 211 212 213 214 A B C D E F G H I J K L M Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Sazonalidade Aditiva. = 0,93092183 = 1,00000000 s= 12 Mês Real Nível Sazonalidade Ajuste de Erro Erro ^ 2 Erro L t S t Previsão Observação jan/96 1,68-4,89 - - - 1 fev/96 1,2-5,37 2 mar/96 1,27-5,30 3 abr/96 1,23-5,34 4 mai/96 2,09-4,48 5 set/12 24,08 12,54 11,54 16,67 7,41 54,94 30,78% 0,36 0,90-7,41 111,41 201 out/12 24,99 15,91 9,08 21,37 3,62 13,12 14,50% 0,02 0,00-3,62 14,36 202 nov/12 17,20 7,79 23,61 203 dez/12 27,84-2,85 12,27 204 jan/13 31,30-6,31 9,34 205 fev/13 30,59-5,60 10,37 206 RMSE 5,1924 MSE 26,9608 26,96 MAD 3,3576 MAPE 38,12% U de Theil 0,7726 60 50 40 30 20 Valores Reais Valores Estimados 10 0-10 Figura 26 Modelo de sazonalidade aditiva com período sazonal de 12 meses e os valores reais e estimados. O valor de e o de, ótimos, resultantes que minimizam os erros projetados, são 0,9303 e 1,00000000, respectivamente. Portanto, entrar com este valor de e de no modelo conduzirá aos melhores valores de previsão que minimiza os erros. 3.6 Sazonalidade Multiplicativa Similarmente, o modelo de sazonalidade multiplicativa exige os parâmetros: e. A diferença da sazonalidade aditiva é que o modelo é multiplicativo, por exemplo, o valor projetado é a multiplicação entre o nível caso base e o fator de sazonalidade. A Figuras 27 ilustra os cálculos exigidos. 3.6.1 Otimizando os Parâmetros de Previsão

jan/96 jul/96 jan/97 jul/97 jan/98 jul/98 jan/99 jul/99 jan/00 jul/00 jan/01 jul/01 jan/02 jul/02 jan/03 jul/03 jan/04 jul/04 jan/05 jul/05 jan/06 jul/06 jan/07 jul/07 jan/08 jul/08 jan/09 jul/09 jan/10 jul/10 jan/11 jul/11 jan/12 jul/12 jan/13 53 O e o ótimos tem que ser obtidos por optimização para o modelo fornecer uma boa previsão. Usando o modelo da Figura 26 e o suplemento Solver do Excel encontram-se os parâmetros e ótimos que minimizam os erros de previsão. A célula objetivo C210 é definida como a RMSE.SM enquanto o objetivo a ser minimizado variando metodicamente os parâmetros e que se encontram nas células C2 e E2. O e o deverão ser permitidos variarem somente entre 0,00 e 1,00. O valor de e o de, ótimos, resultantes que minimizam os erros projetados, calculado pelo Solver são 0,98345282 e 1,000000, respectivamente. 1 2 3 4 5 6 7 8 9 204 205 206 207 208 209 210 211 212 213 214 A B C D E F G H I J K L M Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Sazonalidade Multiplicativa. = 0,98345282 = 1,00000000 Mês Real Nível L t Sazonalidade S t Ajuste de Previsão Erro Erro ^ 2 Erro jan/96 1,68 1,25 - - - fev/96 1,2 0,89 mar/96 1,27 0,94 abr/96 1,23 1,35 0,91 mai/96 2,09 1,67 1,25 1,68 0,41 0,17 19,62% 0,11 0,49-0,41 jun/96 2,19 2,44 0,90 1,49 0,70 0,49 32,05% 0,11 0,00-0,70 0,09 set/12 24,08 29,75 0,81 12,93 11,15 124,24 46,29% 0,81 0,90-11,15 20,71 out/12 24,99 27,67 0,90 26,91 1,92 3,67 7,67% 0,01 0,00 1,92 170,62 nov/12 28,57 dez/12 jan/13 fev/13 RMSE 6,37 MSE 40,60 40,60 MAD 4,26 MAPE 51,94% U de Theil 1,05 60 50 40 30 20 Valores Reais Valores Estimados 10 0 Figura 27 Modelo de uma sazonalidade multiplicativa 3.7 Sazonalidade Aditiva de Holt-Winters Quando existirem a sazonalidade e a tendência, modelos mais avançados são exigidos para decompor os dados nos seus elementos base: um nível caso base (L) ponderado pelo parâmetro alfa ( ); um componente de tendência (b) ponderado pelo parâmetro beta ( ); e um componente de sazonalidade (S) ponderado pelo parâmetro gama ( ). Vários métodos

54 existem, mas os dois mais comuns são os métodos de sazonalidade aditiva de Holt-Winters e sazonalidade multiplicativa Holt-Winters. A Figura 28 ilustra os cálculos exigidos para se determinar o modelo de previsão com sazonalidade aditiva de Holt-Winters. 3.7.1 Otimizando os Parâmetros de Previsão A sazonalidade, ou seja, o número de subperíodos por ano é representada por s. As escolhas dos valores para as constantes de suavização, e estão condicionadas a algum critério e aqui foram, inicialmente, escolhidos arbitrariamente. Novamente, usando o modelo da sazonalidade aditiva de Holt-Winters, o suplemento Solver do Excel encontram-se os parâmetros alfa, beta e gama ótimos que minimizam os erros de previsão. A célula objetivo C210 é definida como a RMSE.SAHW enquanto o objetivo a ser minimizado variando metodicamente os parâmetros alfa, beta e gama que se encontram nas células C2 e F2 e I2. O alfa, o beta e o gama deverão ser permitidos variarem somente entre 0,00 e 1,00. O valor de, de e o de, ótimos, resultantes que minimizam os erros projetados, calculado pelo Solver são 0,00095980, 1,00000000 e 0,000000000, respectivamente. Portanto, entrar com este valor de alfa, de beta e de gama no modelo conduzirá aos melhores valores de previsão que minimiza os erros. 1 2 3 4 5 6 7 8 204 205 206 207 208 209 210 211 212 213 214 A B C D E F G H I J K L M Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Sazonalidade Aditiva de Holt-Winters. = 0,00095980 = 1,00000000 = 0,00000000 Mês Real Nível L t Tendência T t Sazonalidade S t Ajuste de Previsão Erro Erro ^ 2 Erro jan/96 1,68 0,34 - - - fev/96 1,2-0,15 mar/96 1,27-0,08 1,27 1,61 100,00% 1,12 0,00-1,27 abr/96 1,23 1,35 0,00-0,12 1,23 1,51 100,00% 0,94 0,00-1,23 0,00 mai/96 2,09 1,35 0,00 0,34 1,68 0,41 0,17 19,62% 0,11 0,49-0,41 0,67 set/12 24,08 18,10 0,00 0,34 18,43 5,65 31,93 23,47% 0,21 0,90-5,65 127,45 out/12 24,99 18,11 0,01-0,15 17,96 7,03 49,48 28,15% 0,09 0,00-7,03 1,91 nov/12 18,04 dez/12 jan/13 fev/13 RMSE 9,60 MSE 92,20 92,20 MAD 7,44 MAPE 130,03% U de Theil 2,82

55 60 50 40 30 Valores Reais Valores Estimados 20 10 0 jan/96 jul/96 jan/97 jul/97 jan/98 jul/98 jan/99 jul/99 jan/00 jul/00 jan/01 jul/01 jan/02 jul/02 jan/03 jul/03 jan/04 jul/04 jan/05 jul/05 jan/06 jul/06 jan/07 jul/07 jan/08 jul/08 jan/09 jul/09 jan/10 jul/10 jan/11 jul/11 jan/12 jul/12 jan/13 Figura 28 Modelo de uma sazonalidade aditiva de Holt-Winter 3.8 Sazonalidade Multiplicativa de Holt-Winters A Figura 29 ilustra os cálculos exigidos para se determinar o modelo de previsão com sazonalidade multiplicativa de Holt-Winters. 3.8.1 - Otimizando os Parâmetros de Previsão A sazonalidade, ou seja, o número de subperíodos por ano, é representado por s. As escolhas dos valores para as constantes de suavização, e estão condicionadas a algum critério e aqui foram inicialmente escolhidos arbitrariamente. De fato, o alfa, o beta e o gama ótimos tem que ser obtidos para o modelo fornecerem uma boa previsão. Usando o modelo da figura 29, o suplemento Solver do Excel é usado para encontrar os parâmetros alfa e gama ótimos que minimizam os erros de previsão. A célula objetivo C210 é definida como a RMSE.SMHW enquanto o objetivo a ser minimizado variando metodicamente os parâmetros alfa, beta e gama que se encontram nas células C2 e F2 e I2. O valor de, de e o de gama, ótimos, resultantes que minimizam os erros projetados, calculado pelo Solver são 0,03999998, 1,00000000 e 0,27624950, respectivamente.

56 1 2 3 4 5 6 7 8 204 205 206 207 208 209 210 211 212 213 214 A B C D E F G H I J K L M Tabela 1 - Preços Nominais da caixa-peso do Limão e seus valores previstos por Previsão com Sazonalidade Multiplicativa de Holt-Winters. = 0,03999998 = 1,00000000 = 0,27624950 Mês Real Nível L t Tendência T t Sazonalidade S t Ajuste de Previsão Erro Erro ^ 2 Erro jan/96 1,68 1,25 - - - fev/96 1,2 0,89 mar/96 1,27 0,94 1,27 1,61 100,00% 1,12 0,00-1,27 abr/96 1,23 1,35 0,00 0,91 1,23 1,51 100,00% 0,94 0,00-1,23 0,00 mai/96 2,09 1,36 0,01 1,33 1,68 0,41 0,17 19,62% 0,11 0,49-0,41 0,67 set/12 24,08 0,58-0,07 19,94 5,97 18,11 327,80 75,19% 2,15 0,90-18,11 166,05 out/12 24,99 0,58 0,00 20,00 5,65 19,34 374,20 77,41% 0,65 0,00-19,34 1,53 nov/12 6,37 dez/12 jan/13 fev/13 RMSE 26,60 MSE 707,75 707,75 MAD 16,58 MAPE 313,01% U de Theil 11,18 Figura 29 Modelo de uma sazonalidade multiplicativa de Holt-Winter. 3.9 Modelos de Médias Móveis e Auto-Regressivos Faremos agora uma análise mais avançada de previsão da série temporal do limão, usando os modelos de médias móveis MA(q), os modelos auto-regressivos AR e as combinações: ARMA, ARIMA e SARIMA. A teoria que vamos tratar aqui foi apresentada na seção 2.2.3 Para tanto desenvolvemos um suplemento Excel, chamado ARMA que se instala na guia SUPLEMENTOS da Faixa de Opções do Excel: Figura 30 Faixa de Opções do Excel com o Suplemento ARMA instalado. Clicando no menu Modelo ARMA aparece a janela Suplemento ARMA para Excel, onde se introduz a Série Temporal do Limão:

57 Figura 31 Janela inicial do ARMA Ao clicar o botão OK, obtemos:

58 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 B C D E F Estimação ARMA de y série temporal: y Método: Mínimos Quadráticos Não Lineares (Levenberg-Marquardt) data: 16-02-13 relógio: 16:06 Observações incluídas: 201 p = 1 - q = 1 - constante - seleção manual CoeficienteErro Padrão Estatística-t Prob. c 10,6593514 1,720332 6,196101167 3,29E-09 AR(1) 0,65914608 0,063748 10,33994841 1,11E-16 MA(1) 0,41833008 0,07672 5,452670212 1,47E-07 R-quadrado 0,670273 Var dependente média 10,435224 R-quadrado Ajustado 0,666942 S.D. var dependente 10,160706 S.E. da regressão 5,863859 Critério de info de Akaike6,358662 Soma quadrática dos resid. 6808,199329 critério Schwarz 6,407965 Log probabilidade -636,045511 estat. Durbin-Watson 1,876304 Raízes AR invertidas 0,66 Raízes MA invertidas -0,42 Este é o modelo ARMA de Box-Jenkins aplicado ao Limão. e-mail: bertolo@bertolo.pro.br Figura 32 Resultados obtidos com o modelo ARMA, instalado como Suplemento 26 3.10 Usando Softwares de Previsão Neste trabalho usaremos três softwares para previsão e simulação, mais conhecidos no mercado: Risk Simulator da Real Options Valuation, o @Risk da Palisade e o Crystal Ball da Oracle. 3.11 Investigando o modelo clássico apropriado com o Risk Simulator Neste trabalho usaremos três softwares para previsão e simulação, mais conhecidos no mercado: Risk Simulator. Foram testados os 8 modelos apresentados anteriormente com o software Risk Simulator, usando a ferramenta Análise da série temporal, a 15ª do grupo de ferramentas de Previsão. Aqui foi feita a Seleção automática de modelo, inserindo 12 como o número de períodos de sazonalidade por ciclo e feita projeção para 5 períodos. Ver Figura 33:

59 Figura 33 Janela para entrada de dados e seleção do modelo A Figura 34 ilustra os resultados gerados usando a ferramenta Previsão. O modelo usado foi aditiva de sazonalidade. Observe que na Figura 34, o gráfico de ajuste de modelo e previsão indica que a tendência e a sazonalidade são demonstradas pelo modelo Aditiva de sazonalidade. O relatório de análise da série temporal fornece os parâmetros alfa, beta e gama otimizados, as medidas de erro, os dados ajustados, os valores previstos e o gráfico de previsão ajustado. Os parâmetros são somente para referência. Alfa captura os efeitos de memorização das alterações do nível básico ao longo do tempo, beta é o parâmetro de tendência que mede o ponto forte da tendência e gama mede o ponto forte da sazonalidade dos dados históricos. A análise decompõe os dados históricos nesses três elementos e depois os recompõe para prever o futuro. Os dados ajustados ilustram os dados históricos, bem como os dados ajustados que usam o modelo recomposto e mostram a proximidade das previsões no passado (uma técnica chamada backcasting 14 ). Os valores previstos são as estimativas ou 14 Retroajustamento = inicia definindo um futuro desejável e depois vem de volta trabalhando para identificar políticas e programas que conectarão o futuro ao passado. A questão fundamental do processo é se quisermos

60 suposições de ponto único (se a opção de geração de suposição automática for escolhida e um perfil de simulação existir). O gráfico ilustra os valores históricos, ajustados e previstos. O gráfico é uma ferramenta visual e de comunicação poderosa para ver a qualidade do modelo de previsão. Aditiva de sazonalidade Resumo estatístico Alfa Gama REQM Alfa Gama REQM 0,00 0,00 8,362 0,60 0,60 5,650 0,10 0,10 6,127 0,70 0,70 5,500 0,20 0,20 6,028 0,80 0,80 5,339 0,30 0,30 5,945 0,90 0,90 5,207 0,40 0,40 5,865 1,00 1,00 5,495 0,50 0,50 5,771 A análise foi executada com alfa = 0,9303, gama = 1,00 e sazonalidade = 12 Medidas de erro REQM 5,1924 EQM 26,9609 MAD 3,3579 MAPE 38,14% U-Theil 0,7729 atingir certa meta, que ações devem ser tomadas para se chegar lá. O retroajustamento aborda o desafio de discutir o futuro na direção oposta.

Figura 34 Resultados obtidos com o software Risk Simulator 61

62 Figura 35 Ranking dos métodos testados pelo Risk Simulator 3.12 Investigando o modelo de Box-Jenkins apropriado com o Risk Simulator A seguir foram investigados dois modelos de Box-Jenkins: ARIMA e AUTO ARIMA que foram descritos na seção 2.2.3.6.

63 3.12.1 Modelo ARIMA do Risk Simulator No software Risk Simulator, usamos a ferramenta ARIMA, a 1ª do grupo de ferramentas de Previsão. Nela, os valores de P, D e Q foram escolhidos como 1, 0 e 1, como mostra a Figura 36: Figura 36 Janela para entrada de dados do Risk Simulator Os resultados estão mostrados na Figura 37:

64

65 Figura 37 Resultados obtidos com a ferramenta ARIMA do Risk Simulator Interpretação dos resultados: Na interpretação dos resultados do modelo ARIMA, a maioria das especificações é idêntica à análise de regressão multivariada. Há, no entanto, diversos conjuntos adicionais de resultados específicos à análise ARIMA, como observado na Figura 38. A primeira é a adição do critério de informação de Akaike (AIC) e do critério de Schwarz (SC), que são normalmente usados na seleção e identificação do modelo ARIMA. Ou seja, o AIC e o SC são usados para determinar se um modelo particular com um conjunto de parâmetros específicos p, d e q é um bom ajuste estatístico. O SC impõe uma penalidade maior para os coeficientes adicionais do que o AIC, mas em geral o modelo com menores valores de AIC e SC devem ser escolhidos. Finalmente, um

66 conjunto de resultados adicional chamado de estatísticas de auto-correlação (AC) e autocorrelação parcial (PAC) é fornecido no relatório ARIMA. Por exemplo, se a auto-correlação AC(1) é diferente de zero, as séries são correlacionadas em série de primeira ordem. Se a AC for extinta mais ou menos geometricamente com uma defasagem crescente, isso implica que a série segue um processo auto-regressivo de ordem inferior. Se a AC cair a zero depois de um pequeno número de defasagens, isso implica que a série segue um processo de média móvel de ordem inferior. Em contraste, PAC mede a correlação de valores que estão k períodos distante, depois de remover a correlação das defasagens intermédias. Se for possível capturar o padrão de auto-correlação por uma auto-regressão de ordem menor do que k, então a auto-correlação parcial na defasagem k será próxima à zero. As estatísticas Q de Ljung-Box, e seus valores-p na defasagem k, também são fornecidos, nas quais a hipótese nula sendo testada é tal que não há auto-correlação até a ordem k. As linhas pontilhadas na plotagem das auto-correlações são os limites aproximados dos dois erros padrão. Se a auto-correlação estiver dentro desses limites, não será significativamente diferente de zero no nível de significância de 5%, aproximadamente. Encontrar o modelo ARIMA certo requer prática e experiência. AC, PAC, AC e AIC são ferramentas de diagnóstico, muito úteis para ajudar a identificar a especificação de modelo correta. Finalmente, os resultados do parâmetro ARIMA são obtidos usando otimização sofisticada e algoritmos iterativos, que significa que embora as formas funcionais se pareçam com aquelas de uma regressão multivariada, elas não são as mesmas. O ARIMA é uma abordagem econométrica avançada e muito mais intensiva computacionalmente. 3.12.2 Modelo AUTO-ARIMA do Risk Simulator No software Risk Simulator, usamos a ferramenta AutoARIMA, a 2ª do grupo de ferramentas de Previsão. Ver Figura 38:

67

68 Figura 38 Resultados obtidos com o Risk Simulator 3.13 Investigando o modelo de Box-Jenkins apropriado com o Crystal Ball Usando a ferramenta CB-Predictor do Crystal Ball foram investigados todos os modelos anteriores e permitindo a sua auto seleção, o melhor modelo que o software encontrou para a série temporal do limão foi o SARIMA. Neste software os modelos clássicos apresentaram os seguintes resultados:

69 Figura 39 Resultados obtidos com a ferramenta CB-Predictor do Crystal Ball Aqui foram feitas Simulações de Monte Carlo com 1.000 tentativas. Os resultados simulados quando comparados com os informados pelo CEPEA, apresentam uma grande diferença. Isto sugere a busca de novos modelos.

Figura 40 Resultados obtidos com a ferramenta CB-Predictor do Crystal Ball e simulações de Monte Carlo 70

71 Figura 41 Ranking dos métodos pelo CB-Predictor do Crystal Ball 3.13.1 Modelo SARIMA no Crystal Ball Com uma versão mais nova do CB-Predictor do Crystal Ball que agora testa os modelos de Box-Jenkins, encontramos que o modelo que este software oferece como o mais apropriado é o SARIMA(2,1,2)(1,0,1): Figura 42 Ranking dos métodos pelo CB-Predictor Novo para os preços Nominais do Limão

72 Figura 43 Preços projetados pelo CB-Predictor para 12 meses à frente. O relatório fornecido pelo software:

73

74

Figura 44 Relatórios e Tabela comparando os vários métodos pelo CB-Predictor. 75

76 4. RESULTADOS E DISCUSSÕES Como demonstrado na seção 3.13.1, o modelo SARIMA(2,1,2)(1,0,1) foi o que apresentou os melhores resultados e, portanto, será o eleito para nossas análises futuras quanto a previsão de preços da lima ácida Thaiti. Conforme podemos ver na Figura 45, baseada em 202 valores fornecidos pelo CEPEA de janeiro de 1996 a outubro de 2012, o mínimo do preço neste período foi de R$ 1,02 e o preço máximo no período foi de R$ 51,78, tendo um preço médio de R$ 10,39, com desvio padrão de R$ 10,15. A Figura 45 mostra a saída obtida com o CB-Predictor do Crystal Ball, para uma previsão de 14 períodos: Figura 45 Resultados obtidos com o CB-Predictor do Crystal Ball para o modelo de previsão SARIMA(2,1,2)(1,0,1) Para comparação montamos uma tabela com os resultados ajustados e previstos a partir de outubro de 2012 até dezembro de 2013 (14 períodos) e comparamos com os valores fornecidos pelo CEPEA (disponível até abril de 2013):

77 Tabela 3 Comparações dos Resultados obtidos com o CB-Predictor do Crystal Ball para o modelo de previsão SARIMA(2,1,2)(1,0,1) e os valores reais divulgados pelo CEPEA. Devemos ressaltar que este período retratado na tabela acima corresponde a um ano atípico. Os produtores ficaram surpresos com a evolução dos preços. Nos meses de novembro e dezembro de 2012, os preços previstos ficaram abaixo daqueles do mercado. Quanto aos meses de janeiro a abril de 2013 os preços de mercado caíram muito, e ficando abaixo daqueles previstos pelo modelo, decorrência de uma produção elevada da fruta neste período, em virtude do atraso das chuvas no final do ano de 2012. Entretanto, embora não divulgado ainda pelo CEPEA, os preços de mercado, principalmente no mês de junho de 2013, ficaram acima daqueles previstos pelo modelo.