Modelo SARIMA: um estudo de caso sobre venda mensal de gasolina



Documentos relacionados
Análise de séries temporais aplicada aos valores do salário mínimo necessário do Brasil

ESTUDO DO EFEITO DAS AÇÕES DE MARKETING SOBRE O FATURAMENTO DE UMA INSTITUIÇÃO DE SAÚDE DO SUL DE MINAS GERAIS UTLIZANDO TÉCNICAS DE SÉRIES TEMPORAIS

Modelagem do total de passageiros transportados no aeroporto internacional de Belém: Um estudo preliminar

É POSSÍVEL ATINGIR A META DO MINISTÉRIO DA SAÚDE PARA A DOAÇÃO ESPONTÂNEA?

Sérgio Rangel Fernandes Figueira (1) Adhemar Sanches (2) Ana Claudia Giannini Borges (1) David Ferreira Lopes Santos (1)

PREVISÃO DE VENDAS DE CERVEJA PARA UMA INDÚSTRIA DE RIBEIRÃO PRETO

ANÁLISE DE SÉRIES TEMPORAIS DAS INTERNAÇÕES POR DOENÇAS RESPIRATÓRIAS NO HOSPITAL UNIVERSITÁRIO DE SANTA MARIA, RS, NO PERÍODO DE 2006 A 2009.

Ajuste de Modelo de Previsão Para Dados de Séries Temporais de Abate Suino no Brasil

Modelagem da Venda de Revistas. Mônica Barros. Julho de

UM ESTUDO DA VARIAÇÃO DE PREÇOS NA ÁREA DE SAÚDE E CUIDADOS PESSOAIS

Modelo de séries temporais aplicado à série de preços de etanol hidratado no estado de São Paulo

Análise Exploratória de Dados

Simulação Transiente

Previsão de vendas de materiais de construção civil na elaboração de planejamento estratégico

Uma aplicação de Inteligência Computacional e Estatística Clássica na Previsão do Mercado de Seguros de Automóveis Brasileiro

Ajuste de modelos de redes neurais artificiais na precipitação pluviométrica mensal

DEPARTAMENTO DE MÉTODOS QUANTITATIVOS

Previsão de vendas para um modelo de automóvel popular com a metodologia Box e Jenkins

ANAIS PREVISÃO DE VENDAS ATRAVÉS DE MODELOS INTEGRADOS: O CASO DO SETOR TÊXTIL DE UMA EMPRESA

Estimando modelo ARIMA no Software R

Análise de causalidade dentro e entre os mercados BRIC e G8

PRO FOR WINDOWS (FPW)

Utilização da metodologia de Box & Jenkins na previsão do preço futuro pago as exportações paranaenses de madeira serrada

Eixo Temático: Estratégia e Internacionalização de Empresas

PREVISÃO DO PREÇO DA GASOLINA PARA A REGIÃO SUL DO BRASIL GASOLINE PRICE FORECASTING TO SOUTHERN REGION OF THE BRAZILIAN

ANÁLISE DOS PREÇOS DA MAÇÃ NO BRASIL: UMA APLICAÇÃO DE MODELOS ARIMA COM INTERVENÇÃO

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014

Aplicação da metodologia Box & Jenkins para previsão de vendas de emulsificante

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder

Eixo Temático: Inovação e Sustentabilidade em Diferentes Setores

SisDEA Home Windows Versão 1

Distribuição de Freqüências

Introdução. Métodos de inferência são usados para tirar conclusões sobre a população usando informações obtidas a partir de uma amostra.

Faturamento de Restaurantes

Previsão da produção de energia hidrelétrica no Brasil via séries temporais.

Hipóteses Estatísticas Testadas por Diversos Softwares em Modelos com Dois Fatores Cruzados e Dados Desbalanceados

Modelos Sazonais. Aula 06. Bueno (2011) Seção 3.11 Enders, 2004 Capítulo 2 Morettin (2011) Seção 3.6 Morettin e Toloi, 2006 Capítulo 10

'LVWULEXLomR(VWDWtVWLFDGRV9DORUHV([WUHPRVGH5DGLDomR6RODU *OREDOGR(VWDGRGR56

ANÁLISE DA DISTRIBUIÇÃO TEMPORAL DE DADOS HORÁRIOS DE TEMPERATURA EM CURITIBA

UNIVERSIDADE DO ESTADO DE SANTA CATARINA CENTRO DE CIÊNCIAS TECNOLÓGICAS DEPARTAMENTO DE ENGENHARIA DE PRODUÇÃO E SISTEMAS AMANDA CAROLINE MARTIN

UNIVERSIDADE FEDERAL DE ALFENAS Instituto de Ciências Sociais Aplicadas THAÍS DE FRANÇA WATANABE

1. Registou-se o número de assoalhadas da população de 100 apartamentos vendidos num bairro residencial

Análise Temporal dos Preços da Commodity Cobre Usando o Modelo Box & Jenkins

Um estudo da correlação dos resultados patrimoniais e operacionais das seguradoras Francisco Galiza, Mestre em Economia (FGV)

1. Tipos de variáveis e organização dos dados

CÁLCULO DO TAMANHO DA AMOSTRA PARA UMA PESQUISA ELEITORAL. Raquel Oliveira dos Santos, Luis Felipe Dias Lopes

UNIVERSIDADE FEDERAL DE RONDÔNIA CAMPUS DE JI-PARANÁ DEPARTAMENTO DE MATEMÁTICA E ESTATÍSTICA ÉRICA VIEIRA NOGUEIRA

PIM I e II Projeto Integrado Multidisciplinar

Análise bioestatística em fumantes dinamarqueses associado

Hipótese Estatística:

ESTUDO DE PREVISÃO DE DEMANDA PARA EMPRESA DE EQUIPAMENTOS MÉDICOS DE DIAGNÓSTICO

ESTUDO DE MODELO DE SÉRIES TEMPORAIS PARA DADOS DE AÇÕES

UNIVERSIDADE FEDERAL DO PARANÁ MONIQUE VERCHAI PEREIRA SUELEN FERREIRA CORDEIRO

Análise do volume útil do reservatório de Furnas via modelos de séries temporais

1. Introdução. 1.1 Introdução

Estatística e Probabilidade

Análise de Variância com dois ou mais factores - planeamento factorial

Econometria Avançada 1o semestre de 2015

Modelagem e Previsão de Vazões Médias Mensais do Rio Potiribu Utilizando Modelos de Séries Temporais

7Testes de hipótese. Prof. Dr. Paulo Picchetti M.Sc. Erick Y. Mizuno. H 0 : 2,5 peças / hora

Estatística Aplicada. Gestão de TI. Evanivaldo Castro Silva Júnior

OUTLIERS Conceitos básicos

Uma Avaliação do Uso de um Modelo Contínuo na Análise de Dados Discretos de Sobrevivência

UNIVERSIDADE DE SÃO PAULO EXPERIMENTAÇÃO AGRONÔMICA. Tutorial. Disciplina: Geoestatística

4 Fator de carga e fator de demanda: conceituação

Universidade Federal Rural de Pernambuco

Modelagens e Gerenciamento de riscos (Simulação Monte Carlo)

XVIII CONGRESSO DE PÓS-GRADUAÇÃO DA UFLA 19 a 23 de outubro de 2009

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

PESQUISA OPERACIONAL: UMA ABORDAGEM À PROGRAMAÇÃO LINEAR. Rodolfo Cavalcante Pinheiro 1,3 Cleber Giugioli Carrasco 2,3 *

Uma proposta de gráfico de controle EWMA com dados sazonais

SUPERINTENDÊNCIA DE SEGUROS PRIVADOS (SUSEP) DIRETORIA DE AUTORIZAÇÕES (DIRAT) COORDENAÇÃO-GERAL DE PRODUTOS (CGPRO)

QualiQuantiSoft Versão 1.3c

Flavia Corrêa Pinho e Mariana de Castro Agra

LEVANTAMENTO ESTATÍSTICO DO PERFIL DE UM CALL CENTER VISANDO O AJUSTE DE UM MODELO DE FILAS

Modelagem e Avaliação de Desempenho. Pós Graduação em Engenharia Elétrica - PPGEE Prof. Carlos Marcelo Pedroso 2011

Introdução. Existem situações nas quais há interesse em estudar o comportamento conjunto de uma ou mais variáveis;

Introdução à Análise Química QUI 094 ERRO E TRATAMENTO DE DADOS ANALÍTICOS

Testes de Hipóteses para Mèdia de Populações Normais- Variância conhecida e desconhecida

QUEDA NO NÍVEL DE ENDIVIDAMENTO DO CATARINENSE É ACOMPANHADA POR PEQUENA DETERIORAÇÃO DA QUALIDADE DAS DÍVIDAS

IMPACTO DA FEBRE AFTOSA NO PREÇO DA ARROBA DO BOI GORDO, RECEBIDO PELO PRODUTOR NO BRASIL 1

Aula 13 Técnicas de Integração

Valor Prático da Distribuição Amostral de

CAPÍTULO 9 Exercícios Resolvidos

ANÁLISE DA INSPEÇÃO DA LARGURA DOS TECIDOS DE POLIPROPILENO DA INDÚSTRIA TÊXTIL OESTE LTDA

Um Estudo da Série de Vendas de Automóveis no Brasil através de Métodos Clássicos de Previsão de Demanda

AVALIAÇÃO DE TÉCNICAS DE PREVISÃO DE DEMANDA UTILIZADAS POR UM SOFTWARE DE GERENCIAMENTO DE ESTOQUES NO SETOR FARMACÊUTICO

ANÁLISE LONGITUDINAL DOS PREÇOS DO CARVÃO VEGETAL, NO ESTADO DE MINAS GERAIS 1

Módulo 4 PREVISÃO DE DEMANDA

ESTATÍSTICA NA CASIO fx 82 MS

Avaliação de Desempenho em Sistemas de Computação e Comunicação

PLANEJAMENTO EXPERIMENTAL

Regressão Linear em SPSS

Quem foi que? - Um Desafio à Estatística: Questões de Autoria em "Novas Cartas Portuguesas" MADALENA MALVA

CURSO ON-LINE PROFESSOR: VÍTOR MENEZES. Comentários sobre as provas de estatística e financeira ICMS RJ

Combinação de métodos de séries temporais para previsão da demanda de café no Brasil

Cláudio Tadeu Cristino 1. Julho, 2014

CURSO ON-LINE PROFESSOR: VÍTOR MENEZES

PESQUISA SOBRE O PERFIL DE ALUNOS NA UTILIZAÇÃO DE UM SITE DOCENTE DO ENSINO SUPERIOR

Cada gráfico no seu galho. Série Matemática na Escola

Transcrição:

Modelo SARIMA: um estudo de caso sobre venda mensal de gasolina Ana Julia Righetto 1 Luiz Ricardo Nakamura 1 Pedro Henrique Ramos Cerqueira 1 Manoel Ivanildo Silvestre Bezerra 2 Taciana Villela Savian 3 1 Introdução Como pode ser visto em Morettin & Toloi (2004), é denominada série temporal, todo e qualquer conjunto de observações ordenadas ao longo do tempo. A análise de séries temporais pode ser dividida em dois grupos: i) a análise é feita no domínio de frequências e os modelos são não paramétricos; e ii) a análise é feita no domínio temporal e os modelos são paramétricos. Neste trabalho utilizamos o modelo SARIMA (BOX et al., 1994) que pertence ao segundo grupo da análise de séries temporais. Os conceitos da análise de séries temporais foram aplicados em uma série relativa a venda mensal de gasolina (em litros) no período de janeiro do ano 2000 até dezembro do ano 2010. Estes dados são provenientes do posto PIII da rede Prudentão, Presidente Prudente - SP e com o ajuste do modelo SARIMA à eles, será possível realizar previsões das vendas deste tipo de combustível no posto, além de identificar possíveis mudanças em sua venda ao longo do tempo, possibilitando a elaboração de estratégias de marketing da empresa através dos resultados obtidos. 2 Material e métodos 2.1 Conjunto de dados O conjunto de dados utilizado neste trabalho provém do posto PIII da rede Prudentão (Presidente Prudente-SP) e refere-se à uma série mensal de venda mensal (em litros) de gasolina no período de janeiro de 2000 até dezembro de 2010. 2.2 Modelagem SARIMA Um dos modelos mais utilizados que consideram a sazonalidade de uma determinada série temporal, é o chamado modelo ARIMA sazonal, ou SARIMA (Morettin & Toloi (2004)). Estes 1 Programa de Pós-Graduação em Estatística e Experimentação Agronômica - ESALQ/USP. e-mail: ajrighetto@usp.br 2 Departamento de Matemática, Estatística e Computação - FCT/UNESP. 3 Departamento de Ciências Exatas - ESALQ/USP. 1

modelos são importantes pois levam em consideração a sazonalidade estocástica dos dados. Quando o período s=12, o modelo denominado SARIMA de ordem (p,d,q) (P,D,Q) 12, é dado por (MORETTIN & TOLOI, 2004): φ(x)φ(x 12 ) d D 12Z t = θ(x)θ(x)a t (1) em que φ(x) é o operador autorregressivo (AR) de ordem p, θ(x) é o operador médias móveis (MA) de ordem q, Φ(X) é o operador AR-sazonal de ordem P, Θ(X) é o operador MA-sazonal de ordem Q, d é o operador diferença, D 12 é o operador diferença sazonal e a t é um ruído branco. 3 Resultados e Discussões Inicialmente, esboçou-se o gráfico da série temporal mensal de venda mensal de gasolina em litros (Figura 1(a)) onde foi constatado que a série não era estacionária. Desta forma, foi necessário transformar a série original na 1 a diferença do logaritmo da série (Figura 1(b)) para que a série torna-se estacionária. Figura 1: (a) Gráfico da série temporal mensal de venda de gasolina (em litros); (b) Gráfico da primeira diferença do logaritmo da série. Após a confirmação da estacionariedade da série foram calculadas as autocorrelações amostrais (Figura 2(a)) e autocorrelações parciais amostrais (Figura 2(b)) da série transformada para identificação do modelo. Figura 2: (a) Gráfico das autocorrelações amostrais da 1 a diferença do logaritmo da série; (b) Gráfico das autocorrelações parciais da 1 a diferença do logaritmo da série. Analisando as Figuras 2 (a) e (b), nota-se que existe sazonalidade de período 12. Ainda, é possível observar partes com médias móveis-sazonais. Assim, dois possíveis modelos foram 2

escolhidos para o ajuste desta série temporal: SARIMA(1,1,1)(0,1,2) 12 sem constante; SARIMA(1,1,1)(0,1,1) 12 sem constante. Com o ajuste destes modelos, deve-se agora prosseguir com a estimação dos parâmetros e análise dos resíduos. A seguir faz-se uma análise individual de cada um dos modelos escolhidos. Modelo SARIMA(1,1,1)(0,1,2) 12 : Com a escolha do modelo, calculou-se a estimação dos parâmetros (Tabela 1) e foi realizado o teste de Box-Pierce (MORETTIN & TOLOI, 2004) (Tabela 2) para verificar se o ruído é branco. Tabela 1: Estimação dos parâmetros para o modelo SARIMA(1,1,1)(0,1,2) 12 sem constante. Tipo Coeficiente Erro Padrão P-valor AR(1) 0,76 0,08 0,00 MA(1) 0,94 0,05 0,00 SMA(1) 1,13 0,11 0,00 SMA(2) -0,27 0,11 0,01 Pode-se notar que todos os parâmetros são significativos a um nível de 5% de significância. Sendo a variância do modelo igual a 0,002747 com 109 graus de liberdade. Tabela 2: Teste de Box-Pierce para o modelo SARIMA(1,1,1)(0,1,2) 12 sem constante. Lag 12 24 36 48 χ 2 5,7 20,9 31,7 48 g.l. 8 20 32 44 p-valor 0,68 0,41 0,48 0,45 Como todos os p-valores da Tabela 2 são maiores que 0,05, pode-se dizer que a um nível de significância de 5% (H 0 : o ruído é branco) não rejeita-se a hipótese nula, portanto o ruído é branco (MORETTIN & TOLOI, 2004). Com a confirmação de que o ruído é branco, foi realizada a análise dos resíduos, onde a um nível de 5% de significância os mesmos possuíam normalidade, além do mais constatou-se que os resíduos eram aleatórios e possuíam homocedasticidade (Figura 3). 3

Figura 3: (a) Teste de normalidade (CONOVER, 1999); (b) Histograma dos resíduos; (c) Gráfico de dispersão dos valores ajustados resíduos. Depois destas constatações, podemos dizer que o modelo é aceitável e, desta forma, calculamos então as previsões. Tabela 3: Intervalo de 95% de confiança e Previsões do modelo SARIMA(1,1,1)(0,1,2) 12 sem constante. Período Limite Inferior Previsão Limite Superior Julho/2010 57308,26 63513,01 70382,50 Agosto/2010 58712,03 67070,53 76618,97 Setembro/2010 57331,19 66662,64 77512,93 Outubro/2010 58034,91 68268,24 80298,00 Novembro/2010 56117,33 66556,07 78944,47 Dezembro/2010 61420,57 73298,84 87474,27 Modelo SARIMA(1,1,1)(0,1,1) 12 : Para este modelo, também foram calculados os parâmetros estimados (Tabela 4) e foi realizado o teste de Box-Pierce(Tabela 5) para verificar se o ruído é branco. Tabela 4: Estimação dos parâmetros para o modelo SARIMA(1,1,1)(0,1,1) 12 sem constante. AR(1) 0,68 0,09 0,00 MA(1) 0,92 0,05 0,00 SMA(1) 0,88 0,08 0,00 Pode-se notar que todos os parâmetros são significativos a um nível de 5% de significância. Ainda, a variância calculada através do Quadrado Médio do Erro (MS) foi de 0,002879 com 110 graus de liberdade. Tabela 5: Teste de Box-Pierce para o modelo SARIMA(1,1,1)0,1,1) 12 sem constante. Lag 12 24 36 48 χ 2 6,1 16,3 24,9 40,8 g.l. 9 21 33 45 p-valor 0,73 0,75 0,84 0,65 4

Com a confirmação de que o ruído é branco, foi realizada a análise dos resíduos assim como no primeiro modelo e todas as suposições foram verificadas Figura 4: (a) Teste de normalidade (CONOVER, 1999); (b) Histograma dos resíduos; (c) Gráfico de dispersão dos valores ajustados resíduos. Logo podemos dizer que o modelo é aceitável e, desta forma, calculamos então as previsões. Tabela 6: Intervalo de 95% de confiança e Previsões do modelo SARIMA(1,1,1)(0,1,1) 12 sem constante. Período Limite Inferior Previsão Limite Superior 4 Conclusões Julho/2010 57870,51 64289,21 71419,83 Agosto/2010 57994,13 66192,55 75549,95 Setembro/2010 57017,84 66011,43 76423,60 Outubro/2010 58251,91 68030,51 79450,63 Novembro/2010 56853,81 66791,80 78466,94 Dezembro/2010 62259,70 73463,08 86682,47 O modelo que se ajustou melhor aos dados segundo o critério EQMP (MORETTIN & TO- LOI, 2004) foi o SARIMA(1,1,1)(0,1,2) 12 e, portanto, foi o escolhido para realizar as previsões da série referente a venda mensal de gasolina (em litros) do posto PIII da rede Prudentão. As previsões de venda utilizando este modelo podem ser utilizadas como base para estratégias de marketing da empresa. Referências [1] BOX, G. E. P.; JENKINS, G. W.; REINSEL, G. C., Time Series Analysis, Forecasting and Control, 3 rd edition, New Jersey: Prentice-Hall, 1994. [2] CONOVER, W. J., Practical nonparametric statistics, 3 rd edition, New York: John Wiley & Sons, 1999. [3] MORETTIN, P. A.; TOLOI, C. M. C., Análise de séries temporais, 2 a edição, São Paulo: Editora Edgarg Blucher, 2004. 5