MODELAGEM AUTOMÁTICA DE SÉRIES TEMPORAIS Oscr S. Silv Fo., Wgner Cezrino; e Sérgio N. Miymoo Cenro de Pesquiss Reno Archer - CenPRA Rod. D. Pedro I, Km. 43,6 Cmpins SP Absrc: In his pper, n environmen for modeling nd demnd forecsing, bsed on clssicl Box nd Jenkins (BJ) procedures, is described. The min conribuion of his work is o uomed wo sges of he BJ procedure, which re poined ou s responsible for rising he cos of he BJ procedure s pplicion. Generl specs of he uomic procedure nd n exmple re presened. Key words: Time series, Box-Jenkins pproch, demnd forecsing I. INTRODUÇÃO Nese rblho discue-se um mbiene, denomindo MASTER, oriendo à modelgem, idenificção e esimção e previsão de demnd, bsedo no procedimeno clássico Box-Jenkins (BJ) []. O desenvolvimeno dese mbiene eve como mior preocupção inclusão de mecnismos lgorímicos pr uomizção de lgums ds eps do procedimeno BJ que requerem um grnde hbilidde de modelgem e conhecimeno esísicos e probbilísicos do usuário. Assim conribuição dese rblho é crição de um mbiene que oferece oporunidde de usuários noviços poderem desenvolver seus modelos de previsão, reduzindo ssim cusos de emprego do procedimeno BJ. Bsicmene, bordgem qui considerd consise de 5 (cinco) eps principis. A primeir dels consise no rmeno dos ddos, envolvendo enrd dos mesmos vi rquivos de ddos ou ecldo, nálise quliiv que envolve busc de possíveis ddos espúrios que devem ser nlisdos e subsiuídos, lém mbém de um nálise quniiv bsed em criérios esísicos. Aind nes ep, um nálise uomáic quno nurez homocedásic e escionridde d série é levd cbo, concluindo com rnsformção d mesm visndo ssegurr is proprieddes essenciis n plicção d bordgem BJ. A segund ep consider idenificção ds ordens e ipo do modelo de form uomáic com bse em criérios consoliddos pr ese fim n lierur [-3]. A erceir ep consider esimção dos prâmeros óimos pr o modelo definido n ep nerior e deermin como função do desvio pdrão do erro ssocido com cd prâmero óimo esimdo qul ou quis serão descrdos, de modo grnir prcimoniosidde do modelo. A qur ep presen ese de derênci e vlidção probbilísic pr o modelo gerdo. Sendo considerdo po o modelo poderá pssr quin ep, que diz respeio previsão de demnd. ENEGEP 00 ABEPRO
A uomizção d bordgem BJ rz como vngem ornr mis ágil o processo de omd de decisão n escolh de um modelo ARIMA(p,d,q) pr represenr um série emporl. De fo, mior críic o procedimeno BJ esá n necessidde de bsne experiênci do projeis em modelgem e conhecimeno rzoável em probbilidde e esísic. Um procedimeno uomáico, cermene não irá eliminr eses requisios por compleo, ms reduzirá por cero cusos com empo gso devido inens inervenção humn requerid pr operr bordgem clássic. Nese cso, pode-se firmr que é mesmo um usuário noviço pode ser reindo pr relizr ese procedimeno. II. DEFININDO UM MODELO ARIMA Sej série emporl dd por {y, y,..., y N }, onde N deno o ol de observções exisenes (hisórico de vends, por exemplo). Assumindo que es série sej não-escionári (ou sej, presene endêncis), szonl e enh um vrição leóri (erro) que poss ser proximdo por um disribuição de probbilidde Gussin, segue enão que um modelo represenivo pr es série é o ARIMA(p,d,q), descrio como segue: (+ φ () p q B +... + φ pb )W = (+ θ +... + θ qb ) Ψ(B) W = Ω(B) onde B é o operdor deslocmeno, ou sej, By = y -. A vriável deno o erro residul, que é represendo pelo ruído brnco Gussino com médi â = 0 e desvio d λ pdrão σ consne. Noe mbém que W = (Y ) represen um série escionári (ou sej, sem endêncis e szonliddes). Convém descr ind que os polinômios Ψ(B) e Ω(B), d equivlênci em (), denom respecivmene s pres Auoregressiv e Médi-móvel, de um modelo escionário ARMA(p,q). O modelo ssim definido es po receber plicção do procedimeno BJ []. Pr ober um série suvizd e escionári reliz-se lgums mnipulções n série originl, definids como segue: () Suvizção do compormeno d série: nese cso consider-se um operdor exponencil, denodo por λ, plicdo serie. Assim emos: λ, com λ 0. Porno pr, em-se que se λ = série mnêm-se inlerd, já se λ 0 plic-se o λ operdor exponencil (Y =, enquno que se λ = 0 plic-se Ln Y. )...M (b) Eliminção de Tendêncis (rnsformção d série um equivlene escionri): Pr iso, consider-se plicção de diferençs à série originl suvizd (se for o cso). d Assim, plic-se o operdor série, onde d é o número de diferençs. Vi de regr, 0 d. Tem-se, porno pr d= (um diferenç) que Y = ( B)Y = Y Y,=,,..., N; e pr d= segue Y = ( B )Y = ( B + B )Y = Y Y + Y,=,,...,N. ENEGEP 00 ABEPRO
III. APRESENTANDO UM MODELO AUTOMÁTICO DE IDENTIFICAÇÃO Os cinco pssos principis do procedimeno BJ, esão ilusrdos no fluxogrm d figur. Ese esquem consider já uomizção de lgums pres d meodologi BJ. Noe que s linhs rcejds n figur indicm onde ocorre inens inervenção do usuário e que represen o pono críico d meodologi clássic B&J. Es uomizção vis reduzir os cusos ssocidos com o empo gso pelo projeis no processo de modelgem, priculrmene ns eps de nálise exploróri e idenificção de ipo e ordem. Ouro speco ineressne é que uomizção dess eps, vibiliz uilizção do procedimenos BJ por usuários com experiênci em modelgem e inerpreção esísic. LER E PLOTAR A SÉRIE TEMPORAL ANÁLISE DOS DADOS (SUAVIZAÇÃO) eps uomizds Rever ordens IDENTIFICAÇÃO DE TIPO E ORDEM ESTIMAÇÃO DOS PARAMETROS VALIDAÇÂO? Fig.. Fluxogrm do mbiene MASTER OK ATIVAR PREVISOR DE DEMANDA A seguir presenm-se sucinmene os mecnismos memáicos dodos n uomizção ds eps de nálise dos ddos, envolvendo suvizção d série e d rnsformção num série equivlene escionári e n ep de idenificção ds ordens do modelo. 3.. Suvizção d Série e Equivlênci Escionári A idéi qui é selecionr λ que reduz vribilidde d série ornndo- mis suve d λ e d que produz um processo escionário W = (Y ), com =,...,n, onde N=N-d. Es ep é muio imporne pois lev em con s crcerísics básics d série e é um psso imporne pr vibilizr escolh ds ordem do modelo escionário. (i) Seleção do prâmero de suvizção (λ): o vlor de λ que rnsform Y em um processo equivlene {Y } λ com disribuição Norml pode ser esimdo usndo o méodo de Máxim Verossimilhnç como sugere Box nd Cox [5]. No enno, sbe-se que resíduos Gussinos não são necessrimene obidos, lém do que o méodo consome um lo empo de processmeno. Um opção ineressne é dor rnsformção de Brle [6] qul deermin em qul méric mpliude d série é brulmene independene de su médi e porno inge su normlidde. O méodo dodo é o seguine: ENEGEP 00 ABEPRO 3
Pr vlores de λ, série Y λ é dividido em k sub-séries de vlor k. A médi e vriânci de cd sub-série são clculds. O coeficiene de correlção e o índice esísico rms(λ), relcionndo médi e vriânci, são mbém clculdos. O prâmero λ que resulr no menor vlor rms(λ) é o proprido pr ser usdo n rnsformção. Noe que o vlor de k. ser dodo, é o ineiro mis próximo de N e k é o ineiro mis próximo de N/k. Dese modo s esimivs d médi e vriânci são ão preciss quno s fornecids por rms(λ). Ese méodo produz s seguines práics proprieddes: () os resíduos esão disribuídos como um processo Norml e (b) rzão AW= σâ σw que mede pre d vriânci não explicd pelo modelo é minimizd. (ii) Escolh do número de diferençs escionáris (d): pr idenificr o número de diferençs ser plicdo série originl, empreg-se um procedimeno simples de busc o vlor mínimo d vriânci d série, prmerizd por d. O procedimeno dodo consise n solução do seguine problem: Min d { σ (d); z = Y ; d } z k R + () onde d ( - B) d. É imporne lembrr que o mnho d nov série será N=N-d. 3.. Idenificção Auomáic ds Ordens do Modelo Tendo definido um série equivlene escionári, o psso seguine é definir ipo e ordem do modelo. O procedimeno uomáico pr idenificção do ipo e ordem do modelo segue dus eps, sber: idenificr um modelo inverido AR de ordem fini h; e idenificr um modelo equivlene ARMA(p,q). Modelo AR inverido: pr o modelo ARMA, descrio em (), pode-se deerminr um modelo equivlene AR de ordem infini, ddo por[]: Ψ(B) Ψ(B) W = ; Ψ(B) = = + φi B com φ0 =. Ω(B) i= 0 (3) onde ssume-se que o modelo ARMA em () é inversivel e escionário N práic (3) pode ser runcdo em um dd ordem h +. Pr idenificr o vlor de h do-se o criério de Akike [3]. O procedimeno bsicmene é ddo seguir: primeiro define-se um vlor máximo pr h = h mx, em seguid, deermin-se qul AR(h), com h [0, h mx ] minimiz: i AIC(h) = N Ln σ + h N (4) onde σ = N h, com = W + φi W ; =,,..., N N. = i= Modelo ARMA equivlene: pós selecionr o vlor máximo de h *, prir de (4), pode-se deerminr qul o pr (p,q) do modelo ARMA que minimiz o criério de Akike: ENEGEP 00 ABEPRO 4
AIC(p, q) i = N Ln σ + (p + q) N (5) considerndo como condição limie pr pesquis do pr (p,q) desiguldde p+q h *. Pr cd pr, vriânci do resíduo d série escionári, iso é, σ, é deermind prir de: 3.3. Esimção de Prâmeros p q = i= j= = W + φi W i θ j;,,..., N (5) O problem de esimção de prâmeros pode ser formuldo como segue: conhecido os prâmeros iniciis {(φ i 0, θ j 0 ), i =,..., p ; j =,,..., q}, clcule os respecivos vlores óimos, resolvendo o seguine problem de oimizção: Min s.. N = = W p i= φ.w i i + q j= θ j. j (6) Há um imens vriedde de écnics de oimizção oriends esimção dos prâmeros óimos de um modelo ARMA(p, q) e vrines. O mbiene MASTER do um méodo lernivo desenvolvido por [7] bsedo n generlizção do méodo Mriz Esendid []. 3.4. Vlidção do Modelo Após idenificr um modelo ARMA(p, q) (eniv), o psso seguine é verificr se o modelo é represenivo d série W e se ssim ese poderá ser usdo no processo de previsão de demnd. O mbiene MASTER consider nálise do erro residul do modelo (i.e., ) pr verificr se ind há lgo que foge prioriddes desejds de Normlidde e Homoscedáic. 3.5. Previsão de Demnd O modelo provdo no ese de vlidção, pode ind ser nlisdo por um ese visul de derênci, usndo um predior de -psso frene. Um dos objeivos dese ese é eliminr possíveis ddos espúrios exisenes n série originl, permiindo ssim su subsiuição por vlores previsos pelo predior de -psso à frene. O modelo de previsão dodo no procedimeno BJ (vide Progrm 4 no pêndice, pp. 505-508 em []) foi implemendo no mbiene MASTER. Ele permie que o usuário poss rpidmene ober esimivs pr períodos por ele definidos. IV. EXEMPLO Descrição: vends semnis de proximdmene 00.000 rolos de ppel olh bsorvene (em uniddes de 0.000 rolos), exemplo ese exrído de [9]. ENEGEP 00 ABEPRO 5
Ep Análise d Série: visulizção gráfic d série no empo e ddos relciondos 0 5 0 5 0-5 0 0 40 60 80 00 0 No de ponos Médi Desvio No. máximo No. mínimo 0.5839 9.63 -.373 8.5997 Comenários: nlisndo o compormeno d curv, não se verific necessidde de promover qulquer rnsformção que suvize o compormeno d série, ou sej, plicção de lgum operdor exponencil ou logrímico. Observndo, no enno, o pdrão d curv, pode-se verificr ele presen endêncis de crescimeno e decrescimeno o longo do empo, o que sugere o nlis plicção de ou -diferençs. É mbém observdo vrições leóris considerds normis fce s fluuções mensis de vends. Szonliddes e ouros pdrões menos comuns não form observdos. Ep : Suvizção e Escionridde d série: ) Suvizção: usndo meodologi de uomizção discuid n seção 3 não verificouse qulquer necessidde de relizr lgum ipo de suvizção n série λ= (vide seção, pr cerificr noção). b) Escionridde: dondo meodologi pr idenificção d necessidde de promover diferençs n série discuid n seção 3, o mbiene MASTER, deecou necessidde de relizr (um únic) diferenç, iso é d= (vide seção, pr noção): Iso signific que será necessário pens plicr -diferenç n série pr orná-l ESTACIONÁRIA. O gráfico seguir mosrm o compormeno d série pós plicr -diferenç: Ep 3: Idenificção ds ordens do modelo: -Adondo-se o esquem uomáico de idenificção de ordens do modelo, discuido n seção 3, dodo pelo mbiene MASTER, obeve-se que s ordens serim p * =0 e q * =. Ep 4: Esimção dos prâmeros: usndo o lgorimo de esimção do mbiene MASTER [8] obeve-se os seguines resuldos: No. de Consne Prâmero Desvio pdrão Vriânci Médi ierções do modelo uoregressivo do prâmero residul residul 8 0 θ =- 0.35440 +/- 0.094796.063. 0.00603 ENEGEP 00 ABEPRO 6
Psso 5: Vlidção do Modelo:O mbiene MASTER do o ese de BOX-PIERCE [] pr vlidr o modelo. Assim: Grus de liberdde No. Qui-qudrdo Probbilidde (%) 9.60469 56.663 Resuldo: Modelo dequdo pr represenr série Psso 5: Previsor de Demnd: usndo roin de previsão de demnd do sisem MASTER, qul implemen o Progrm 4 do procedimeno BJ descrio nos pêndices de [], relizou-se o seguine experimeno: Como resuldo obeve-se: Tempo máximo de previsão = 0 Defsgem d origem = 0 Inervlo de Confinç (50, 90, 95 ou 99%): 50 0 PREVISAO DA SÉRIE 5 0 5 0-5 0 0 40 60 80 00 0 40 8 ZOOM DA PARTE PREVISTA 7 6 5 4 3 4 5 6 7 8 9 0 ENEGEP 00 ABEPRO 7
V. CONCLUSÃO Nese rblho um bordgem uomizd pr rr o procedimeno BJ foi presend. De fo, s eps que presenm mior dificuldde n idenificção de modelos (vide figur, n seção 3) form uomizds com bse em écnics disponíveis n lierur. O mbiene MASTER implemen eses recursos. Aulmene, ele rod em dus plforms, ou sej: Mlb e Visul Bsic. Embor, nese rblho, o enfoque enh sido à modelos do ipo ARIMA, é imporne descr qui que modelos do ipo SARIMA, que envolvem szonliddes, são explordos igulmene no mbiene MASTER e seguem pricmene s mesms roins comends no rblho, com pens pequens dpções pr incluir períodos szonis. A versão gerl do mbiene esá em fse de eses, já com bons resuldos gerdos qundo comprdos ouros mbienes d lierur. Eses resuldos serão disponibilizdos em breve os ineressdos. VI. REFERÊNCIAS Box, G. E. P. & G. M Jenkins.(970): Time Series Anlysis-Forecsing nd Conrol, Holden-Dy, Sn Frncisco.. Durbin, J.(960): The Fiing of Time-Series Models, Inernionl Sisicl Reviews, Vol. 8, pp. 3-44.. Ozki, T. (977): On he order Deerminion of ARIMA Models, Appl. Sisics, Vol. 6 No. 3, pp. 90-30. 3. Rfery, A. E. (985): Time Series Anlysis, Europen Journl of Operionl Reserch, Vol. 0, pp 7-37. 4. Box, G. E. P. nd D. R. Cox (964) An Anlysis of Trnsformions, Jornl Royl S. Soc. Ser. B 6, pp. -43. 5. Dowdy S nd Snley W. (99): Sisic for Reserch, John Wiley nd Sons, USA. 6. Silv Filho, O. S. & J. C. Geromel (984): Modelgem Liner e Previsão de Apores em Sisems Hidroeléricos, 5o. CBA / o. Cong. L. Americ. Auomáic, Cmpin Grnde. 7. Silv Filho, O. S. (00): Ambiene Auomizdo pr Idenificção, Esimção e Previsão de Series Temporis bsed em Modelos ARMA(p,d,q)*{P,D,Q), Documeno Técnico, LTGE_0, CenPRA, Cmpins, SP. 8. Bowermn B. L. & O Connell, R. T. (987) Time Series Forecsiing: Unified Conceps nd Compuer Implemenion, Duxbury Press, Boson. ENEGEP 00 ABEPRO 8