Previsão da Eficácia Ofensiva do Fuebol Profissional: Um Caso Poruguês Jorge Caiado a,b,*, Aníbal Vieira a, Ana Bonio a, Carlos Reis a e Francisco Fernandes a a Escola Superior de Ciências Empresariais, Insiuo Poliécnico de Seúbal, Campus do IPS, Esefanilha, 2914-503 Seúbal b Cenro de Maemáica Aplicada à Previsão e à Decisão Económica, Insiuo Superior de Economia e Gesão, Universidade Técnica de Lisboa, Rua do Quelhas 6, 1200-781 Lisboa Resumo A previsão desempenha um papel imporane no planeameno, omada de decisão e conrolo em qualquer domínio de acividade, incluindo o fenómeno desporivo do fuebol. A experiência em mosrado que os modelos exrapolaivos ou não causais (modelos univariados), que se baseiam no conhecimeno exclusivo dos seus valores passados para prever o fuuro, são muias vezes mais eficienes do que os modelos causais ou mulivariados. Preende-se com ese arigo elaborar um exercício de modelação e previsão da eficácia ofensiva da equipa de fuebol do Spor Lisboa e Benfica na Liga Poruguesa de Fuebol. Para modelar e prever a série anual do número de golos, são uilizados méodos de previsão deerminísicos (endência linear, médias móveis, alisameno exponencial, hol, naïve) e esocásicos (modelos ARMA, passeio aleaório). No processo de selecção dos melhores modelos, são considerados as fuções do erro quadráico médio, erro absoluo médio e erro percenual absoluo médio de previsão a um passo sobre as úlimas rês observações conhecidas da série observada. Palavras chave: Alisameno exponencial, fuebol, médias móveis, modelo ARMA, previsão. Absrac The forecas plays an imporan role in he planning, he decision-making and conrol in any domain of aciviy, including he sporive phenomenon of he soccer. The experience has shown ha he exrapolaive or no casual models (univariae models), ha use only he informaion of is pas values o forecas he fuure, can ofen predic fuure wih more accuracy han causal or mulivariae models. In his paper, we model and forecas he offensive effeciveness of he soccer eam Spor Lisbon and Benfica, in Poruguese soccer league, by using deerminisic mehods (linear rend, moving average, exponenial smoohing, hol, naïve) and sochasic models (ARMA models, random walk). The model selecion crieria used in our sudy were he mean squared error, he mean absolue error and he mean absolue percenage error based in a one-sep forecas of he las hree observaions. Keywords: Exponenial smoohing, soccer, moving average, ARMA model, forecas. * Conaco por e-mail: jcaiado@esce.ips.p (Jorge Caiado). 1
1 Inrodução O desporo em vindo a adquirir uma magniude crescene na acualidade, onde se inclui o fuebol, inquesionavelmene o desporo mais popular do mundo. Enquano que o basebol, o baskebol, o fuebol americano e o hóquei no gelo são considerados os maiores passaempos desporivos nos Esados Unidos, o fuebol é o desporo nacional na maioria dos países da Europa, América Laina, África e na maior pare dos países da Ásia. Apesar da sua popularidade mundial, o fuebol em merecido pouca aenção por pare da comunidade cienífica quando comparada com a vasa lieraura exisene sobre os mais imporanes desporos americanos. Dos poucos esudos cieníficos sobre fuebol, desacam-se alguns ligados ao fuebol europeu. Har, Huon e Sharo (1975) esudaram a assisência de especadores aos jogos de 4 equipas de opo da liga inglesa de fuebol enre 1969 e 1972, e em paricular, analisaram as variações no número de especadores em função de facores geográficos, demográficos e da aracividade dos jogos em si. Num ouro rabalho, Bird (1982) usou dados de séries emporais enre 1948 e 1975 para esimar a assisência de especadores no fuebol inglês com base no preço dos bilhees (incluindo os cusos de viagem), o rendimeno nacional, e ouras variáveis ligadas ao sucesso da Inglaerra no campeonao do mundo, ao esado do empo, ao golos marcados e ao fenómeno do hooliganismo. Dobson e Goddard (1992) analisaram a procura de bilhees de lugares senados e lugares em pé com base numa amosra de 795 jogos da liga inglesa nas épocas de 1989-1990 e 1990-1991. Concluíram que o número de especadores que assisem aos jogos de pé aumena significaivamene nos jogos enre as equipas rivais e nos jogos enre as equipas que iveram bom desempenho em jogos recenes, ao passo que as vendas de bilhees para lugares senados dependem mais da performance das equipas ao longo das épocas passadas. Num esudo sobre o desempenho desporivo das equipas de fuebol da liga ialiana, Lucifora e Simmons (2003) verificaram que o número de golos, o número de minuos e as convocaórias para selecção nacional são facores prediivos do aumeno do nível salarial do jogadores. Na liga inglesa, como os salários individuais dos seus jogadores são geralmene desconhecidos para o público, Szymanski e Smih (1997) basearam-se no orçameno oal da equipa para medir a sua performance desporiva, e 2
concluíram que exise uma fore correlação enre a percenagem de viórias e o orçameno da equipa. Anderson, Ekman e Edman (2003) analisaram a performance de previsões feias por especialisas e não especialisas em fuebol. Para o efeio, quesionaram 250 indivíduos com diferenes níveis de conhecimenos sobre fuebol acerca dos seus prognósicos para os resulados da primeira ronda do campeonao do mundo de fuebol de 2002. Das verificações empíricas obidas, eses auores concluíram que os especialisas em fuebol (jornalisas, adepos e reinadores de fuebol) não conseguem ober melhores previsões do que os não especialisas, que se baseiam em juízos subjecivos face à ausência de informação. A modelação e previsão de resulados desporivos e a sua aplicação no desenvolvimeno de esraégias de aposas em surgido basane na lieraura cienífica. São exemplos os esudos sobre a liga de fuebol americano (Craig e Hall 1994, Gray e Gray 1997, Glickman e Sern 1998, Vergin 2001), o fuebol inglês (Lee 1997, Crowder, Dixon, Ledford e Robinson, 2002), o basebol nos Esados Unidos (Alber 1994, Gandar, Zuber e Lamb 2001, Schall e Smih, 2000), e o fuebol auraliano (Sefani e Clarke 1992, Clarke 1993 e Brailsford, Eason, Gray e Gray, 1995). O papel da previsão aravés de julgamenos e especulações de analisas baseados nas suas experiências e conhecimenos passados em sido exensivamene invesigado. Alguns esudos êm mosrado que os analisas experienes sobresimam a sua habilidade para prever com precisão devido ao seu excesso de confiança (Ayon 1992). Para além disso, exisem enviesamenos e limiações que caracerizam o julgameno humano quando se preende minimizar as consequências negaivas da previsão (Caiado 2002). Ese arigo em como objecivo cenral a modelação e previsão da série emporal do número de golos marcados pelo maior e mais popular clube poruguês de fuebol profissional - o Spor Lisboa e Benfica. Para o esudo empírico, foram uilizados méodos de previsão deerminísicos (endência linear, médias móveis, alisameno exponencial, naïve) e esocásicos (modelo ARMA de Box-Jenkins, modelo de passeio aleaório). No processo de escolha dos melhores modelos, omou-se em consideração os erros absoluos de previsão a um passo sobre as úlimas rês observações conhecidas da série observada. 3
2 - Meodologia de Análise A previsão desempenha um papel imporane no planeameno, omada de decisão e conrolo em qualquer domínio de acividade, incluindo o fenómeno desporivo do fuebol. Uma previsão consise na enaiva de exrapolar o comporameno fuuro a parir das condições acuais, uilizando dados hisóricos do passado. Nese processo, o analisa pressupõe que as condições no presene, mesmo as que se ignoram, se vão maner inaleradas no fuuro. A experiência em mosrado que os modelos exrapolaivos ou não causais (modelos univariados), que se baseiam no conhecimeno exclusivo dos seus valores passados para prever o fuuro, são muias vezes mais eficienes do que os modelos causais ou mulivariados. Em seguida faz-se uma breve exposição dos méodos deerminísicos e esocásicos de previsão uilizados no esudo empírico. a) Modelos de endência linear Eses modelos pressupõe um comporameno linear de endência da série. Quando numa série emporal se não deecam movimenos de carácer oscilaório nem movimenos sazonais e se admie a exisência de variação não explicada, pode adopar-se o seguine modelo deerminísico para a endência, Y = b0 + b1 + ε, que descreve a série Y como função da variável empo () e da componene aleaória ε que represena aquilo que não consegue explicar-se. A esimação dos parâmeros b 0 e b 1 é feia pelo méodo dos mínimos quadrados. b) Modelos de médias móveis Eses méodos são adequados para avaliar a endência de uma série e são muio sensíveis às alerações recenes do seu comporameno. Uilizam a informação relaiva ao ermos da série numa vizinhança de alguns períodos para esimar o seu nível correne. Para séries com endência localmene esacionária, o méodo de médias móveis simples obém previsões consanes para odo o horizone da previsão, T ˆ 1 T = T k + 1 1 YT + YT 1 + L+ YT k + Y + m = Y =, m = 1,2,..., k k 4
onde ˆ é a previsão da série Y no momeno T+m (com T a origem da previsão e m Y T + m o horizone da previsão) e YT, YT 1, K, YT k+ 1 são as k observações incluídas na média móvel. Ouros méodos de médias móveis aribuem uma maior imporância à informação passada mais recene relaivamene à mais aniga. c) Modelos de alisameno exponencial Ese méodos de previsão uilizam ponderadores exponencialmene decrescenes com a aniguidade das observações. São de vários ipos os modelos de alisameno exponencial: - Modelos de alisameno exponencial simples (séries com endência localmene esacionária e sem movimenos sazonais), M αy + ( 1 α) M 1, com 0 < α < 1, = onde M é a esimaiva do nível da série no momeno e α é a consane de alisameno. - Modelos de alisameno exponencial duplo (séries com endência linear e sem movimenos sazonais), M, = αy + ( 1 α) M 1 D, = αm + ( 1 α) D 1 Y ˆ = aˆ( T ) + bˆ( T ) m, = 1,2,... T + m m, onde M é a série de alisameno exponencial simples, D é a série de alisameno exponencial duplo, a( ) = 2M D e b T ) = [ α (1 α)]( M D ) são as esimaivas do nível e do declive da série, respecivamene e passos. ( ˆ a função de previsão a m Y T + m - Modelo de Hol-Winers sem sazonalidade (séries com endência linear e sem movimenos sazonais), [ a( 1) + b( 1) ], 0 < α 1 a( ) = αy + (1 α) <, [ a( ) a( 1) ] + (1 β) b( 1), 0 < β 1 b ( ) = β <, Y ˆ = aˆ( T) + bˆ( T ) m, = 1,2,... T + m m, onde a () e b () são as equações de acualização do nível e do declive de endência da série, respecivamene e Y T + m veja-se Makridakis, Wheelwrigh e Hyndman (1998). ˆ a função de previsão a m passos. Para mais dealhes 5
d) Previsões näive Nos mercados onde a informação esá muio dispersa e que são influenciados por um elevado número de inervenienes, as previsões dos analisas feias para o dia, mês, rimesre ou ano seguine correspondem aos valores observados no acual dia, = mês, rimesre ou ano, Y Y 1. São por isso chamadas previsões naïve. e) Modelo de passeio aleaório No modelo de passeio aleaório (random walk), o valor da série no momeno é igual ao seu valor passado mais um choque aleaório (geralmene conhecido por ruído branco), Y = 1 + ε. Y Ese modelo é muio uilizado na modelização e previsão de séries económicas e financeiras não esacionárias. Os passeios aleaórios caracerizam-se por movimenos de endência crescene ou decrescene em períodos longos seguidos de mudanças bruscas de senido imprevisíveis. f) Modelos ARMA Modelos lineares inroduzidos por Box e Jenkins (1970) que permiem modelar e prever séries cronológicas esacionárias e não esacionárias aravés de uma represenação auoregressiva e de médias móveis (ARMA). Sob ceras condições de esacionaridade e inveribilidade (veja-se Box e Jenkins 1970), o modelo genérico ARMA em a represenação, Y = φ L 1 Y 1 + L+ φ py p + ε θ1ε 1 θqε q. Ese modelo descreve a série Y como função dos seus valores passados e como combinação linear de uma sucessão de choques aleaórios. O processo inegrado auoregressivo e médias móveis ou (p,d,q) assume para o modelo comum (1,1,1) a forma, Z. = φ1 Z 1 + ε θ1ε 1, onde Z = Y Y 1 Box e Jenkins (1970) propuseram uma meodologia de modelização baseada nas eapas de idenificação, esimação, avaliação do diagnósico, selecção de modelos e previsão, que é acualmene ainda muio uilizada por especialisas em séries emporais e méodos de previsão. Desenvolvimenos mais recenes podem verse em Box, Jenkins e Reinsel (1994) e Wei (1990). 6
3 - Esudo Empírico A série em esudo refere-se ao número de golos marcados pelo Spor Lisboa e Benfica na Liga Poruguesa de Fuebol, nas úlimas 32 épocas de 1972/73 a 2003/04 (fone: www.zerozero.p). Na Figura 1 pode observar-se o cronograma da série. Esa parece apresenar uma endência ligeiramene decrescene ao longo do período em análise, acompanhada de oscilações de carácer aleaório. Figura 1 Série do número de golos marcados pelo Spor Lisboa e Benfica enre 1972/73 e 2003/04 110 100 90 80 70 60 50 40 74 76 78 80 82 84 86 88 90 92 94 96 98 00 02 04 A escoha do melhor modelo de previsão será deerminada com base no modelo que pruduzir menores erros de previsão a um passo sobre as úlimas 3 observações conhecidas do número de golos marcados. Os criérios dos erros de previsão uilizados são os seguines: Erro quadráico médio, EQM = ( 1 m) = 1e (onde e = Y P é o desvio enre o valor observado e o valor previso da série no momeno ); Erro absoluo médio, EAM = ( 1 m) = 1 e ; Erro percenual absoluo médio, m EPAM = ( 1 m) = 1 e Y 100. m m 2 7
No Quadro 1 apresenam-se as previsões a um passo à frene do número de golos marcados nas épocas de 2001/02, 2002/03 e 2003/04 e os respecivos valores do erro quadráico médio, erro absoluo médio e erro percenual absoluo médio. Na úlima linha do Quadro 1 enconram-se as previsões ou-of-sample para a época de 2004/05 com base nos diferenes modelos de previsão. Os Quadros 2 e 3 mosram os erros de previsão absoluos e percenuais absoluos. Épocas Golos Quadro 1 Erros de previsão do número de golos do Benfica enre 2001/02 e 2003/04 Modelos deerminísicos MTL MM2 MM3 MM4 MM8 AES AED HOLT NAIVE Modelos esocásicos RW (1,1,2) 01/02 66 57 56 61 61 61 64 56 56 54 52 57 61 02/03 74 58 60 59 62 60 64 58 59 66 63 74 70 03/04 62 59 70 65 63 61 65 60 65 74 71 62 69 (0,1,2) EQM 115,3 120,0 86,3 56,7 74,0 37,7 120,0 111,3 117,3 132,7 27,0 30,0 EAM 9,3 10,7 7,7 6,0 6,7 5,0 9,3 9,3 10,7 11,3 3,0 5,3 EPAM 13,4 15,7 10,9 8,5 9,4 7,1 13,3 13,4 16,1 16,9 4,5 8,1 Previsão 04/05 59 68 67 64 62 65 60 63 62 59 66 61 Noas: MTL é o modelos de endência linear; MM2, MM3, MM4 e MM8 são os modelo de médias móveis de ordens 2, 3, 4 e 8, respecivamene; AES e AED são os modelo de alisameno exponencial simples e duplo com pesquisa ópima das consanes de alisameno α pelo sofware Eviews 5; HOLT é o modelo de Hol-Winers sem sazonalidade com pesquisa ópima das consanes de alisameno α e β; NAIVE é o modelo de previsão naïve; RW é o modelo de passeio aleaório (random walk); (1,1,2) é um modelo inegrado auoregressivo de ordem 1 e de média móveis de ordem 2 com a resrição θ 2 =0; (0,1,2) é um modelo inegrado de médias móveis de ordem 2. Assinala-se a sombreado os menores erros de previsão. Épocas Quadro 2 Erros de previsão absoluos do número de golos do Benfica enre 2001/02 e 2003/04 Modelos deerminísicos MTL MM2 MM3 MM4 MM8 AES AED HOLT NAIVE RW Modelos esocásicos (1,1,2) 2001/02 9 10 5 5 5 2 10 10 12 14 9 5 2002/03 16 14 15 12 14 10 16 15 8 11 0 4 2003/04 3 8 3 1 1 3 2 3 12 9 0 7 (0,1,2) 8
Quadro 3 Erros de previsão percenuais do número de golos do Benfica enre 2001/02 e 2003/04 Épocas Modelos deerminísicos MTL MM2 MM3 MM4 MM8 AES AED HOLT NAIVE RW Modelos esocásicos (1,1,2) (0,1,2) 2001/02 13,6 15,2 7,6 7,6 7,6 3,0 15,2 15,2 18,2 21,2 13,6 7,6 2002/03 21,6 18,9 20,3 16,2 18,9 13,5 21,6 20,3 10,8 14,9 0,0 5,4 2003/04 4,8 12,9 4,8 1,6 1,6 4,8 3,2 4,8 19,4 14,5 0,0 11,3 O modelo (1,1,2) com uma parâmero auoregressivo de ordm 1 e um parâmero de médias móveis de ordem 2 e uma diferenciação simples revelou-se o melhor méodo para prever a performance ofensiva do fuebol do Benfica, a avaliar pelas funções EQM (27,0), EAM (3,0) e EPAM (4,5%) sobre as úlimas rês observações disponíveis. Em conrase, o modelo que apresena piores previsões foi o modelo de passeio aleaório. Dos modelos deerminísicos uilizados na previsão, desaca-se o modelo de alisameno exponencial simples com um EQM de 37,7, um EAM de 5,0 e um EPAM de 7,1%, que conseguiu ober a melhor previsão para a época de 2001/02 (erro absoluo de 2 golos). 4 Conclusões Muios analisas e invesigadores na área do desporo êm a preocupação de modelar e prever o comporameno fuuro de alguns imporanes e imprevisíveis resulados desporivos. O fenómeno do fuebol em merecido um enorme e crescene ineresse não só por pare dos agenes desporivos e adepos como ambém por invesidores insiucionais e individuais. Nese arigo forma uilizados méodos de previsão deerminísicos e esocásicos para prever a eficácia ofensiva do mais popular clube poruguês o Spor Lisboa e Benfica. Os resuldos empíricos sugerem que os modelos auoregressivos e de médias móveis (ARMA) de Box-Jenkins são aqueles que conseguem acompanhar melhor as oscilações da série do número de golos marcados e produzir melhores previsões. Os modelos de alisameno exponencial simples e de médias móveis de ordem 4 revelaram ambém boas qualidades prediivas. 9
5 Referências Alber, J. (1994), Exploring baseball hiing daa: Wha abou hose breakdown saisics?, Journal of he American Saisical Associaion, 89, 1066-1074. Anderson, P., Ekman, M. e Edman, J. (2003), Forecasing he fas and frugal way: A sudy of performance and informaion-processing sraegies of expers and nonexpers when predicing he World Cup 2002 in soccer, Working Paper Series in Business Adminisraion No 2003:9. Ayon, P. (1992). On he compeence and incompeence of expers. In: F. Bolger e G. Wrigh (Eds.), Experise and Decision Suppor, Plenum Press, 77-105. Bird, P. (1982), The demand for league fooball, Applied Economics, 14, 637-649. Box, G. E. P. e Jenkins, G. (1970), Time Series Analysis, Forecasing and Conrol, Holden-Day, San Francisco. Box, G. E. P., Jenkins, G. e Reinsel, G. C. (1994), Time Series Analysis, Forecasing and Conrol, 3.ª ed., Prenice-Hall, New York. Brailsford, T. J., Eason, S. A., Gray, P. K. e Gray, S. F. (1995), The efficiency of Ausralian fooball being markes, Ausralian Journal of Managemen, 20, 167-195. Caiado, J. (2002), Méodos de previsão em economia e gesão: desenvolvimenos recenes, Inforbanca, XIV, n.º 53, 18-19 e 44-47. Clarke, S. R. (1993), Compuer forecasing of Ausralian rules fooball for a daily newspaper, Journal of he Operaional Research Sociey, 44, 753-759. Craig, L. A. e Hall, A. R. (1994), Trying ou for he eam: Do exhibiions maer? Evidence from he Naional Fooball League, Journal of he American Saisical Associaion, 89, 1091-1099. Crowder, M., Dixon, M., Ledford, A. e Robinson, M. (2002), Dynamic modeling and predicion of English Fooball League maches for being, Journal of he Royal Saisical Sociey Series D (The Saisician), 51, 157-168. 10
Dobson, S. e Goddard, J. (1992), The demand for sanding and seaed viewing accommodaion in he English Fooball League, Applied Economics, 24, 1155-1163. Gandar, J. M., Zuber, R. A. e Lamb, R. P. (2001), The home field advanage revisied: a search for he bias in oher spors being markes, Journal of Economics and Business, 53, 439-453. Glickman, M. E. e Sern, H. S. (1998), A sae-space model for Naional Fooball League scores, Journal of he American Saisical Associaion, 93, 25-35. Gray, P. K. e Gray, S. F. (1997), Tesing marke efficiency: Evidence from he NFL spors being marke, Journal of Finance, 52, 1725-1737. Har, S., Huon, J. e Sharo, T. (1975), A saisical analysis of associaion fooball aendances, Journal of Royal Saisical Sociey Series C, 24, 17-27. Lee, A. J. (1997), Modelling scores in he premier league: Is Mancheser Unied really he bes?, Chance, 10, 15-19. Lucifora, C. e Simmons, R. (2003), Supersar effecs in spor: Evidence from Ialian soccer, Journal of Spors Economics, 3, 169-203. Makridakis, S., Wheelwrigh, S. e Hyndman, R. (1998), Forecasing: Mehods and Applicaions, 3.ª ed., John Wiley & Sons, New York. Schall, T. e Smih, G. (2000), Do baseball players regress oward he mean?, American Saisician, 54, 231-235. Sefani, R. T. e Clarke, S. R. (1992), Predicions and home advanage for Ausralian Rules fooball, Journal of Applied Saisics, 9, 251-261. Szymanski, S. e Smih, R. (1997), The English fooball indusry: performance, profi and indusrial srucure, Inernaional Review of Applied Economics, 11, 135-154. Vergin, R. C. (2001), Overreacion in he NFL poin spread marke, Applied Financial Economics, 11, 497-509. Wei, W. W. S. (1990), Time Series Analysis: Univariae and Mulivariae Mehods, Addison-Wesley Publishing Company, New York. 11