PREVISÃO DE RESULTADOS EM PARTIDAS DE FUTEBOL Unvrsdad Fdral d R Grand d Nrt - Smana d Estatístca 3 Marcl Lm d Arruda Intrduçã A prvsã (prbablístca) d rsultads d partdas d futbl nã é mas d qu um cas partcular d prblma fundamntal nfrntad pr qualqur statístc: a nfrênca sbr grandzas dscnhcdas a partr d valrs cnhcds bsrvads Mdls d prvsõs d rsultads d futbl, assm cm d prvsõs d ndcadrs fnancrs, d taxas blógcas u d qualqur utra grandza qu s qura studar, s basam ssncalmnt m ds ngrdnts: uma rprsntaçã paramétrca dssa grandza um métd para btnçã/stmaçã dsss parâmtrs As duas prmras prncpas tapas dst mncurs srã vltadas à análs dsss ds ngrdnts É prtnnt sclarcr qu dvrsas fnts utlzam a palavra mdl para dsgnar a rprsntaçã paramétrca da grandza m stud ( Mdl d Pssn, pr xmpl) Nst mncurs, prém, para s prvnr ambgüdads, trm mdl srá utlzada para dsgnar smnt prcss cm um td (a rprsntaçã paramétrca mas métd d stmaçã/btnçã ds parâmtrs) Exst, anda, um trcr ngrdnt, gualmnt mprtant, mas nm smpr lvad m cnsdraçã cm a atnçã qu mrcra: a análs da qualdad d mdl Essa análs pd sr basada m (pl mns) duas abrdagns pssívs, as quas, acmpanhadas d cmntárs sbr s mdls aprsntads, srã bt da trcra sçã A quarta sçã aprsntará, cm stud d cas, um xmpl d aplcaçã cncrta d um mdl xstnt utlzad pr um st d prvsõs statístcas d rsultads d futbl Pr fm, srã tcdas, na últma sçã, algumas cnsdraçõs sbr tmas atualmnt m abrt na ára da statístca aplcada a partdas d futbl Rprsntaçã paramétrca A rprsntaçã paramétrca é a dscrçã matmátca da grandza qu s qur studar N cas partcular das partdas d futbl d cmptçõs sprtvas paradas ( m qu s partcpants s nfrntam ds a ds) m gral, há duas pssívs grandzas d ntrss, cada qual rlacnada a uma das duas rprsntaçõs paramétrca mas usualmnt mprgadas: Rprsntaçã para rsultad d g Exstm análss qu utlzam cm grandza d ntrss smnt rsultad d g,, a nfrmaçã acrca d qum vncu u s g trmnu mpatad Essas
análss ssncalmnt s basam na rprsntaçã d Bradly-Trry (95), cua frmulaçã smpls facltu sua ppularzaçã ntr s studss d assunt Cnsdrand um cnunt d N cmptdrs π, π, K, π N ( π >,,, K, N) parâmtrs asscads à frça (habldad, nívl técnc, tc) d cada cmptdr, ntã, d acrd cm a rprsntaçã d Bradly-Trry, a prbabldad d cmptdr drrtar cmptdr num cnfrnt drt ntr ambs é dada pr: p, π π + π Além d sr naturalmnt ntutva d fácl cmprnsã, ssa rprsntaçã tm rspald tórc, pdnd sr drvada a partr da Dstrbuçã d Gumbl (96, também cnhcda cm Dstrbuçã d Valrs Extrms) Uma varávl alatóra cntínua X tm Dstrbuçã d Gumbl, cm parâmtrs µ (d lcalzaçã) (d scala), s sua funçã dnsdad d prbabldad é dada pr xµ x µ f ( x) xp Pr cnsgunt, sua funçã dstrbuçã acumulada é dada pr: ( xµ) F ( x) Supnha-s, ntã, qu cada um ds tms m qustã tnha asscad a s um scr latnt alatór ( ndpndnt d qum sa advrsár) S cm dstrbuçã d Gumbl cm parâmtrs µ lnπ Entã, scr S d -ésm tm tm dstrbuçã acumulada Dfnnd ( s lnπ ) F( s ) S S cm rsultad d g (a margm d vtóra a favr d tm ), pd-s mstrar qu sua dstrbuçã acumulada é F ( ) P( δ ) (lnπ lnπ δ + ) Lg, a prbabldad d tm drrtar tm é dada pr P( vncr ) P( > ) P( ) (lnπ + ln π ) π π + π
Em sua frmulaçã padrã, a rprsntaçã d Bradly-Trry s aplca smnt a sprts m qu nã xstm mpats Um ds xmpls mas dfundds da aplcaçã dssa rprsntaçã é xadrz, cuas prncpas ntdads ntrnacnas (nclund a FIDE Fédératn Intrnatnal ds Échcs []) utlzam cm frramnta fcal d classfcaçã Ranng El (978) Ess ranng quval a rprsntar a prfrmanc d cada nxadrsta pr uma Dstrbuçã d Gumbl cus parâmtrs sã dfnds d uma frma spcífca atualzads, após cada g u sér d gs, pr uma rgra gualmnt spcífca Exstm, pr utr lad, adaptaçõs /u xpansõs da rprsntaçã d Bradly- Trry, as quas cntmplam, m sua frmulaçã, fatrs cm: - a pssbldad d um cnfrnt trmnar mpatad; - ft vantagm d prmr gadr (quvalnt, n futbl, a fatr mand d camp u, n xadrz, à vantagm d gar cm as brancas ); - a margm d vtóra, dscrnnd ntr placars dstnts (x, x, x tc) u ntr vtóras flgadas vtóras aprtadas ; - tc Rprsntaçã para placar d g Análss mas abrangnts utlzam cm grandza d ntrss placar d g ( s scrs ftvamnt btds pr cada tm) nã smnt rsultad (a dntfcaçã d vncdr) Usualmnt, nssas análss númr d gls marcads pr um tm é rprsntad pr uma Dstrbuçã d Pssn, sgund a qual a prbabldad d tm marcar x gls num dtrmnad g é dada pr: P( X λ x λ x), x! nd λ E X ] é númr sprad d gls marcads pr ss tm n g m qustã [ É plausívl cnsdrar, cntud, qu númr sprad d gls marcads pr um tm dpnda da frça d tm advrsár É prftamnt prsumívl, pr xmpl, qu cntra advrsárs mas fracs, um tm tnda a marcar mas gls d qu cntra advrsárs mas frts Pr ssa razã, uma rprsntaçã mas adquada pd sr a Dstrbuçã d Hlgat (964), uma class d dstrbuçõs bvaradas d Pssn, cua funçã d prbabldad cnunta é dada pr: P( X x, Y y) mn(, ) ( + + ) x y λ λ λ λ x λ y λ ( x )!( y )!! Essa dstrbuçã pd sr caractrzada da sgunt frma: sam P, P P três varávs alatóras ndpndnts cm dstrbuçã d Pssn cm médas rspctvamnt guas a λ, λ λ Entã, vtr ( X, Y ) ( P + P, P + P ) sgu uma Dstrbuçã d Hlgat, cm funçã d prbabldad gual à acma frmulada
A prsnça d P m ambas as smas é rspnsávl pla xstênca d uma dpndênca ntr as varávs X Y Essa dpndênca, pr sua vz, pd prprcnar uma rprsntaçã mas ralístca das quantdads d gls marcads pr um tm X quand gand spcfcamnt cntra tm Y Evdntmnt, utras rprsntaçõs para placar pdm sr frmuladas (usand, pr xmpl, uma dstrbuçã Bnmal Ngatva u uma dstrbuçã Gama dscrtzada), assm cm pdm sr dsnvlvdas rprsntaçõs para rsultad dfrnts da d Bradly-Trry Prém, pr srm mas frqüntmnt utlzadas, a próxma sçã s ddcará prdmnantmnt às rprsntaçõs d Bradly-Trry d Pssn Estmaçã/btnçã ds parâmtrs Estmaçã pr máxma vrssmlhança A stmaçã pr máxma vrssmlhança é, talvz, mas ntutv md d s btr s parâmtrs ncssárs para cálcul das prbabldads Trata-s, numa xplcaçã rsumda, d prcurar, dntr tds s valrs pssívs qu s parâmtrs pdm assumr, aquls qu maxmzam a prbabldad d crrênca ds rsultads prvamnt bsrvads Para a rprsntaçã d Bradly-Trry, lmbrand qu a prbabldad d cmptdr drrtar cmptdr num cnfrnt drt ntr ambs é dada pr: π p,, π + π tm-s qu, para uma clçã d rsultads d gs ntr dvrss tms, a vrssmlhança cnunta é dada pr: L N N n π n + ( π π ), nd N é a quantdad ttal d tms m stud; n é ttal d vtóras d tm m gs cntra tm n n N é ttal d vtóras d tm m gs cntra tds s dmas tms Os valrs ds parâmtrs π, π, K, π N ds cmptdrs pdm, ntã, sr stmads pr m da maxmzaçã da vrssmlhança L Nã há, cm rgra gral, uma frma analítca fchada para s stmadrs d máxma vrssmlhança d Bradly-Trry Prém, xstm dvrss métds numércs faclmnt prgramávs qu prmtm btr sss valrs
Uma bsrvaçã mprtant qu cab sr tcda acrca dsss stmadrs é fat d nã srm úncs! Cm ft, s s valrs π, π, K, π N frm tds multplcads pr uma msma cnstant, s valrs rsultants π, π, K, π N também srvrã cm parâmtrs d Bradly-Trry, ps, chamand-s d a prbabldad d vtóra d tm p, sbr tm calculada a partr ds nvs parâmtrs, é fácl prcbr qu: π π p, p, π + π π + π Ess fnômn é uma cnsqüênca drta da naturza multplcatva da rprsntaçã d Bradly-Trry (ps as prbabldads d vtóra sã drtamnt prprcnas as parâmtrs π ), para vtar ambgüdads, cstuma-s usar a rstrçã adcnal π π + K + π + N Para a rprsntaçã d Pssn (Hlgat), pr utr lad, a stmaçã pr máxma vrssmlhança nã é vávl, uma vz qu a funçã d vrssmlhança nvlv prduts d smatóras qu, pr sua vz, nvlvm prduts d fatras Escrvr ssa funçã pr s só á é cmplcad prcurar valrs d parâmtrs λ qu a maxmzm sra uma tarfa anda mas cmplxa Mdls lnars (mínms quadrads) Outra frma pssívl para btnçã d parâmtrs é a stmaçã pr mínms quadrads Aqu, dfrntmnt da abrdagm pr máxma vrssmlhança, s parâmtrs sã cnsdrads cm varávs dpndnts d nfrmaçõs bsrvadas (varávs xplcatvas) ssa dpndênca é xplctada sb a frma d mdls lnars Gnrcamnt, pd s rprsntar ssa rlaçã d dpndênca cm: θ x + x + L + x + ε, nd θ é um parâmtr (para -ésm g) qu s qur stmar x, x, K, x sã varávs xplcatvas d cus valrs dpnd parâmtr θ ;,, K, sã (hpr)parâmtrs cus valrs s dsa stmar ε é um cmpnnt d rr (dstânca ntr valrs bsrvads prvsts) Aqu, θ pd sr um π d Bradly-Trry, um λ da Dstrbuçã d Hlgat, um parâmtr d utra rprsntaçã u msm uma funçã d parâmtr(s), cm srá xmplfcad mas à frnt O tratamnt padrã para ssa abrdagm é buscar s valrs d mnmzam rr quadrátc ttal, u sa, qu trnam mínma a sma,, K qu θ ( x + x + + ε L x )] [
Uma caractrístca útl dssa abrdagm é fat d lmnts cm a dntfcaçã d tm advrsár, fatr gar m casa quasqur utras varávs vntualmnt prtnnts pdrm sr nsrdas cm varávs xplcatvas nss mdl lnar Essa nsrçã dspnsa a rprsntaçã paramétrca d struturas qu xplctm a dpndênca dsss fatrs, prmtnd qu tal rprsntaçã pssa sr mas lv manpulávl Além dss, é mprtant mncnar qu a stmaçã ds valrs d,, K pd sr ralzada pr Mínms Quadrads Ordnárs (MQO) u pr Mínms Quadrads Pndrads (MQP) A adçã ds MQP m lugar ds MQO prmt cnfrr pss dfrncads a cada g, cm ss, dscrnr ntr amstss gs d cmptçã, acntuar a nfrmaçã prprcnada pr gs mas rcnts m cmparaçã cm gs mas antgs u stablcr qualqur ênfas qu s ds a algum fatr d ntrss Pr fm, mbra a frmulaçã supra xpsta s bas m mdls báscs d Rgrssã Lnar Múltpla, xstm mdls qu s fundamntam m frmulaçõs mas sfstcadas, cm Mdl Lnar Gral (GLM) (McCullagh Nldr, 989), Rgrssã Lgístca (Drapr Smth, 998) tc O mdl d L (997), basad m GLM d Pssn, é um xmpl ral da aplcaçã mplmntaçã d tas frmulaçõs avançadas Embra sss mdls s mbasm m tras mas avançadas qu a rgrssã lnar básca, a mnmzaçã ds rrs é prftamnt factívl s prncpas sftwars statístcs pssum sss mdls m suas prgramaçõs 3 Estmaçã baysana métds tratvs Uma utra abrdagm para a btnçã d parâmtrs é a atualzaçã tratva d valrs Iss sgnfca qu, após um dtrmnad tm dsputar um g u sqüênca d gs, nv valr d parâmtr dss tm srá btd drtamnt a partr d antg valr d rsultad dss(s) gs dsputad(s) Analtcamnt, ss prcss pd sr gnrcamnt rprsntad cm ' ' θ f ( θ, R), nd θ é valr atualzad d parâmtr d ntrss para -ésm tm; θ é valr antrr dss parâmtr; R é rsultad d(s) g(s) dsputad(s) pr ss tm Aqu, nvamnt θ pd sr um π d Bradly-Trry, um λ da Dstrbuçã d Hlgat, um parâmtr d utra rprsntaçã tc Cm um xmpl smpls d tas métds tratvs, pd-s ctar Ranng El (nã-fcal) d slçõs nacnas d futbl [] Após um g cntra a slçã, ss sstma atualza parâmtr da slçã d acrd cm a fórmula ' θ θ + K( S S ),
nd K é um ps qu dpnd da cmptçã pr qu g é váld da dfrnça d gls a favr d mandant; S é rsultad btd n g m qustã pla slçã ( pnt pr vtóra,,5 pr mpat pr drrta) π S P(vtóra) + P(drrta) é rsultad sprad para ss g π + π Pr fm, s parâmtrs dssa rprsntaçã d Bradly-Trry sã dfnds cm: π ( θ + ) / 4 θ / 4 s a slçã gar m casa cas cntrár, analgamnt: ( θ + ) / 4 s a slçã gar m casa π θ / 4 cas cntrár Exstm dvrsas utras frmas d atualzaçã tratva d parâmtrs, mutas dlas frmuladas arbtraramnt, sm mar mbasamnt tórc Exst também uma class, mas mprtant abrangnt, cmpsta pls métds d Estmaçã Baysana (O Hagan, 994) Rsumdamnt, a stmaçã baysana cnsst na atrbuçã d uma dstrbuçã d prbabldads para (s) parâmtr(s) da rprsntaçã na atualzaçã ds hprparâmtrs dssa dstrbuçã após cada g u cnunt d gs As ntaçõs usuas para ssas dstrbuçõs sã: π (θ ) - dstrbuçã a prr d parâmtr (scalar u vtral) θ; f ( x θ ) - dstrbuçã (vrssmlhança) d x cndcnal a valr d θ, π ( θ x) - dstrbuçã a pstrr d θ, cndcnal a valr bsrvad d x Dadas uma dstrbuçã a prr π a vrssmlhança f grada pls dads bsrvads x, a dstrbuçã a pstrr é dfnda cm: ( θ ) ( θ ) f π f ( x θ ) π ( θ x) π θ π ( x θ ) dθ Θ ( θ ) f ( x ) Em utras palavras, a dstrbuçã a pstrr é btda a partr d prdut da prr π θ f ( x θ ) dθ smnt uma cnstant d pla vrssmlhança, snd dnmnadr ( ) nrmalzaçã Θ
Num xmpl smplfcad para facldad d lustraçã, cnsdr-s qu s gls d um tm sam rprsntads pr uma dstrbuçã d Pssn cm méda λ Entã a vrssmlhança grada pr um g m qu ss tm marcu x gls sra: f ( x λ) P( X x λ) λ x λ x! Supnd qu a dstrbuçã a prr para λ sa uma Gama cm parâmtrs : λ π ( λ) λ Γ( ), ntã a dstrbuçã a pstrr para λ dad valr bsrvad x é gual a f ( λ x ) λ x λ λ λ Γ( ) λ Γ( ) λ λ x Essa praçã frqüntmnt nvlv ntgras cmplcadas n dnmnadr, qu nvablza a btnçã drta da pstrr Cntud, para uma grand class d dstrbuçõs (ntadamnt as prtncnts à Famíla Expnncal), ss trabalh é facltad pla xstênca das classs d prrs cnugadas (Fn, 997) Iss sgnfca dzr qu, para dtrmnadas vrssmlhanças, xstm dstrbuçõs a prr qu cnduzm a pstrrs da msma famíla, tnd apnas s valrs ds hprparâmtrs atualzads N xmpl acma, cm a prr Gama é cnugada para vrssmlhanças Pssn, a dstrbuçã a pstrr também srá uma Gama, cm parâmtrs + x +, d nd: λ x! x! dλ π ( λ x + x ( ) λ ) + + λ x Γ( + x ) D pss da dstrbuçã a pstrr, há algumas manras usuas para s rprsntar a dstrbuçã futura da varávl d ntrss x: a) cm uma dstrbuçã f (x) cm parâmtr θ E[ λ x ] (a sprança a pstrr d θ x ); b) cm uma dstrbuçã f (x) cm parâmtr θ max[ λ x ] (a mda a pstrr d θ x ); c) pr m da Dstrbuçã Prdtva DP( x) π ( λ x ) P( x λ) dλ
A btnçã da Dstrbuçã Prdtva nvamnt nvlv ntgras cmplcadas dfícs d srm drtamnt calculadas Nvamnt, prém, us d classs d prrs cnugadas mutas vzs faclta ss trabalh Assm, n xmpl lustratv, ssas três dstrbuçõs sram: + x a) Dstrbuçã d Pssn cm méda λ E [ λ x ] + + x b) Dstrbuçã d Pssn cm méda λ max[ λ x ] + c) Dstrbuçã Prdtva: Bnmal Ngatva cm n + x p + D um md gral, s mdls xstnts na ltratura sã mas cmplxs qu s xmpls aqu aprsntads Os mdls tratvs d Sars (98 998), pr xmpl, utlzam uma rprsntaçã cm ds parâmtrs pr tm (frça fnsva frça dfnsva), s quas sã atualzads rcíprca smultanamnt Os mdls baysans d Suzu t al () Glcman (993) nvlvm, na frmulaçã da vrssmlhança, a nclusã d parâmtrs rlacnads à frça d(s) advrsár(s), a lcal d ralzaçã d g (fatr gar m casa ) tc O mdl d Glcmann, alás, nvlv até msm a passagm d tmp ( nvlhcmnt d tm) ntr s gs, assunt qu srá abrdad mas à frnt, ns cmntárs fnas 4 Estmaçã drta Uma últma catgra a sr abrdada é a daquls mdls qu xtram as prbabldads d vtóra, mpat drrta drtamnt a partr d statístcas dscrtvas ds tms m cnfrnt, sm nm squr frmular uma rprsntaçã paramétrca Em utras palavras, qu dfr sss mdls ds dmas é fat d utlzarm nã parâmtrs nduzds pr uma rprsntaçã prvamnt frmulada, mas ndcadrs xtrns, pré-xstnts usualmnt sm víncul cm a strutura prbablístca utlzada Exmpls d tas ndcadrs sã Ranng d slçõs nacnas da FIFA [3] ttas cumulatvs d pnts ganhs, vtóras, gls marcads tc pr cada tm n campnat m qustã u msm a lng da hstóra Embra ssa abrdagm prmta cntmplar, sm mars dfculdads, a nclusã d fatrs adcnas (cm pr xmpl fatr gar m casa ), cm frqüênca us d ndcadrs xtrns dsvnculads da strutura prbablístca acaba cmprmtnd a ssênca ds cálculs cnduznd a rsultads qu nã ncssaramnt rfltm a raldad Exmpl típc dssa abrdagm sra tmar R x R y (s pnts d ds tms, X Y, n ranng d slçõs da FIFA) frmular as prbabldads d vtóra d cada tm sgund a rprsntaçã d Bradly-Trry (aqu, para facldad d lustraçã, a pssbldad d mpat stá snd gnrada):
Rx P( vtóra d X ) R + R x y P( vtóra d Y ) R x R y + R y Exst nssa frmulaçã uma clara ncngruênca cnctual, qu pd lvar a rsultads mut puc cndznts cm a raldad técnca ds tms m qustã Iss suscta uma rflxã mut mprtant, mbra raramnt ftuada, qu vltará a sr abrdada na próxma sçã 3 Vrfcaçã d qualdad A qualdad prdtva d um mdl pd sr analsada sb duas vsõs dstntas Pd-s avalar mdl d frma flsófca cm bas m caractrístcas d sua frmulaçã u pd-s studá-l pr um vés mas numérc, cm bas n cnfrnt, para uma clçã d gs passads, ntr rsultads bsrvads prbabldads prvamnt calculadas A avalaçã flsófca pd sr ftuada drtamnt a partr da dscrçã tórca d mdl, msm ants d qualqur prbabldad sr calculada d qualqur g sr ncad Assm, pd-s rfrr a ssa avalaçã cm análs antrr A análs numérca pr utr lad, dpnd da xstênca d um hstórc d gs cus rsultads pssam sr cmparads cm as prbabldads antrrmnt anuncadas Evdntmnt, ss hstórc só pdrá sr frmad após cálcul das prbabldads a ralzaçã ds gs Pr ssa razã, ss stud pd sr rfrd cm análs pstrr 3 Análs antrr A análs antrr cnsst bascamnt numa vrfcaçã crítca da cnsstênca da fundamntaçã d mdl É uma rflxã qualtatva ( sm a cnstruçã d ndcadrs numércs) ds prquês d cada pass da cnstruçã d mdl É através dssa análs qu s pd vdncar falhas d cnct u d cnstruçã qu pdm cmprmtr aplcaçã d mdl, m últma nstânca, prduzr valrs rras para as prbabldads d ntrss Usualmnt, s mdls d stmaçã drta, abrdads na sçã 4, sã s qu mas cmtm quívcs dtctávs nssa análs Cm lustraçã d tas quívcs, pd-s ctar xmpl aprsntad naqula sçã, n qual s pnts d cada slçã n ranng da FIFA fram usads cm parâmtrs d uma rprsntaçã d Bradly-Trry Nssa rprsntaçã, as prbabldads d cada rsultad sã drtamnt prprcnas as valrs ds parâmtrs d cada tm: P(vtóra d X ) P(vtóra d Y ) π x π y ( π + π ) x x y ( π + π ) y π x π y Iss quvalra, naqul xmpl, a arbtrar qu as prbabldads d cada rsultad fssm drtamnt prprcnas as pnts d cada slçã n ranng da FIFA Prém, nã xst nada n prcss d cnstruçã dss ranng qu prmta afrmar qu uma
slçã qu tnha vzs a pntuaçã d utra sa vzs mlhr u tnha uma prbabldad d vtóra vzs mar qu a advrsára Outrs xmpls d ncnsstêncas dtctávs na análs antrr sã s mdls qu utlzam cm nfrmaçõs dads cm médas u ttas d gls marcads, gls sfrds, pnts ganhs tc, calculads slada ndpndntmnt para cada tm gnrand s advrsárs cntra s quas tas númrs fram btds Essa prátca pd lvar a grands dstrçõs, spcalmnt s ssas médas ttas frm btdas a partr d unvrss ( cnunts d advrsárs) substancalmnt dfrnts Cm xmpl cncrt, basta lmbrar das Elmnatóras para a Cpa d Mund d, quand a Austrála marcu 66 gls m 4 gs cntra slçõs smamadras da Ocana alcançu, a fnal d sua partcpaçã n trn, uma méda d 9,5 gls pr g (73 gls m 8 gs) Cm tdas as utras znas cntnntas ram tcncamnt mas nvladas qu a Ocana, nnhuma utra slçã d planta atngu tamanha quantdad d gls marcads, cnsqüntmnt, para um mdl qu s basass drtamnt nas médas d gls pr g nas Elmnatóras, a Austrála sra smpr dstacadamnt favrta à vtóra cntra qualqur slçã nacnal qu nfrntass Analgamnt as aspcts xplrads nsss xmpls, utras caractrístcas d mdl também pdm sr studadas xamnadas na análs antrr: a plausbldad das varávs xplcatvas sclhdas, tratamnt ddcad a tmp dcrrd ntr s gs passads (rspnsávs plas nfrmaçõs xstnts n banc d dads) g prsnt (cuas prbabldads s qur calcular), a razabldad d mdl prbablístc frmulad tc 3 Análs pstrr A análs pstrr, qu trata d cnfrnt ntr as prbabldads calculadas s rsultads ftvamnt bsrvads, pd sr fta bascamnt pr m d ds atrbuts, cada qual cm sua própra mdda d qualdad O prmr atrbut é a cnfabldad, cnct rlacnad a cmprtamnt ds gs quand bsrvads m cnunt Nss cntxt, as prbabldads sã tratadas cm valrs ndvduas (scalars) a Mdda d Cnfabldad pd sr dfnda m trms futblístcs cm: MC # VO p + # EOp + # DOp p p # VPp + # EPp + # DPp, nd: #VO P númr d vtóras (cm prbabldad p atrbuída) crrdas; #EO P númr d mpats (cm prbabldad p atrbuída) crrds; #DO P númr d drrtas (cm prbabldad p atrbuída) crrdas; #VP P númr d vtóras (cm prbabldad p atrbuída) prvstas; #EP P númr d mpats (cm prbabldad p atrbuída) prvsts; #DP P númr d drrtas (cm prbabldad p atrbuída) prvstas
Em utras palavras, a afrçã da cnfabldad cnsst m cmparar cada valr p cm a frqüênca bsrvada d rsultads cua prbabldad anuncada ra gual a p Na prátca, cm p é um númr ral qu pd assumr qualqur valr ntr, as prbabldads sã agrupadas m ntrvals ([ ;,], [,;,],, [,9 ;] ), pr xmpl) a cmparaçã é ralzada ntr pnt méd d cada ntrval a frqüênca bsrvada d rsultads cua prbabldad anuncada prtnca a ss ntrval, cnfrm s pd vsualzar n gráfc abax:,9,8,7,6,5,4,3,,,,,3,4,5,6,7,8,9 Nss gráfc, a dagnal azul (rta dntdad) rprsnta as prbabldads anuncadas (frqüêncas rlatvas spradas) a curva vrmlha crrspnd às frqüêncas ftvamnt bsrvadas m cada ntrval A Mdda d Cnfabldad quval, ntã, à dstânca ucldana quadrátca ntr ssas duas curvas Evdntmnt, quant mas próxmas as frqüêncas rlatvas bsrvadas stvrm das prbabldads anuncadas, mnr a dstânca ntr as curvas prtant mnr srá valr d MC Lg, a avalaçã d mdl sgund ss qust srá tã mlhr quant mnr fr valr a Mdda d Cnfabldad, cm a qualdad máxma (cnfabldad prfta) snd atngda quand MC, st é, quand as duas curvas frm cncdnts O sgund atrbut a sr avalad é a xatdã qu, m cntrast cm a cnfabldad, stá asscad a cmprtamnt ds gs quand analsads ndvdualmnt Nssa abrdagm, as prbabldads sã tratadas cm vtrs, a partr ds quas a Dstânca d DFntt (97) é assm dfnda: DDF ( PV ( PV ( PV ) ) ) + ( PE ) + ( PE ) + ( PE ) + ( PD ) + ( PD ) + ( PD ) s a qup mandant vncr g; s a qup mandant mpatar g; s a qup mandant prdr g; Cnfrm pd-s vr na lustraçã a sgur, ssa cnstruçã quval a cnsdrar um smplx cntd m R³ cm rprsntaçã gmétrca d cnunt das pssívs
prvsõs prbablístcas Nss smplx, s vértcs crrspndm às crrêncas ds rsultads ( (,,) para a vtóra d mandant, (,, ) para mpat (,, ) para a vtóra d vstant) s dmas pnts a tdas as utras pssívs prvsõs Assm, a mdda d Dstânca d DFntt crrspnd, gmtrcamnt, à dstânca ucldana quadrátca ntr pnt crrspndnt a vtr d prbabldads anuncadas vértc crrspndnt a rsultad ftvamnt bsrvad Para a análs d um cnunt d ds u mas gs, utlza-s a Mdda d DFntt, índc dad pla méda artmétca das dstâncas d DFntt calculadas para cada g ndvdual Smlhantmnt a qu crr cm a Mdda d Cnfabldad, quant mnrs frm as dstâncas ntr as prbabldads anuncadas s vértcs (rsultads anuncads), mnr srá valr d DDF, cnsqüntmnt, mdl srá tã mlhr avalad sb ss atrbut quant mnr fr a Mdda d DFntt Aqu, a qualdad máxma (xatdã prfta) srá atngda quand as prbabldads anuncadas smpr cncdrm cm s vértcs ftvamnt bsrvads ( quand as prbabldads frm guas a para rsultad qu d fat acntcr para s dmas rsultads), qu quval a MDF A avalaçã da qualdad d um mdl pr m da Mdda d DFntt pd nclur a cmparaçã d valr dssa mdda cm algum padrã d rfrênca Para mdls d prvsã d rsultads d futbl, um padrã cmumnt utlzad é a mdda btda pr um mdl qu, para qualqur g, atrbuíss prguçsamnt prbabldads guas a tds s rsultads pssívs ( PV PE PD 3 ) A Mdda d DFntt para mdl prguçs é gual a ( 3 ) + ( 3 ),6667, cnsqüntmnt, pdm sr cnsdrads mdls d qualdad mnmamnt actávl aquls qu aprsntarm Mddas d DFntt mnrs qu,6667 Cm ft, s um mdl tvr MDF mar qu,6667, ntã mas cnvnnt qu utlzá-l sra adrr a mdl prguçs Uma rlaçã ntr ssas duas mddas é xbda pr Murphy (97), qu stablc uma partçã da Mdda d DFntt m duas parclas, snd a prmra uma vrsã lgramnt mdfcada da Mdda da Cnfabldad a sgunda rlatva à rsluçã (rslutn) d mdl (grss md, uma mdda d dsprsã das frqüêncas rlatvas bsrvadas)
Além dssas duas mddas, um ndcadr mprtant a sr bsrvad é a taxa d funcnamnt d mdl, u sa, a prprçã d vzs m qu prcdmnt gra valrs actávs para s parâmtrs Tmand cm xmpl um mdl basad numa rprsntaçã paramétrca d Pssn, msm qu suas cnfabldad (MC) xatdã (MDF) sam xclnts, s as stmaçõs ds parâmtrs λ frqüntmnt prduzrm valrs ngatvs, d puca srvnta srá ss mdl Pr fm, cab alrtar para uma mdda frqüntmnt utlzada pr lgs qu na raldad cnsttu um grav quívc cnctual Trata-s da taxa d acrt, calculada cm a frqüênca cm qu crr rsultad (vtóra, mpat u drrta) a qual s hava atrbuíd mar prbabldad Em lnguagm lga, ssa taxa quval à vrfcaçã d quantas vzs mdl acrtu vncdr ds gs é nssa xprssã ( acrtar vncdr ) qu rsd quívc: qualqur vnt qu tm prbabldad p d acntcr, também tm prbabldad p d nã acntcr; lg, as duas pssbldads (acntcr nã acntcr) stã prvstas, pr cnsgunt, nã s pd rtular cm acrt u rr a crrênca d vnt d mar prbabldad O xmpl abax auda a prcbr cm, além d cnctualmnt ncrrta, ssa taxa d acrt também pd cnduzr a ulgamnts nadquads acrca da qualdad ds mdls Cnsdr-s ds mdls hptétcs qu tvssm prduzd as sgunts prbabldads para um g futur ntr as qups X Y: P(vtóra d X) P(mpat) P(vtóra d Y) Mdl I,9,6,4 Mdl II,35,33,3 Supnha-s também qu tm Y tnha vncd ss g Entã, s ds mdls tram rrad vncdr cnsqüntmnt tram taxa d acrt gual a zr Tdava, é fácl prcbr, numa análs mas atnta ds númrs, qu Mdl I, a tr atrbuíd um favrtsm mar a tm X, rru mas qu Mdl II, prtant, qu índcs cm as Mddas d Calbraçã d DFntt mnsuraram as qualdads ds mdls cm mut mas fddgndad d qu a smpls taxa d acrt 4 Estud d Cas Cm xmpl d aplcaçã d tud qu f aprsntad nas sçõs antrrs, srá analsada uma vrsã smplfcada d mdl dsnvlvd pr Arruda () aplcad n st Chanc d Gl [4] Ess mdl s basa num par d Dstrbuçõs d Pssn cm rprsntaçã paramétrca para númr G d gls marcads pr cada qup Assm, num cnfrnt ntr s tms, as varávs G G têm dstrbuçõs d prbabldads: P( G λ λ g) g! g P( G λ g λ g) g! A stmaçã ds valrs ds parâmtrs λ λ s basa ssncalmnt m duas bsrvaçõs acrca d rsultad d um g: a dfrnça ntr s gls marcads pls ds tms m cnfrnt (varávl ndcatva d quã um tm é mlhr qu utr) a sma
ds gls marcads pls tms m cada g (varávl ndcatva d pdr fnsv dssas duas qups) Analtcamnt, ss sgnfca uma frmulaçã basada m duas varávs alatóras, S E G + G ] D E G G ], a partr das quas pdm sr faclmnt btdas as [ spranças ds scrs G [ G d cada tm: E[ G + G E[ G ] E[ G + G E[ G ] ] + E[ G ] E[ G G G ] S ] S + D D Dada uma clçã d rsultads d gs passads, s valrs stmads pr m d duas quaçõs d rgrssã lnar múltpla: S X D Y + X + Y + K+ N X N + ε + K+ Y + ε N N S D sã nd: S é a sma ds gls marcads pls tms n -ésm g, s - ésm tm partcpu d - ésm g X, s - ésm tm nã partcpu d - ésm g D é a dfrnça d gls marcads a favr d tm mandant n -ésm g, s - ésm tm partcpu cm "mandant" d - ésm g Y s - ésm tm partcpu cm " vstant" d - ésm g s - ésm tm nã partcpu d - ésm g, K,,,,, sã (hpr)parâmtrs cus valrs s dsa stmar, N K N Aqu, s trms mandant vstant dntfcam rspctvamnt prmr sgund nm ctads n rsultad d cnfrnt (, na rprsntaçã usual, s nms qu aparcm à squrda à drta d snal x ), ndpndntmnt d xstr u nã um tm mandant d fat (gand m sua própra casa u dtnd algum utr tp d vantagm smlar) Cm lustraçã d funcnamnt dss mdl, cnsdr-s um trn quadrangular hptétc qu tnha aprsntad s sgunts rsultads: Jg - Tm A x3 Tm B Jg - Tm C 5x Tm D Jg 3 - Tm A 4x Tm C Jg 4 - Tm B x Tm D Jg 5 - Tm A x Tm D O btv, ntã, é calcular as prbabldads para Jg 6 - Tm B x Tm C
Nss cas, tr-s-a: 4 6 5 S, X, para a prmra rgrssã 4 4 D Y, para a sgunda rgrssã Para uma mlhr vsualzaçã d cnct dss mdl, pd-s pnsar na prmra rgrssã cm a sluçã d sstma d quaçõs + + + + + 4 6 5 D Tm A Tm D Tm B Tm Tm C A Tm D Tm Tm C B Tm A Tm na sgunda rgrssã cm a sluçã d sstma 4 4 D Tm A Tm D Tm B Tm Tm C A Tm D Tm Tm C B Tm A Tm Cm sss sstmas nrmalmnt pssum mas quaçõs (gs) d qu varávs (tms), dfclmnt havrá uma sluçã xata É ssa a razã da utlzaçã d mdls lnars (mdls d rgrssã) para a busca ds valrs ( s s) qu mas s aprxmam d slucnar s sstmas Assm, s valrs ds parâmtrs N,,, K N,,, K sã, ftvamnt, stmads pr m da mnmzaçã ds rrs quadrátcs + + + )] ( [ N N X X X S ε K + + + )] ( [ N N Y Y Y D ε K
Uma vz btds s stmadrs d mínms quadrads ˆ ˆ N, ˆ,, ˆ, ˆ, K, ˆ, K N, pd-s calcular, para qualqur g futur cuas prbabldads s qura btr, as spranças E ˆ[ G + G ] Eˆ[ G G ], pr cnsgunt, s parâmtrs ˆ λ Eˆ[ G ] ˆ λ Eˆ[ ] das dstrbuçõs d Pssn asscadas as tms partcpants dss g G futur Vltand a campnat hptétc cnclund s cálculs dst xmpl, s stmadrs d mínms quadrads para s (hpr)parâmtrs sã ˆ ˆ ˆ ˆ Tm A Tm B Tm C Tm D,5,5 4,75 ˆ ˆ ˆ ˆ Tm A Tm B Tm C Tm D,5,5,875 D pss dsss stmadrs supnd qu próxm g (cuas prbabldads s qur calcular) sa Tm B x Tm C, pd-s ntã calcular as spranças stmadas E ˆ [ G + ] (,5 ) + (,5 ) + (4 ) + (,75 ) B G C 6,5 E ˆ [ G ] (,5 ) + ( ) + (,5 ( )) + (,875 ) B G,5, as spranças margnas stmadas C ˆ Eˆ[ GB + GC ] + Eˆ[ GB GC ] 6,5 +,5 λ B Eˆ[ GB ] 3,5 ˆ Eˆ[ GB + GC ] Eˆ[ GB GC ] 6,5,5 λ C Eˆ[ GC ] 3 Pr fm, as prbabldads d cada tm marcar uma dada quantdad d gls n próxm g sã: P( G B b) 3,5 (3,5) b! b P( G C 3 3 c) c! c A btnçã das prbabldads P(vtóra d B), P(mpat) P(vtóra d C), cntud, nã é smpls drta, uma vz qu nã xst uma fórmula fchada para tas valrs Ds artfícs sã mas usualmnt mprgads para a btnçã d aprxmaçõs satsfatóras dsss valrs:
a) Dstrbuçã d Sllam (946): S G B G C sã varávs ndpndnts cm dstrbuçõs d Pssn cm médas λ B λ C, ntã a dfrnça GB GC sgu uma dstrbuçã d Sllam dada pr: P d / ( λb + λc ) λb ( GB GC d) I d λ C nd I d é a funçã d Bssl mdfcada d rdm d ( λ λ ) Nã xst uma fórmula fchada para a sma dssas prbabldads para tds valrs pstvs u tds s valrs ngatvs d d Prém, sclhr cudadsamnt um valr d N (qu nã prcsa sr mut grand) aprxmar as prbabldads d vtóra d cada tm plas smas B C, ( ˆ λb C ) d / ˆ + ˆ ˆ ( λ B λc ) λb I ˆ ˆ d λc P( vtóra d B) λ d N d / ˆ + ˆ ˆ ( λ ) (vtóra d ) B λc λb P C I ( ˆ ˆ d λbλc ) d N ˆ λc nquant a prbabldad d mpat pd sr calculada d frma xata: P ( ˆ λ B + ˆ λ ( mpat) C ) I ( ˆ λ ˆ BλC ) b) Rtângul truncad: uma altrnatva mas smpls (pr nã xgr cálculs d funçõs d Bssl) cnsst m lmtar a análs às prbabldads stuadas dntr d rtângul cm vértcs (,), (,N), (N,) (N,N): P ( G B, GC ) P ( G B, GC ) K P ( GB N, GC ) P ( G B, GC ) P ( G B, GC ) K P ( GB N, GC ) M M O M P( G, G N) P( G, G N) K P( G N, G N) B C B C Pr argumnt análg a utlzad para a Dstrbuçã d Sllam, é pssívl sclhr um valr N (rlatvamnt bax) aprxmar as prbabldads d mpat, d vtóra d Tm B d vtóra d Tm C, rspctvamnt plas smas ds valrs da dagnal (dstacada m cnza), d trângul suprr d trângul nfrr Assm, vltand a campnat hptétc as prbabldads d cada rsultad pssívl d próxm g (aprxmadas pla Dstrbuçã d Sllam truncada a ntrval [-, ]) sã guas a:, P(vtóra d B),498 P(mpat),57 P(vtóra d C),345
Pr fm, rflx dssas prbabldads nas mddas d qualdad d mdl srá: ) Cntrbuçã para a Mdda d Cnfabldad: * sma d a dnmnadr da parcla rfrnt a ntrval [,4 ;,5]; * sma d a rspctv numradr s Tm B vncr g m cas cntrár; * sma d a dnmnadr da parcla rfrnt a ntrval [, ;,]; * sma d a rspctv numradr s g acabar mpatad m cas cntrár; * sma d a dnmnadr da parcla rfrnt a ntrval [,3 ;,4]; * sma d a rspctv numradr s Tm B prdr g m cas cntrár ) Mdda d DFntt: * DDF (,498 ) + (,57 ) + (,345 ), 396 s Tm B vncr g; * DDF (,498 ) + (,57 ) + (,345 ), 78 s g acabar mpatad; * DDF (,498 ) + (,57 ) + (,345 ), 7 s Tm B prdr g 5 Cmntárs Fnas 5 Ranngs paramétrcs Mdls qu sam mnmamnt cnsstnts (d acrd, pr xmpl, cm s crtérs da análs antrr dscrta na sçã 3) prmtm, além das prbabldads para s gs futurs, a frmaçã d ranngs paramétrcs ds tms d um dad unvrs u cmptçã Tmand-s cm xmpl mdl d Bradly-Trry, é vdnt qu π > π π π > π + π π + π P( drrtar ) > P( drrtar ) é mlhr qu, cnsqüntmnt, qu pd-s stablcr um ranng técnc ds tms m funçã d sus parâmtrs π Smlhantmnt, para mdl d st Chanc d Gl, é fácl prcbr qu > E[ G G ] > P( G E[ G ] > E[ G ] > G ) > P( G < G ) é mlhr qu, pr cnsgunt, qu s tms pdm sr tcncamnt rdnads cm bas m sus parâmtrs
Para utrs mdls mnmamnt razávs, é gualmnt pssívl dntfcar parâmtrs a partr d cus valrs s pssa ranquar s tms Dcrr das partculardads d cada mdl, prém, qu ranng ds tms d um dad unvrs pd varar cnfrm mdl sclhd Em alguns cass, nclusv, tal varaçã pd até parcr cntradtóra u ant-ntutva, cm s pd vr na sçã a sgur 5 Rsultads vrsus placars Mdls basads m rsultads (vtóra, mpat u drrta) mdls basads m placars (x, x, x tc) tndm a nxrgar as rlaçõs técncas ntr dfrnts tms d frmas dstntas, vntualmnt valrzand aspcts cntrastants das nfrmaçõs hstórcas xstnts Pr um lad, mdls basads m placars, a dscrnrm ntr vtóras pr x pr 8x prmtm uma sntna fna na stmaçã das frças d tms qu tnham vncd (u prdd para) um msm advrsár Pr utr lad, cntud, mdls basads m rsultads parcm s aprxmar mas d btv prncpal d um g (spcalmnt quand dntr d um campnat), qu é a vtóra: x 8x valm s msms três pnts, sb ss pnt d vsta, a dfrnça ntr um mpat uma vtóra magra é mut mnr qu a dfrnça ntr uma vtóra magra uma glada Para mlhr lustraçã dss fnômn, cnsdr-s s xmpls abax: Exmpl (mlhr d cnc gs ntr ds tms): Tm M x Tm N Tm M x Tm N Tm M x Tm N Tm M x Tm N Tm N 7x Tm M Exmpl (campnat ntr ss tms gand tds cntra tds): Tm X x Tm W Tm Y 8x Tm W Tm X x Tm V Tm Y 8x Tm V Tm X x Tm U Tm Y 8x Tm U Tm X x Tm T Tm Y 8x Tm T Tm X x Tm S Tm Y 8x Tm S Tm X x Tm Y N prmr xmpl, um mdl basad m rsultads bsrvará qu Tm M smu quatr vtóras cntra apnas uma d Tm N cnsqüntmnt cnsdrará Tm M cm mlhr ( mas bm ranquad favrt à vtóra num hptétc cnfrnt futur) qu su advrsár, nquant um mdl basad m placars tndrá a rssaltar placar ttal (Tm N 7x4 Tm M) a lgr Tm N cm mlhr qu su cncrrnt
Analgamnt, n sgund xmpl um mdl basad m rsultads prcbrá qu Tm X vncu tds s sus gs qu Tm Y tv uma drrta (ustamnt cntra Tm X) apntará Tm X cm mlhr qu su pnnt Um mdl basad m placars, pr utr lad, tndrá a valrzar as ntnsdads das vtóras d Tm Y cnsqüntmnt a dntfcá-l cm mlhr qu su rval Ess cntrast pd susctar dvrss dbats flsófcs (até msm ntr dfnsrs d futbl pragmátc adpts d g fnsv ) prvavlmnt sra mut bmvnda uma abrdagm ntrmdára qu pssa valrzar a dfrnça ntr um mpat uma vtóra, a msm tmp, dstngur as vtóras pr margns dstntas d gls 53 Áras d stud Muta csa anda há a sr studada n camp das prvsõs aplcadas a gs d futbl um ds tmas m abrt é ustamnt a busca d um mdl ntrmdár qu pssa cnclar a mprtânca d rsultad cm a dmnsã d placar Outra ára m qu s pd nvstr é a frmulaçã d mdls qu d alguma frma lvm m cnsdraçã as ndvdualdads (gadrs) qu ntgram um tm, prmtnd qu fatrs cm dsfalqus rfrçs pssam sr nsrds n cálcul das prbabldads Pr fm, um tópc mas dsafadr anda puc xplrad é a busca d mdls qu prmtam cnfccnar ranngs hstórcs d frma a cmparar tms qu atuaram m épcas dfrnts Brry t al (999) labraram um mdl para cmptçõs ndvduas, mas a sua xpansã a cmptçõs ntr qups stá lng d sr mdata 6 Rfrêncas Bblgráfcas 6 Lvrs pródcs ARRUDA, Marcl L () Pssn, Bays, Futbl DFntt, Sã Paul, IME-USP (Dssrtaçã d Mstrad) BERRY, Sctt M, REESE, C Shan, LARKEY, Patrc D (999) Brdgng Dffrnt Eras n Sprts Jurnal f th Amrcan Statstcal Asscatn 447 (94), 66-676 BRADLEY, Ralph A TERRY, Mltn E (95) Th ran analyss f ncmplt blc dsgns Bmtra 39, 34-345 DFINETTI, Brun (97), Prbablty, Inductn and Statstcs, Lndn: Jhn Wly DRAPER, Nrman R SMITH, Harry (998), Appld Rgrssn Analyss, Lndn: Jhn Wly ELO, Arpad E (978) Th ratng f chss playrs, past and prsnt Arc Publshng, Nw Yr
FINK, Danl (997), A Cmpndum f Cnugat Prrs Tchncal Rprt: Mntana Stat Unvrsty GLICKMAN, Mar E (993) Pard Cmparsn Mdls wth Tm-Varyng Paramtrs Cambrdg: Harvard Unvrsty, Dpartmnt f Statstcs (Ts d Dutrad) GUMBEL, Eml J (96) Smms t dfférncs d valurs xtrms ndépndants Cmpts Rndus Acadmc d Scncs 53: 838-839 HOLGATE, Phlp (964), Estmatn fr th Bvarat Pssn Dstrbutn, Bmtra 5, 4-45 LEE, Alan J (997), Mdlng Scrs n th Prmr Lagu: Is Manchstr Untd Rally th Bst?, Chanc (), 5-9 McCULLAGH, Ptr NELDER, Jhn A (989), Gnralzd Lnar Mdls, Nw Yr: Chapman and Hall MURPHY, Allan H (97), Scalar and Vctr Parttns f th Prbablty Scr: Part I: Tw-Stat Stuatn, Jurnal f Appld Mtrlgy, 73-8 O HAGAN, Anthny (994), Kndall s Advancd Thry f Statstcs, Vl B: Baysan Infrnc, Lndn: Edward Arnld Halstd Prss SKELLAM, Jhn G (946) Th frquncy dstrbutn f th dffrnc btwn tw Pssn varats blngng t dffrnt ppulatns JRSS A 9, 96 SOARES, Jsé F (98), Chancs d vtóra m uma partda d futbl, Atas d Snap, 95-98 SOARES, Jsé F (998), Wnnng Odds n a Sccr Match, Dpartamnt d Estatístca, UFMG SUZUKI, Adran K, SALASAR, Luís E B, LEITE, Jsé G LOUZADA-NETO, Francsc (), Prdctng Ftball Wrld Cup va a baysan apprach, Dpartamnt d Estatístca, Unvrsdad Fdral d Sã Carls 6 Sts [] FIDE Chss Ratngs (http://ratngsfdcm/) [] Wrld Ftball El Ratngs (http://wwwlratngsnt/) [3] FIFA/Cca-Cla Wrld Ranng (http://wwwffacm/wrldranng/ndxhtml) [4] Chanc d Gl (http://wwwchancdglcmbr)