Um modelo estatístico para campeonatos de Futebol Zwinglio Guimarães IFUSP Tratamento Estatístico de dados em Física Experimental - 2016
Sumário Apresentar um modelo para jogos de Futebol Incerteza dos jogos Vantagem de ser o mandante Caracterizar campeonatos Extrapolação (Basquete) Simulações Monte-Carlo Avaliar a resolução dos campeonatos Comparar diferentes sistemas de disputa Conclusões
A arte do Futebol Alguns conceitos empíricos: Os resultados dos jogos são imprevisíveis Futebol é uma caixinha de surpresas O jogo se define é no campo O mandante tem maior chance de ganhar Empatar fora de casa é um bom resultado No campeonato Brasileiro os times são mais equilibrados do que nos regionais No Brasileirão não tem jogo fácil
O jogo como uma medição Time A G A x G B Time B Resultado da partida: R = G A - G B Interpretação estatística: R Onde ε é um erro aleatório e Δ é o valor médio esperado para o resultado da partida (relacionado aos times A e B).
Resultados de jogos Interpretação estatística: R pdf(ε)? Δ?
Modelo I p/ copas do mundo Δ é a diferença entre as qualidades efetivas de A e B Δ = Q A - Q B R Q Q A B Ajuste pelo Método dos Mínimos Quadrados permite estimar: A qualidade efetiva de cada time, Q A incerteza, σ, no resultado R de cada jogo As características dos erros, ε, pela análise de resíduos
Ajuste pelo MMQ Modelo para o resultado dos jogos: R 1 = Q A Q B R 2 = Q C Q D R N = Q A Q D Na forma matricial: Y = X A Y = X = Onde: R 1 R 2 R N A = Q A Q B Q C Q D 1 1 0 0 0 0 1 1 1 0 0 1
Ajuste de funções lineares nos parâmetros pelo MMQ (revisão) Escrevendo a função modelo como: G(x) = a 1 g 1 x + a 2 g 2 x + + a M g M (x) O sistema linear de equações do MMQ pode ser escrito de forma matricial: D l = i=1 D = M A N yi g l (x i ) 2 M l,c = σ i N gl (x i )g c (x i ) i=1 σ i 2 cuja solução é: A = a 1 a 2 = (M 1 )D com V A = M 1 a M
Ajuste pelo MMQ - II O modelo para o resultado dos jogos na forma matricial: Com: Y = Y = X A R 1 R 2 R N A = Q A Q B Q C Q D Implica que a matriz X é: X = g 1 g 2 g 3 g 4 X = 1 1 0 0 0 0 1 1 1 0 0 1 Possibilitando escrever M e D e determinar A pelo MMQ.
Exemplo de resultados (Q) 02
Exemplo de resultados (ε) 02 Desvio-padrão, σ ε = 1,3(2) Curtose, K ε = 4,0 (14)
Quantificando o ε COPAS
Mais sobre o ε COPAS (58 a 06) Desvio-padrão, σ ε = 1,53(6) Curtose, K ε = 3,5 (4)
Campeonatos Nacionais: BR Distribuição assimétrica: Mandante tem vantagem. Novo modelo para Δ: Q A Q B M
Efeito do mando de jogo BR Sem considerar o mando: Q A Q B σ ε = 1,58 (2) K ε = 3,5 (2) Considerando o efeito do mando: Q A Q B M
Quantificadores de ε - BR σ ε = 1.58 (2) K ε = 3.5 (2)
Qualidades dos times no BR σ Q = 0,47 (8) M = 0,58 (8) σ Q = 0,42 (8) M = 0,47 (8) σ Q = 0,32 (7) M = 0,47 (7)
Caracterização do Brasileirão
Caracterização de campeonatos
ε em diversos campeonatos σ ε ~ 1,55 K ε ~ 3,4
K ε ~ 3.4 e as probabilidades A x B com Q A Q B = 0,45 M = 0,5 B x A
ALGUMAS APLICAÇÕES
Dúvidas Históricas Final da copa 98 França 3 x 0 Brasil Δ = 0,2 (1,5) copa 1978 Argentina 6 x 0 Peru Δ = 0,7 (1,1)
Mudança de Q devida ao técnico
EXTRAPOLAÇÃO PARA CAMPEONATOS DE BASQUETE
Extrapolação: ε no Basquete σ ε ~ 11 K ε ~ 3,4
Extrapolação - Campeonatos
Futebol x Basquete
Assimetrias e Curtoses
SIMULAÇÕES MONTE CARLO PARA AVALIAR SISTEMAS DE DISPUTA
Simulações Monte Carlo Interpretação estatística: R Características do ε:
Simulações Monte Carlo Interpretação estatística: R Características do ε: σ ε ~ 1,55 K ε ~ 3,4 Modelo para Δ: Q A Q B M Simular os resultados (Saldo de gols) das partidas de um campeonato e determinar a classificação obtida segundo os critérios do campeonato. As qualidades efetivas e os fatores de mando são definidos com base nos valores típicos dos campeonatos do tipo escolhido.
Simulações Monte Carlo Interpretação estatística: R Características do ε: σ ε ~ 1,55 K ε ~ 3,4 Modelo para Δ: Q A Q B M Simular os resultados (Saldo de gols) das partidas de um campeonato e determinar a classificação obtida segundo os critérios do campeonato. As qualidades efetivas e os fatores de mando são definidos com base nos valores típicos dos campeonatos do tipo escolhido.
Exemplo Monte Carlo BR Características do Campeonato Brasileiro: σ Q = 0,45 M = 0,50 20 times, pontos corridos 2 turnos
BR (pts corridos 2 turnos, 20 times)
Paulistão (com semifinais, 20 times)
copa do BR (mata-mata, 64 times)
Comparação Sistemas Características comuns: σ ε = 1,55 K ε = 3,4 σ Q = 0,45 M = 0,50 32 times
Comparação de sistemas c/ 16 times
Discussão A modelagem proposta permitiu: Quantificar alguns conceitos intuitivos: Imprevisibilidade (σ ε ~ 1,55 é maior que o Δ típico) Vantagem de ser o mandante (M ~ 0,4 em camp. por pontuação) Equilíbrio dos campeonatos (σ Q ~ 0,5 em camp. nacionais) Identificar semelhanças entre o Futebol e Basquete Características dos campeonatos (Imprevisibilidade, vantagem do mandante e equilíbrio dos times) Caracterizar campeonatos e avaliar sistemas de disputa O melhor time é o campeão em apenas ~50% das vezes Grande dificuldade para definir os 4 melhores (e os 4 piores) Segunda fase eliminatória não ajuda a identificar o melhor time
Conclusões Propriedades gerais do Futebol e do Basquete foram obtidos com uma modelagem simples Quantificação possibilita outras investigações: Origem da vantagem de ser o mandante Evolução temporal da Qualidade efetiva Causas das incertezas dos jogos Relação entre qualidade efetiva e índices técnicos Avaliar resultados polêmicos / dúvidas históricas Futebol e Basquete são caixinhas de incertezas
Previsões (modelo intuitivo) Desvio-padrão médio: 0,82 (7)
Comparação Bolão x Copas BOLÃO: σ ε = 0,82 (7) K ε = 3,7 (6) COPAS (58 a 06): σ ε = 1,53 (6) K ε = 3,5 (4)
Ajuste pelo MMQ N D A N D C B A Q Q R Q Q R Q Q R 2 2 1 1 Da tabela de jogos: A Y X Na forma matricial: 1 0 0 1 1 1 0 0 0 0 1 1 X R N R R Y 2 1 D C B A Q Q Q Q A Onde:
O ajuste pelo MMQ - II A Y X Y A T A 1 ~ ~ V X V 1 1 ~ X V X V T A Solução só depende de Y, X e V ε : 1 0 0 1 1 1 0 0 0 0 1 1 X R N R R Y 2 1 D C B A Q Q Q Q A ~ ~ ~ ~ ~ I N V 2