O Benfica venceu o Borussia Dortmund por 1-0 em fevereiro do ano passado, com um golo de Mitroglou. Rui Vitória elogiou a forma como o SLB controlou o ataque alemão. Na realidade, simplesmente teve bastante sorte. O “normal” naquele jogo teria sido os alemães marcarem três golos (um deles de penálti) e o Benfica ficar a zeros. Não é conversa de café, é análise estatística. Na segunda mão, o pêndulo balançou para o outro lado. Perante as oportunidades criadas, o normal seria o Borussia marcar dois golos e o Benfica nenhum. O jogo acabou 4-0 para os alemães e o SLB foi eliminado.
O exemplo foi dado num texto do goalpoint.pt, um site de estatística desportiva, que nos mostra a utilidade de um sistema métrico relativamente recente, chamado expected goals (golos esperados), que expressa o número provável de golos num jogo, tendo por base as oportunidades criadas. Além disso, analisa várias características do remate: a distância da baliza, o ângulo, se é feito com a cabeça ou o pé, que tipo de passe o antecede, em que jogada se enquadra (contra-ataque, bola parada), se é um ressalto e se surge depois de fintar o adversário. É um indicador avançado cada vez mais popular, sendo ao mesmo tempo intuitivo para os adeptos. Naquele caso, ele dizia muito mais sobre o jogo do que o resultado. Este é um dos avanços que a análise de dados tem permitido no entendimento do que se passa dentro das quatro linhas. O movimento que já varreu o basebol e o basquetebol começa, aos poucos, a chegar ao futebol. Conseguiremos explicar o jogo com a matemática?
“O jogo de futebol é um fenómeno de grande complexidade que atrai muita atenção na academia. Atualmente, o uso de tecnologias avançadas, que capturam todo o tipo de dados com elevada facilidade e precisão, tem permitido construir enormes bases de dados sobre o processo de treino e de competição”, explica à EXAME Jaime Sampaio, diretor do Centro de Investigação em Desporto, Saúde e Desenvolvimento Humano, da Universidade de Trás-os-Montes e Alto Douro.
O desenvolvimento da área de analytics e da tecnologia – há câmaras capazes de captar movimentos dos jogadores a cada 0,1 segundo – coincide com o engordar do negócio do futebol que torna cada golo mais valioso. Em nenhuma liga isso é mais claro do que em Inglaterra, onde grupos estrangeiros têm injetado dinheiro e imposto um estilo de gestão com raízes no mundo financeiro, preferindo números ao feeling na altura de tomar decisões. Hoje, a informação espalha-se como um vírus, mesmo fora dos protegidos laboratórios dos grandes clubes (Porto, Sporting e Benfica não quiseram contribuir para este artigo). Basta acompanhar uma transmissão televisiva. Há cada vez mais estatísticas sobre áreas de ação ou de percentagem de passes bem-sucedidos. O problema é que nem sempre é clara a sua utilidade. De que nos serve saber que William Carvalho acerta 90% dos passes curtos e 69% dos longos, sem mais informação sobre o grau de dificuldade e a utilidade dos mesmos?
“Nem sempre os indicadores apresentados refletem o nível de jogo da equipa. A distância percorrida, um indicador que é normalmente apresentado ao intervalo ou quando um jogador é substituído, não tem uma relação direta com o rendimento do jogador. Não é por um jogador correr mais que vai jogar melhor ou ter um melhor rendimento na equipa”, aponta Hugo Folgado, professor da Universidade de Évora.
O futebol tem dificuldades acrescidas face a outros desportos, como o basebol ou o basquetebol. É mais fluido, menos binário entre ataque/defesa e produz menos observações. LeBron James já fez mais de 1 500 lançamentos nesta época. Nesta temporada, Jonas rematou 133 vezes nos jogos da Liga portuguesa e mais nenhum jogador chegou aos cem. Num jogo de futebol, uma escorregadela do guarda-redes facilmente determina o vencedor; num jogo de basquetebol, um erro vale, no máximo, três pontos, numa partida que normalmente ultrapassa os cem. Luís Cristóvão, comentador da Eurosport e cronista do goalpoint.pt, alerta que, “estando a falar de uma modalidade que não tem, concretamente, uma ligação entre a tendência do jogo e o seu resultado final (devido a um número muito baixo de golos/pontos), devemos sempre olhar para vários dados ao mesmo tempo se quisermos ter essa ideia aproximada do que aconteceu”.
Não sendo aleatório, o futebol é mais imprevisível. Precisamente por isso, qualquer vantagem é preciosa. Talvez o adepto comum não se dê conta, mas o desporto vive uma verdadeira corrida às armas na busca por analistas e novas ferramentas de análise. Na Premier League, onde o fluxo de dinheiro não para de crescer – mais de cinco mil milhões de euros de receita nesta época –, essa tendência é clara. Praticamente todos os clubes usam Prozone (um serviço de análise de dados, como a Opta ou a StatDNA). Os departamentos de análise estatística nascem como cogumelos e têm cada vez mais influência.
“Os clubes de alto nível perceberam que o processo de análise do rendimento é vital para ajudar a controlar as cargas de treino e otimizar o rendimento, ajudando também a prevenir lesões”, refere Jaime Sampaio. “A exigência de recolha, processamento e visualização de dados é enorme [e] já dispõem de laboratórios próprios e muitos técnicos especializados, porque os calendários competitivos são intensos e requerem que se faça tudo no menor tempo possível.”
Em Portugal, o avanço tem sido mais lento. A maioria tem dados, mas nem todos têm departamentos profissionais que consigam analisar essa informação. Do outro lado do canal da Mancha, curiosamente, uma das equipas que mais avanços fizeram é liderada pelo treinador que há mais tempo está no cargo. O Arsenal, de Arsène Wenger, comprou a StatDNA por quase três milhões de euros em 2012. O New York Times escreveu que a empresa tentou convencer a direção do Arsenal a comprar Gonzalo Higuaín, antes da sua ida para o Nápoles, que acabaria por vendê-lo por 85 milhões à Juventus.
“Alguns sistemas métricos podem ajudar a identificar bons jogadores antes do tempo. Harry Kane está a fazer bem mais do que muitos esperavam; mal ele começou a jogar na Premier League, o seu volume de remates passou a bom, bem como os seus expected goals. Alguns acharam que poderia estar a atravessar um bom momento e que iria ‘arrefecer’, mas de acordo com os números ele era muito bom desde o primeiro dia”, recorda James Yorke, analista do site StatsBomb. Claro que o método não é infalível. Quando Wenger quis contratar um jovem ala da Real Sociedad, os números desencorajaram a aquisição. Era Antoine Griezmann, hoje estrela do Atlético de Madrid (marcou dois golos na recente final da Liga Europa que a sua equipa venceu) e da seleção nacional francesa.
Conclusões perigosas
Para encontrar as raízes da análise estatística do futebol, é necessário recuar até aos anos 50 e folhear o caderno de notas de um tenente-coronel da Força Aérea britânica. Charles Reep era contabilista da Royal Air Force e decidiu registar todos os lances dos jogos a que assistia. O seu estudo, publicado em 1968, foi a primeira tentativa de identificar padrões na forma como as equipas jogavam. Descobriu que estas marcam golos a cada nove remates; que a probabilidade de fazer um passe com sucesso é 50/50, mas que diminui a cada um bem-sucedido; e que 30% das bolas recuperadas no último terço do terreno geram uma oportunidade de golo.
No entanto, provavelmente, a sua conclusão mais famosa é também a mais infame. Ele notou que 80% dos golos nasciam de jogadas com menos de quatro passes, o que significava que as equipas tinham a ganhar com um estilo de jogo mais direto, com bolas longas. A ideia serviu de sustentação teórica para um estilo de jogo baseado nos passes longos, o que se tornou a marca de água do futebol inglês, sob a designação de “Kick and Rush”. “Se uma equipa tentar não fazer mais de três passes terá muito mais hipóteses de ganhar. Passe, por passe, isso pode ser desastroso”, dizia Reep, numa entrevista dada em 1993.
O Barcelona de Guardiola teria uma ou outra coisa a dizer sobre isto. É que Reep não percebeu que a maioria dos golos nascia dessas situações, porque elas compõem a maior parte do jogo. Isso não quer dizer que seja mais provável marcar dessa forma. Aliás, hoje sabemos que quanto mais tempo uma equipa tem a bola, mais probabilidades tem de ganhar.
Simon Wilson, diretor de desempenho estratégico do Manchester City – outro dos clubes na vanguarda –, explicou à Wired que o clube dá especial atenção a alguns momentos do jogo, como passes que atravessam a linha de médios do adversário (se for dos defesas, ainda melhor) e o que acontece nos 20 segundos depois de a equipa perder a bola. Conseguir manter a posse de bola no último terço é uma das principais diferenças entre equipas boas e medianas, e o City procura contratar jogadores que sejam muito bons a trocar a bola nessa zona do terreno.
O que já sabemos?
Charles Reep podia demorar 80 horas a examinar um jogo. Hoje, é tudo mais rápido e mais aprofundado. Os movimentos de ataque já nos dão muitas pistas de análise. “Os sistemas métricos de remates, nomeadamente os expected goals, tendem a ser melhores a prever o desempenho futuro das equipas do que os golos em si mesmos. Existe um contributo significativo da sorte nos resultados de curto prazo no futebol, o que significa que esse sistema métrico nos permite entender se o processo está em linha com os resultados e se devemos esperar que se aproxime das expectativas no futuro”, sublinha Yorke. “Se a sua equipa está a criar imensas oportunidades de golo e não permite muitas, provavelmente não se deve preocupar com resultados medíocres a curto prazo. A longo prazo, provavelmente vai ganhar mais jogos do que perder.”
Os lances de bola parada estão especialmente descodificados. Se é daqueles que gritam para a televisão sempre que a sua equipa marca cantos com um cruzamento a curvar para fora (a bola vai-se afastando da baliza), tem alguma razão. Cantos marcados “para dentro” têm mais probabilidades de resultarem em golo. Por outro lado, o desempenho defensivo é ainda muito difícil de quantificar, uma vez que não fazer nada pode ser ótimo sinal. Cortes de carrinho espetaculares são muito aplaudidos, mas os melhores defesas não têm de fazê-los. “Se tiver de efetuar um corte, é porque eu já cometi um erro”, dizia Paolo Maldini. A falta de informação é ainda mais relevante se tivermos em conta que não sofrer golos está mais correlacionado com a vitória do que marcar. Daí que os analistas estejam a concentrar-se menos em intervenções individuais e mais no movimento coletivo dos jogadores. “É possível identificar que as equipas de sucesso apresentam elevada velocidade de expansão/contração, elevada sincronização entre movimentos dos defesas e elevada imprevisibilidade dos atacantes”, afirma Jaime Sampaio. “De igual forma, é possível associar o insucesso às equipas com menor variabilidade nas respostas aos problemas do jogo, quer seja a utilizar quase sempre os mesmos movimentos ou as mesmas sequências de passe.”
O apetite por esta informação existe – dos donos dos clubes que pretendem saber que estratégias são mais eficazes aos jornalistas que querem explicar aos adeptos o que aconteceu naqueles 90 minutos. “Com a utilização da estatística em jogos de computador, temos hoje uma geração de adeptos e de jogadores muito interessada no fenómeno e muito aberta à explicação do que acontece no jogo através dos números”, aponta Luís Cristóvão.
Contudo, a possibilidade de quantificar cada vez mais momentos do jogo não as deve iludir-nos em relação à nossa capacidade de prever um resultado. Por vezes, um campeonato ganha-se com um remate de fora da área de um jogador que ainda não tinha marcado dessa zona em 27 remates nessa época, como Herrera; ou com um falhanço de baliza aberta de um dos jogadores com melhor técnica da liga, como Bryan Ruiz há dois anos. No livro Numbers Game, os autores concluem que um jogo deve o seu resultado em 50% à sorte – o que pode não ser assim tão mau. Afinal, já nos pôs a gritar dias a fio pelo Éder.
> Basebol
Foi neste desporto que os analytics começaram a desenvolver-se em primeiro lugar. A mudança chegou à maioria com o livro Moneyball, A Arte de Ganhar um Jogo Injusto, adaptado para cinema em 2011, com Brad Pitt no papel principal. Conta a história de Billy Beane, executivo dos Oakland A, uma das equipas com orçamento mais baixo mas que conseguiu bater o recorde de vitórias consecutivas. Enquanto desporto mais “estático” e “binário”, o ataque já tem poucos segredos no basebol.
> Basquetebol
A análise de dados chegou um pouco mais tarde à NBA, mas o seu impacto tem sido claro na última década. Algumas ideias, hoje consensuais, escandalizariam muitos no início do século. As equipas devem lançar um grande número de triplos, e jogadores mais altos (postes e extremos) começam a tornar-se pouco úteis se não souberem lançar de longe. Cada vez mais se percebe que marcar muitos pontos não basta para que um jogador seja considerado de elite. Para esta apreciação, a defesa é cada vez mais valorizada.
“Indicadores das TV
nem sempre refletem o jogo”
Entrevista a Hugo Folgado, professor na Universidade de Évora
O que nos ensina a academia sobre como ganhar um jogo de futebol?
O futebol é um desporto complexo, que depende da constante interação entre jogadores e equipas. Equipas de nível superior estão normalmente associadas a mais tempo de posse de bola, mas não significa que mais passes tenham como consequência a vitória. Tem sido possível uma maior contextualização das ações através da integração de diferentes dados. Não sabemos apenas quantos passes uma equipa faz, mas também quando e onde os faz. Isso levou a que a quantidade de informação recolhida subisse de forma exponencial.
O adepto comum já consegue identificar essas tendências em campo?
Creio que existe uma maior atenção para esses indicadores, apesar de nem sempre bem direcionada. O adepto tem acesso a cada vez mais informação. Esta tem sido uma preocupação dos canais de televisão, por exemplo, que procuram diferenciar a experiência de quem vê o jogo. No entanto, nem sempre os indicadores apresentados refletem o nível de jogo da equipa. A distância percorrida, um indicador normalmente apresentado ao intervalo ou quando um jogador é substituído, não tem relação direta com o rendimento.
Quais são as maiores limitações de análise?
Há uns anos, diria que seria o acesso à informação. Hoje em dia, com o desenvolvimento tecnológico, creio que o maior desafio será o da simplificação. Com tantos dados, nem sempre é fácil identificar informação relevante.