No jogo de tabuleiro Diplomacy, os sete jogadores devem falar uns com os outros, negociar táticas, formar alianças e dissolvê-las quando necessário com o objetivo de conquistar a Europa. Este é um cenário complexo em que os sistemas de Inteligência Artificial, tradicionalmente, não conseguem obter bons resultados, mas a Meta anuncia estar a mudar o paradigma com o agente artificial Cicero.
O novo algoritmo da dona do Facebook conseguiu entrar no top 10 após 40 partidas jogadas na versão online do jogo Diplomacy, em que defrontou 82 humanos (e que não sabiam estar a jogar contra um bot). Os resultados obtidos pelo Cicero são bastante promissores, com o sistema a ter conseguido mesmo vencer um torneio de oito partidas contra 21 jogadores, revela a publicação MIT Technology Review.
A complexidade de Diplomacy é fácil de perceber: são múltiplos jogadores, a fazer jogadas ao mesmo tempo e que envolvem negociações antes de cada passo, com conversações em pares nas quais se tentam formar alianças para destruir os rivais. Só depois da negociação é que são feitos os movimentos, com a possibilidade de que os acordos sejam honrados ou ignorados, em grandes ‘bluffs’.
A Meta conseguiu preparar o Cicero para avaliar as probabilidades de comportamento dos outros jogadores e gerar mensagens que encorajam o trabalho conjunto ou ataques concertados para se conseguirem atingir objetivos mutuamente benéficos.
Num estudo publicado na Science, a Meta explica que combina dois sistemas de IA no Cicero: um modelo de aprendizagem por reforço (reinforcement learning) que decide qual o movimento a efetuar e um modelo de linguagem natural complexo que negoceia com os jogadores.
Apesar de algumas gralhas, falhas de estratégia e mensagens contraditórias durante a fase de negociação, a Meta explica que os jogadores acabam muitas vezes por escolher aliar-se ao Cicero (sem saberem que é uma máquina).
O avanço conseguido por este modelo torna a Inteligência Artificial mais capaz de lidar com problemas complexos, onde nem sempre há vencedores e vencidos declarados, mas uma multiplicidade de fatores e resultados, que requerem compromisso e estratégias negociais de médio e longo prazo.