À force de l’entendre parler de métavers à tort et à travers, on pourrait presque oublier que Meta est aussi un acteur de premier plan dans le monde de l’intelligence artificielle. Les troupes de Mark Zuckerberg ont dévoilé hier leurs dernières avancées dans ce domaine ; elles ont présenté CICERO, une IA qui revendique des performances impressionnantes sur Diplomacy, un célèbre jeu de stratégie sur plateau.
À première vue, on pourrait se demander ce que ces travaux ont de particulier. Après tout, les intelligences artificielles ont déjà prouvé à maintes reprises qu’elles étaient capables d’humilier les humains dans des jeux très complexes. Gary Kasparov, légende des échecs qui a régné sans conteste sur la discipline pendant des années, peut en attester ; il s’est incliné contre DeepBlue dès 1997 (voir notre dossier sur l’histoire de l’informatique dans les échecs).
Et depuis, ces algorithmes n’ont cessé de progresser. En 2016, AlphaGo a vaincu Lee Sedol, véritable divinité du jeu de go. Il s’agissait d’une nouvelle avancée remarquable, car pendant de longues années, ce jeu qui repose beaucoup sur l’intuition était considéré comme inabordable pour ce genre d’algorithmes. Rebelote en 2019, lorsqu’une IA a battu une table de professionnels au poker pour la première fois. On peut aussi citer des tas de jeux vidéo, comme DOTA 2 et Starcraft II, où l’humain n’a désormais plus la moindre chance de vaincre un programme spécialisé.
Les algorithmes face à la psyché humaine
Mais tous ces jeux présentent un dénominateur commun : les interactions entre les joueurs reposent entièrement sur des éléments de jeu comme des cartes, des pions ou des personnages qui peuvent être représentés par une poignée de variables. Par exemple, il est possible de retranscrire l’intégralité d’une partie d’échecs à l’aide d’une simple suite de lettres qui représentent les pièces, et les coordonnées des cases où elles se déplacent.
Dans le cas de Diplomacy, en revanche, la situation est assez différente. L’action est certes matérialisée par des pions, mais elle repose essentiellement sur la négociation et les interactions verbales entre les joueurs. Or, ces échanges impliquent une certaine capacité d’abstraction supplémentaire; algorithmiquement parlant, c’est très différent des échecs, où chaque coup (comme « Reine en h4 ») peut facilement être traduit en langage informatique.
Ici, il faut tenir compte des subtilités du langage, mais aussi de la façon dont chaque joueur interprète la situation. Pour remporter une partie de Diplomacy, l’IA doit être capable de forger des alliances, de contourner les tentatives de bluff, de jauger la façon dont chaque humain réagira à ses coups… et pour une IA, c’est beaucoup plus difficile que de calculer l’option optimale à partir d’une liste bien définie de coups possibles. Meta affirme pourtant y être parvenu avec CICERO.
CICERO, un stratège redoutable
Ce programme fonctionne grâce à deux sous-systèmes distincts. Le premier analyse les forces en présence pour proposer une stratégie, pendant que le deuxième se charge d’échanger avec les joueurs et d’interpréter leurs propos. C’est la première fois qu’un même programme est à la fois capable de “discuter” textuellement et de construire un raisonnement stratégique nouveau à partir des réponses qu’il récolte. Et apparemment, la recette fonctionne ; selon Meta, l’IA a régulièrement atteint un score deux fois plus important que ses adversaires en chair et en os.
Le programme aurait même réussi à se placer parmi les 10 % de joueurs les plus performants sur webDiplomacy.net, la version en ligne du jeu. En termes strictement stratégiques, il s’agit donc d’un adversaire redoutable ; les chercheurs considèrent désormais qu’il a atteint « des performances de niveau humain ».
Pour pousser l’analyse plus loin, les troupes de Meta ont fait appel à un spécialiste ; comme DeepMind qui avait sollicité le champion européen Fan Hui pour améliorer son programme AlphaGo, ils ont recruté Andrew Gof, champion du monde de Diplomacy.
Son expertise a permis de mettre en évidence quelques lacunes importantes, et sans surprise, cela concerne surtout la composante humaine et émotionnelle du jeu. « Beaucoup de joueurs humains peuvent adoucir leur approche ou seront motivés par un sentiment de revanche, mais CICERO ne fait jamais ça », explique Goff.
Cela a tendance à rendre le programme plus prévisible qu’un humain dans certaines situations, puisqu’il privilégie systématiquement l’approche qui lui semble la plus optimale en termes mathématiques, sans forcément tenir compte des plans à long terme de ses adversaires.
Apprendre à communiquer avec les IA
Mais ce qui rend ces travaux intéressants, c’est que leur portée dépasse largement Diplomacy. Selon les ingénieurs de Meta, cette technologie pourrait aussi se montrer très utile dans de nombreux autres contextes.
« Contrôler la génération de langage naturel pourrait faciliter la communication entre les humains et les systèmes basés sur l’IA », expliquent-ils dans leur communiqué. Par exemple, un algorithme de ce genre pourrait permettre de développer des IA éducatives, capables de « maintenir une conversation sur le long terme dans l’objectif d’enseigner de nouvelles compétences » à un humain.
On peut aussi imaginer des tas d’applications en lien avec le divertissement, comme dans le cas des jeux vidéo. « Imaginez un jeu vidéo où un NPC pourrait planifier et converser comme un humain — en comprenant vos motivations et en adaptant la conversation — pour vous aider dans votre quête », suggèrent les auteurs du billet.
Ce qui est surprenant, en revanche, c’est que le communiqué ne mentionne pas une seule fois le fameux métavers dont rêve Mark Zuckerberg. Et connaissant la feuille de route de Meta ces derniers mois, il serait très étonnant que la firme ne cherche pas implémenter ce genre de technologie dans ce fameux espace virtuel. Il sera donc intéressant de voir comment et dans quel contexte les technologies qui sous-tendent CICERO seront réutilisées à l’avenir.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.