Passer au contenu

Pour la première fois, une IA bat les humains à un jeu d’adresse physique

Après les jeux de stratégie et les jeux vidéo, les systèmes à base de machine learning commencent à maîtriser des jeux d’adresse dans lesquels les humains restaient bien plus performants jusqu’à présent.

Échecs, poker, go, jeux vidéo… Cela fait déjà plusieurs années que les humains sont largement surclassés dans de nombreux exercices intellectuels par des machines, et plus récemment par des systèmes de machine learning aux performances étourdissantes. En revanche l’humanité dispose encore d’une avance significative dans le domaine des jeux d’adresse physique… ou du moins, c’était le cas jusqu’à présent. Une équipe du prestigieux ETH de Zurich a conçu un robot dopé à l’intelligence artificielle capable de battre notre espèce au jeu du labyrinthe.

Comme son nom l’indique, le jeu repose sur une bille placée dans un labyrinthe. Ce dernier est construit sur un plateau mobile dont l’orientation peut être contrôlée à l’aide de deux poignées disposées sur les côtés. L’objectif est de guider la bille jusqu’au bout du tracé tout en évitant de la faire tomber dans l’un des nombreux trous qui jonchent le parcours.

Certes, le concept est simple comme bonjour — mais la pratique l’est beaucoup moins. Si vous vous êtes déjà prêté à l’exercice, vous avez certainement constaté qu’il faut beaucoup de précision, de finesse et surtout d’entraînement pour maîtriser la trajectoire de la sphère. C’est un jeu qui repose beaucoup sur le ressenti. Et jusqu’à présent, les robots ont eu toutes les peines du monde à reproduire les performances des humains dans ce contexte.

Le machine learning à l’assaut du monde réel

C’était donc un objectif très intéressant pour l’équipe de Raffaelo D’Andrea, professeur à l’ETH Zurich. Son objectif est de sortir les systèmes basés sur le machine learning de leur zone de confort, à savoir les environnements virtuels, pour leur permettre de surmonter des défis basés sur la physique du monde réel.

Après avoir jeté son dévolu sur le jeu du labyrinthe, D’Andrea s’est attaqué à la conception d’un système baptisé CyberRunner avec l’objectif de dépasser les performances des humains.

Il est composé de deux parties distinctes. D’un côté, on trouve un système de contrôle physique. Il est composé d’une caméra qui enregistre la position de la bille et de deux petits moteurs. Ces derniers reproduisent l’action d’une paire de mains sur les poignées qui contrôlent le plateau.

De l’autre, on trouve un modèle IA qui s’entraîne à la fois sur le support physique, mais aussi sur une simulation virtuelle. Il analyse chaque tentative, puis explore diverses façons de corriger ses erreurs dans cet environnement numérique. Les approches plus prometteuses sont ensuite mises en application dans le monde réel pour renforcer le modèle à chaque itération. Dans ce contexte, cela revient à terminer le parcours le plus rapidement possible.

 

Cyberrunner Schéma
© Raffaello D’Andrea / Thomas Bi

Le champion humain battu à plate couture

Et le moins que l’on puisse dire, c’est que cette approche a remarquablement bien fonctionné. Après six heures d’entraînement à peine, le robot était déjà capable de battre des joueurs humains confirmés qui avaient passé des années à maîtriser toutes les nuances du jeu.

Il a même battu le record du monde établi en 2022 par Lars Göran Danielsson, un expert du labyrinthe qui pratique ce jeu depuis… 1988. Et il ne s’agissait pas d’une petite victoire ; avec son chrono de 14,48 secondes, CyberRunner affiche presque une seconde d’avance sur le temps du champion humain (15,41s). Un écart très important à ce niveau.

Le plus intéressant, c’est que la victoire aurait pu être encore plus écrasante. En effet, D’Andrea a été forcé d’imposer certaines limites à CyberRunner pour l’empêcher de pulvériser les temps de ses adversaires. Au cours de son entraînement, il a rapidement identifié des stratégies de triche redoutablement efficaces, comme faire sauter la bille au-dessus d’un mur à l’aide d’un mouvement très précis pour zapper une portion entière du parcours.

Un champ de recherche très prometteur

D’après Forbes, D’Andrea compte mettre ce modèle à profit dans le cadre de sa startup Verity. Elle développe des systèmes qui permettent à des drones autonomes de collecter des informations sur des produits dans de grands entrepôts pour éviter aux humains de multiplier les allers-retours.

Il compte aussi mettre son modèle à disposition des autres développeurs sous licence open source. Une démarche surprenante, sachant que cette technologie pourrait offrir un vrai avantage compétitif à son entreprise.

Mais il ne s’agit pas seulement de se montrer généreux. Il espère que cette initiative permettra d’accélérer le développement de l’IA appliquée aux problèmes physiques, ce qui bénéficiera à toute cette niche technologique — y compris sa propre firme. Au-delà des drones, ces systèmes de renforcement pourraient être exploités dans des activités comme la manutention, l’assemblage sur une ligne de production, et ainsi de suite. Il sera donc intéressant de voir quelles innovations les autres entreprises et instituts de recherche vont proposer à partir de ce modèle.

Le texte de l’étude est disponible ici.

🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.

Mode