Les IA (intelligences artificielles) qui jouent à des jeux et surpassent l’homme, on connait depuis un certain temps. Le plus grand exploit en la matière est l’écrasante victoire de l’IA AlphaGo au jeu de Go réalisé en 2015 par Google DeepMind. Aujourd’hui encore, c’est de cette filiale de Google dont il est (en partie) question.
Un système d’IA utilisant deux méthodes d’apprentissage en simultané
Cette fois-ci, DeepMind et OpenAI annoncent avoir appris à jouer à neuf jeux de la console Atari 2600 (dont le célèbre Pong) à une IA en observant des humains jouer. Le système d’IA d’apprentissage en profondeur (deep learning) a compris la mécanique de jeu de Pong et d’Enduro par auto-apprentissage.L’IA a même présentés des capacités surhumaines sur deux des neufs jeux observés: Pong et Enduro.
L’intelligence artificielle mise au point par les chercheurs combinait deux types d’apprentissage en parallèle : un réseau neuronal d’apprentissage profond, devant observer et imiter le jeu humain, et un réseau neuronal convolutif, apprenant à l’IA à jouer par un test suivi système de punition/récompense
La première technique d’apprentissage utilisée ici à un nom : “inverse reinforcement learning“, autrement dit de l’apprentissage par renforcement inverse. Cette méthode d’apprentissage fait ici preuve d’une grande efficacité dans un cas où l’objectif à atteindre est difficilement définissable pour l’IA. La prouesse est que l’IA ne s’est pas contentée d’imiter et de comprendre la mécanique de jeu des joueurs humains : elle l’a fait évoluer et l’a améliorée pour atteindre des performances décrites comme nettement supérieures par les scientifiques.
L’IA ne s’en sort pas avec le jeu Private Eye
Après 50 millions d’étapes, l’IA formée a dépassé l’homme pour tous les jeux (dont Pong, mais aussi Hero, Montezuma’s Revenge, Beamrider, Breakout, Enduro, Q*bert et Seaquest), sauf pour le jeu Private Eye où l’homme garde l’avantage (pour le moment du moins…).
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.
En même temps, une IA qui gagne toujours à Pong c’est assez simple, il suffit de la laisser toujours en face de la balle…
A la différence que ce que vous décrivez, n’est plus une IA, mais juste des lignes de code ^^’.
Là, elle a appris toute seule à jouer au jeu, c’est ça le côté impressionnant. Le fait qu’elle ai surpassée l’humain n’est pas réellement ce qu’il faut retenir. Car in fine, une foi le but compris, l’IA a plus d’avantage que l’homme, c’est normale qu’elle surpasse.