Ce n’est pas comme si on ne s’y attendait pas. Après avoir écrasé Lee Sedol l’an dernier (4 à 1), l’intelligence artificielle de Google était donnée favori de ce nouveau combat.
#AlphaGo wins game 2. What an amazing and complex game! Ke Jie pushed AlphaGo right to the limit.
— Demis Hassabis (@demishassabis) 25 mai 2017
L’intelligence artificielle s’est même permis d’analyser la performance de son adversaire humain, qui aurait joué à la perfection pendant les 50 premiers coups. Si la partie n’a jamais été aussi serrée face à un joueur humain durant les 100 premiers coups, note Demis Hassabis, le CEO de DeepMind (l’entreprise qui a développé AlphaGo), c’est bien l’intelligence artificielle qui a eu le dernier mot. Si vous souhaitez revoir ce match, voici la vidéo de la rencontre.
AlphaGo, plus jamais battue ?
La difficulté pour l’humain, c’est qu’AlphaGo apprend de chacune de ses parties. C’est ce qu’on appelle le Deep reinforcement learning ; AlphaGo analyse chacune de ses rencontres et en tire des leçons pour être plus efficace la fois d’après. Les parties gagnées contre Lee Sedol notamment, puis contre d’autres gros joueurs en début d’année (51 victoires consécutives pour AlphaGo, qui a aussi l’avantage de ne pas se fatiguer) ont donc permis à la machine de se perfectionner encore et toujours, si bien qu’on peut se demander aujourd’hui, si un humain est encore capable de gagner l’I.A. de DeepMind au jeu de Go.
Éléments de réponse demain, lors du troisième et dernier match entre AlphaGo et Ke Jie. La rencontre pourra être suivie en direct sur le site de l’événement. En attendant, on vous invite à aller relire notre interview de Bruno Poucet et Claude Touzet, spécialistes de l’intelligence artificielle, au sujet des progrès fulgurants de celle-ci.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.
Est-ce qu’un betaGo (une autre génération) pourra battre alphaGo ?
Je sens qu’on est sur une pente glissante là.
vivement que AlphaGo arrive sur starcraft 2.
Les Russes sortiront un “cheat” <3 <3 <3
Pour être plus clair, ce n’est pas le deep reinforcement learning qui fait qu’une machine apprend de ses erreurs, mais le machine learning. Le deep reinforcement learning est seulement un type d’algorithme qui permet à une machine d’apprendre de ses erreurs, via des Deep Neural Networks (Réseaux de neurones profonds). Ces réseaux de neurones sont “profonds” dans le sens où les neurones fonctionnent en couche, et il y a beaucoup de couches entre l’entrée et la sortie.