Passer au contenu

[Interview] Nous avons posé quelques questions à deux scientifiques au sujet du robot joueur de Go

À l’occasion du match de Go entre AlphaGo et Lee Sedol, le meilleur joueur humain du monde, nous avons interviewé Bruno Poucet du CNRS (Centre National…

À l’occasion du match de Go entre AlphaGo et Lee Sedol, le meilleur joueur humain du monde, nous avons interviewé Bruno Poucet du CNRS (Centre National de la Recherche Scientifique), du laboratoire de neurosciences cognitives, spécialiste de l’intelligence humaine (à gauche sur la photo) et Claude Touzet de l’AMU (Aix-Marseille Université), qui travaille au laboratoire de neurosciences intégratives et adaptives. C’est un spécialiste de l’intelligence artificielle.

poucet-touzet2

Lee Sedol a-t-il vraiment eu la moindre chance face à AlphaGo, ou est-ce juste un match dont le résultat était couru d’avance, juste mis en scène pour démontrer les capacités de la machine ?

BRUNO POUCET

Non. Sinon, il n’y aurait pas de match.
Ce que n’a pas vraiment la machine, qu’ils (les chercheurs) doivent encore développer, c’est l’intuition telle que nous l’avons. Mais la machine finira par complètement dépasser l’humain. L’homme a des limites, qu’il s’agisse de sa capacité de calcul et son expérience plus limitée. La machine ne se fatigue pas, elle ne stresse pas ni ne se presse. Elle n’a pas d’états d’âme qui peuvent venir l’handicaper.

CLAUDE TOUZET

Oui, l’humain a une chance. Enfin, en vérité, il est possible que la machine ait déjà dépassé l’humain grâce aux nouvelles technologies, telles que le Deep learning, dans des tâches spécialisées du moins.

match-vs-alphago-lee-sedol-debut

Les algorithmes du robot peuvent-ils prévoir chaque cas de figure possible et imaginable dans une partie telle que celle-ci ?

CLAUDE TOUZET

Non, le robot ne peut pas tout prévoir. Il y a trop de possibilités dans le Go et lui, n’est qu’un ordinateur. Il estime par rapport à l’état du plateau les meilleurs coups à effectuer et tente de deviner les prochains coups de l’adversaire pour plus d’efficacité.
Pendant son apprentissage vous savez, il a beaucoup joué contre lui-même et contre des joueurs. Des millions de fois même. La mémoire de toutes ces simulations devient son expérience.
Quant au temps de chaque tour, AlphaGo s’adapte. Plus il a de temps, plus il peut intérieurement simuler de situations.

BRUNO POUCET

Je dirais qu’il n’y a pas vraiment de limites à la puissance de calcul ou du moins, celle-ci n’est pas vraiment handicapante pour le robot. AlphaGo est équipé d’un processeur moderne. Il peut presque tout prévoir en avance. Il faut garder à l’esprit cependant que la machine est un peu bête. Elle ne fait qu’effectuer des “tirages” (simulations), évalue les résultats et applique le plus probable, celui qui a le plus de chance de tomber.

Lorsque le robot joue, peut-on parler de réaction face à des situations programmées ou de véritable créativité de la machine ?

BRUNO POUCET – Avant, les ordinateurs étaient programmés pour des dizaines de milliers de configurations possibles. Chaque cas de figure était manuellement ajouté à sa base de données. Aujourd’hui, on a beaucoup évolué.
Il faut que vous sachiez qu’il y a deux types d’algorithmes : les supervisés, dirigés par l’homme. Celui-ci choisit ce que la machine apprend. Puis, il y a les non-supervisés, avec lesquels la machine apprend par elle-même, par essais et simulations.
La machine, AlphaGo, joue contre elle-même, elle teste ainsi des centaines de milliers de situations possibles. C’est la simulation par erreur. Elle stocke les résultats et les utilise contre son adversaire.

CLAUDE TOUZET – On peut parler de créativité dans le sens où la machine va se mettre à jouer des coups inédits, qu’elle n’a jamais tenté avant. Elle se base sur son expérience, qui est énorme grâce à ses simulations. Si elle découvre une situation nouvelle, elle va “repenser” à des configurations similaires dans lesquelles elle s’est déjà retrouvée. Pas des situations identiques. Aucun jeu de Go n’est identique. Donc, elle se base sur des parties passées qui ressemblent à la situation actuelle, et détermine à partir de là, le meilleur coup possible. À coup de nouvelles simulations, bien sûr.

reseau-alphago

Comment AlphaGo marche-t-il exactement ?

CLAUDE TOUZET

Une bonne partie du cerveau d’AlphaGo fonctionne grâce au Deep Learning (en bref, des algorithmes capables de modéliser des abstractions). Avant, les robots utilisaient principalement des réseaux neuronaux. Aujourd’hui, c’est le Deep Learning. Le robot analyse la situation et tente de déterminer ce que va faire l’autre. À chaque étape du jeu, il peut intégrer de nouvelles règles.
Le Deep Learning ne fait pas toujours tout cependant. Le robot réfléchit aussi grâce à un système expert, qui raisonne selon des règles connues. AlphaGo alterne entre les deux, selon les étapes du jeu.
Pour les imprévus, c’est-à-dire pour chaque coup, car chaque plateau de Go est différent, il peut aussi utiliser la méthode de Monte-Carlo. Celle-ci porte le nom d’un casino, car en l’appliquant, AlphaGo utilise des coups aléatoires dans ses simulations pour déterminer leur viabilité, pour voir si les appliquer est la bonne marche à suivre. Bien sûr, ça se combine aux “souvenirs” du robot, de ses expériences de jeu passé.

BRUNO POUCET

AlphaGo contient plusieurs technologies différentes. Des réseaux neuronaux peuvent échanger des informations et se déplacer comme de vrais neurones. C’est sans doute ça qui lui offre en partie sa puissance de calcul.

Les stratégies de Go peuvent faire penser à des stratégies militaires. Va-t-on vers des robots capables d’établir des stratégies véritables sur un champ de bataille ?

BRUNO POUCET

Les applications possibles sont multiples. Dans l’économie par exemple, utiliser des logiciels “robots” est un courant dominant. Les ordinateurs calculent les pertes éventuelles pour chaque manœuvre. Mais il y a toujours beaucoup de facteurs difficiles à prendre en compte : humains, naturels, sociaux, etc.
Ce ne sont que des machines Je ne pense pas qu’il soit souhaitable de les laisser prendre des décisions pour nous. Par contre, les laisser nous assister sous notre supervision, oui.

CLAUDE TOUZET

Les robots stratèges, je pense que ça existe déjà. Les militaires utilisent sans doute le Deep Learning, ne serait-ce que pour les assister. Mais si ce n’est pas encore fait, ça ne saurait tarder.

Pour ceux qui désirent revoir le match, en voici la vidéo :

🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.

8 commentaires
  1. Merci pour ces investigations, quelqu’un connait-il la puissance du calculateur utilisé par google?
    Utilisent-ils l’ordinateur quantique D-Wave 2X ?

  2. Mais quel ramassis de lieux communs. Pas etonnant que la France ait du retard si ses specialistes racontent autant de betises. Ecoutez plutot Yann Lecun, inventeur du deep learning, français et patron de l’ia chez facebook.

Les commentaires sont fermés.

Mode