Nvidia Research a présenté Eureka, un nouvel agent d’intelligence artificielle qui permet à des robots d’apprendre rapidement de nouvelles compétences. Le logiciel utilise le grand modèle de langage GPT-4 combiné à des méthodes d’apprentissage par renforcement.
Des performances supérieures à l’expertise humaine
L’outil fonctionne en prenant en compte le code d’un environnement de simulation robotique, pour ensuite générer des fonctions de « récompense », autrement dit des algorithmes permettant aux robots d’apprendre grâce à une approche basée sur les essais et les erreurs. Le plus remarquable est que Eureka accomplit cette tâche sans aucune intervention humaine ni modèles pré-définis.
Des démonstrations vidéo montrent comment Eureka a formé une main robotique à tourner rapidement un stylo, une tâche nécessitant un contrôle moteur complexe, à un niveau équivalent à une performance humaine. D’autres compétences telles que l’ouverture de tiroirs, le lancer de balles et la manipulation de ciseaux ont également été enseignées à différents types de robots.
Anima Anandkumar, directrice de la recherche en IA chez Nvidia, souligne que la conception de fonctions de récompense a lui aussi longtemps été un « processus d’essai et d’erreur » ! En utilisant l’environnement de simulation physique Isaac Gym de Nvidia, Eureka peut rapidement évaluer la qualité des fonctions de récompense générées, ce qui rend l’apprentissage beaucoup plus efficace.
Dans des tests réalisés dans 29 environnements différents et avec 10 plates-formes robotiques variées, les fonctions de récompense générées par Eureka ont démontré une performance supérieure à celles écrites par des experts humains. Dans plus de 80 % des tâches, les récompenses générées par l’IA ont conduit à des performances de tâches supérieures de plus de 50 % en moyenne.
Eureka est un mélange de « modèles de langage de grande taille et de technologies de simulation accélérées par GPU de Nvidia », décrit Linxi “Jim” Fan, un contributeur clé du projet. Le logiciel ne permettrait pas seulement un contrôle robotique complexe, mais pourrait également transformer la création d’animations physiquement réalistes pour les artistes.
Nvidia a annoncé l’ouverture du code et des benchmarks de Eureka, permettant ainsi à la communauté de développeurs de construire sur ces recherches. Ce geste ouvre la voie à l’exploitation de cet apprentissage robotique plus intelligent dans des contextes industriels et grand public.
Eureka s’inscrit également dans une série de projets menés par Nvidia dans le domaine de l’intelligence artificielle, après Voyager, un autre agent d’IA construit avec GPT-4 capable de naviguer de manière autonome dans l’univers de Minecraft.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.
C’était a prévoir ,ils ne vont pas détruire leur planète eux , ce sont nos successeurs !
La prochaine vie intelligente , finalement nous aurons servi a quelque chose malgré notre bêtise crasse et notre cupidité , participer a l’avènement d’une espèce immortelle !
C’est la thèse de l’économiste Paul Jorion , c’est aussi la mienne !
Pourquoi avoir peur de nos descendants , c’est une fin magnifique !