OpenAI présente o1, un modèle IA capable de "raisonner" pour résoudre des problèmes

OpenAI présente o1, un modèle IA capable de “raisonner” pour résoudre des problèmes

Ce nouveau modèle représente un vrai pas en avant, notamment grâce à l’implémentation d’une approche “Chain of Thought” qui lui permet de décomposer des problèmes complexes en plusieurs étapes.

OpenAI a présenté un tout nouveau produit appelé o1, le premier représentant d’une famille de modèles IA capables de « raisonner » pour répondre à des questions et résoudre des problèmes complexes plus efficacement que les humains.

Ce nouveau modèle n’est pas franchement conçu pour être rapide ; il risque même d’être significativement plus lent à la détente que les différentes variantes de GPT-4, le modèle qui alimente la dernière version de ChatGPT. C’est en partie parce qu’il est encore assez balbutiant, mais aussi à cause d’un parti-pris assumé de l’entreprise. Elle explique qu’elle a spécifiquement entraîné son modèle à « passer plus de temps à réfléchir avant de répondre, comme le ferait une personne ». « À travers cet entraînement, il apprend à affiner son processus de pensée, à essayer différentes stratégies, et à reconnaître ses erreurs », ajoute le communiqué.

Un modèle conçu pour résoudre des problèmes

Par conséquent, o1 est moins taillé pour la génération de texte pure que pour s’attaquer aux problèmes sous-jacents. L’entreprise affirme que la dernière mise à jour de son modèle atteint le niveau d’un doctorant lorsqu’il s’agit de résoudre des problèmes en physique, de chimie, et de biologie. Il « excelle » aussi en mathématiques et en programmation.

Pour illustrer cette distinction, OpenAI a soumis son modèle au dernier examen des Olympiades internationales de mathématiques, une compétition destinée aux étudiants… du cycle secondaire, soit un niveau académique largement inférieur aux doctorants dont le communiqué parle quelques lignes plus haut. Une incohérence curieuse, mais il faut admettre que les résultats parlent d’eux-mêmes. Dans les mêmes conditions que les humains (dix heures pour surmonter six problèmes algorithmiques corsés), o1 a atteint un score de 83 %. GPT-4o, en revanche, n’a pu résoudre que 13 % des problèmes. Ses capacités en programmation ont aussi été évaluées dans des compétitions Codeforce où le modèle a atteint le 89e percentile.

Plus largement, OpenAI estime que ce modèle peut être très utile à toutes les personnes qui travaillent avec des problèmes complexes dans des domaines comme la science, l’informatique ou les maths. « Par exemple, o1 peut être utilisé par des chercheurs en médecine pour annoter des données de séquençage de cellules, par des physiciens pour générer des formules mathématiques compliquées afin de résoudre des problèmes d’optique quantique, et par les développeurs dans tous les domaines pour construire et exécuter des flux de travails à plusieurs étapes ».

Enfin un modèle “Chain of Thought“

Pour en arriver là, l’entreprise de Sam Altman a misé sur le Chain of Thought (CoT), une approche prometteuse avec laquelle Amazon a déjà expérimenté l’année dernière.

Cette démarche s’oppose à celle des modèles comme GPT-4o, qui utilisent une approche dite de « standard prompting ». En substance, cela signifie qu’ils tentent d’analyser la question dans sa globalité, en une seule étape. Ils sont donc très performants lorsqu’il s’agit de réaliser des tâches qui peuvent être abordées facilement et intuitivement par les humains. En revanche, dès qu’il faut décomposer un raisonnement en plusieurs étapes, ces algorithmes ont tendance à perdre les pédales et à produire des réponses sans queue ni tête que les spécialistes qualifient d’« hallucinations ».

Avec le Chain of Thought, le modèle peut déconstruire l’énoncé du problème pour procéder étape par étape, un peu comme le ferait un humain. En découpant ainsi le problème, l’algorithme fournit théoriquement une réponse plus élaborée et qui a plus de chances d’être correcte.

L’entreprise estime aussi que l’approche CoT est offre des garanties supplémentaires en termes de sécurité. « Nous pensons que la Chain of Thought présente une opportunité unique de contrôler les modèles. Par exemple, à l’avenir, nous souhaiterons peut-être surveiller la chaîne de pensée à la recherche de signes de manipulation de l’utilisateur », peut-on lire dans le communiqué.

Entre le vrai progrès et l’écran de fumée

Comme mentionné plus haut, ce modèle est encore loin d’être mature ; OpenAI parle d’ailleurs d’une “preview”. On constate d’ailleurs que l’entreprise a fourni des efforts importants pour que son modèle apparaisse plus “intelligent” qu’il ne l’est en réalité…

En effet, contrairement à GPT-4o, ses réponses sont truffées de formules comme “je pense à…”, “j’explore le problème à partir de…”, ou encore “Ok, laissez-moi voir” — des artifices sémantiques qui créent une illusion de raisonnement construit. Cette approche peut sembler trompeuse — et elle l’est, dans une certaine mesure. Cette rhétorique joue clairement sur la réponse émotionnelle des humains et sur leur tendance à anthropomorphiser les agents conversationnels.

Mais OpenAI ne l’entend pas de cette oreille. Selon The Verge, elle considère simplement ces tours de passe-passe comme une façon de montrer que son modèle “raisonne” de façon moins superficielle que GPT-4o et consorts. On peut toutefois s’interroger sur la pertinence de cette approche, puisque les utilisateurs qui voudraient s’en servir pour résoudre de vrais problèmes risquent fort de trouver ces enrobages plus horripilants qu’autre chose…

Quoi qu’il en soit, o1 représente tout de même un pas un avant significatif dans la capacité des modèles IA à résoudre de vrais problèmes, et il sera intéressant de suivre l’évolution de ce produit dérivé au potentiel indiscutable. Ceux qui disposent d’un abonnement à ChatGPT Plus — la formule payante du service — pourront déjà commencer à expérimenter avec le modèle dès aujourd’hui, tandis que les utilisateurs de la formule gratuite devront encore patienter quelques semaines pour s’y frotter.

🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités et sur notre WhatsApp. Et si vous nous adorez, on a une newsletter tous les matins.