ChatGPT est sans nul doute l’agent conversationnel le plus connu du grand public. Le chatbot doit cette renommée à ses nombreuses qualités dans différents domaines, mais la génération d’images n’en faisait pas vraiment partie. Un problème pour OpenAI qui doit faire face à une concurrence toujours plus forte, comme Imagen 3 (Google), Aurora (xAI et Grok) ou des outils spécialisés (Midjourney, Leonardo, Firefly…). La firme américaine a peut-être trouvé une solution pour éviter à ses 400 millions d’utilisateurs d’aller voir ailleurs.
OpenAI vient de dévoiler un nouvel outil de création d’images intégré directement à ChatGPT. Ce nouveau modèle, appelé GPT-4o Image Generation, remplace l’ancien modèle Dall-E et doit aider la firme à rattraper son retard dans ce domaine.
Les atouts de nouvel outil
Si le mot-valise Dall-E est drôle et facile à retenir, l’entreprise ne rigole pas avec ce nouvel outil. Il n’a pas réellement de nom et n’est pas un modèle d’instinct, mais une extension du modèle « omnimodal » GPT-4o apparu l’an dernier. Il s’intègre nativement à ChatGPT et cela constitue un premier atout important pour les utilisateurs. GPT-4o Image Generation veut faire oublier Dall-E en se distinguant par sa capacité à produire des images très réalistes, portant une attention particulière sur les détails. L’un des points forts de ce nouveau modèle est de pouvoir générer efficacement du texte dans les images, comblant une lacune importante des outils précédents. Il affiche aussi une meilleure compréhension et n’exige pas de l’utilisateur qu’il sache écrire des prompts.

Ce modèle peut traiter entre 10 et 20 demandes dans une seule requête, de quoi permettre aux utilisateurs de décrire des scènes très détaillées. OpenAI met également en avant la polyvalence de GPT-4o Image Generation et l’outil se révèle, là encore, impressionnant dans l’exercice. Il peut générer une grande variété de formats, allant des photographies réalistes aux bandes dessinées, en passant par des infographies, des diagrammes et des visuels promotionnels pour les réseaux sociaux.
Plutôt que de se limiter à de la simple création d’images esthétiques ou surréalistes, OpenAI met l’accent sur la production d’images « utiles » :
Sur les réseaux sociaux, la possibilité de modifier une image dans le « style Ghibli » fait sensation :
Ok I think I’m in love with ChatGPT’s new image editing feature.
Can turn all my family photos into Ghibli portraits. pic.twitter.com/tZCbxPUA0D
— Peter Yang (@petergyang) March 26, 2025
De plus, le modèle a la capacité de modifier progressivement une image existante et les utilisateurs peuvent demander des ajustements, ajouts ou transformations à une image générée. Une solution qui place ChatGPT en concurrence direct avec des solutions de retouche photo telles que Photoshop.

OpenAI reconnaît que le modèle n’est pas parfait
Le nouveau générateur d’images de ChatGPT ne se prive pas de générer des célébrités, mais OpenAI reconnaît qu’il a encore des progrès à faire. Parmi les limitations actuelles figurent un recadrage parfois trop serré des images longues, des hallucinations occasionnelles (informations inventées), des difficultés avec le rendu très précis de concepts complexes (comme un tableau périodique complet) ou de textes en langues non latines, et une précision d’édition encore perfectible.
Par ailleurs, l’entreprise indique que la sécurité « reste une priorité » et que les images générées incluent des métadonnées C2PA pour indiquer leur origine. De plus, les contenus dangereux ou non conformes aux politiques sont bloqués, avec des restrictions renforcées pour les images de personnes réelles.
Comment essayer le nouveau générateur d’images de ChatGPT ?
OpenAI a choisi de rendre cette nouvelle fonctionnalité accessible à tous les utilisateurs de ChatGPT, y compris ceux qui utilisent la version gratuite. Il suffit d’accéder à ChatGPT et de lui demander de générer une image, une photographie, un dessin sur le thème que vous souhaitez. Afin de profiter au mieux de ses compétences, nous vous conseillons d’être le plus précis possible pour obtenir un résultat fidèle à vos attentes. Le temps de rendu peut aller jusqu’à une minute.
Notez que le déploiement est progressif et devrait être achevé dans les prochaines erreur, ce qui explique pourquoi ChatGPT peut encore utiliser Dall-E dans ses réponses.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.