Avec le lancement d’Imagen 3, Google ouvre en grand les portes de la création d’images par IA sur mobile et sur le web. Disponible gratuitement sur la plateforme Gemini à cette adresse, le générateur crée des images en réponse aux descriptions texte des utilisateurs.
Un usage gratuit limité
Il y a cependant une limite si l’on veut générer des images avec des personnes : il est nécessaire de souscrire à l’offre Gemini Advanced, une option intégrée à la formule Google One AI Premium facturée 21,99 € mois. Elle inclut également un stockage étendu sur Google One (2 To) et des fonctionnalités IA premium dans Google Docs.
Comparé aux versions précédentes, Imagen 3 offre une qualité d’image supérieure, avec des détails plus précis, des couleurs vibrantes et une réduction notable des imperfections visuelles. L’outil propose une multitude de styles visuels, ce qui permet de générer aussi bien des paysages réalistes que des scènes façon « claymation » ou des peintures à l’huile.
Google souligne également des améliorations dans le rendu du texte intégré aux images, un défi important pour les générateurs d’images par IA. Ainsi, lorsqu’un utilisateur demande une illustration de bande dessinée avec une bulle de dialogue, le texte doit être lisible et en accord avec le style demandé… même si certaines imperfections subsistent dans ce domaine.
Imagen 3 a été évalué par Google DeepMind en comparaison avec d’autres modèles IA de génération d’images, comme DALL-E 3, Midjourney v6 et Stable Diffusion XL 1.0. Les résultats montrent qu’Imagen 3 se distingue par sa capacité à produire des images qui satisfont davantage les attentes des utilisateurs, que ce soit pour la précision des détails ou pour la variété des styles offerts.
Parmi les fonctionnalités phares, la plateforme permet une personnalisation en continu de l’image. Contrairement à certains générateurs qui créent plusieurs variantes par défaut, Imagen génère une seule image par description, laissant ensuite l’utilisateur affiner le résultat à sa guise. Chaque nouvelle demande génère une nouvelle image basée sur les modifications apportées, une manière de proposer une expérience plus interactive et flexible afin d’ajuster les éléments visuels en fonction des retours de l’utilisateur.
Les utilisateurs peuvent télécharger les images produites en haute résolution (2048 x 2048 pixels), sans limite quotidienne pour les téléchargements, tant qu’ils respectent les restrictions concernant la représentation des personnes. Par ailleurs, toutes les images, même sur l’offre gratuite, peuvent être stockées, partagées, ou même intégrées dans Google Docs et Gmail.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.