Le nouveau modèle d’IA multimodale baptisé Gemini était censé révolutionner l’intelligence artificielle. Un sérieux concurrent à Open AI et GPT-4, qui vient d’être mis à pied, sans réelle explication. Le projet, sous la supervision de Google DeepMind devait notamment permettre de propulser Bard, le chatbot de l’entreprise américaine à un tout autre niveau.
Révolutionner Bard, et l’IA
En mai dernier, l’IA Google Bard avait fait les gros titres de l’événement annuel Google I/O 2023. L’entreprise américaine avait aussi évoqué plus discrètement le projet Gemini, tout en indiquant que ce dernier était encore en phase de développement dans ses laboratoires, et qu’il méritait d’être affiné.
Concrètement, et alors que Bard se contente jusqu’alors de produire des réponses textuelles à partir de prompts écrits, l’IA multimodale Gemini serait en mesure de gérer aussi bien des commandes textuelles que des images. De plus, ses capacités seraient bien supérieures à celles de GPT-4, le modèle de langage actuellement utilisé chez Open AI. Autant d’avantages qui assureraient à l’IA de Google une sacrée avance technique sur ChatGPT et sa petite année d’existence.
Pourquoi Google annule Gemini ?
Alors que The Information rapportait il y a peu que Google était sur le point de dévoiler Gemini dans les jours à venir, son dirigeant Sundar Pichai aurait finalement annulé les événements prévus aux États-Unis en vue de l’officialisation de l’IA. Selon les informations de The Information, Gemini serait encore très immature. Il aurait en effet du mal à interpréter les requêtes n’étant pas en anglais. Un problème de taille face à un concurrent qui supporte déjà plus de cinquante langues et dialectes à travers le monde.
Le fait que le prochain langage d’IA de Google soit en anglais n’est pas réellement choquant. Les IA génératives sont très majoritairement entraînées avec des contenus en anglais, ce qui pose d’ailleurs souvent quelques problèmes de transcription lors de leur passage en versions étrangères. Là où GPT-4 semble avoir réussi à passer outre ce changement de langue, Gemini n’en serait encore qu’à ses balbutiements.
Gemini va avoir du retard ?
Pour le moment, aucune information officielle n’a été confirmée par Google concernant son modèle d’IA. En novembre, Sundar Pichai indiquait son intention de lancer rapidement Gemini 1.0, en déployant une première phase de test en accès limité, et un lancement au début de l’année prochaine. Le projet étant visiblement retardé, aucun calendrier de substitution n’a encore été dévoilé.
Reste que la promesse derrière Gemini est grande. L’IA multimodale de Google pourrait être implémentée dans bon nombre d’outils propriétaires et tiers, à condition de séduire le grand public au moment de sa sortie… et de s’imposer à l’international en prenant en charge plusieurs langues.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.