L’intelligence artificielle était partout à la Google I/O 2024. Le géant de l’Internet a multiplié les annonces en lien avec l’IA et notamment présenté Veo. Google Veo est le modèle le plus performant de la firme pour la génération de vidéo en haute définition grâce à l’IA. À en croire les démonstrations du géant américain, Veo a tout d’une réponse à l’impressionnant générateur de vidéo Sora d’OpenAI.
Avec Veo, Google promet de générer des vidéos en 1080p d’une durée pouvant dépasser une minute. La firme évoque une grande variété de styles cinématographiques et visuels pour un outil capable de « générer des vidéos qui représentent fidèlement la vision créative de l’utilisateur ». Veo dispose pour cela d’une compréhension avancée du langage naturel et de la sémantique visuelle, ce qui l’aide a mieux capté le ton d’une invite et de comprendre des termes cinématographiques. Veo comprend « timelapse » ou encore « plans aériens d’un paysage ».
Depuis le lancement de DALL-E 2 en avril 2022, les générateurs d’images et de vidéos par intelligence artificielle se succèdent. Les outils sont de plus en plus impressionnants et la récente annonce de Sora par OpenAI a marqué les esprits. Comme souvent, un modèle de génération dé vidéo aussi impressionnant suscite des craintes, en particulier lorsqu’ils tombent entre les mains de créateurs de deepfakes. Le rival de Google avance toutefois prudemment et ne propose pas encore un accès au grand public.
Un concurrent de taille pour Sora d’OpenAI
La firme de Mountain View pourrait profiter de ce délai pour prouver qu’il n’a rien à envier au père de ChatGPT et Sora. Bien que nous n’ayons pas encore eu l’occasion d’essayer Veo par nous-mêmes, les vidéos de démonstrations de Google sont prometteuses et Veo semble se rapprocher des capacités de la solution d’OpenAI. Nous devons cependant rester prudents face à ces démonstrations, car elles ne sont pas forcément représentatives de l’expérience utilisateur typique.
On observe néanmoins que Google se donne les moyens en proposant son modèle de génération de vidéos le plus performant. Veo s’appuie sur les précédents modèles de génération vidéo de Google tels que Generative Query Network, DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet ou encore Lumiere. Cela lui permet de générer entièrement des séquences « cohérentes et homogènes, de sorte que les personnes, les animaux et les objets se déplacent de manière réaliste tout au long des plans ».
La société californienne précise que Veo est d’ores et déjà disponible pour certains créateurs en avant-première dans VideoFX. Il est possible de s’inscrire sur la liste d’attente et Google prévoit déjà de porter certaines des capacités de Veo « à YouTube Shorts et à d’autres produits ». Enfin, Google indique suivre une approche « responsable » dans le développement de Veo. La firme précise que toutes les vidéos générées par Veo sur VideoFX seront marquées par SynthID.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.