Google DeepMind a levé le voile sur Veo 2, son dernier modèle d’intelligence artificielle dédié à la génération vidéo. Présenté comme une version largement améliorée de son prédécesseur (Veo, donc), ce nouvel outil est capable de créer des vidéos de plus de deux minutes en résolution 4K. À titre de comparaison, son concurrent Sora d’OpenAI se limite à des clips de 20 secondes en 1080p.
Toujours plus loin dans le réalisme
Mais ces performances restent théoriques pour l’instant. L’outil VideoFX, où Veo 2 est actuellement en test, limite la création à des vidéos de 8 secondes en 720p. Google assure que l’accès à cet outil sera élargi dans les prochains jours, et que Veo 2 sera également intégré à d’autres produits, comme sa plateforme Vertex AI, à mesure que la technologie sera prête pour un usage à grande échelle.
Eli Collins, vice-président produit chez DeepMind, a expliqué : « Nous continuerons à améliorer Veo 2 grâce aux retours des utilisateurs et prévoyons de partager davantage de nouveautés l’année prochaine.»
Au-delà des chiffres impressionnants, Veo 2 se distingue par ses capacités techniques. DeepMind affirme que le modèle comprend mieux les principes de la physique, les mouvements de caméra, et les propriétés de la lumière. Résultat : des textures plus nettes, une gestion plus réaliste des ombres et reflets, et une meilleure modélisation des fluides, comme du café versé dans une tasse ou du sirop d’érable coulant sur des pancakes.
En termes de style, Veo 2 peut produire des vidéos aussi variées qu’un clip animé façon Pixar ou une scène tournée avec des effets cinématographiques spécifiques. Par exemple, il est possible de demander un « gros plan » ou un « objectif 18 mm » et le modèle adapte ses créations en conséquence.
Cependant, tout n’est pas parfait. Malgré des progrès, Veo 2 n’échappe pas à certains défauts courants dans les modèles IA : incohérences dans les détails complexes, personnages qui peinent à rester identiques sur la durée, ou encore difficultés avec les mouvements rapides.
Eli Collins reconnaît ces limites : « Il y a encore des défis à relever en termes de cohérence et de réalisme. Nous travaillons avec des créateurs pour affiner nos outils. » Parmi les artistes collaborant avec DeepMind, on trouve des noms prestigieux comme Donald Glover ou The Weeknd.
Comme beaucoup d’outils basés sur l’intelligence artificielle, Veo 2 soulève des questions éthiques. DeepMind reste flou sur les sources de vidéos utilisées pour entraîner son modèle, mais YouTube, propriété de Google, est un candidat probable. Cette utilisation de contenus publics sans consentement explicite des créateurs fait grincer des dents, notamment dans les milieux artistiques.
Pour limiter les abus, Veo 2 intègre une technologie de watermarking, baptisée SynthID, qui marque discrètement les vidéos pour signaler qu’elles ont été générées par IA. Cependant, ces protections ne sont pas infaillibles.
En parallèle, DeepMind a annoncé une mise à jour de son modèle d’image, Imagen 3, qui génère désormais des images plus détaillées et stylisées, allant du réalisme à l’animation japonaise. Ces outils, certes prometteurs, montrent que l’avenir de la création numérique reste étroitement lié aux avancées — et aux limites — de l’intelligence artificielle.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.