Nouveau GPU Blackwell Ultra
La puce Blackwell Ultra de Nvidia est une évolution majeure dans le domaine de l’intelligence artificielle, offrant une capacité mémoire de 288 Go par puce. Cette architecture est conçue pour répondre aux besoins croissants des applications d’IA avancées, telles que l’agentic AI et l’IA de raisonnement. Avec une performance de 20 pétaflops en IA, elle permet aux modèles de résoudre des problèmes complexes de manière autonome tout en réduisant les coûts opérationnels grâce à une meilleure gestion de la mémoire et une efficacité accrue.
Des GPU Vera Rubin et Rubin Ultra
Nvidia a dévoilé sa feuille de route future avec les architectures Vera Rubin et Rubin Ultra. Vera Rubin, prévue pour 2026, promet une performance de 50 pétaflops en FP4, tandis que Rubin Ultra, attendue pour 2027, doublera cette performance avec 100 pétaflops et une mémoire de 1 To par GPU. Rubin Ultra utilisera quatre GPU interconnectés, offrant un bond technologique majeur avec des performances en inférence et entraînement significativement améliorées. Ces architectures visent à répondre aux besoins croissants des applications d’IA avancées et des simulations complexes.
NVIDIA Dynamo
Nvidia a lancé Dynamo, un système d’exploitation open-source pour l’AI, conçu pour accélérer et optimiser les modèles de raisonnement AI dans les usines d’IA. Dynamo permet une gestion efficace des requêtes d’inférence sur de grandes flottes de GPU, réduisant ainsi les coûts opérationnels tout en augmentant la performance. Grâce à des techniques de traitement décomposé et de routage intelligent, Dynamo simplifie la mise en œuvre et la gestion des infrastructures d’IA, facilitant l’adoption de l’IA dans divers secteurs.
Des avancées en Robotique et Automotive
Nvidia a teasé des avancées significatives dans la robotique et l’automotive, avec des systèmes autonomes et des technologies de conduite autonome. Le partenariat avec General Motors pour intégrer l’IA dans la conception et la production de véhicules est un exemple notable. Ces innovations pourraient transformer l’industrie automobile en intégrant l’IA dans la production, la conception et l’expérience de conduite. Les systèmes autonomes promettent une sécurité accrue et une efficacité améliorée dans les usines et sur les routes.
Quantum Computing
Nvidia a organisé une “journée quantique” lors de la GTC pour explorer les applications concrètes du calcul quantique, potentiellement révolutionnant des domaines comme la cryptographie et la simulation moléculaire. L’objectif est de lier les GPU de Nvidia aux avancées quantiques pour résoudre des problèmes insolubles pour les ordinateurs classiques. Cette initiative vise à ouvrir de nouvelles voies pour la recherche scientifique et l’innovation technologique, en exploitant les capacités uniques du calcul quantique pour aborder des défis complexes.
L’arrivée de Superordinateurs AI Personnels (DGX Spark et DGX Station)
Nvidia a présenté les supercalculateurs personnels d’IA DGX Spark et DGX Station, conçus pour permettre aux utilisateurs de prototyper et déployer des modèles d’IA complexes localement. DGX Station utilise la puce Blackwell Ultra, offrant des performances de 20 pétaflops en IA, tandis que DGX Spark est alimenté par la puce GB10 et offre une puissance considérable dans un format compact. Ces systèmes visent à démocratiser l’accès à l’IA pour les chercheurs et les développeurs, leur permettant de travailler sur des projets d’IA avancés sans dépendre d’infrastructures cloud coûteuses. Des partenariat avec plusieurs constructeurs tel que ASUS ont également été annoncés.

Un nouvelle Gamme de Serveurs d’IA (GB300 NVL72)
Le système GB300 NVL72 de Nvidia regroupe 72 GPU Blackwell Ultra et 36 CPU Grace, offrant une puissance de 50 petaflops en inférence. Prévu pour la seconde moitié de 2025, ce système est conçu pour répondre aux besoins croissants des centres de données et des applications d’IA à grande échelle. Il offre une compatibilité avec les infrastructures existantes tout en améliorant les performances et la capacité de mémoire par rapport aux modèles précédents, facilitant ainsi l’intégration dans les environnements de production actuels.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.