Nvidia, leader du marché des puces IA avec plus de 80 % de part de marché, a levé le voile sur le GH200 qui possède le même GPU que le H100, son processeur IA haut de gamme actuel. Ce nouveau processeur est couplé avec 141 Go de mémoire et un processeur central ARM doté de 72 cœurs.
Nvidia trône en majesté au sommet du marché
Jensen Huang, le CEO de Nvidia, a présenté cette nouvelle puce comme un accélérateur du développement à grande échelle des centres de données mondiaux. La disponibilité est prévue pour le deuxième trimestre 2024, avec des échantillons disponibles avant la fin de cette année.
Le GH200 est particulièrement doué pour tout ce qui est lié à l’inférence, étape coûteuse en calcul qui nécessite une grande puissance de traitement chaque fois que le logiciel fonctionne. Avec une mémoire plus importante, ce processeur permettra à de plus grands modèles d’IA de fonctionner sur un seul système. Jensen Huang l’a promis : « l’inférence de grands modèles de langage sera beaucoup moins coûteuse ».
L’annonce de Nvidia survient alors que la concurrence s’intensifie dans le domaine du matériel IA. Récemment, AMD a annoncé son propre processeur destiné aux traitements d’intelligence artificielle, le MI300X, qui peut supporter 192 Go de mémoire. Il est justement vendu sur ses capacités d’inférence IA. Google et Amazon développent également leurs propres puces IA personnalisées pour l’inférence. La rareté des puces de Nvidia, très demandées par les géants de la technologie, les fournisseurs de cloud et les startups, ajoute à la pression sur l’entreprise qui veut absolument maintenir son avance. Ian Buck, vice-président de Nvidia, a souligné l’importance de la mémoire plus grande, permettant au modèle de demeurer sur un seul GPU, sans nécessiter de systèmes ou de GPU multiples pour fonctionner.
Avec le GH200, Nvidia cherche à répondre aux besoins de plus en plus pressants des entreprises qui font commerce de l’intelligence artificielle. De quoi assurer la place de numéro 1 du constructeur, qui veut éviter de se reposer sur ses lauriers : la concurrence investit elle aussi lourdement dans la recherche et le développement de solutions tout aussi performantes. L’explosion de l’intelligence artificielle générative (ChatGPT, Dall-E, Bard…) offre un boulevard à Nvidia pour vendre ses solutions de calcul de l’IA, comme cela avait été le cas d’ailleurs pendant la « bulle » des NFT. Nvidia a décidément le chic de se retrouver toujours au cœur des nouveautés technologiques.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.