Jensen Huang lance la plateforme Vera Rubin pesant 2,5 tonnes au CES 2026, déterminé à conquérir l'IA physique

2026-03-05 22:12:18

CES 2026 a récemment marqué une étape historique dans le secteur de l’IA lorsque Jensen Huang, PDG de NVIDIA, a présenté sur scène une « machine miracle » pesant 2,5 tonnes. Contrairement aux années précédentes axées sur les cartes graphiques grand public, cette fois Jensen Huang a totalement orienté sa stratégie vers les systèmes de calcul pour entreprises, en annonçant la plateforme Vera Rubin – une avancée majeure dans l’histoire du développement des GPU NVIDIA.

En 48 heures, Jensen Huang a participé à trois grands événements : NVIDIA Live, un séminaire sur l’IA avec Siemens, et TechWorld de Lenovo. Cette présence continue n’est pas fortuite – elle reflète la stratégie globale de NVIDIA pour bâtir un écosystème IA dédié aux applications concrètes.

Vera Rubin : une avancée révolutionnaire dans l’architecture des puces NVIDIA

La plateforme Vera Rubin, nommée d’après l’astronome célèbre, incarne une innovation fondamentale. Pour la première fois dans l’histoire de NVIDIA, une génération de produits ne se contente pas d’améliorer, mais repense entièrement 6 types de puces simultanément, qui entrent désormais en production de masse.

Les raisons de ce changement sont claires : la loi de Moore ralentit. L’approche traditionnelle ne suit plus le rythme multiplié par 10 chaque année des modèles IA. Jensen Huang et NVIDIA ont choisi la voie de la « conception coordonnée extrême » – innover à tous les niveaux simultanément.

Les six composants incluent :

Vera CPU : 88 cœurs Olympus personnalisés, mémoire système de 1,5 To (3 fois la génération Grace), supportant 176 threads avec une bande passante NVLink C2C de 1,8 To/s
Rubin GPU : puissance d’inférence NVFP4 de 50 PFLOPS (5 fois Blackwell), intégrant le moteur Transformer de 3e génération
ConnectX-9 : réseau Ethernet 800 Gb/s avec RDMA programmable
BlueField-4 DPU : processeur dédié avec 64 cœurs Grace CPU, doté de 150 To de mémoire de contexte
NVLink-6 Switch : connectant 72 GPU en un seul bloc cohérent
Spectrum-6 : technologie optique à 512 canaux, chacun à 200 Gbps

Performances dépassant toutes attentes

Le système Vera Rubin NVL72 affiche des chiffres impressionnants. En inférence, la puissance de calcul atteint 3,6 EFLOPS, 5 fois celle de Blackwell. En entraînement, elle atteint 2,5 EFLOPS, soit 3,5 fois plus.

La capacité mémoire LPDDR5X atteint 54 To (3 fois la génération précédente), tandis que la mémoire HBM4 atteint 1,6 Po/s, soit 2,8 fois plus. La plus grande surprise : malgré cette multiplication par 2, la puissance augmente de 70 %, le nombre de transistors n’augmente que de 1,7 fois, pour atteindre 220 000 milliards.

Même du point de vue des coûts, Vera Rubin montre sa puissance. Pour entraîner un modèle de 100 000 milliards de paramètres, il faut seulement 1/4 du nombre de systèmes Blackwell, et le coût pour générer un Token n’est qu’1/10. En termes de performance énergétique, le throughput (nombre de Tokens IA traités par watt et par dollar) augmente de 10 fois – pour un centre de données de plusieurs gigawatts évalué à 50 milliards de dollars, cela signifie doubler le chiffre d’affaires.

La technologie réseau Spectrum-X : une « gratuité » estimée à 5 milliards de dollars

Jensen Huang a calculé précisément : Spectrum-X, la plateforme réseau Ethernet dédiée à l’IA générative, peut augmenter le throughput de 25 %, ce qui équivaut à une économie de 5 milliards de dollars pour un centre de données de plusieurs gigawatts. Il affirme avec confiance : « Ce système réseau est presque gratuit. »

Cette technologie utilise le procédé COOP de TSMC, intégrant la photonique en silicium, permettant à des milliers de GPU et BlueField-4 de fonctionner comme une seule mémoire distribuée.

Résoudre le « problème de la queue longue » de la mémoire de contexte

Un défi majeur pour l’IA a toujours été la mémoire KV Cache, ou « mémoire de tâche » de l’IA. Lors de conversations longues ou avec de grands modèles, la mémoire HBM devient saturée.

Vera Rubin résout ce problème en déployant un BlueField-4 dans chaque nœud serveur. Chaque nœud comporte 4 BlueField-4, chacun avec 150 To de mémoire de contexte, offrant 16 To par GPU sans ralentissement du transfert (toujours à 200 Gbps).

Sécurité renforcée

Vera Rubin supporte le Confidential Computing – toutes les données sont chiffrées durant leur transfert, stockage et calcul, y compris via PCIe, NVLink, et communication CPU-GPU. Les entreprises peuvent déployer leurs modèles en toute sécurité, sans risque de fuite de données.

Open source et agents : les tendances majeures

Jensen Huang a rappelé l’importance du logiciel open source. Il a particulièrement loué DeepSeek V1 – le premier système d’inférence open source, qui a surpris le monde entier. Sur ses slides, des modèles comme Kimi k2 et DeepSeek V3.2 sont listés comme numéro 1 et 2 dans leur domaine.

Même si les modèles open source actuels ont un retard d’environ 6 mois sur les leaders, un nouveau modèle apparaît tous les 6 mois. Cette cadence explique pourquoi startups, géants et chercheurs ne veulent pas rater le train – y compris NVIDIA.

NVIDIA construit un écosystème open source couvrant la biologie, l’IA physique, les agents, la robotique et la conduite autonome. Ils développent aussi des modèles avancés comme La Proteina (synthèse de protéines) et OpenFold 3, ainsi que le supercalculateur DGX Cloud valant plusieurs milliards de dollars.

IA physique : conquérir le monde réel

Si les grands modèles linguistiques résolvent le problème du « monde numérique », la prochaine ambition de Jensen Huang est clairement de conquérir le « monde physique ».

Il propose une architecture « trois ordinateurs principaux » pour l’Physical AI : un ordinateur d’entraînement (construit à partir de GPU), un ordinateur d’inférence (petit cerveau placé en bordure de robot ou voiture), et un ordinateur de simulation (Omniverse et Cosmos).

Alpamayo : un système de conduite autonome capable de raisonnement

Sur cette base, Jensen Huang a officiellement présenté Alpamayo – le premier modèle de conduite autonome capable de penser et de raisonner réellement.

Contrairement à la conduite autonome classique, Alpamayo ne se contente pas d’exécuter des ordres rigides. Lorsqu’il rencontre des situations de trafic complexes inédites, il peut raisonner comme un conducteur humain : « Il vous dira ce qu’il va faire, et pourquoi il a décidé ainsi. »

La Mercedes CLA équipée de la technologie Alpamayo sera lancée aux États-Unis au premier trimestre 2026, puis en Europe et en Asie. Ce véhicule, évalué comme la voiture la plus sûre au monde par NCAP, bénéficie d’un « empilement de sécurité double » unique de NVIDIA – lorsque le modèle IA n’est pas confiant, le système passe en mode sécurité traditionnel.

Stratégie robotique : de Boston Dynamics à l’usine

Tous les robots seront équipés d’un mini-ordinateur Jetson, entraîné dans Isaac Simulator sur la plateforme Omniverse. NVIDIA intègre cette technologie dans l’écosystème industriel, avec Synopsys, Cadence, Siemens.

Jensen Huang a invité sur scène des robots humanoïdes, des robots à quatre pattes de Boston Dynamics et Agility, ainsi que des robots Disney mignons. Mais il a souligné un point clé : « Le plus grand robot, en réalité, c’est l’usine. »

À l’avenir, la conception des puces, la modélisation des systèmes, la simulation d’usines – tout sera accéléré par l’IA physique. Jensen Huang a même dit à l’équipe robotique : « Vous serez conçus dans l’ordinateur, fabriqués dans l’ordinateur, et même vérifiés et validés dans l’ordinateur avant de réellement faire face à la gravité. »

La stratégie globale de Jensen Huang

Dans un contexte de controverse sur la bulle de l’IA, Jensen Huang semble devoir prouver ce que l’IA peut réellement faire. Au-delà de l’annonce de la puissance de Vera Rubin, il investit massivement dans les applications et logiciels.

Passant de la fabrication de puces pour le monde virtuel à la démonstration directe et à l’accent mis sur le Physical AI – conduite autonome, robots humanoïdes – il veut entrer dans le monde physique réel. Comme il le dit : « Ce n’est qu’au moment où la bataille fait rage que l’arme peut continuer à se vendre. »

CES 2026 a prouvé qu’avec Jensen Huang à la tête, NVIDIA ne vend pas seulement des puces – ils construisent l’avenir de l’IA physique.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.