CITIC Securities : Se concentrer sur l'inflation de la chaîne de puissance de calcul, optimiste sur le renforcement de la confiance par Nvidia GTC dans la croissance continue de l'industrie de l'IA

robot
Création du résumé en cours

China Securities a publié un rapport de recherche indiquant que la conférence GTC 2026 de Nvidia approche à grands pas, et il est prévu que la gamme de produits de puces de l’entreprise soit encore élargie. En plus de l’ensemble des six puces principales de la plateforme Vera Rubin AI, il est possible que des détails supplémentaires sur la Rubin Ultra et les armoires soient dévoilés lors de la conférence, apportant des innovations dans l’architecture de conception telles que l’interconnexion de données et l’alimentation. La mise en œuvre de nouveaux produits comme le backplane orthogonal et le CPO pourrait également voir une visibilité accrue. Dans le contexte de la tendance inflationniste de la chaîne de puissance, la demande mondiale en capacité de calcul continue de dépasser les attentes, et la prospérité ainsi que la hausse des prix dans les segments en amont devraient perdurer. Cela en fait la ligne directrice la plus certaine pour la configuration du secteur technologique actuel, axée sur la croissance prospère. La société estime que la GTC 2026 renforcera davantage la confiance du marché dans la croissance continue de l’industrie de l’IA et la réalisation de la logique d’incrément.

Les principaux points de China Securities sont les suivants :

Point d’intérêt 1 : La plateforme Rubin apporte une nouvelle gamme de puces, illustrant une conception de collaboration extrême.

Lors du CES 2026, Nvidia a lancé l’ensemble des six puces principales de la plateforme Vera Rubin AI : Rubin GPU, Vera CPU, BlueField-4 DPU, NVLink 6 Switch, ConnectX-9 SuperNIC, Spectrum-6 Ethernet Switch, comprenant tous les composants clés à l’intérieur des armoires. La fabrication de ces puces a été mise à niveau vers le procédé TSMC 3 nm, intégrant la mémoire HBM4, avec une capacité et une bande passante accrues. Cette nouvelle gamme de produits favorise une synergie renforcée entre GPU, CPU et puces d’interconnexion, tandis que la conception modulaire améliore la cohésion globale de l’armoire par rapport à la génération précédente Blackwell.

Point d’intérêt 2 : Des détails supplémentaires sur Rubin Ultra pourraient être dévoilés, avec des innovations attendues dans l’interconnexion de données et l’alimentation.

Considérant que Nvidia a confirmé lors du CES 2026 que la plateforme Vera Rubin est entrée en production à grande échelle, cette société pense que lors de la GTC 2026, Nvidia pourrait révéler davantage de détails sur Rubin Ultra et les armoires. En plus de doubler la performance de Rubin Ultra via l’intégration de 4 dies de calcul, deux axes principaux méritent une attention particulière :

  1. En matière d’interconnexion de données : une augmentation significative de l’échelle, avec une architecture réseau superposée à deux couches, combinant un backplane en cuivre (interconnexion interne des canisters) et une interconnexion optique (interconnexion entre canisters). De nouvelles technologies et matériaux tels que RPCB 78L, M9 CCL, Q glass, CPO pourraient être déployés.

  2. En ce qui concerne le système d’alimentation : la puissance et la consommation énergétique deviennent des contraintes majeures pour l’expansion de la capacité de calcul. Des solutions comme le système d’alimentation en courant continu haute tension (HVDC) à 800V et l’alimentation modulaire pourraient être adoptées, avec des améliorations possibles dans la technologie PCB enterrée, les semi-conducteurs GaN de troisième génération, etc.

Point d’intérêt 3 : Nvidia pourrait lancer une nouvelle puce d’inférence, la LPU, renforçant la ligne de produits d’inférence.

Nvidia pourrait élever l’inférence IA au rang d’infrastructure système, avec une séparation PD entre LPU et CPX pour renforcer la gamme de produits d’inférence.

Concernant la LPU : lors de la GTC, cette société prévoit de lancer une nouvelle puce d’inférence intégrant la technologie LPU de Groq, conçue spécifiquement pour l’inférence LLM, avec une architecture de puce personnalisée, une refonte du Tensor Streaming Processor (TSP) et l’utilisation de SRAM comme mémoire intégrée, ce qui augmente considérablement la vitesse de stockage et de récupération des données, parfaitement adaptée aux exigences élevées en bande passante mémoire lors du décodage.

Concernant le CPX : le Rubin CPX lancé en 2025 permettrait de réduire efficacement les coûts lors de la phase de pré-remplissage, avec une possible adoption de GDDR7 ou HBM3E comme mémoire principale. En termes de forme produit, selon SemiAnalysis, le CPX pourrait passer d’une intégration dans le Rubin Compute Tray à une configuration dans une armoire indépendante, livrée avec le NVL72 VR200. D’après des informations de la chaîne industrielle, la LPU pourrait également être déployée sous forme d’une armoire indépendante de 256 cartes LPX.

Point d’intérêt 4 : Perspectives sur la prochaine génération d’architecture Feynman.

La tendance de conception de la prochaine architecture Feynman de Nvidia suscite un intérêt croissant dans l’industrie, et Nvidia pourrait également en présenter des éléments lors de la GTC 2026. Selon les informations industrielles actuelles, Trendforce prévoit que Feynman sera l’un des premiers à adopter le procédé A16 de TSMC, avec une alimentation potentiellement basée sur la technologie SPR (Backside Power Delivery), libérant plus d’espace pour le routage, et pourrait intégrer la technologie d’empilement 3D pour la combinaison avec la pile matérielle LPU de Groq.

En termes de calendrier de déploiement, la production pourrait commencer en 2028, avec une livraison aux clients dès 2029. Les détails précis de l’architecture Feynman restent encore flous, mais cette société estime que la compréhension de Nvidia concernant l’avenir de la mise à niveau des capacités de calcul IA sera cruciale. Face au ralentissement de la loi de Moore, il sera essentiel d’innover dans la puissance, la mémoire et la capacité de calcul pour soutenir l’évolution continue de l’industrie de l’IA, en redéfinissant le rôle et la position de la formation et de l’inférence, en anticipant le cycle de retour sur investissement dans l’IA. Nvidia pourrait ainsi apporter lors de la GTC davantage d’inspiration et de surprises pour l’industrie de l’IA.

Facteurs de risque :

Risques géopolitiques, volume de lancement de nouveaux produits de leaders mondiaux du calcul hors ligne inférieur aux attentes, croissance de la demande du marché de l’IA inférieure aux prévisions, hausse continue des prix des composants de stockage, risques liés à la révolution technologique et à l’itération des produits, risques réglementaires et de confidentialité des données, intensification de la concurrence dans l’industrie PCB.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler