东兴证券_超节点与Scale up网络专题之英伟达:行业标杆,领先优势建立在NVLink和NVLink Switch_20260205.pdfVIP

  • 0
  • 0
  • 约2.49万字
  • 约 27页
  • 2026-02-06 发布于辽宁
  • 举报

东兴证券_超节点与Scale up网络专题之英伟达:行业标杆,领先优势建立在NVLink和NVLink Switch_20260205.pdf

超节点与Scaleup网络专题之英伟达:2026年2月5日

东行业标杆,领先优势建立在NVLink和看好/维持

通信行业报告

兴NVLinkSwitch

分析师石伟晶电话:021邮箱:shi_wj@dxzq.net.cn执业证书编号:S1480518080001

有投资摘要:

公大语言模型(LLM)参数规模从千亿级向万亿级乃至十万亿级演进,跨服务器张量并行(TP)成为必然选

司择;此外混合专家(MoE)模型在Transformer架构LLM中的规模化应用,更使跨服务器专家并行(EP)

证成为分布式训练和推理的关键技术需求。为应对TP和EP对网络带宽与延迟的极为严苛的要求,构建超高

券带宽、超低延迟的Scaleup网络(纵向扩张网络)成为业界主流技术路径。

究目前英伟达超节点已经推出成熟方案。2024-2026年,英伟达陆续推出GH200NVL72、GB200/GB300

报NVL72、VR200NVL72三代超节点。

Hopper架构开启超节点Scaleup初步探索。GH200通过NVLink和NVLink-C2C(Chip-to-Chip)

技术,使得每个GPU可以访问其他所有CPU和GPU芯片的内存,实现GPU与CPU内存统一编址。

Blackwell架构推动Scaleup标准化。GB200NVL72将Scale-up规模稳定在72个GPU/机柜,形

成可复制标准化方案。NVL72由18个ComputeTray(计算托架)和9个SwitchTray(网络交换托

架)构成。其中,ComputeTray是计算核心单元,负责提供强大的计算能力;SwitchTray是高速通

信枢纽,用于实现GPU之间的高速数据交换。NVL72背板通过“NVLink5私有协议+铜线缆”将

18个ComputeTray中的72颗B200GPU和9个SwitchTray中的18颗NVSwitch芯片进行满带

宽全连接。

Rubin架构推动Scaleup方案带宽倍增。2026年1月CES展会,英伟达发布Rubin架构VR200NVL72。

其中NVLink6Switch实现单GPU的互连带宽提升至3.6TB/s,上代为1.8TB/s。Scaleout方面,

Spectrum-6交换机支持CPO(共封装光学)技术,将32个1.6Tb/s硅光光学引擎与交换芯片直接封

装集成。

在超节点方案上,英伟达处于领先优势。2024-2025年,英伟达陆续推出GH200NVL72、GB200/GB300

NVL72等成熟超节点解决方案。根据大摩预测,2025年英伟达GB200/300NVL72出货量约2800台。展

望2026-2027年,英伟达计划推出VeraRubinNVL144和RubinUltraNVL576。互联GPU数将从72颗

进一步向576颗发展。届时,英伟达将在新一代Kyber机架架构中引入NVLinkSwitchBlade(NVLink交

换机刀片),通过PCB中板替代传统5000+根有源铜缆。可以看到,RubinUltraNVL576仍具有较强的工

程创新能力。

英伟达超节点的优势建立在NVLink和NVLinkSwitch。为实现AI训练集群高带宽与低延迟数据传输,

NVLink重新设计通信架构,并引入一系列先进技术,包括网状拓扑、差分信号传输、流量调度信用机制

文档评论(0)

1亿VIP精品文档

相关文档