超节点与Scale up网络行业:谷歌、AMD、国产超节点持续发力,打破英伟达独大格局.pptxVIP

  • 0
  • 0
  • 约5.24万字
  • 约 10页
  • 2026-03-06 发布于湖南
  • 举报

超节点与Scale up网络行业:谷歌、AMD、国产超节点持续发力,打破英伟达独大格局.pptx

投资摘要:

超节点与Scale-up网络是突破算力与通信瓶颈、支撑万亿级大模型与高实时性应用的关键基础设施。本篇超节点与Scaleup网络行业深度报告,详细研究英伟达、谷歌、AMD以及华为四家头部AI算力芯片厂商在此领域的布局进展以及各自优势。我们认为,超节点与Scale-up网络正处于快速发展期,并将成为算力芯片、网络部件(PCB板、交换芯片、光器件、高速铜缆)、存储部件、供电和散热设施部件等新兴技术的重要应用市场。

(1)英伟达:超节点领先优势建立在NVLink和NVLinkSwitch。

在超节点技术方案上,英伟达处于领先优势。2024-2025年,英伟达陆续推出GH200NVL72、GB200/GB300NVL72等成熟超节点解决方案。根据大摩预测,2025年英伟达GB200/300NVL72出货量约2800台。展望2026-2027年,英伟达计划推出VeraRubinNVL144和RubinUltraNVL576。互联GPU数将从72颗进一步向576颗发展。届时,英伟达将发布新一代Kyber机架,架构引入NVLinkSwitchBlade(NVLink交换机刀片),通过PCB中板替代传统5000+根有源铜缆。可以看到,RubinUltraNVL576仍保持较强的工程创新能力。

英伟达超节点的优势建立在NVLink和NVLinkSwitch。为实现AI训练集群高带宽与低延迟数据传输,

NVLink重新设计通信架构,并引入一系列先进技术,包括网状拓扑、差分信号传输、流量调度信用机制、多Lane绑定技术、统一内存空间等。截止2025年,NVLink5Switch实现支持单GPU到GPU带宽1800GB/s,可构建72GPU的NVLink域,总带宽达130TB/s(双向),支持72GPU全互联通信。在后续计划中,

NVSwitchGen6和Gen7的GPU-to-GPU通信带宽继续升级为3.6TB/s。

但另一方面,Scaleup网络兴起源于满足大模型分布式训练和推理中的张量并行(TP)与专家并行(EP)。目前AI产业也在探索降低TP与EP规模的技术方案,从而降低Scaleup网络规模的上限。我们认为,Scaleup网络的发展空间或限制英伟达在超节点领域的领先优势。为保持领先优势,实现Scaleup网络和Scaleout网络融合或将成为英伟达超节点新的发展趋势。

(2)华为:对外开放灵衢互联协议,超节点性能追赶英伟达。

国内ScaleUp协议尚未统一,华为灵衢协议尚未被国内业界广泛接受。在ScaleUp协议方面,华为推出灵衢协议,并从2.0版本起转向开放标准。除此之外,国内其他厂商正探索多种互联协议,包括中移OISA、腾讯ETH-X、高通量以太网ETH+以及中兴通讯OLink等。为打破生态壁垒,国内正积极推动标准统一,比如工信部正牵头推动CLink协议,旨在形成统一的国内标准。

华为超节点依靠集群化方式实现性能追赶。Atlas950超节点预计2026年第四季度发布,相比英伟达同样将在2026年下半年上市的NVL144总算力2.52EFLOPS(FP8),其算力达到8EFLOPS(FP8)。此外,Atlas950超节点在内存容量1152TB与互联带宽16.3PB/s,也实现大幅领先。我们认为,短期内,华为超

超节点与Scaleup网络行业:谷歌、AMD、国产超节点持续发力,打破英伟达独大格局

行业研究

看好/维持

通信

行业报告

敬请参阅报告结尾处的免责声明东方财智兴盛之源

2026年3月2日

节点依靠集群化实现性能追赶,但在超节点复杂性、可靠性、功耗等维度需要平衡。从整体解决方案看,英伟达在超节点的芯片工艺、软件生态与系统集成上的优势仍难以撼动。

Atlas950超节点互联方案或将调整,显示华为超节点技术在标准化阶段仍需夯实。相比上一代超节点,华为Atlas950超节点不再使用全光互联架构,其通过“柜内正交铜互联+柜间光互联”的混合设计,在机柜内部利用铜互联实现高可靠、低成本和低功耗的连接,跨机柜则通过光互联保障系统的可扩展性,从而在维持系统可扩展性的同时,有效控制总体拥有

文档评论(0)

1亿VIP精品文档

相关文档