半导体行业跟踪报告之十八:卡间互联成为AI芯片竞争焦点,华丰科技铜互连方案国内领先.docx

半导体行业跟踪报告之十八:卡间互联成为AI芯片竞争焦点,华丰科技铜互连方案国内领先.docx

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

RAS引擎:Blackwell支持的GPU包含一个专用引擎,实现可靠性、可用性和服务性。此外,Blackwell架构还增加了芯片级功能,利用基于AI的预防性维护进行诊断和预测可靠性问题。这可以最大限度地延长系统正常运行时间,并提高大部署规模AI的弹性,使其能连续运行数周甚至数月,并降低运营成本。

安全人工智能:先进的机密计算功能可在不影响性能的情况下保护AI模型和客户数据,并支持新的本机接口加密协议,这对于医疗保健和金融服务等隐私敏感行业至关重要。

解压缩引擎:专用解压缩引擎支持最新格式,加快数据库查询,提供数据分析和数据科学的最高性能。未来几年,在企业每年花费数百亿美元的数据处理方面,将越来越多地由GPU加速。

此外,英伟达发布了GB200NVL72,把18个Blackwell计算节点(ComputeTray)组合在一起,形成新一代计算单元。

图表2:GB200NVL72

资料来源:英伟达GTC大会

GB200NVL72中一共包含了9个NVLink交换节点(SwitchTray),每个交换节点中配置了2颗NVLinkSwitch芯片,向外提供14.4TB/s的聚合带宽。

图表3:NVLinkSwitchChip 图表4:NVIDIAGB200InternalNVLinkSwitch

资料来源:Servethehome 资料来源:Servethehome

如果要训练一个1.8万亿参数量的GPT模型,需要8000张HopperGPU,消耗15兆瓦的电力,连续跑上90天。但如果使用BlackwellGPU,只需要2000张,同样跑90天只要消耗四分之一的电力。除了训练之外,生成Token的成本也会随之降低。GB200NVL72训练和推理性能相比于等同数量的H100GPU表现提升4倍和30倍。

从NVLINK1.0到NVLINK5.0,英伟达GPU卡间互联快速演进。作为英伟达的核心技术,NVLink在GPU网络通信系统中占据重要地位,其对于提升数据传输效率和处理性能具有显著作用。

NVLink技术实现了GPU与支持该技术的CPU之间以及多个GPU之间的高带宽直接连接,从而大幅提升了整体性能。然而值得注意的是,NVLink技术并未向行业开放,这在一定程度上影响了其他厂商在相关领域的竞争力。

英伟达不仅拥有出色的GPU和软件,还在跨多个GPU和系统横向扩展工作负载方面拥有丰富的技术积累。这些技术包括芯片上和封装上互连、用于服务器或pod中GPU到GPU通信的NVLink、用于超pod扩展的Infiniband以及连接到更庞大基础设施的以太网等。NVLink技术使得CPU与GPU之间能够实现快速数据交换,从而提升了整个计算系统的数据吞吐量,有效克服了加速计算领域的一大瓶颈。

随着英伟达GPU芯片的更新迭代,NVLink技术也在不断进化。从2017年的NVLink2.0到2020年的NVLink3.0,再到2022年的NVLink4.0,每一次更新都带来了更高的性能和更广泛的应用场景。

图表5:NVLink升级过程

资料来源:英伟达,腾讯网

在2024年的GTC大会上,英伟达推出了全新的NVLink5.0技术,并与最新一代Blackwell芯片一同亮相。这一技术极大地提升了大型多GPU系统的可扩展性,单个BlackwellTensorCoreGPU支持多达18个NVLink100GB/s连接,总带宽达到1.8TB/s,较上一代产品提升了两倍之多。此外,NVLink5.0技术还支持跨节点扩展,通过NVLinkSwitch以及铜缆互联实现无缝、高带宽、多节点GPU集群的构建,从而满足数据中心级别的大型GPU需求。

利用NVLink技术,多服务器集群能够平衡GPU通信与增加的计算量,从而实现了更高的性能和效率。例如,在GB200NVL72等服务器平台上,NVLink技术的应用使得这些平台能够支持更为复杂的大型模型,并提供了更高的可扩展性。这些优势使得英伟达在GPU网络通信领域继续保持领先地位,并为其在AI、数据中心等领域的广泛应用提供了有力支持。

二、八巨头组建UALink联盟,卡间互联成为竞争焦点

为弥补卡间互联差距,八大巨头组建UALINK联盟。谷歌、Meta、微软、AMD、英特尔、博通、思科、惠普在内的科技巨头联合宣布成立UltraAcceleratorLink

(UALink)联盟,致

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档