电子设备-“AI的裂变时刻”系列13：计算集群规模提升趋势明确，以太网交换机市场空间广阔-广发证券[王亮,耿正,张大伟]-20240704【7页】.pdf

下载文档

0
0
约1.02万字
约 7页
2024-07-09 发布于北京
举报
版权申诉
保障服务

电子设备-“AI的裂变时刻”系列13：计算集群规模提升趋势明确，以太网交换机市场空间广阔-广发证券[王亮,耿正,张大伟]-20240704【7页】.pdf

1、本文档共7页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

[Table_Page]行业专题研究|电子

2024年7月4日

证券研究报告

[Table_Title]

“AI的裂变时刻”系列13

计算集群规模提升趋势明确，以太网交换机市场空间广阔

[Tabl

分析师：王亮分析师：耿正分析师：张大伟

e_Author]SAC执证号：S0260519060001SAC执证号：S0260520090002SAC执证号：S0260523050001

SFCCE.no:BFS478

021021021

gfwangliang@gengzheng@zhangdawei@

请注意，耿正,张大伟并非香港证券及期货事务监察委员会的注册持牌人，不可在香港从事受监管活动。

[Table_Summary]

核心观点：

GPU集群规模增长趋势显著。在大模型ScalingLaws持续有效的背景下，以集群形式的分布式并行训练能够

有效节省训练时间与提升GPU使用效率，面对不断膨胀的模型参数和训练数据，为尽可能缩短模型训练时间，

提升模型迭代效率，集群规模有望实现指数级增长。以英伟达为例，根据其在COMPUTEX2024上发布的升

级规划：（1）2024年互联超一万颗GPU；（2）2025年互联超十万颗GPU；（3）2026年互联超百万颗GPU。

集群规模扩张推动网络层数增加，进而提升交换机配比。集群内网络搭建需要满足高带宽和低延迟的需求，因

此，使用Fat-Tree（胖树）架构的CLOS网络正被广泛应用于计算集群中。随着计算集群规模的持续扩大，交

换机网络层数将随之提升。根据英伟达官网，以SPECTRUM-X以太网交换机为例，主流型号SN5600拥有64

个800Gbps端口。根据论文《AScalable,CommodityDataCenterNetworkArchitecture》中的测算，在不考

虑网络收敛和光模块拆分的情况下，不同层数的CLOS胖树架构互联GPU的上限分别为：（1）2层架构：计

算网络最多使用96个交换机，最多互联2,048个GPU，GPU与计算网络交换机配比为64:3；（2）3层架构：

计算网络最多使用5,120个交换机，最多互联65,536个GPU，GPU与计算网络交换机配比为64:5；（3）4层

架构：计算网络最多使用229,376个交换机，最多互联2,097,152个GPU，GPU与交计算网络机的配比为64:7。

GPU集群规模扩张触发InfiniBand互联上限，RoCE协议有望在大集群中更多被应用。InfiniBand协议中优先

考虑尽可能降低网络延迟，而RoCE协议则优先考虑网络的兼容性与分布式。在数据交互中，IB协议中每个

GPU都有自己的LID（LocalID），两两GPU之间交互路径由路由表提前算好，以此实现低延时效果。但根据

IB协议中的报文结构，LID由一个16位的二进制编码组成，因此在IB网络协议下，互联的GPU上限为

2^16=65,536个。随着集群规模向十万卡级别升级，R

您可能关注的文档

文档评论（0）

我爱分享 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

电子设备-“AI的裂变时刻”系列13：计算集群规模提升趋势明确，以太网交换机市场空间广阔-广发证券[王亮,耿正,张大伟]-20240704【7页】.pdf