- 1、本文档共91页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
[编号ODCC-2024-03007]
ETH-X互联报告
开放数据中心标准推进委员会
2024.09发布
ETH-X互联报告
版权声明
ODCC(开放数据中心委员会)发布的各项成果,受《著作权法》保护,编制单位共同享有著作权。
转载、摘编或利用其它方式使用ODCC成果中的文字或者观点的,应注明来源:“开放数据中心委员会ODCC”。
对于未经著作权人书面同意而实施的剽窃、复制、修改、销售、改编、汇编和翻译出版等侵权行为,ODCC及有关单位将追究其法律责任,感谢各单位的配合与支持。
I
ETH-X互联报告
编写组
项目经理:
张玓
北京快手科技有限公司
工作组长:
何泽坤
腾讯科技(深圳)有限公司
贡献专家:
崔鹏
腾讯科技(深圳)有限公司
孙敏
腾讯科技(深圳)有限公司
余曦
北京快手科技有限公司
王正斌
北京快手科技有限公司
戚宝侃
北京快手科技有限公司
陈琼南
东莞立讯技术有限公司
金龙
东莞立讯技术有限公司
罗振
东莞立讯技术有限公司
朱虎
武汉光迅科技股份有限公司
李庭宇
武汉光迅科技股份有限公司
王飚
武汉光迅科技股份有限公司
夏寅贲
腾讯科技(深圳)有限公司
孙聪
中国信息通信研究院
II
ETH-X互联报告
目录
版权声明 I
编写组 II
一、缩略语 1
二、ETH-X互联解决方案 1
(一)Scaleup的高密度高速率互联解决方案(ETHXLink) 3
1ETHXLink高速互联应用场景介绍 4
2ETHXLink柜内高速互联界面 8
3ETHXLink服务器节点高速互联界面 12
4ETHXLink交换节点高速互联介面 17
5ETHXLink机柜到机柜间高速互联界面 24
(二)Scaleout的高密度高速率互联解决方案(ROCE) 27
1Scaleout高速互联应用场景介绍 27
2Scaleout超节点高速互联界面 29
III
ETH-X互联报告
一、缩略语
下列缩略语适用于本文件。
表1缩略语
ACC
ActiveCopperCablepluggable
AEC
ActiveElectricalCablepluggable
Capex
Capitalexpenditure
DAC
DirectAttachCablepluggable
HBD
HighBandwidthDomain
Opex
Operatingexpense
OSFP
OctalsmallForm-Factorpluggable
QSFP112
QuadsmallForm-Factorpluggable112Gpbs
QSFP-DD
QuadsmallForm-Factorpluggable-DoubleDensity
RAR
Rightanglereceptacle.
二、ETH-X互联解决方案
AIGC从探索到实际生产力的快速演进,AIGC已经成为各个行业的重要战略;随着模型参数规模的快速增大,可支撑AIGC的相关基础设施技术快速迭代,业内也在不断涌现不同的构建新型算力单元及集群的方式,尽快对下一代基础设施算力能力的构建方式的探索和框架指定显得尤为重要。下一代的算力基础设施需要满足:可支持高性能超大规模模型对训练及推理性能的需求;从架构设计角度解锁因当前外部环境国内单卡算力和供应均受限的供应效率问题;足够的稳定性、以及解决高性能、高可用下对基础设施CaPex和Opex运行成本的追求。
Nvidia、Google和华为为代表的公司纷纷推出了超节点(SuperPod)的架构来应对更大模型参数对AI基础设施的挑战。其特点在于:HighBandwidthDomain-HBD,即通过NVLINK/HCCS等
1
ETH-X互联报告
私有协议实现一定卡数规模大带宽,内存一致性,更低时延的互连;以HBD为基础单元,通过基于RoCE的组网,实现更大规模的算力集群;结合高功率整机柜单元,通过铜缆替代AOC/光模块在柜内应用的方式,进一步降低延时,同时实现更低网络建设成本;
ETH-X项目旨在借鉴相关技术/架构的基础上,打造一个开放解耦的AI算力基础设施架构,核心特征是基于直出以太网的GPU打造下一代算力基础设施。其中ETH-X对互连的技术要求是满足:大带宽、低延时、灵活拆分并支持前向/后向兼容;充分考虑简化互连组件的微结构,降低互连成本;尽可能降低因链路稳定性带来的训练中断时间和多元化上游部件和芯片生
您可能关注的文档
- 2024年8月金融数据解读:M2平行移动 等待政策合力.docx
- 2024年8月进出口数据点评:外需韧性及抢出口支撑出口小幅回升,进口增速快速回落值得关注 20240910 -中诚信.docx
- 2024年8月贸易数据解读:8月出口超预期,进口增速较快回落 -东方金诚.docx
- 2024年中国政务行业大模型发展洞察.docx
- 2024全球人工智能发展研究报告-鼎雄咨询.docx
- 2024小红书青年城市文化创造趋势报告.docx
- AlibabaCloudLinux 产品介绍 打造阿里云上最佳操作系统体验.docx
- A股市场资金研究系列(二):美股 日股 台股 A股对比研究-A股投资者结构演变及国际经验借鉴.docx
- CEEM《全球智库半月谈》(总第287期).docx
- CEEM中国外部经济监测(2024年8月).docx
文档评论(0)