- 1、本文档共91页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
[编号ODCC-2024-03007]
ETH-X互联报告
开放数据中心标准推进委员会
2024.09发布
ETH-X互联报告
版权声明
ODCC(开放数据中心委员会)发布的各项成果,受《著作权法》保护,编制单位共同享有著作权。
转载、摘编或利用其它方式使用ODCC成果中的文字或者观点的,应注明来源:“开放数据中心委员会ODCC”。
对于未经著作权人书面同意而实施的剽窃、复制、修改、销售、改编、汇编和翻译出版等侵权行为,ODCC及有关单位将追究其法律责任,感谢各单位的配合与支持。
I
ETH-X互联报告
编写组
项目经理:
张玓
北京快手科技有限公司
工作组长:
何泽坤
腾讯科技(深圳)有限公司
贡献专家:
崔鹏
腾讯科技(深圳)有限公司
孙敏
腾讯科技(深圳)有限公司
余曦
北京快手科技有限公司
王正斌
北京快手科技有限公司
戚宝侃
北京快手科技有限公司
陈琼南
东莞立讯技术有限公司
金龙
东莞立讯技术有限公司
罗振
东莞立讯技术有限公司
朱虎
武汉光迅科技股份有限公司
李庭宇
武汉光迅科技股份有限公司
王飚
武汉光迅科技股份有限公司
夏寅贲
腾讯科技(深圳)有限公司
孙聪
中国信息通信研究院
II
ETH-X互联报告
目录
版权声明 I
编写组 II
一、缩略语 1
二、ETH-X互联解决方案 1
(一)Scaleup的高密度高速率互联解决方案(ETHXLink) 3
1ETHXLink高速互联应用场景介绍 4
2ETHXLink柜内高速互联界面 8
3ETHXLink服务器节点高速互联界面 12
4ETHXLink交换节点高速互联介面 17
5ETHXLink机柜到机柜间高速互联界面 24
(二)Scaleout的高密度高速率互联解决方案(ROCE) 27
1Scaleout高速互联应用场景介绍 27
2Scaleout超节点高速互联界面 29
III
ETH-X互联报告
一、缩略语
下列缩略语适用于本文件。
表1缩略语
ACC
ActiveCopperCablepluggable
AEC
ActiveElectricalCablepluggable
Capex
Capitalexpenditure
DAC
DirectAttachCablepluggable
HBD
HighBandwidthDomain
Opex
Operatingexpense
OSFP
OctalsmallForm-Factorpluggable
QSFP112
QuadsmallForm-Factorpluggable112Gpbs
QSFP-DD
QuadsmallForm-Factorpluggable-DoubleDensity
RAR
Rightanglereceptacle.
二、ETH-X互联解决方案
AIGC从探索到实际生产力的快速演进,AIGC已经成为各个行业的重要战略;随着模型参数规模的快速增大,可支撑AIGC的相关基础设施技术快速迭代,业内也在不断涌现不同的构建新型算力单元及集群的方式,尽快对下一代基础设施算力能力的构建方式的探索和框架指定显得尤为重要。下一代的算力基础设施需要满足:可支持高性能超大规模模型对训练及推理性能的需求;从架构设计角度解锁因当前外部环境国内单卡算力和供应均受限的供应效率问题;足够的稳定性、以及解决高性能、高可用下对基础设施CaPex和Opex运行成本的追求。
Nvidia、Google和华为为代表的公司纷纷推出了超节点(SuperPod)的架构来应对更大模型参数对AI基础设施的挑战。其特点在于:HighBandwidthDomain-HBD,即通过NVLINK/HCCS等
1
ETH-X互联报告
私有协议实现一定卡数规模大带宽,内存一致性,更低时延的互连;以HBD为基础单元,通过基于RoCE的组网,实现更大规模的算力集群;结合高功率整机柜单元,通过铜缆替代AOC/光模块在柜内应用的方式,进一步降低延时,同时实现更低网络建设成本;
ETH-X项目旨在借鉴相关技术/架构的基础上,打造一个开放解耦的AI算力基础设施架构,核心特征是基于直出以太网的GPU打造下一代算力基础设施。其中ETH-X对互连的技术要求是满足:大带宽、低延时、灵活拆分并支持前向/后向兼容;充分考虑简化互连组件的微结构,降低互连成本;尽可能降低因链路稳定性带来的训练中断时间和多元化上游部件和芯片生
您可能关注的文档
- 2024年中国变压器行业概览:AI数据中心建设如火如荼,电网投资拉动变压器需求 -头豹.docx
- 2024年中国风干牛肉行业概览:传承古老工艺,品味舌尖之旅 -头豹.docx
- 2024年中国政务行业大模型发展洞察.docx
- 2024数字经济报告.docx
- AI数据中心网络建网参考报告 2024.docx
- ETH-X超节点AI 整机柜设计规范 2024.docx
- ETH-X计算节点参考设计 2024.docx
- ETH-X交换节点硬件规范 2024.docx
- kpmg -2024年控制系统网络安全年度报告 运营技术(OT)网络安全的最新趋势与挑战.docx
- M13A 口服固体速释制剂的生物等效性.docx
- 2024年江西省寻乌县九上数学开学复习检测模拟试题【含答案】.doc
- 2024年江西省省宜春市袁州区数学九上开学学业水平测试模拟试题【含答案】.doc
- 《GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语》.pdf
- 中国国家标准 GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- 《GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构》.pdf
- 中国国家标准 GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 中国国家标准 GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 《GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南》.pdf
文档评论(0)