基于光互连的智能算力集群建议硬件环境清单、智能算力集群加速卡技术规格、模型参数要求、测试报告模板、存档材料列表.docxVIP

基于光互连的智能算力集群建议硬件环境清单、智能算力集群加速卡技术规格、模型参数要求、测试报告模板、存档材料列表.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

STYLEREF标准文件_文件编号T/CESAXXX—XXXX

STYLEREF标准文件_文件编号错误!文档中没有指定样式的文字。

PAGE9

PAGE1

(资料性)

建议硬件环境清单

光直连集群机房硬件配置清单

序号

设备名称

数量

参考规格

备注

1

GPU服务器

2

cpu:IntelXeonCPU*2

ram:2TB

ssd:系统盘480G*2,数据盘3.84TB*4

gpu:厂家GPU*8

电口:千兆网口*1

光口:GPU计算网口200Gb*2,管理网口25Gb*1

电源:4个

GPU计算区域GPU服务器

2

RoCE交换机

1

L3以太网交换机,

支持RoCE网络,

支持200G光口,

配套模块和线缆

GPU计算区网络设备

3

核心交换机

1

L3以太网交换机,

支持25Gb光口,

配套模块和线缆

可选,非必须

4

带外管理交换机

1

L3以太网交换机,

支持1000BASE-T电口,

配套线缆

可选,非必须

5

防火墙

1

1个配置口(CON)

4个千兆以太电口

可选,非必须

6

光互连模组

若干

型号:LTPW-CBQDSOP5NCS-XXX

必选

光互连电交换集群机房硬件配置清单

序号

设备名称

数量

参考规格

备注

1

GPU服务器

4/8

cpu:IntelXeonCPU*2

ram:2TB

ssd:系统盘480G*2,数据盘3.84TB*4

gpu:厂家GPU*8

电口:千兆网口*1

光口:GPU计算网口200Gb*2,管理网口25Gb*1

电源:4个

GPU计算区域GPU服务器

2

RoCE交换机

1

L3以太网交换机,

支持RoCE网络,

支持200G光口,

配套模块和线缆

GPU计算区网络设备

3

核心交换机

1

L3以太网交换机,

支持25Gb光口,

配套模块和线缆

可选,非必须

4

带外管理交换机

1

L3以太网交换机,

支持1000BASE-T电口,

配套线缆

可选,非必须

5

防火墙

1

1个配置口(CON)

4个千兆以太电口

可选,非必须

6

光互连模组

若干

型号:LTPW-CBQDSOP5NCS-XXX

必选

7

电交换机

若干

PORT数量:16/32

PORT速率:Gen5x8/x16

必选

光互连光交换集群机房硬件配置清单

序号

设备名称

数量

参考规格

备注

1

GPU服务器

4/8

cpu:IntelXeonCPU*2

ram:2TB

ssd:系统盘480G*2,数据盘3.84TB*4

gpu:厂家GPU*8

电口:千兆网口*1

光口:GPU计算网口200Gb*2,管理网口25Gb*1

电源:4个

GPU计算区域GPU服务器

2

RoCE交换机

1

L3以太网交换机,

支持RoCE网络,

支持200G光口,

配套模块和线缆

GPU计算区网络设备

3

核心交换机

1

L3以太网交换机,

支持25Gb光口,

配套模块和线缆

可选,非必须

4

带外管理交换机

1

L3以太网交换机,

支持1000BASE-T电口,

配套线缆

可选,非必须

5

防火墙

1

1个配置口(CON)

4个千兆以太电口

可选,非必须

6

OCS模组

若干

型号:TBD

必选

(资料性)

智能算力集群加速卡技术规格

参数

参数值

型号

制程工艺

晶体管数量

核心频率

核心数量

FP32(vector)

FP32(matrix)

TF32

FP16

BF16

INT32

INT16

INT8

INT4

显存容量

显存类型

显存位宽

显存带宽

视频编解码

图片编解码

显示最大分辨率

接口类型

显示接口

互连带宽

最大热设计功耗(TDP)

最大整板功耗(TBP)

散热设计

形态

槽位数

外形尺寸

STYLEREF标准文件_文件编号T/CESAXXX—XXXX

STYLEREF标准文件_文件编号错误!文档中没有指定样式的文字。

PAGE10

PAGE1

(资料性)

建议模型及模型参数要求

建议测试模型

建议模型

集群规模要求

Llama270B

至少16卡

Llama3.1405B

至少128卡

GPTMoE567B

至少128卡

GPTMoE1.8T

至少512卡

DeepSeekR1671B

至少128卡

Grok-1

至少128卡

Stablediffusion

至少16卡

OpenSora

至少16卡

私有模型

...

注:Llama3.1405B、GPTMoE567B、GPTMoE1.8T等千亿以上参数模型需要在512卡集群环境进行测试。

Llama270B模型测试参数要求

序号

参数项

参数值

说明

1

global_batchs

文档评论(0)

雄霸天下 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档