《智能计算数据中心网络关键能力测试方法》.pdfVIP

  • 1
  • 0
  • 约6.41万字
  • 约 64页
  • 2026-01-15 发布于河南
  • 举报

《智能计算数据中心网络关键能力测试方法》.pdf

ICS33.040.40

CCSI631T/NIDA

全球固定网络创新联盟

T/NIDA008-2025

智能计算数据中心网络关键能力测试方法

TestMethodofKeyCapabilityofIntelligentComputingDataCenterNetwork

2025-10-26发布2025-11-01施行

全球固定网络创新联盟(NIDA)发布

T/NIDA008-2025

目录

前言V

1范围1

2规范性引用文件1

3术语和定义1

4缩略语1

5测试环境2

6测试框架2

6.1测试床-昇腾算力2

6.2测试床-英伟达算力3

7建网开局能力测试3

7.1网络部署自动化3

7.2训前网络全量自检4

7.3队列一致性检测6

7.4网络配置调优6

8昇腾算力训练任务网络性能测试7

8.1单训练任务性能测试7

8.1.1AllReduce-HD测试10

8.1.2AllReduce-NHR测试11

8.1.3AllReduce-NB测试12

8.1.4AllToAll测试13

8.1.5ReduceScatter-HD测试14

8.1.6备注15

8.1.715

8.1.8AllGather-HD测试15

8.1.9LLM端到端性能测试16

8.2多训练任务性能测试18

8.2.1AllReduce性能隔离测试18

8.2.2AlltoAll性能隔离测试19

8.2.3AllReduce+AlltoAll性能隔离测试20

8.2.4LLM应用隔离测试22

9英伟达算力训练任务网络性能测试23

I

T/NIDA008-2025

9.1单训练任务性能测试24

9.1.1AllReduce-Ring测试24

9.1.2AlltoAll测试25

9.1.3LLM端到端性能测试26

9.2多训练任务性能测试28

9.2.1AllReduce-Ring性能隔离测试28

9.2.2AlltoAll性能隔离测试30

9.2.3AllReduce+AlltoAll性能隔离测试31

10昇腾算力推理任务网络性能测试33

10.1HCCLAlltoAll多推理任务性能测试33

10.2HCCLAlltoAllv多推理任务性能测试34

10.3基于大模型多推理任务性能测试35

10.4基于大模型训推一体性能测试(3P+训练)36

11英伟达算力推理任务网络性能测试36

11.1单Prefill推理任务性能测试37

11.2单Decode推理任务性能测试37

11.3多Prefill推理任务性能测试38

11.4多Decode推理任务竞争碎片化环境性能测试40

11.5混合推理任务(Prefill+Decode)共存推理测试41

11.6训推一体性能测试42

12故障主动预防能力测试44

12.1PFC死锁预防44

12.2光模块单激光器故障检测能力45

12.3光模块脏污检测能力46

12.4光模块松动检测能力47

13高可用能力测

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档