- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
[编号ODCC-2025-0A002]
AI存储系统需求研究
系
点燃算
0259
2年月
前言
AI
随着大模型参数量从十亿级跃升至万亿级,系统对存储带宽、
AI“--
容量与时延的需求呈指数级增长。本文系统梳理了在训练推理
”PCIe
本地部署三大阶段的存储流量特征,指出总线带宽已逐渐落后
于计算、网络、存储三者的需求增速,成为新的系统级瓶颈。结合最
新学术与产业数据,本文定量分析了PCIe4.0/5.0/6.0/7.0在不同模型
NVLinkCXLUCIe
规模下的理论余量与实际缺口,并对比、、等新兴
互连技术的补偿效果。最后,面向边缘与终端的本地部署场景,提出
以存储计算协同设计、分层缓存、高并发-NAND和内存内计算为核
心的缓解路径。
目录
一、研究有关的技术现状综述1
二、AI时代的存储挑战2
(一)AI计算范式的转变与存储需求2
(二)存储墙问题的加剧3
(三)存力问题的瓶颈分析与解决策略3
三、AI应用不同阶段对存储系统的要求分析4
(一)白皮书有关的技术背景4
(二)AI存储流量的模型7
(三)AI存储系统需求研究方案7
四、人工智能系统从训练到应用的八个阶段的存储需求11
(一)阶段1:数据摄取(DataIngestion)11
(二)阶段2:预处理(Pre-processing)13
(三)阶段3:训练(Training)15
(四)阶段4:Checkpoint17
(五)阶段5:微调(Fine-tuning)19
(六)阶段6:推理(Inference)20
(七)阶段7:边缘服务(EdgeServing)22
(八)阶段8:终端离线(On-device)26
五、人工智能应用对存储系统的压力评测方法30
(一)带宽赤字指数(BDI)与展望30
(二)PCIe6.0/7.0技术透视33
(三)CXL3.0/3.1技术解析36
(四)NVLink5.0UCIe2.039
(五)硅光互连:光子在AI机柜中的再定位42
(六)近存计算(Near-DataProcessing,NDP)44
六、国产AI生态系统的存储架构建议48
七、结论与未来工作50
八、参考文献52
图目录
图12023–2024年已公开场景的BDI结果30
图2公开路线打分情况32
AI存储系统需求研究(ODCC-2025-0A002)
一、研究有关的技术现状综述
在大模型参数规模持续膨胀的背景下,人工智能系统正由“计算
”“”
主导逐步演化为存储主导的新范式。本文立足于训练、推理与本
您可能关注的文档
- 可行性研究报告,商业策划书 + 关注
-
实名认证服务提供商
专注于金融公司,实体制造业,销售代理公司的企业文化和实体项目或者互联网项目的策划编写润色,曾经协助多家基金公司,保险代理公司,房地产代销公司等初创企业完成企业文化和人事营销等制度的编写,由于疫情影响离开了喜欢的首都。
文档评论(0)