- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
集碧专题报告
人工智能算力基础设施赋能
研究报告
(2025年)
2025年11月
前言
在人工智能落地破局与赋能千行百业进程中,以智算中心为代表的人工智能算力基础设施,被赋予更重要的定位和使命,成为支撑人工智能技术及产业发展的重要基石。然而,目前人工智能算力基础设施利用负载情况差异较大,尤其是地方政府或国资平台主导投建的智算设施,赋能价值有待进一步提升。因此,需要厘清智算中心赋能的需求场景、需求场景与所需关键能力的匹配,以及推进赋能落地的生态模式,助力人工智能算力基础设施真正实现赋能价值。本报告聚焦智算中心赋能,围绕需求场景、关键能力、落地生态这三个关键环节,阐述最新发展趋势,致力于进一步释放智算中心的赋能效应,助力人工智能与实体经济深度融合。
需求场景方面,大模型预训练、微调、推理场景对计算需求不一,当前各方主体已针对性开展各类场景的支撑。推进基础预训练大模型的训练,需要具备E级(EFlops)计算能力的高端万卡集群中心支撑。推进小模型(百亿级及以下参数)的训练、微调,或推进模型的推理,依托百P级(PFlops)计算能力的中小型智算中心即可支撑。
关键能力方面,训练场景与微调/推理场景在底层支撑能力、创新服务能力、运营保障能力要求有较大区别。在算力市场高阶技术服务需求暴涨的当下,智算中心亟需针对性夯实关键能力,支撑数据处理服务、算力调度服务及推理应用服务等。
落地生态方面,智算中心赋能需要分场景聚合AI能力主体,推进智算中心赋能所需核心要素主体的协同。智算中心需求场景和关键
能力需要有落地生态的加持才能落地,而落地生态需要推进算力、数据、算法、场景、产业等要素间协同协作,助力AI大模型赋能行业场景落地。
当然,报告仍有诸多不足,恳请各界批评指正。
目录
一、人工智能算力基础设施演进态势 1
(一)技术创新:三位一体智算设施升级 1
(二)布局优化:全国智算设施协调发展 3
(三)产业升级:智算全产业链协同发展 4
二、人工智能算力基础设施赋能的重要走势 6
(一)需求场景逐步明晰,促使智算资源优配 7
(二)关键能力逐步聚焦,提升智算服务水准 7
(三)落地生态逐步聚和,加速智算价值释放 8
三、人工智能算力基础设施需求场景 8
(一)大模型预训练场景 9
(二)大模型微调场景 10
(三)大模型推理场景 11
四、人工智能算力基础设施关键能力 13
(一)基础支撑能力 14
(二)创新服务能力 17
(三)运营保障能力 19
五、人工智能算力基础设施落地生态 21
(一)智算与数据要素协同 22
(二)智算与模型算法协同 23
(三)智算与跨域智算协同 24
(四)智算与行业场景协同 25
(五)智算与区域产业协同 26
六、发展展望 28
(一)需求场景更加多元、复杂 28
(二)关键能力更加集约、软性 29
(三)落地生态更加聚合、协同 30
人工智能算力基础设施赋能研究报告(2025年)
1
一、人工智能算力基础设施演进态势
人工智能算力基础设施,是基于人工智能专用算力芯片及加速芯片等组成异构计算架构,以智能计算设施为核心设施,以智能算力集群为核心载体,面向人工智能应用场景,提供所需算力服务、数据服务和算法服务的公共算力基础设施。大模型加速技术迭代与工程创新步伐,对人工智能算力基础设施技术创新、布局优化、产业升级也提出了更高阶的要求。
(一)技术创新:三位一体智算设施升级
当前,我国人工智能算力基础设施正处于系统性升级与架构演进的关键时期,正加速向集约高效、低碳共生、高速泛在的融合形态纵深发展,全面步入以超大规模集群化、绿色低碳化与高速互联化为核心特征的新发展阶段。在顶层设计与政策引导协同驱动下,我国智算中心规模持续扩大、技术体系日益自主、能效水平不断提升、互联能力显著增强,逐步构建起支撑数字经济高质量发展和现代化产业体系建设的算力底座。
超大规模集群化实现突破。超大规模集群指由万或超十万颗高性能GPU/NPU/DPU/CPU等异构算力卡、HBM/DRAM/SSD等异构存储单元构成的异构计算/存储集群,通过高速互联网络实现近乎线性的算力扩展,以支撑千亿乃至万亿参数大模型的训练与复杂推理任务。超节点作为智算集群化发展的关键技术之一,正逐渐成为行业焦点。以华为昇腾384超节点为例,通过高速总线实现384卡高速总线互联,跨节点通信带宽提升15倍,并通过全局内存统一编址技术,将
人工智能算力基础设施赋能研究报告(2025年)
2
分散在各节点的内存池虚拟为统一地址空间,支持跨节点直接内存访问,配置8节点存储超节点集群,具备超大带宽、超低时延、超
原创力文档


文档评论(0)