- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
算力网络人工智能模型
推理算力度量
研究报告
2025年8月
算力网络人工智能模型推理算力度量研究报告
目录
一、研究背景与意义 2
(一)算力网络概念与架构 2
(二)人工智能模型推理的算力需求加速 3
(三)算力网络为人工智能模型推理提供算力 5
二、算力网络人工智能模型推理算力度量 7
(一)算力度量相关研究进展 7
(二)算力网络人工智能模型推理算力度量概念 8
三、模型推理算力度量方法 10
(一)算力度量模型 10
(二)算力消耗量度量方法 11
(三)算力使用量度量方法 12
四、模型推理算力度量指标 13
(一)模型推理算力度量指标体系 13
(二)算力消耗量度量指标 13
(三)算力使用量度量指标 15
五、模型推理算力度量关键技术 16
(一)模型剖析技术 16
(二)模型推理并行技术 17
(三)基本操作数测量技术 18
六、模型推理算力度量案例 20
(一)模型推理算力消耗量度量案例 20
(二)模型推理算力使用量度量案例 22
(三)联通云计量计费案例 22
七、总结 25
参考文献 26
算力网络人工智能模型推理算力度量研究报告
-1-
前言
随着人工智能技术的迅猛发展,模型推理已成为算力需求的核心驱动力。从AI搜索、智能体的兴起到多模态内容生成的广泛应用,模型推理的算力需求呈现出前所未有的加速态势。在此背景下,算力网络作为计算与网络深度融合的新型基础设施,为人工智能模型推理提供了灵活、高效的算力支持。然而,如何精准度量模型推理所需的算力资源,并实现算力的高效调度与优化,是当前行业面临的重要挑战。
本报告深入研究了算力网络人工智能模型推理算力度量的理论框架、方法体系及关键技术,并结合典型应用案例验证其有效性。本报告旨在提出一套科学、系统且可落地的算力度量方案,推动人工智能的规模化、普及化应用。
编写组成员(排名不分先后):
中国联通研究院:曹畅、张岩、刘永生、王施霁、曹云飞、崔煜喆
中讯邮电咨询设计院:刘扬、尼松涛、张奎、裴培、何万县、段谊海、马威、申佳、周旭晖、王迪
联通数字科技有限公司:温源、姜辉、刘点、刘文涛、宋占军
算力网络人工智能模型推理算力度量研究报告
-2-
一、研究背景与意义
(一)算力网络概念与架构
算力网络是指在计算能力不断泛在化发展的基础上,通过网络手段将计算、存储等基础资源在云-边-端之间进行有效调配的方式,以此提升业务服务质量和用户的服务体验。
中国联通在探索计算与网络融合思路的基础上,结合业界先进经验,制定了算力网络体系架构,如图1所示。在该算力网络架构图中,主要包含服务提供层、服务编排层、网络控制层、算力管理层和算力资源层/网络转发层等若干功能模块,其中服务提供层主要实现面向用户的服务能力开放;服务编排层负责对虚机、容器等服务资源的纳管、调度、配给和全生命周期管理;网络控制层主要通过网络控制平面实现算网多维度资源在网络中的关联、寻址、调配、优化与确定性服务;算力管理层解决异构算力资源的建模、纳管与交易等问题;算力资源层和网络转发层扁平化融合,并需要结合网络中计算处理能力与网络转发能力的实际情况和应用效能,实现各类计算、存储资源的高质量传递和流动。
算力网络人工智能模型推理算力度量研究报告
-3-
图1中国联通算力网络架构
算力网络中的计算资源类型包括通用CPU、专用AI芯片(如GPU、FPGA、ASIC等)、以及各类加速卡等。不同类型的计算资源在处理AI模型推理任务时,性能表现各异,如GPU擅长并行计算,适合大规模矩阵运算为主的深度学习模型推理;而FPGA在特定定制化推理任务中具有低功耗、高能效优势。
算力网络被明确定义为提供“整体算力服务”,并强调“按需分配和灵活调度计算资源、存储资源以及网络资源”。这种转变意味着网络的核心价值正从单纯的数据传输演进为集成化的计算能力交付。这不仅是网络技术的升级,更是数字经济中价值创造的新范式,它将网络从被动的传输介质提升为主动的资源编排者,对未来的网络架构、服务模型和商业模式都将产生深远影响。
(二)人工智能模型推理的算力需求加速
2025年被认为是推理之年,AI模型推理已成为算力需求增长的主要驱动力。根据行业分析,推理算力需求规模轻松超过去年估
算力网络人工智能模型推理算力度量研究报告
-4-
计的100倍。
1)搜索AI化转型,如谷歌搜索在今年5月21日正式迎来AI模式,并逐步在美国市场推出,考虑到谷歌搜索全球范围内年搜索量
文档评论(0)