多模型与智能体聚合及服务引擎(MoMA)白皮书.docxVIP

多模型与智能体聚合及服务引擎(MoMA)白皮书.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

多模型与智能体聚合及

服务引擎(MoMA)白皮书

MixtureofModelsandAgents(MoMA)

WhitePaper

(2025年)

多模型与智能体聚合及服务引擎(MoMA)白皮书(2025)

1

目录

1.引言 2

2.愿景与框架 3

2.1目标愿景 3

2.2总体框架 4

3.关键技术特征 6

3.1MoMA生态汇聚层 6

3.2MoMA核心功能层 8

3.2.1MoMA模型 8

3.2.2MoMA工程引擎 9

3.2.3MoMA协议体系 10

3.3MoMA开放服务层 12

4.典型应用场景 14

4.1面向个人用户的智慧生活助手 14

4.2面向行业客户的智能服务调度引擎 15

5.展望与倡议 18

缩略语 20

参考文献 21

多模型与智能体聚合及服务引擎(MoMA)白皮书(2025)

2

1.引言

近年来,大模型技术得到了突飞猛进的发展,模型规模和能力的不断跃升催生了以智能体为主要应用范式的智能服务新形态和AI产业新生态,使智能体逐渐成为大模型应用落地和各行业智能化转型的重要驱动力。

与此同时,随着大模型和智能体技术不断走向落地应用,产业的发展重心正逐步由模型的技术创新转变为以落地价值为导向的应用创新,更加关注应用的实际成效和长期运行成本。这一转变的关键不在于追求更大的模型规模,而在于构建能让大模型及智能体自主协作、动态演化的技术和服务生态;在于如何能以广大用户接受的成本实现更优的服务体验。在产业应用实践过程中,也逐渐暴露出两大痛点:

一是模型选择及组合问题。大模型与智能体的能力各异且数量不断增长,用户的应用场景和业务需求也在持续演进创新,单一模型或智能体难以满足用户的所有需求。如何为用户找到最匹配应用场景需求的能力组合最优解,以保证场景任务完成质量和用户体验,成为部署模型和智能体实现智能服务的首要挑战。

二是模型应用成本问题。除了模型训练外,大量用户并发情况下模型的推理同样需要消耗巨量算力,智能体的长期运营也会带来持续开销。如何在保障服务质量的同时,有效控制算力使用效率和运营成本,成为模型和智能体大规模落地的关键瓶颈。

在这一背景下,大模型和智能体的发展已进入一个迫切需要体系化AI基础设施[1]的阶段。智能服务无法仅依赖单一模型或智能体,而是需要一个能够聚合多模型与多智能体的体系化解决方案,以根据用户需求自动探测匹配各类模型、智能体和工具组合,并通过智能规划、动态路由与精准调度,实现平衡效果、效率和成本的智能化业务服务。

多模型与智能体聚合及服务引擎(MoMA)白皮书(2025)

3

2.愿景与框架

2.1目标愿景

图1MoMA的愿景和目标

为解决模型选择组合难、模型应用成本高的痛点问题,从供需两个方向推动模型和智能体的规模化应用和商用落地进程,本白皮书基于中国移动在AI领域的“供给者、汇聚者、运营者”定位提出多模型与智能体聚合及服务引擎MixtureofModelsandAgents(MoMA)的概念。

MoMA通过标准化接口自动感知和探索各类模型、智能体和工具,实现动态路由、智能规划、精确调度,提供高准确、高安全、高可靠、高效能的大模型推理服务。一方面为用户提供精准匹配应用需求的,如同通信服务般便捷、普惠和可靠的模型与智能体服务;另一方面有效控制模型和智能体服务全流程的成本,为供需双方提高经济效益。其核心目标包括:

l打造MoMA模型:打造最懂模型和智能体的MoMA模型。探测MoMA汇聚的模型和智能体能力,并识别和理解用户意图,精准匹配满足用户应用需求的模型和智能体组合最优解;

多模型与智能体聚合及服务引擎(MoMA)白皮书(2025)

4

l提供MoMA引擎:提供具备超大规模服务能力和极致优化成本的工程引擎。在效果、效率、成本三重约束下实现对任务类型、资源分配、执行流程的动态管理和最优决策,提速降本;

l构建MoMA协议:构建支持模型、智能体接口互联互通的标准化、高安全的协议体系。融合“类MCP、A2A”等主流通信协议,并增强统一认证及安全通信等能力,使能模型、智能体、工具、数据、环境和应用系统之间的无障碍互联互通。

2.2总体框架

图2MoMA总体框架

MoMA通过分层架构集成多源异构模型、智能体,形成覆盖能力汇聚、动态智能调度、应用支撑的全链路智能服务流程闭环。其核心架构包含生态汇聚层、核心功能层、开放服务层:

多模型与智能体聚合及服务

文档评论(0)

情报猿 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档