【国盛-2025研报】手机Agent的两种范式:API与GUI.pdfVIP

【国盛-2025研报】手机Agent的两种范式:API与GUI.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

证券研究报告|行业周报

gszqdatemark

20251207

年月日

计算机

手机Agent的两种范式:API与GUI

手机Agent,移动交互范式的跃迁。自触控屏幕开启移动互联网黄金时代增持(维持)

以来,App被设计为一个个独立的孤岛,用户通过点击图标进入特定的应

用环境,依靠视觉和手动点击来完成任务。随着应用数量的增长和功能的

行业走势

堆叠,用户在不同App间切换、寻找功能入口、手动搬运数据的成本显著

上升。随着大模型的突破性进展,移动交互范式正处于跃迁的前夜:从GUI计算机沪深300

交互向Agentic交互演进。用户只需通过自然语言表达想做什么,手机30%

Agent便负责将意图转化为具体的执行步骤并交付结果。如何在碎片化的20%

移动生态中让AI跨越应用围墙执行任务,业界目前有两条不同的技术路

10%

线:

API范式:建立标准化的语义接口,App开发者主动适配并暴露相应功能。0%

Agent通过结构化的API调用来指挥App执行任务,以苹果的Apple-10%

Intelligence及其AppIntents框架为典型代表。-20%

GUI范式:利用多模态模型看懂屏幕上的UI元素,利用系统辅助服务模2024-112025-032025-072025-11

拟手指的点击与滑动。这一路线不依赖开发者的配合,试图以通用的视觉

能力“暴力”打通所有应用。智谱AI的AutoGLM和字节跳动的豆包手机作者

助手是这一路线的先锋。分析师刘高畅

执业证书编号:S0680518090001

核心差异对比,APIAgent与GUIAgent各有千秋。对比了两种范式的邮箱:liugaochang@

技术路线差异,GUIAgent的核心优势在于通用性高,在可靠性、性能、分析师李可夫

隐私风险角度则是APIAgent更胜一筹。1)通用性:GUIAgent的通用性执业证书编号:S0680525060001

显著更高,这是核心优势,不需要App开发者进行适配。理论上只要是人邮箱:likefu@

类能够使用的App,GUI-Agent都能使用。解决了应用覆盖率的问题,新

功能或未暴露功能的适配度也更高。可靠性;的可靠性仍然相关研究

2)GUIAgent

较低。原因包括模型对复杂界面的识别能力还达不到百分百;需要多步骤1、《计算机:AI投资继续加码》2025-11-08

模拟用户操作,整体任务失败率更高;UI改版时容易失效。3)性能:API2、《计算机:软件筹码与景气双见底》2025-11-01

Agent可以一次调用完成复杂任务,后端直接驱动执行效率高。GUIAgent3、《计算机:国产化景气继续加速》2025-10-26

性能较低,完成简单任务可能需要多次截图分析、视觉推理等复杂计

您可能关注的文档

文档评论(0)

soso168 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档