计算机行业“AI操作系统”时代已至.docx

计算机行业“AI操作系统”时代已至.docx

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

内容目录

内容目录

AI+OS,操作系统级Agent开启人机交互革命 4

建立交互数据集,深耕Post-Training,获得“从Chat走向Act”通用Agent能力 6

CogAgent:CogVLM结合高分辨率交叉模块,实现高效GUI推理 6

AutoWebGLM:基于大语言模型的Web导航Agent 8

AutoGLM:图形用户界面的自主基础Agent,可用于网页浏览与安卓手机操作 11

GLM多端Agent家族,打造手机、PC、汽车等终端交互入口 13

GLM-Phone:可实现跨APP操作、支持超长任务流程、支持更多主流APP 13

GLM-PC:办公领域将迎来生产力跃升 15

CogAgent实现ComputerUse 15

AutoGLM-Web进一步扩展AI搜索能力边界 18

GLM-CarMore:Agent为AI终极形态,加速万物智能、万物互联 19

投资建议 20

风险提示 20

图表目录

图表目录

图1.Agent类型分为通用型与垂域型两个层面 4

图2.智谱清言Agent发展历程 5

图3.智谱清言GLMAgent系列产品 6

图4.CogAgent模型架构 7

图5.CogAgent在多个测试集上显著领先通用模型,部分领域领先专业微调模型 8

图6.AutoWebGLM的系统架构 9

图7.训练步骤包括课程学习、强化学习、拒绝采样微调 9

图8.训练数据集构建包括简单和复杂任务两部分 10

图9.AutoWebGLM在Mind2Web、MiniWoB++和WebArena上测试性能具有明显优势 11

图10.通过AutoGLM在美团App上“点一杯半糖瑞幸热椰奶拿铁” 12

图11.在VAB-WebArena-Lite上各模型与人类表现的差距 12

图12.在AndroidLab(VAB-Mobile)上测试各模型的成功率 13

图13.GLM-Phone前版本操作示例 13

图14.GLM-Phone跨APP操作实例 14

图15.GLM-Phone多步骤任务流程实现 15

图16.GLM-Phone循环任务执行 15

图17.GLM-PC实现ComputerUse 16

图18.GLM-PC理解指令、规划任务、逐步完成 16

图19.GLM-PC隐形屏幕功能 17

图20.像人一样使用电脑,具备更高能力上限 17

图21.通过WebAgent实现给智谱清言微博点赞、评论流程自动化 18

图22.AutoGLM-Web的操作面板 18

图23.AutoGLM-Web的基础AI生成功能 18

图24.智谱与小鹏合作的“AI小P” 19

图25.大模型为智能设备带来新的机会 20

AI+OS,操作系统级Agent开启人机交互革命

AI赋能OS,操作系统级Agent由于其C端入口特性,有望成为首个“爆款”AI应用。AIAgent(人工智能代理)一般认为是能够感知环境,基于目标进行决策,并利用工具自主执行动作的智能化应用,其包括规划、记忆、工具、行动四大核心能力。我们认为Agent可以进一步划分为通用与垂域两个层级:

通用层级:壁垒在于底层大模型能力,终局大概率为少数有实力的大型厂商。其分类包括操作系统级与平台级Agent:操作系统级Agent可跨应用、跨界面甚至跨设备操作,是对不同细分功能协调的“总指挥”;平台级Agent是底层通用模块的组合,用户可根据自己所需功能调用或搭建。

垂域层级:壁垒在于高质量数据、工作流know-how与行业工具生态。包括众多细分行业的应用智能化与流程自动化,包括办公、金融、医疗、法律、教育、创意设计等。不过其中一些非交互性、高度流程化的应用功能,也存在被通用层级Agent“吃掉”的风险。

当前市场中长期缺乏“爆款”AI应用,我们认为主要系C端大众对AI的感知度仍然较低,尽管有大量可下载、可付费的AI应用存在,但从广大用户体验来讲,各类AI软件对其生活重塑的边际变化不大。而近期,包括手机端苹果、荣耀、Vivo等,以及PC端联想等厂商上新操作系统级Agent作为新的人机交互形态,以端侧入口形式首次深入群众,令其“被迫”体验接受新的操作范式,有望打造首个“爆款”AI应用,由此将带动AI端侧硬件需求涌现,以及刺激软件内部AI功能快速迭代。

图1.Agent类型分为通用型与垂域型两个层面

数据来源:《中国Age

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档