- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
内容目录
内容目录
AI+OS,操作系统级Agent开启人机交互革命 4
建立交互数据集,深耕Post-Training,获得“从Chat走向Act”通用Agent能力 6
CogAgent:CogVLM结合高分辨率交叉模块,实现高效GUI推理 6
AutoWebGLM:基于大语言模型的Web导航Agent 8
AutoGLM:图形用户界面的自主基础Agent,可用于网页浏览与安卓手机操作 11
GLM多端Agent家族,打造手机、PC、汽车等终端交互入口 13
GLM-Phone:可实现跨APP操作、支持超长任务流程、支持更多主流APP 13
GLM-PC:办公领域将迎来生产力跃升 15
CogAgent实现ComputerUse 15
AutoGLM-Web进一步扩展AI搜索能力边界 18
GLM-CarMore:Agent为AI终极形态,加速万物智能、万物互联 19
投资建议 20
风险提示 20
图表目录
图表目录
图1.Agent类型分为通用型与垂域型两个层面 4
图2.智谱清言Agent发展历程 5
图3.智谱清言GLMAgent系列产品 6
图4.CogAgent模型架构 7
图5.CogAgent在多个测试集上显著领先通用模型,部分领域领先专业微调模型 8
图6.AutoWebGLM的系统架构 9
图7.训练步骤包括课程学习、强化学习、拒绝采样微调 9
图8.训练数据集构建包括简单和复杂任务两部分 10
图9.AutoWebGLM在Mind2Web、MiniWoB++和WebArena上测试性能具有明显优势 11
图10.通过AutoGLM在美团App上“点一杯半糖瑞幸热椰奶拿铁” 12
图11.在VAB-WebArena-Lite上各模型与人类表现的差距 12
图12.在AndroidLab(VAB-Mobile)上测试各模型的成功率 13
图13.GLM-Phone前版本操作示例 13
图14.GLM-Phone跨APP操作实例 14
图15.GLM-Phone多步骤任务流程实现 15
图16.GLM-Phone循环任务执行 15
图17.GLM-PC实现ComputerUse 16
图18.GLM-PC理解指令、规划任务、逐步完成 16
图19.GLM-PC隐形屏幕功能 17
图20.像人一样使用电脑,具备更高能力上限 17
图21.通过WebAgent实现给智谱清言微博点赞、评论流程自动化 18
图22.AutoGLM-Web的操作面板 18
图23.AutoGLM-Web的基础AI生成功能 18
图24.智谱与小鹏合作的“AI小P” 19
图25.大模型为智能设备带来新的机会 20
AI+OS,操作系统级Agent开启人机交互革命
AI赋能OS,操作系统级Agent由于其C端入口特性,有望成为首个“爆款”AI应用。AIAgent(人工智能代理)一般认为是能够感知环境,基于目标进行决策,并利用工具自主执行动作的智能化应用,其包括规划、记忆、工具、行动四大核心能力。我们认为Agent可以进一步划分为通用与垂域两个层级:
通用层级:壁垒在于底层大模型能力,终局大概率为少数有实力的大型厂商。其分类包括操作系统级与平台级Agent:操作系统级Agent可跨应用、跨界面甚至跨设备操作,是对不同细分功能协调的“总指挥”;平台级Agent是底层通用模块的组合,用户可根据自己所需功能调用或搭建。
垂域层级:壁垒在于高质量数据、工作流know-how与行业工具生态。包括众多细分行业的应用智能化与流程自动化,包括办公、金融、医疗、法律、教育、创意设计等。不过其中一些非交互性、高度流程化的应用功能,也存在被通用层级Agent“吃掉”的风险。
当前市场中长期缺乏“爆款”AI应用,我们认为主要系C端大众对AI的感知度仍然较低,尽管有大量可下载、可付费的AI应用存在,但从广大用户体验来讲,各类AI软件对其生活重塑的边际变化不大。而近期,包括手机端苹果、荣耀、Vivo等,以及PC端联想等厂商上新操作系统级Agent作为新的人机交互形态,以端侧入口形式首次深入群众,令其“被迫”体验接受新的操作范式,有望打造首个“爆款”AI应用,由此将带动AI端侧硬件需求涌现,以及刺激软件内部AI功能快速迭代。
图1.Agent类型分为通用型与垂域型两个层面
数据来源:《中国Age
您可能关注的文档
最近下载
- 党员先锋队创建实施方案范文(精选6篇).docx VIP
- 《jjg692-1999-数字式电子血压计(静态)检定规程》.pdf
- 万维生物核心知识点.pdf
- GB 44263-2024 电动汽车传导充电系统安全要求.pdf
- 2024年考研中医综合真题及答案.doc
- 多层隔热组件接地装置.pdf VIP
- 中英对照 USP美国药典 1504 化学合成法多肽原料药起始物料的质量属性0109.docx
- 工程招标文件课件.pptx
- 中职英语(高教版)基础模块一Unit4 School Life Warming up优质教学课件PPT.pptx VIP
- 24DX002-1建筑电气与智能化通用规范图示.pdf VIP
文档评论(0)