网站大量收购闲置独家精品文档,联系QQ:2885784924

计算机行业智谱AutoGLM,人机交互范式的创新与探索.docx

计算机行业智谱AutoGLM,人机交互范式的创新与探索.docx

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

内容目录

内容目录

智谱AutoGLM重磅升级,推动人与机器交互方式的范式转变 5

手机端AutoGLM:理解超长指令,执行超长任务 6

社交媒体类测评(微信) 6

美食探店类测评(大众点评、饿了么) 7

好物选购类测评(淘宝、京东、拼多多等) 9

日常出行类测评(12306、高德地图打车、高德地图导航) 15

旅游订票类测评(携程) 18

小红书查攻略-美团批量购买(跨应用协同长任务) 19

手机端AutoGLM测评总结:简单任务完成度高,未来提升空间大 20

AutoGLM-Web插件:与用户持续交互反馈,全自动上网新体验 20

社交媒体类测评(知乎、微博、豆瓣、贴吧) 21

搜索引擎类测评(谷歌、百度、必应) 31

学术类测评(Arxiv、谷歌学术、百度学术) 33

代码托管类测评(GitHub) 39

资讯类测评(网易) 41

AutoGLM-Web插件测评总结:简单任务表现出色,未来提升空间大 41

测评总结与Agent展望:持续强化基座模型,多路径探索和实践AIAgent 41

风险提示 43

图表目录

图表目录

图1.OpenDay现场,AutoGLM给在场数百位嘉宾发送“AI给人类发的第一个红包” 5

图2.AutoGLM-Web插件现场自动完成了“在百度搜索芒果tv,打开小巷人家,播放最新一集” 5

图3.大模型为智能设备带来新机会 5

图4.升级版AutoGLM支持应用 6

图5.手机端AutoGLM目前支持的跨应用协同长任务 6

图6.微信搜索与内容转发 7

图7.大众点评餐厅搜索 8

图8.饿了么点外卖 9

图9.淘宝商品搜索与选购 10

图10.京东商品搜索与选购 11

图11.拼多多商品搜索与选购1 12

图12.拼多多商品搜索与选购2(定性描述) 13

图13.已购产品评价撰写(淘宝) 14

图14.购物车选购与结算(淘宝) 15

图15.高铁票选购12306 16

图16.高德地图打车 17

图17.高德地图导航 18

图18.携程机票订购 19

图19.小红书查攻略-美团批量购买(跨应用协同长任务) 20

图20.AutoGLM-Web能力范围 21

图21.高级模式使用方式 21

图22.知乎:内容筛选(成功) 22

图23.知乎:热榜总结(成功) 22

图24.知乎:撰写回复(失败) 23

图25.知乎:个人信息修改(失败) 23

图26.微博:发微博(成功) 24

图27.微博:点赞回复(成功) 25

图28.微博:超话发帖(成功) 25

图29.微博:超话签到(失败) 25

图30.微博:置顶微博(成功) 26

图31.豆瓣:撰写评论(成功) 27

图32.豆瓣:评论打星 27

图33.豆瓣:提取/总结信息(成功) 27

图34.豆瓣:分享电影(失败) 28

图35.豆瓣:加入小组(成功) 28

图36.豆瓣:创建豆列,收藏电影(成功) 29

图37.贴吧:总结/提取(成功) 30

图38.贴吧:关注(成功)/签到(失败) 30

图39.贴吧:总结/提取(成功) 31

图40.谷歌、百度、必应搜索测评 32

图41.Arxiv:检索(成功) 33

图42.Arxiv:查看文献pdf(成功) 34

图43.Arxiv:获取论文引用(成功) 34

图44.谷歌学术:搜索总结(成功) 35

图45.谷歌学术:按年份检索文献(失败) 36

图46.谷歌学术:获取引文格式(成功) 36

图47.百度学术:高级检索功能(执行失误) 37

图48.百度学术:普通检索(成功但流程出现问题) 38

图49.百度学术:收藏文献(成功) 38

图50.百度学术:获取引用(成功) 39

图51.GitHub:搜索并下载项目(失败) 40

图52.GitHub:简易文件管理(部分成功) 40

图53.网易:搜索(成功) 41

图54.网易财经不适配 41

图55.GLM-4-Plus基准测试表现 42

图56.GLM-4-PlusSuperBench大模型测评表现 42

图57.SuperCLUEAgent总榜(2024年10-12月) 42

智谱AutoGLM重磅升级,推动人与机器交互方式的范式转变

智谱推出升级版AutoGLM。2024年11月29日,智谱在OpenDay推出升级版

AutoGLM,挑战完成复杂任务。重要进展包

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档