- 1、本文档共43页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
内容目录
内容目录
智谱AutoGLM重磅升级,推动人与机器交互方式的范式转变 5
手机端AutoGLM:理解超长指令,执行超长任务 6
社交媒体类测评(微信) 6
美食探店类测评(大众点评、饿了么) 7
好物选购类测评(淘宝、京东、拼多多等) 9
日常出行类测评(12306、高德地图打车、高德地图导航) 15
旅游订票类测评(携程) 18
小红书查攻略-美团批量购买(跨应用协同长任务) 19
手机端AutoGLM测评总结:简单任务完成度高,未来提升空间大 20
AutoGLM-Web插件:与用户持续交互反馈,全自动上网新体验 20
社交媒体类测评(知乎、微博、豆瓣、贴吧) 21
搜索引擎类测评(谷歌、百度、必应) 31
学术类测评(Arxiv、谷歌学术、百度学术) 33
代码托管类测评(GitHub) 39
资讯类测评(网易) 41
AutoGLM-Web插件测评总结:简单任务表现出色,未来提升空间大 41
测评总结与Agent展望:持续强化基座模型,多路径探索和实践AIAgent 41
风险提示 43
图表目录
图表目录
图1.OpenDay现场,AutoGLM给在场数百位嘉宾发送“AI给人类发的第一个红包” 5
图2.AutoGLM-Web插件现场自动完成了“在百度搜索芒果tv,打开小巷人家,播放最新一集” 5
图3.大模型为智能设备带来新机会 5
图4.升级版AutoGLM支持应用 6
图5.手机端AutoGLM目前支持的跨应用协同长任务 6
图6.微信搜索与内容转发 7
图7.大众点评餐厅搜索 8
图8.饿了么点外卖 9
图9.淘宝商品搜索与选购 10
图10.京东商品搜索与选购 11
图11.拼多多商品搜索与选购1 12
图12.拼多多商品搜索与选购2(定性描述) 13
图13.已购产品评价撰写(淘宝) 14
图14.购物车选购与结算(淘宝) 15
图15.高铁票选购12306 16
图16.高德地图打车 17
图17.高德地图导航 18
图18.携程机票订购 19
图19.小红书查攻略-美团批量购买(跨应用协同长任务) 20
图20.AutoGLM-Web能力范围 21
图21.高级模式使用方式 21
图22.知乎:内容筛选(成功) 22
图23.知乎:热榜总结(成功) 22
图24.知乎:撰写回复(失败) 23
图25.知乎:个人信息修改(失败) 23
图26.微博:发微博(成功) 24
图27.微博:点赞回复(成功) 25
图28.微博:超话发帖(成功) 25
图29.微博:超话签到(失败) 25
图30.微博:置顶微博(成功) 26
图31.豆瓣:撰写评论(成功) 27
图32.豆瓣:评论打星 27
图33.豆瓣:提取/总结信息(成功) 27
图34.豆瓣:分享电影(失败) 28
图35.豆瓣:加入小组(成功) 28
图36.豆瓣:创建豆列,收藏电影(成功) 29
图37.贴吧:总结/提取(成功) 30
图38.贴吧:关注(成功)/签到(失败) 30
图39.贴吧:总结/提取(成功) 31
图40.谷歌、百度、必应搜索测评 32
图41.Arxiv:检索(成功) 33
图42.Arxiv:查看文献pdf(成功) 34
图43.Arxiv:获取论文引用(成功) 34
图44.谷歌学术:搜索总结(成功) 35
图45.谷歌学术:按年份检索文献(失败) 36
图46.谷歌学术:获取引文格式(成功) 36
图47.百度学术:高级检索功能(执行失误) 37
图48.百度学术:普通检索(成功但流程出现问题) 38
图49.百度学术:收藏文献(成功) 38
图50.百度学术:获取引用(成功) 39
图51.GitHub:搜索并下载项目(失败) 40
图52.GitHub:简易文件管理(部分成功) 40
图53.网易:搜索(成功) 41
图54.网易财经不适配 41
图55.GLM-4-Plus基准测试表现 42
图56.GLM-4-PlusSuperBench大模型测评表现 42
图57.SuperCLUEAgent总榜(2024年10-12月) 42
智谱AutoGLM重磅升级,推动人与机器交互方式的范式转变
智谱推出升级版AutoGLM。2024年11月29日,智谱在OpenDay推出升级版
AutoGLM,挑战完成复杂任务。重要进展包
您可能关注的文档
- 机械行业2025年攻守兼备,聚焦新质生产力和顺周期.pptx
- 机械行业2025年技术驱动,装备全球,产能出清.docx
- 机械行业全球产业链系列专题研究报告:“新质生产力”与全球产业链重塑-价值链、空间链、供应链三维驱动-银河证券.docx
- 基本面高频跟踪02:工业生产季节性走弱,“抢出口”延续.docx
- 基础化工行业工信部等三部门:加快清洁低碳氢替代应用,丙烯酸、乙二醇价格上涨.docx
- 基础化工行业简评报告:兴发集团拟建设10万吨/年工业硅,新洋丰拟建设磷系新材料产业园.docx
- 基础化工行业深度报告:固态锂电池方兴未艾,高性能材料有望迎新发展机遇.docx
- 基础化工行业研究:烧碱,供给侧或将受制于氯碱平衡,氧化铝产能投放拉动需求增长.docx
- 基于货币市场机构行为的分析:1月资金面怎么看?.docx
- 基于其他存款性公司资产负债表的视角:货币政策变革对商业银行的影响.docx
文档评论(0)