网站大量收购独家精品文档,联系QQ:2885784924

端到端训练开启Agent新范式,四月国产Agent迎集中发布潮.pptxVIP

端到端训练开启Agent新范式,四月国产Agent迎集中发布潮.pptx

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要;第一章;1.1大模型困境:成本投入大、边际收益放缓、商业化慢;1.1大模型困境:API调用价格快速下降、商业化模式需改善;1.2从LLM出发,到AgenticWorkflow,再到真“Agent”;1.3海外Agent进展开始加速,从工作流迈向端到端驱动;1.4市场空间:AIAgent战略转型,驱动生态革命与未来范式迁移;第二章;2.1工作流框架VS智能体框架;2.1工作流框架技术路径;;2.3智能体代际划分,从“小镇做题家”到“任务多面手”;2.4预训练ScalingLaw已达峰,瓶颈难以突破;2.5后训练阶段,强化学习(RL)同样遵循ScalingLaw;2.5强化学习催生长CoT,遵循推理ScalingLaw;;2.6单智能体Scaling:强化学习与推理层面突破大有可为;;2.6多智能体ScalingLaw:注重协作,但未底层破壁;第三章;;;2025年2月,Claude系列最新迭代3.7发布,这款模型被定位为“迄今最智能的模型”,并首次引入混合推理功能,结合了普通大型语言模型(LLM)和专门的推理模型能力。Claude3.7有两项关键升级:一是超强的多模态能力:能准确解读图片内容,理解图表、截图中的文字,甚至可以分析复杂的技术图像。二是超长上下文支持:能够处理高达20万tokens的内容,相当于一本小说的长度。扩展思考模式计费标准为每百万输出tokens15美元。;资料来源:Anthropic,CSDN,中信建投;3.3OpenAI发布“博士级”AgentOperator;手机端AgentAutoGLM是智谱AI推出的一款AI智能体应用,它能够根据人的自然语言指令,自主的规划操作路径和识别

手机页面,自动模拟人类操作手机和网页,执行各种任务。

AutoGLM具备强大的任务规划以及屏幕界面信息理解的能力,仅通过自然语言指令即可实现复杂任务的快速执行。面对真实使用过程中所出现的诸多情况,AutoGLM具有一定的判断与自我纠错能力,并且可以在任务执行的过程中持续与用户进行交互反馈,同时还可以调用多种工具,根据用户的要求精准完成操作。

AutoGLM可以自主执行超过50步的长步骤操作,也可以跨app执行任务;AutoGLM也能够开启「全自动」上网新体验,支持数十个网站的无人浏览;并能基于视觉多模态模型实现通用Agent的技术探索。;3.4AutoGL能力源自于强大的基底模型和RL;3.5Manus:国产工作流Agent展现强大能力;3.6Google:三大Agent矩阵驱动向智能体工作流转型;3.7微软:Agent与产品结合,深耕端侧智能体赛道;3.8Meta:多智能体协同先行者;第四章;4.1Agent算力需求趋势分析;对于智能体工作流,解决问题往往需要多次反复调用API并进行计算,因而对算力的消耗会显著大于单次调用的情形。

算力消耗主要体现在运算次数提升和提示词生成两个阶段。对于仅需一次API调用的情况,提示词消耗token量较低。而对于多次生成提示词的情形(更类似于Agenticworkflow机制),token消耗量大大增加。;4.3多Agent算力需求百倍跃升;第五章;大模型技术发展不及预期:大模型属于先进AI算法,若后续大模型算法更新迭代效果不及预期,则会影响大模型演进及拓展,进而会影响其商业化落地等;

商业化落地不及预期:大模型的商业落地模式在业界中普遍处于探索阶段,用户对于大模型的接受程度和商业化变现能力可能不及预期;

算力基础设施支持不及预期:美国制裁中国高科技企业,对中国形成芯片、算力的封锁,大语言模型训练过程中需

要大量算力资源,需要关注中美关系带来的算力的压力;

政策监管力度不及预期:大语言模型带来新的网络生态商业,尚属于前期成长阶段,政策监管难度加大,相关法律

法规尚不完善,政策监管力度可能不及预期。

数据数量与数据质量不及预期:大型语言模型需要大量的高质量数据进行训练,若数据数量和质量存在短板,则会影响大语言模型效果。

文档评论(0)

535600147 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档