- 1、本文档共223页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
1/18
页码:2/148
目录
目录 2
AlAgent 大模型时代重要落地方向...................................................................................3
大模型微调方案设计和能力整合 15
大模型分布式训练的第四种境界 29
面向2026年的推荐算法前瞻 53
NVIDIA大语言模型落地的全流程解析 72
小布助手闲聊生成式算法 94
大模型的高效训练和部署技术卷出新高度! 120
页码:3/148
AlAgent--大模型时代重要落地方向
导读:随着大语言模型的日趋成熟,各类基于大语言模型的AIAgent逐渐走入人们的视野。本文将梳理大语言模型Agent的相关知识点,并对大模型时代AIAgent的重要落地方向进行探讨。
今天的介绍会围绕下面五点展开:
1.LLM-basedAgent整体架构
2.LLM-basedAgent重点难点问题
3.基于大语言模型的用户行为模拟智能体
4.基于大语言模型的多智能体软件开发
5.LLM-basedAgent未来方向
分享嘉宾|陈旭博士中国人民大学准聘副教授
编辑整理|王吉东内容校对|李瑶
出品社区|DataFun
01
LLM-basedAgent整体架构
页码:4/148
大语言模型Agent的构成,主要分为以下4个模块:
1.画像模块:主要描述Agent的背景信息
下面介绍画像模块的主要内容和生成策略。
(1)画像内容,主要基于3种信息:人口统计信息、个性信息和社交信息。
(2)生成策略:主要采用3种策略来生成画像内容:
n手工设计方法:自行通过指定的方式,将用户画像的内容写入大模型的
prompt中;适用于Agent数量比较少的情况;
n大模型生成方法:首先指定少量画像,并将其作为示例,进而使用大语言模
型生成更多的画像;适用于大量Agent的情况;
n数据对齐方法:需要根据事先指定的数据集中人物的背景信息作为大语言模
型的prompt,进而做相应的预测。
2.记忆模块:主要目的是记录Agent行为,并为未来Agent决策提供支撑
页码:5/148
(1)记忆结构
n统一记忆:仅考虑短期记忆,不考虑长期记忆;
n混合记忆:长期记忆和短期记忆相结合
(2)记忆形式:主要基于以下4种形式
n语言
n数据库
n向量表示
n列表
(3)记忆内容:常见以下3种操作:
n记忆读取
n记忆写入
n记忆反思
3.规划模块
n无需反馈的规划:大语言模型在做推理的过程中无需外界环境的反馈。这类规划进一步细分为三种类型:基于单路的推理,仅使用一次大语言模型就可以完整输出推理的步骤;基于多路的推理,借鉴众包的思想,让大语言模型生成多个推理路径,进而确定最佳路径;借用外部的规划器。
n带有反馈的规划:这种规划方式需要外界环境提供反馈,而大语言模型需要基于环境的反馈进行下一步以及后续的规划。这类规划反馈的提供者来自三个方面:环境反馈、人类反馈和模型反馈。
4.动作模块
n动作目标:有些Agent的目标是完成某个任务,有些是交流,有些是探索。
页码:6/148
n动作生成:有些Agent是依靠记忆回想生成动作,有些是按照原有计划执
行特定的动作。
n动作空间:有些动作空间是工具的集合,有些是基于大语言模型自身知识,
从自我认知的角度考虑整个动作空间。
n动作影响:包括对环境的影响、对内在状态的影响,以及对未来新动作的影
响。
以上是Agent的整体框架,更多内容可参考下述论文:
LeiWang,ChenMa,XueyangFeng,ZeyuZhang,HaoYang,JingsenZhang,ZhiyuanChen,JiakaiTang,XuChen,YankaiLin,WayneXinZhao,ZheweiWei,Ji-RongWen:ASurveyonLargeLanguageModelbasedAutonomousAgents.CoRRab
您可能关注的文档
- 2023年中国消费者对于重复使用模式的态度调查--摆脱塑缚.docx
- 2025礼赠偏好调研报告-尼尔森niq-202501.docx
- 电子行业专题研究(普通):Deepseek+R1是AGI的里程碑,中长期利好算力硬件.docx
- 关键岗位人才盘点与发展(要点与难点).docx
- 宏观深度报告:春节出行和消费数据显著提升.docx
- 计算机行业深度报告:DeepSeek惊艳世界,算力与应用将迎来结构性变化.docx
- 中国AI搜索行业发展报告2024-月狐数据.docx
- 浅谈生态环境保护的途径及发展方式-生态环境保护论文-水利论文.docx
- 浅谈物资采购公开招标风险防范.docx
- 浅谈新课改下高中美术教学中存在的问题及对策.docx
文档评论(0)