- 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
- 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
- 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
1148
页码:/
目录
目录2
AlAgent--大模型时代重要落地方向3
大模型微调方案设计和能力整合15
大模型分布式训练的第四种境界29
面向2026年的推荐算法前瞻53
NVIDIA大语言模型落地的全流程解析72
小布助手闲聊生成式算法94
大模型的高效训练和部署技术卷出新高度!120
2148
页码:/
AlAgent--大模型时代重要落地方向
导读:随着大语言模型的日趋成熟,各类基于大语言模型的AIAgent逐渐走入
人们的视野。本文将梳理大语言模型Agent的相关知识点,并对大模型时代AI
Agent的重要落地方向进行探讨。
今天的介绍会围绕下面五点展开:
1.LLM-basedAgent整体架构
2.LLM-basedAgent重点难点问题
3.基于大语言模型的用户行为模拟智能体
4.基于大语言模型的多智能体软件开发
5.LLM-basedAgent未来方向
分享嘉宾|陈旭博士中国人民大学准聘副教授
编辑整理|王吉东
内容校对|李瑶
出品社区|DataFun
01
LLM-basedAgent整体架构
3148
页码:/
大语言模型Agent的构成,主要分为以下4个模块:
1.画像模块:主要描述Agent的背景信息
下面介绍画像模块的主要内容和生成策略。
(1)画像内容,主要基于3种信息:人口统计信息、个性信息和社交信息。
(2)生成策略:主要采用3种策略来生成画像内容:
手工设计方法:自行通过指定的方式,将用户画像的内容写入大模型的
prompt中;适用于Agent数量比较少的情况;
大模型生成方法:首先指定少量画像,并将其作为示例,进而使用大语言模
型生成更多的画像;适用于大量Agent的情况;
数据对齐方法:需要根据事先指定的数据集中人物的背景信息作为大语言模
型的prompt,进而做相应的预测。
2.记忆模块:主要目的是记录Agent行为,并为未来Agent决策提供支撑
4148
页码:/
(1)记忆结构
统一记忆:仅考虑短期记忆,不考虑长期记忆;
混合记忆:长期记忆和短期记忆相结合
(2)记忆形式:主要基于以下4种形式
语言
数据库
向量表示
列表
(3)记忆内容:常见以下3种操作:
记忆读取
记忆写入
记忆反思
3.规划模块
无需反馈的规划:大语言模型在做推理的过程中无需外界环境的反馈。这类
规划进一步细分为三种类型:基于单路的推理,仅使用一次大语言模型就可
以完整输出推理的步骤;基于多路的推理,借鉴众包的思想,让大语言模型
生成多个推理路径,进而确定最佳路径;借用外部的规划器。
带有反馈的规划:这种规划方式需要外界环境提供反馈,而大语言模型需要
基于环境的反馈进行下一步以及后续的规划。这类规划反馈的提供者来自三
个方面:环境反馈、人类反馈和模型反馈。
4.动作模块
动作目标:有些Agent的目标是完成某个任务,有些是交流,有些是探索。
5148
页码:/
动作生
文档评论(0)