网站大量收购闲置独家精品文档,联系QQ:2885784924

生成式AI实战手册.pdf

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多

1148

页码:/

目录

目录2

AlAgent--大模型时代重要落地方向3

大模型微调方案设计和能力整合15

大模型分布式训练的第四种境界29

面向2026年的推荐算法前瞻53

NVIDIA大语言模型落地的全流程解析72

小布助手闲聊生成式算法94

大模型的高效训练和部署技术卷出新高度!120

2148

页码:/

AlAgent--大模型时代重要落地方向

导读:随着大语言模型的日趋成熟,各类基于大语言模型的AIAgent逐渐走入

人们的视野。本文将梳理大语言模型Agent的相关知识点,并对大模型时代AI

Agent的重要落地方向进行探讨。

今天的介绍会围绕下面五点展开:

1.LLM-basedAgent整体架构

2.LLM-basedAgent重点难点问题

3.基于大语言模型的用户行为模拟智能体

4.基于大语言模型的多智能体软件开发

5.LLM-basedAgent未来方向

分享嘉宾|陈旭博士中国人民大学准聘副教授

编辑整理|王吉东

内容校对|李瑶

出品社区|DataFun

01

LLM-basedAgent整体架构

3148

页码:/

大语言模型Agent的构成,主要分为以下4个模块:

1.画像模块:主要描述Agent的背景信息

下面介绍画像模块的主要内容和生成策略。

(1)画像内容,主要基于3种信息:人口统计信息、个性信息和社交信息。

(2)生成策略:主要采用3种策略来生成画像内容:

手工设计方法:自行通过指定的方式,将用户画像的内容写入大模型的

prompt中;适用于Agent数量比较少的情况;

大模型生成方法:首先指定少量画像,并将其作为示例,进而使用大语言模

型生成更多的画像;适用于大量Agent的情况;

数据对齐方法:需要根据事先指定的数据集中人物的背景信息作为大语言模

型的prompt,进而做相应的预测。

2.记忆模块:主要目的是记录Agent行为,并为未来Agent决策提供支撑

4148

页码:/

(1)记忆结构

统一记忆:仅考虑短期记忆,不考虑长期记忆;

混合记忆:长期记忆和短期记忆相结合

(2)记忆形式:主要基于以下4种形式

语言

数据库

向量表示

列表

(3)记忆内容:常见以下3种操作:

记忆读取

记忆写入

记忆反思

3.规划模块

无需反馈的规划:大语言模型在做推理的过程中无需外界环境的反馈。这类

规划进一步细分为三种类型:基于单路的推理,仅使用一次大语言模型就可

以完整输出推理的步骤;基于多路的推理,借鉴众包的思想,让大语言模型

生成多个推理路径,进而确定最佳路径;借用外部的规划器。

带有反馈的规划:这种规划方式需要外界环境提供反馈,而大语言模型需要

基于环境的反馈进行下一步以及后续的规划。这类规划反馈的提供者来自三

个方面:环境反馈、人类反馈和模型反馈。

4.动作模块

动作目标:有些Agent的目标是完成某个任务,有些是交流,有些是探索。

5148

页码:/

动作生

文档评论(0)

186****0576 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5013000222000100

1亿VIP精品文档

相关文档