- 1、本文档共35页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
大模型驱动的多智能体协同初探
钱忱清华大学
演讲嘉宾
钱忱
清华大学博士后
清华大学软件学院博士,现于清华大学自然语言处理实验室(THUNLP)
担任博士后,清华大学水木学者,主要研究方向为预训练模型、自主智能体、群体智能;合作导师为孙茂松和刘知远教授,曾在ACL、SIGIR、ICLR、AAAI、CIKM等人工智能、信息管理、软件工程等相关的国际学术会议或期刊上以第一作者身份发表论文数篇。在群体智能方面,主持发布
了大语言模型驱动的群体协作框架ChatDev、群体共学习范式Co-
Learning、群体协同网络MacNet,面向任务完成和社会模拟的多智能体平台AgentVerse等。
1.从大模型走向自主智能体
目录CONTENTS
目录
CONTENTS
3.多智能体协同及演化
4.智能体协同的缩放法则
5.总结与展望
PART01
从大模型走向自主智能体
大模型驱动的自主智能体
?基础大模型作为智能应用技术的内核,必须以自主智能体作为载体与动态环境进行交互,才能充分胜任动态复杂的智能应用,因此亟需发展大模型驱动的自主智
能体技术
学习环境动态大模型驱动智能体
学习环境动态
大模型驱动智能体
训练数据有限训练数据无限
训练数据有限
大模型为智能“灵魂”智能体为智能“载体”监督信号间接智能体反馈大模型
大模型为智能
“灵魂”
智能体为智能
“载体”
监督信号间接
智能体反馈大模型
人工智能将进入智能体时代
自主智能体是OpenAI核心战略之一
自主智能体是OpenAI核心战略之一
重要战略窗口期
2023年11月6日,OpenAI在第一届开发者大会上正式提出构建自主智能体及相关生态的
2023年11月6日,OpenAI在第一届开发者大会上正式提出构建自主智能体及相关生态的战略目标
自主智能体相关研究爆发式增长
2年增长约100自主智能体相关研究在大模型带动下迅速成为人工智能研究必争之地,
2年增长约100
2023年自主智能体研究论文数量呈井喷趋势
人类智能与人工智能
?人工智能很可能即将走跟人类智能一样的发展路径
人类智能
群体协作脑容量小脑容量大工具使用
群体协作
脑容量小
脑容量大
智能体人工智能小模型大模型群体智能
智能体
人工智能
小模型
大模型
XAgent:大模型驱动的自主智能体框架
?XAgent通过双循环机制协调决策制定和任务执行过程:外循环规划、内循环执行
?外循环处理任务的高级管理和分配,内循环专注每个子任务的低级执行和优化
PART02
大模型多智能体系统
多智能体系统的两种基本类型
社会模拟型任务完成型
社会模拟型
清华ChatDev数字团队:基于语言交互的智能体数字公司,实现群体协作式软件开发斯坦福SmallVille小镇:基于层次规划的智能体社
清华ChatDev数字团队:基于语言交互的智能体数字公司,实现群体协作式软件开发
ChenQian,etal.ChatDev:CommunicativeAgentsforSoftwareDevelopment.InACL-2024.
ParkJS,etal.Generativeagents:Interactivesimulacraofhumanbehavior.InUIST-2023.
多智能体自主交互:任务解决新范式
?群体协作实现多方优势互补、配合无间,提高解决问题的准确率
?语言交互搭建沟通桥梁、缓解信息茧房,通过任务分工和协作执行处理复杂任务
解决方案----大语言模型---------
解决方案
----
大语言模型
----
----
----
复杂任务
----
自主智能体群体协作
自主智能体
?联盟结构:独立结构、层
?联盟结构:独立结构、层次化结构、中心化结构、全连接结构
?组织规模:小规模、中规模、大规模
任务目标社会组织?无目标导向型:群体自由规划及行为执行(e.g.,社会模拟)
任务目标
社会组织
?目标导向型:制定群体特定目标以协同进行任务完成(e.g.,软件开发)
?顺序型:各子组织间依次行动
?顺序型:各子组织间依次行动
?互斥型:各子组织间选择性行动
?并发型:各子组织间并行行动
组织管理行为路由?行为关系:合作关系、竞争关系
组织管理
行为路由
?组织行为:激励行为、团队凝聚力、劳动力多元化、资源竞争、同龄人压力、群体懈怠、评价焦虑、情绪感染等
PART03
文档评论(0)