- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
软件学报
ISSN
1000-9825,
CODEN
RUXUEWE-mail:
jos@
2025,36(2):590−607
[doi:
10.13328/ki.jos.007150]
[CSTR:
32375.14.jos.007150]
©中国科学院软件研究所版权所有.Tel:
+86-10
面向参数化动作空间的多智能体中心化策略梯度分解及其
*
应用
12213
田树聪,
谢
愈,
张远龙,
周正春,
高
阳
1(西南交通大学
信息科学与技术学院,
四川
成都
611756)
2(国防科技大学
智能科学学院,
湖南
长沙
410073)
3(计算机软件新技术国家重点实验室(南京大学),
江苏
南京
210023)
通信作者:
谢愈,
E-mail:
xieyu@
摘要:
近年来,
多智能体强化学习方法凭借AlphaStar、AlphaDogFight、AlphaMosaic等成功案例展示出卓越的
决策能力以及广泛的应用前景.
在真实环境的多智能体决策系统中,
其任务的决策空间往往是同时具有离散型动
作变量和连续型动作变量的参数化动作空间.
这类动作空间的复杂性结构使得传统单一针对离散型或连续型的多
智能体强化学习算法不在适用,
因此研究能用于参数化动作空间的多智能体强化学习算法具有重要的现实意义.
提出一种面向参数化动作空间的多智能体中心化策略梯度分解算法,
利用中心化策略梯度分解算法保证多智能体
的有效协同,
结合参数化深度确定性策略梯度算法中双头策略输出实现对参数化动作空间的有效耦合.
通过在
Hybrid
Predator-Prey场景中不同参数设置下的实验结果表明该算法在经典的多智能体参数化动作空间协作任务
上具有良好的性能.
此外,
在多巡航导弹协同突防场景中进行算法效能验证,
实验结果表明该算法在多巡航导弹突
防这类具有高动态、行为复杂化的协同任务中有效性和可行性.
关键词:
参数化动作空间;
多智能体强化学习;
中心化策略梯度分解;
多巡航导弹突防
中图法分类号:
TP18
中文引用格式:
田树聪,
谢愈,
张远龙,
周正春,
高阳.
面向参数化动作空间的多智能体中心化策略梯度分解及其应用.
软件学报,
2025,
36(2):
590–607.
/1000-9825/7150.htm
英文引用格式:
Tian
SC,
Xie
Y,
Zhang
YL,
Zhou
ZC,
Gao
Y.
Factored
Multi-agent
Centralised
Policy
Gradient
with
Parameterized
Action
Space
and
Its
Application.
Ruan
Jian
Xue
Bao/Journal
of
Software,
2025,
36(2):
590–607
(in
Chinese).
/
1000-9825/7150.htm
FactoredMulti-agentCentralisedPolicyGradientwithParameterizedActionSpaceand
ItsApplication
12213
TIAN
Shu-Cong,
XIE
Yu,
ZHANG
Yuan-Long,
ZHOU
Zheng-Chun,
GAO
Yang
1(School
of
Information
Science
and
Technology,
Southwest
Jiaotong
University,
Chengdu
611756,
China)
2(College
of
Intelligence
Science
and
Technolo
您可能关注的文档
- 面向边缘计算的矿区障碍检测模型研究.pdf
- 面向边缘计算的轻量级非侵入式负荷分解模型研究.pdf
- 面向边缘计算的柔性定制化生产关键技术研究.pdf
- 面向边缘计算的数字化车间制造数据实时融合方法.pdf
- 面向边缘计算的无证书排序密文检索方案.pdf
- 面向边缘计算的新能源台区实数化潮流算法.pdf
- 面向边缘计算的一种基于深度强化学习的计算卸载策略.pdf
- 面向边缘计算平台及遥感影像的实时检测算法.pdf
- 面向边缘计算在线任务调度的时间抗操纵机制.pdf
- 面向边缘智能的通信计算一体化研究.pdf
- 2025年资助政策知识竞赛题库(参考版2).docx
- 2025版急救救护学突发疾病应急处置演练答案及解析.docx
- 2025版传染病疫情防控专家的疫情处置能力模拟考试答案及解析.docx
- 人教版(2019)物理必修二3 动能和动能定理 (15)教学课件PPT.pptx
- 人教版(2019)物理必修二3 向心加速度 (2)教学课件PPT.pptx
- 人教版(2019)物理必修二3 动能和动能定理 (11)教学课件PPT.pptx
- 人教版(2019)物理必修二2 向心力 (19)教学课件PPT.pptx
- 人教版(2019)物理必修二1 圆周运动 (18)教学课件PPT.pptx
- 人教版(2019)物理必修二1 功与功率 (14)教学课件PPT.pptx
- 人教版(2019)物理必修二3 万有引力理论的成就 (17)教学课件PPT.pptx
- 1.ppt制作及优化;2.办公模板制作;3.文案制作及优化。 + 关注
-
实名认证服务提供商
教师资格证、公共营养师持证人
本人专注ppt制作、办公模板编辑六年有余,可以根据客户需求做出高品质ppt、办公表格等模板,以及文案等。
原创力文档


文档评论(0)