一种基于多智能体生成对抗模仿安全学习的协作围捕方法.pdfVIP

  • 10
  • 0
  • 约2.42万字
  • 约 21页
  • 2023-07-02 发布于四川
  • 举报

一种基于多智能体生成对抗模仿安全学习的协作围捕方法.pdf

本发明涉及一种基于多智能体生成对抗模仿安全学习的协作围捕方法,该方法包括:步骤1:搭建多智能体协作围捕仿真平台;步骤2:将多智能体协作围捕任务过程建立为MGP模型;步骤3:获取专家的围捕轨迹信息,并将其存入经验存储模块;步骤4:针对多智能体系统搭建轨迹判别网络、策略生成网络、值估计网络和限制估计网络;步骤5:基于多智能体生成对抗模仿安全学习对网络参数进行优化训练,得到策略生成网络和轨迹判别网络的最佳参数;步骤6:通过动作安全校正器对输出策略进行安全性校正,将校正后的策略应用于实际围捕作业任务,与

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113723012 A (43)申请公布日 2021.11.30 (21)申请号 202111060274.6 (22)申请日 2021.09.10 (71)申请人 上海

文档评论(0)

1亿VIP精品文档

相关文档