基于情节记忆的多智能体协同策略的训练方法和系统.pdfVIP

  • 5
  • 0
  • 约1.71万字
  • 约 16页
  • 2023-07-01 发布于四川
  • 举报

基于情节记忆的多智能体协同策略的训练方法和系统.pdf

本发明公开一种基于情节记忆的多智能体协同策略的训练方法和系统,利用情节记忆方法,在收集训练数据时,记录各个机器人不同状态下经历的情节与对应累计回报,并将该情节与对应回报作为策略训练时机器人的额外目标。通过多机器人强化学习方法,使得各机器人能够在有限数据下快速学习高效协同策略,训练得到的机器人协同策略使智能体在决策时,既能考虑目前的状态价值函数,又能考虑到长期的情节回报,从而实现综合决策。本发明在实际场景中仅通过少量训练数据实现快速策略训练,以有效应对动态开放场景下的合作任务。

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116360435 A (43)申请公布日 2023.06.30 (21)申请号 202310294489.7 G06N 7/01 (2023.01) (22)申请日 2023.03.2

文档评论(0)

1亿VIP精品文档

相关文档