一种基于目标采样的模仿学习方法.pdfVIP

  • 2
  • 0
  • 约1.03万字
  • 约 9页
  • 2023-05-17 发布于四川
  • 举报
一种基于目标采样的模仿学习方法,属于人工智能技术领域。本发明包括网络结构设计、参考轨迹生成及学习算法。通过把一个复杂任务的目标转换为一系列容易训练的子目标,并借助于模仿学习,大大降低复杂任务采用强化学习训练的难度,有效解决了强化学习中具有稀疏reward特征的任务难以训练的问题。

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114819060 A (43)申请公布日 2022.07.29 (21)申请号 202210333460.0 (22)申请日 2022.03.30 (71)申请人 北京控制工程研究所 地址 1000

文档评论(0)

1亿VIP精品文档

相关文档