一种空间精细操作的离线强化学习方法及系统.pdfVIP

  • 1
  • 0
  • 约1.2万字
  • 约 11页
  • 2023-05-17 发布于四川
  • 举报

一种空间精细操作的离线强化学习方法及系统.pdf

本发明公开了一种空间精细操作的离线强化学习方法及系统,其中,该方法包括如下步骤:步骤1:采集离线多任务交互数据,并对离线多任务交互数据进行分割;步骤2:基于分割后的离线多任务交互数据,进行离线多任务演员‑评论家优化得到全局策略网络;步骤3:将全局策略网络作为控制器,移植到真实物理环境。本发明实现空间精细操作的交互数据一次离线采集、多种任务多次重复利用,提升样本采集与样本利用效率。

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114819179 A (43)申请公布日 2022.07.29 (21)申请号 202210233709.0 (22)申请日 2022.03.10 (71)申请人 北京控制工程研究所 地址 1000

文档评论(0)

1亿VIP精品文档

相关文档