- 1
- 0
- 约1.2万字
- 约 11页
- 2023-05-17 发布于四川
- 举报
本发明公开了一种空间精细操作的离线强化学习方法及系统,其中,该方法包括如下步骤:步骤1:采集离线多任务交互数据,并对离线多任务交互数据进行分割;步骤2:基于分割后的离线多任务交互数据,进行离线多任务演员‑评论家优化得到全局策略网络;步骤3:将全局策略网络作为控制器,移植到真实物理环境。本发明实现空间精细操作的交互数据一次离线采集、多种任务多次重复利用,提升样本采集与样本利用效率。
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 114819179 A
(43)申请公布日 2022.07.29
(21)申请号 202210233709.0
(22)申请日 2022.03.10
(71)申请人 北京控制工程研究所
地址 1000
原创力文档

文档评论(0)