一种空间精细操作的离线强化学习方法及系统.pdfVIP

下载本文档

1
0
约1.2万字
约 11页
2023-05-17 发布于四川
举报

一种空间精细操作的离线强化学习方法及系统.pdf

本发明公开了一种空间精细操作的离线强化学习方法及系统，其中，该方法包括如下步骤：步骤1：采集离线多任务交互数据，并对离线多任务交互数据进行分割；步骤2：基于分割后的离线多任务交互数据，进行离线多任务演员‑评论家优化得到全局策略网络；步骤3：将全局策略网络作为控制器，移植到真实物理环境。本发明实现空间精细操作的交互数据一次离线采集、多种任务多次重复利用，提升样本采集与样本利用效率。

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114819179 A (43)申请公布日 2022.07.29 (21)申请号 202210233709.0 (22)申请日 2022.03.10 (71)申请人北京控制工程研究所地址 1000

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

一种空间精细操作的离线强化学习方法及系统.pdfVIP

一种空间精细操作的离线强化学习方法及系统.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档