- 8
- 0
- 约2.12万字
- 约 20页
- 2023-06-23 发布于四川
- 举报
本申请提供了一种基于深度强化学习的机器人运动参数自适应控制方法和系统。该方法包括:在仿真环境中构建智能体,所述智能体包括:策略神经网络、价值神经网络和任务规划模块;基于引导式强化学习,根据样本参数,对所述智能体中的策略神经网络进行训练;基于分层式强化学习,根据多个子任务及其对应的奖励函数,对所述智能体中的策略神经网络和价值神经网络依次交替进行策略提升和策略评估,得到训练完成的策略神经网络模型;基于训练完成的所述策略神经网络模型,根据所述目标任务,向所述控制器输出控制参数优化值,以由所述控制器根据
(19)国家知识产权局
(12)发明专利
(10)授权公告号 CN 113478486 B
(45)授权公告日 2022.05.17
(21)申请号 202110786283.7 (56)对比文件
(22)申请日 2021.07.12
原创力文档

文档评论(0)