一种用于机械臂强化学习运动规划中启发式奖励函数的设计方法.pdfVIP

  • 18
  • 0
  • 约1.22万字
  • 约 11页
  • 2023-04-21 发布于四川
  • 举报

一种用于机械臂强化学习运动规划中启发式奖励函数的设计方法.pdf

一种用于机械臂强化学习运动规划中启发式奖励函数的设计方法,本发明涉及机器人运动规划与智能控制技术领域。本发明为了解决基于强化学习的机械臂运动规划算法的奖励函数设计无统一的指导方法通常依靠经验进行设计的问题。本发明包括:建立机械臂运动规划问题的启发式函数;根据启发式函数,构建机械臂运动规划的启发式奖励函数;确定启发式奖励函数中的参数取值;利用构建的启发式奖励函数训练机械臂运动规划的神经网络运动规划器。启发式奖励函数明显提升了运动规划的成功率并加快了收敛速度。本发明用于机械臂的运动规划与智能控制领域

(19)国家知识产权局 (12)发明专利 (10)授权公告号 CN 113894787 B (45)授权公告日 2022.06.14 (21)申请号 202111278998.8 (56)对比文件 (22)申请日 2021.10.31

文档评论(0)

1亿VIP精品文档

相关文档