基于深度强化学习的移动机器人轨迹跟踪和动态避障.PDF

基于深度强化学习的移动机器人轨迹跟踪和动态避障.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于深度强化学习的移动机器人轨迹跟踪和动态避障

第 36 卷 第 1 期 广东工业大学学报 Vol. 36  No. 1 2019 年 1 月 Journal of Guangdong University of Technology January 2019   doi: 10.12052/gdutxb.180029 基于深度强化学习的移动机器人 轨迹跟踪和动态避障 吴运雄,曾 碧 (广东工业大学 计算机学院,广东 广州  510006) 摘要: 针对移动机器人在局部可观测的非线性动态环境下, 实现轨迹跟踪和动态避障时容易出错和不稳定的问题, 提 出了基于深度强化学习的视觉感知与决策方法. 该方法以一种通用的形式将卷积神经网络的感知能力与强化学习的 决策能力结合在一起, 通过端对端的学习方式实现从环境的视觉感知输入到动作的直接输出控制, 将系统环境感知与 决策控制直接形成闭环, 其中最优决策策略是通过最大化机器人与动力学环境交互的累计奖回报中学习获得. 仿真实 验结果证明, 该方法可以满足多任务智能感知与决策要求, 较好地解决了传统算法存在的容易陷入局部最优、在相近 的障碍物群中震荡且不能识别路径、在狭窄通道中摆动以及障碍物附近目标不可达等问题, 并且大大提高了机器人 轨迹跟踪和动态避障的实时性和适应性. 关键词: 深度强化学习;移动机器人;轨迹跟踪;动态避障 中图分类号: TP242.6                   文献标志码: A                       文章编号: 1007–7162(2019)01–0042–09 Trajectory Tracking and Dynamic Obstacle Avoidance of Mobile Robot Based on Deep Reinforcement Learning Wu Yun-xiong, Zeng Bi (School of Computers, Guangdong University of Technology, Guangzhou 510006, China) Abstract: A method of visual perception and decision making based on deep reinforcement learning was proposed, to solve the problem of malfunction and instability in the trajectory tracking and dynamic obstacle avoidance of mobile robot in a partly observable nonlinear dynamic environment. This method was used in a general for

您可能关注的文档

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档