- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于深度强化学习的移动机器人轨迹跟踪和动态避障
第 36 卷 第 1 期 广东工业大学学报 Vol. 36 No. 1
2019 年 1 月 Journal of Guangdong University of Technology January 2019
doi: 10.12052/gdutxb.180029
基于深度强化学习的移动机器人
轨迹跟踪和动态避障
吴运雄,曾 碧
(广东工业大学 计算机学院,广东 广州 510006)
摘要: 针对移动机器人在局部可观测的非线性动态环境下, 实现轨迹跟踪和动态避障时容易出错和不稳定的问题, 提
出了基于深度强化学习的视觉感知与决策方法. 该方法以一种通用的形式将卷积神经网络的感知能力与强化学习的
决策能力结合在一起, 通过端对端的学习方式实现从环境的视觉感知输入到动作的直接输出控制, 将系统环境感知与
决策控制直接形成闭环, 其中最优决策策略是通过最大化机器人与动力学环境交互的累计奖回报中学习获得. 仿真实
验结果证明, 该方法可以满足多任务智能感知与决策要求, 较好地解决了传统算法存在的容易陷入局部最优、在相近
的障碍物群中震荡且不能识别路径、在狭窄通道中摆动以及障碍物附近目标不可达等问题, 并且大大提高了机器人
轨迹跟踪和动态避障的实时性和适应性.
关键词: 深度强化学习;移动机器人;轨迹跟踪;动态避障
中图分类号: TP242.6 文献标志码: A 文章编号: 1007–7162(2019)01–0042–09
Trajectory Tracking and Dynamic Obstacle Avoidance of Mobile
Robot Based on Deep Reinforcement Learning
Wu Yun-xiong, Zeng Bi
(School of Computers, Guangdong University of Technology, Guangzhou 510006, China)
Abstract: A method of visual perception and decision making based on deep reinforcement learning was
proposed, to solve the problem of malfunction and instability in the trajectory tracking and dynamic obstacle
avoidance of mobile robot in a partly observable nonlinear dynamic environment. This method was used in a
general for
您可能关注的文档
- 基于全球模式对中国21世纪夏季高温的变化预估-GongDaoyi.PDF
- 基于光纤的能见度测量方法-光学精密工程.PDF
- 基于内容的图像自适应加网方法-武汉大学学报·信息科学版.PDF
- 基于农业灾情的东北粮食产量估算模型及灾损分析+.PDF
- 基于准地转垂直运动方程对犙矢量的进一步探讨.PDF
- 基于几何图像滤波的3D人脸识别算法-东南大学学报.PDF
- 基于准晶体近似的多层积雪InSAR散射模型ViewTableofContents.PDF
- 基于分数阶微分差与高斯曲率滤波的边缘检测算法.PDF
- 基于分布式光纤的混凝土表面温度梯度监测试验及反馈-长江科学院.PDF
- 基于前端电流平衡器概念的分布式直流系统极间均衡策略.PDF
- 基于混沌动力学的滚动轴承故障诊断研究-自动化仪表.PDF
- 基于温波传递理论的日光温室土墙体蓄热层及墙体-IngentaConnect.PDF
- 基于激光的后向角散射法测量蒸汽湿度-激光与红外杂志.PDF
- 基于烟道喷射蒸发的脱硫废水处理数值模拟研究-中国环境科学.PDF
- 基于热力学理论的超固结黏土边界面模型.PDF
- 基于点苍山—洱海剖面观测系统对青藏高原东南缘-中国气象局图书馆.PDF
- 基于热红外光谱的人脸特征提取算法.PDF
- 基于物质流分析的区域经济系统环境效率评价-资源科学.PDF
- 基于状态空间模型的经济分析-厦门大学学报自然科学版.PDF
- 基于犌犘牦的南极电离层电子总含量空间分布特征研究-测绘学报.PDF
文档评论(0)