基于Q学习的无人机航迹规划.docVIP

下载本文档

26
1
约7.08千字
约 7页
2017-09-22 发布于安徽
举报
版权申诉

基于Q学习的无人机航迹规划.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于 Q 学习的无人机航迹规划毛治力，张宝昌，徐彬** （飞行器控制一体化技术重点实验室，自动化科学与电气工程学院， 5 10 15 20 25 30 35 40 北京航空航天大学，北京 100191）摘要：本文使用 Q 学习算法来解决实时无人机航迹规划问题. 最优的航迹规划问题实际上是根据几何问题对路线进行求解,Q 学习本质上来说是一种增强学习算法, 不仅能够充分利用距离信息来计算基于几何距离信息的航迹, 同时也融合了复杂环境中的危险信息,从实用和理论角度都很好的解决了无人机航迹规划问题. 最后通过分析几种不同的仿真结果, 表明该方法的可行性及有效性. 关键词：无人机；航迹规划；Q 学习中图分类号：TP181 Path Planning of UAV Based on Q-learning Mao Zhili, Zhang Baochang, Xu Bin （Science and Technology on Aircraft Control Laboratory, Department of Automatic Control, Beijing University of Aeronautics and Astronautics, Beijing 100191） Abstract: In this paper, we used a classic learning algorithm, the Q-Learning, and its application on the UAV (unmanned aircraft vehicles) planning problem. The route planning problem is considered as a geometric problem in this paper and is solved by Q-learning. Essentially the Geometric learning is a kind of reinforce learning methods and is able to utilize the distance and danger information from the map at the same time which can lead to a comprehensive solution to the planning problem. At the end of paper, some representative results are shown to prove Q-Learning’s effectiveness and feasibility. Keywords: UAV; path planning; Q-learning 0 引言无人机在威胁区域内进行飞行活动时，路径规划的合理与否对于任务能否顺利完成起了至关重要的作用．路径规划的任务要求既能保证无人机在任务执行过程中安全的抵达任务目标，也需对该路径的经济性进行考虑．寻找两者之间合理的平衡点，是航迹规划算法的目标之一．在前人的工作中，文献[1]中提出的 Voronoi 图法与文献[2]中提出的可视图法，在地图信息不完全、存在未知危险体与障碍物的实际情况下，不能顺利完成规划路径的任务，未对实时性加以考虑．而在文献[3]中所提出 A2 D 算法属于实时性的算法，但仍存在不足：首先是在危险区域的转弯角度过大，其次在局部复杂区域内不能找到有效的导航路径；另外需要额外设计危险区域的逃离方案，才能顺利逃脱危险区域；文献[4]中的 BCV 算法虽然在算法的实时性与全局的收敛性上做出了较多的思考，但是算法中对于安全性的考虑较少，贴近威胁域边缘的飞行，并不能较好处理威胁与安全之间的关系．对于波动的环境，该算法的飞行器处在的环境变化较大，安全系数大大下降．而本文中所提出的算法利用 Q 学习的加强型学习，在全局中对威胁域和目标点进行考虑，做出的全局性决策，同时对安全性与经济性做出了综合考虑．作者简介：毛治力，（1990-），男，主要研究方向：机器学习，无人机航迹规划。通信联系人：张宝昌，（1976-），男，副教授，硕士生导师，主要研究方向：机器学习，模式识别。 E-mail: bczhang@buaa.edu.cn -1- 1 基于 Q 学习的无人机路径规划算法无人机所处的环境往往非常恶劣，这是因为它通常是低空作业．不仅容易受到来自地面的攻击，还有高出地面的山体植物和人工的建筑物，若不及时避让，将会造成无人机坠落．硬 45 件的损毁与任务的失败都是不可估量的损失，应当极力避免．所以无人机在飞行过程中，既