基于深度强化学习的无人艇路径规划方法研究
摘要
近年来自主无人系统的发展迅猛,水面无人艇作为其中一员,被广泛应用于海洋
探测与搜索等多个领域中,而自主路径规划能力则是其实现全自主化、智能化的关键
所在。随着人工智能领域的不断突破与发展,应用深度强化学习算法来进行无人艇路
径规划成为研究的新趋势。基于上述背景,本文针对深度强化学习算法在不同环境下
的路径规划问题进行研究,主要研究内容如下:
首先,系统梳理无人艇、路径规划的发展现状,分析深度强化学习及其应用于路
径规划领域的研究现状,明确本文的研究意义。在此基础上,介绍本文的理论基础,
并对无人艇模型进行简化。
其次,针对无人艇的全局路径规划,采用Actor-Critic算法。针对传统Actor-Critic
算法探索和利用平衡的问题,采用−greedy策略来保证探索利用的随机性。为了更好
地处理时间序列数据,通过将LSTM层与全连接层相结合来构建神经网络模型。为了
提高算法的训练效率,对状态空间进行简化,设计离散的动作空间和引导性的奖励函
数。通过在不同环境中进行仿真实验,证明改进后Actor-Critic算法的有效性。
然后,针对存在局部动态障
原创力文档

文档评论(0)