基于深度强化学习的无人艇路径规划方法研究.pdf

基于深度强化学习的无人艇路径规划方法研究.pdf

基于深度强化学习的无人艇路径规划方法研究

摘要

近年来自主无人系统的发展迅猛,水面无人艇作为其中一员,被广泛应用于海洋

探测与搜索等多个领域中,而自主路径规划能力则是其实现全自主化、智能化的关键

所在。随着人工智能领域的不断突破与发展,应用深度强化学习算法来进行无人艇路

径规划成为研究的新趋势。基于上述背景,本文针对深度强化学习算法在不同环境下

的路径规划问题进行研究,主要研究内容如下:

首先,系统梳理无人艇、路径规划的发展现状,分析深度强化学习及其应用于路

径规划领域的研究现状,明确本文的研究意义。在此基础上,介绍本文的理论基础,

并对无人艇模型进行简化。

其次,针对无人艇的全局路径规划,采用Actor-Critic算法。针对传统Actor-Critic

算法探索和利用平衡的问题,采用−greedy策略来保证探索利用的随机性。为了更好

地处理时间序列数据,通过将LSTM层与全连接层相结合来构建神经网络模型。为了

提高算法的训练效率,对状态空间进行简化,设计离散的动作空间和引导性的奖励函

数。通过在不同环境中进行仿真实验,证明改进后Actor-Critic算法的有效性。

然后,针对存在局部动态障

文档评论(0)

1亿VIP精品文档

相关文档