基于延迟经验优先回放机制的强化学习无人机航迹规划方法.pdfVIP

  • 8
  • 0
  • 约2.99万字
  • 约 25页
  • 2023-11-01 发布于四川
  • 举报

基于延迟经验优先回放机制的强化学习无人机航迹规划方法.pdf

本发明公开的一种基于延迟经验优先回放机制的强化学习航迹规划方法,属于航迹规划技术领域。本发明实现方法为:考虑无人机动力学、飞行性能、地形和威胁约束构造无人机避障航迹规划问题模型,并以此设计航迹规划问题的强化学习状态‑动作‑奖励三要素;构建基于最大化熵策略的局部航迹规划训练与应用框架,通过“离线训练‑在线规划”分层机制降低局部信息驱动下航迹规划的计算耗时;结合非稀疏设计引导奖励函数,利用局部信息引导无人机逐渐趋近目标。引入策略延迟更新机制与优先经验回放机制,在网络参数的训练过程中,分阶段训练以加快

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116974299 A (43)申请公布日 2023.10.31 (21)申请号 202311004197.1 (22)申请日 2023.08.10 (71)申请人 北京理工大学 地址 100081

文档评论(0)

1亿VIP精品文档

相关文档