- 8
- 0
- 约2.99万字
- 约 25页
- 2023-11-01 发布于四川
- 举报
本发明公开的一种基于延迟经验优先回放机制的强化学习航迹规划方法,属于航迹规划技术领域。本发明实现方法为:考虑无人机动力学、飞行性能、地形和威胁约束构造无人机避障航迹规划问题模型,并以此设计航迹规划问题的强化学习状态‑动作‑奖励三要素;构建基于最大化熵策略的局部航迹规划训练与应用框架,通过“离线训练‑在线规划”分层机制降低局部信息驱动下航迹规划的计算耗时;结合非稀疏设计引导奖励函数,利用局部信息引导无人机逐渐趋近目标。引入策略延迟更新机制与优先经验回放机制,在网络参数的训练过程中,分阶段训练以加快
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 116974299 A
(43)申请公布日 2023.10.31
(21)申请号 202311004197.1
(22)申请日 2023.08.10
(71)申请人 北京理工大学
地址 100081
您可能关注的文档
最近下载
- 2025年地方病防治技能竞赛(理论知识)历年参考题库含答案详解(5套).docx VIP
- 中华古籍文渊阁四库全书 子部609医家 医垒元戎 简体.pdf VIP
- 秦伯未《中医入门》.pdf VIP
- 屋面光伏项目支架及基础计算书.docx VIP
- 单片机原理及应用课程设计报告模板.doc VIP
- 2024年地方病竞赛理论知识考试试题.docx VIP
- 《基于PLC的地铁排水控制系统》-毕业论文(设计).doc VIP
- 2023年西电微电子学院数字集成电路上机作业.pdf VIP
- 高中历史会考知识点.doc VIP
- 2026河北秦皇岛秦热发电有限责任公司春季招聘2人考试参考试题及答案解析.docx VIP
原创力文档

文档评论(0)