- 1
- 0
- 约6.04千字
- 约 6页
- 2023-06-15 发布于四川
- 举报
本发明公开了一种以安全性、距离代价为约束的自学习路径规划方法,借鉴A*启发函数的设计思想,设计一种综合考虑安全代价和距离代价的启发函数,并将此启发函数引入强化学习DQN算法中的报酬函数的设计中,通过新的报酬函数,能够引导智能体找出安全、最短的路径。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 113177664 A
(43)申请公布日 2021.07.27
(21)申请号 202110550501.7
(22)申请日 2021.05.20
(71)申请人 的卢技术有限公司
地址
您可能关注的文档
最近下载
- 新版冀教版科学四年级上册期末试卷(5套).pdf VIP
- 人行悬索桥专项施工方案(论证).pdf VIP
- 你是在高三如何最大幅度提分?——from知乎:铁匠qwer(提分150+).pdf VIP
- 标准图集-17J008 挡土墙(重力式、衡重式、悬臂式) -抗震烈度7.pdf VIP
- 浙江省宁波市余姚市2024-2025学年三年级上学期期末语文试卷.docx VIP
- 电土施表13.3-12 地漏及地面清扫口排水试验记录.doc VIP
- 工商业储能商业模式探索_储能PPT - 副本.pptx VIP
- 数据库原理及应用教程(MySQL版)全套教学课件.pptx VIP
- 医学课件-会厌囊肿护理查房.pptx VIP
- CATL安全作业试题及答案.doc
原创力文档

文档评论(0)