- 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
- 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
本发明针对传统强化学习方法在自动驾驶这种连续状态空间和动作空间的任务所需探索量庞大的问题,通过搭建基于异构融合特征的深度确定性策略梯度强化学习方法来完成自动驾驶任务,设计了先模仿后强化,异构融合精简状态的学习思路。在模仿学习阶段,利用从驾驶数据中将高维信息降维为低维特征,连同从仿真环境中获得的几个描述环境的关键参数构成车辆状态特征,采用分级整合连接的方式异构融合这些特征。在强化学习阶段,采用深度确定性策略梯度算法并为自动驾驶量身定制了奖励函数,有效地引导了学习过程。经验证,该系统设计可以有效习得
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 113255054 A
(43)申请公布日 2021.08.13
(21)申请号 202110273101.6
(22)申请日 2021.03.14
(71)申请人 南京晓庄学院
地址
您可能关注的文档
- 系统、机动车辆.pdf
- 用于车辆座椅的侧部的气动调整设备.pdf
- 钟表用搭扣构造、钟表用表带和钟表.pdf
- 充电接口.pdf
- 物体移动检测装置和方法及非暂时性计算机可读存储介质.pdf
- 温度传感器.pdf
- 模块化液压动力单元的罐和包括罐的模块化液压动力单元.pdf
- 门装置.pdf
- 藉由LiDAR传感器确定风向的方法.pdf
- 通信系统和代理输入与输出单元.pdf
- 2025年河南省郑州市管城回族区陇海路街道国民经济和社会发展第十五个五年规划.docx
- 2025年河南省郑州市金水区庙李镇国民经济和社会发展第十五个五年规划.docx
- 2025年河南省濮阳市清丰县韩村乡国民经济和社会发展第十五个五年规划.docx
- 2025年河南省许昌市襄城县双庙乡国民经济和社会发展第十五个五年规划.docx
- 2025年河南省平顶山市卫东区建设路街道国民经济和社会发展第十五个五年规划.docx
- 2025年河南省平顶山市湛河区南环路街道国民经济和社会发展第十五个五年规划.docx
- 2025年河南省郑州市金水区丰产路街道国民经济和社会发展第十五个五年规划.docx
- 2025年河南省平顶山市汝州市骑岭乡国民经济和社会发展第十五个五年规划.docx
- 2025年河南省平顶山市卫东区东安路街道国民经济和社会发展第十五个五年规划.docx
- 2025年河南省驻马店市汝南县官庄乡国民经济和社会发展第十五个五年规划.docx
文档评论(0)