用于自动驾驶的基于模型的动作提议的摊销Q学习
布兰卡·米尔切夫斯卡¨
,玛丽亚·H格尔,加布里埃尔·卡尔,莫里茨·维尔林,·博德克尔
—已建立的优化方法可以保证在较短的优化时间范围
内(通常不超过几秒)的最佳轨迹。然而,选择这个短期范围
内的最佳轨迹仍可能导致次优的长期解决方案。同时,生成的
短期轨迹允许在动态交通环境中进行有效、舒适且可证明安
您可能关注的文档
最近下载
- 康复工程技术-肖晓鸿-第四章其他康复辅助器具技术第一节轮椅.pptx
- 职业技能鉴定《三级烟草专卖管理师》模拟真题四.pdf VIP
- 新修订《国有企业领导人员廉洁从业规定》全文课件.ppt
- (高清版)DG∕TJ 08-2434-2023 城市轨道交通结构安全保护技术标准.pdf VIP
- 盾构隧道内电瓶车轨道安装交底.docx VIP
- ISO50001-2018能源管理体系能源因素识别表、能源因素评价表及重要能源因素控制清单.pdf VIP
- (2025年)国家职业技能鉴定考评员考试题库(含答案).docx VIP
- 07K103-2 防排烟系统设备及附件选用及安装.pdf VIP
- 城乡结合部社区养老服务方案.docx VIP
- 案例教学典型案例.doc VIP
原创力文档

文档评论(0)