摘要
随着自动驾驶技术的发展,在高速公路跟驰与超越场景的运动规划决策能
力成为落地关键。传统系统在该场景面临环境约束建模复杂、动态决策效率不
足的问题,深度强化学习虽具潜力,但传统方法存在过度Q估计、策略收敛不
稳定等挑战。本文聚焦高速公路结构化道路场景,提出适用于三车道环境的运
动规划决策框架。通过设计状态空间、离散化的动作空间及奖励函数,重点解
决多车动态交互中的安全高效决策问题。此项研究基于深度Q学习算法,聚焦
自动驾驶运动规划决策问题,指导自动驾驶运动规划决策,具体工作如下:
摘要
随着自动驾驶技术的发展,在高速公路跟驰与超越场景的运动规划决策能
力成为落地关键。传统系统在该场景面临环境约束建模复杂、动态决策效率不
足的问题,深度强化学习虽具潜力,但传统方法存在过度Q估计、策略收敛不
稳定等挑战。本文聚焦高速公路结构化道路场景,提出适用于三车道环境的运
动规划决策框架。通过设计状态空间、离散化的动作空间及奖励函数,重点解
决多车动态交互中的安全高效决策问题。此项研究基于深度Q学习算法,聚焦
自动驾驶运动规划决策问题,指导自动驾驶运动规划决策,具体工作如下:
文档评论(0)