- 3
- 0
- 约2.36万字
- 约 15页
- 2023-05-12 发布于四川
- 举报
本发明公开了一种基于指导学习的深度强化学习车辆队列控制方法,首先,引入自适应巡航控制模型作为强化学习智能体训练初期的指导器,并设计动作合成器,将强化学习智能体的动作输出和指导器的输出进行融合;在后期的训练过程中,通过设计合理的奖励机制来激励智能体逐渐减小甚至忽略指导器的输出,从而让智能体经过动作探索能够学习到优于初期指导的策略函数;所设计强化学习算法无需进行复杂的车辆动力学模型建模,只依赖设计的观测空间,在奖励函数的激励下寻找最优策略函数,凸显了无模型算法的优势;最后,在保证安全决策的前提下,所
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 116088502 A
(43)申请公布日 2023.05.09
(21)申请号 202211623780.6
(22)申请日 2022.12.16
(71)申请人 西北工业大学
地址 710072
原创力文档

文档评论(0)