- 12
- 0
- 约2.21万字
- 约 17页
- 2023-06-08 发布于四川
- 举报
本申请公开了一种基于强化学习的交通信号灯控制方法与系统,包括:S1,控制器根据局部观测信息和上层策略,从多个子策略中选择一个;S2,子策略根据局部观测信息,从多个相位中选择一个执行一个时间步;S3,控制器根据获取到的奖励和当前时间观测信息,更新子策略的参数;S4,更新后的子策略选择保持或更换相位,执行一个时间步;S5,控制器根据执行的时间步和周期的数量以及邻域观测信息,更新权重参数和上层策略,执行S1,或执行S3,或得到训练好的智能体;S6,使用训练好的智能体控制一个路口中的所有交通信号灯。能够
(19)国家知识产权局
(12)发明专利
(10)授权公告号 CN 112863206 B
(45)授权公告日 2022.08.09
(21)申请号 202110020458.3 DE 102018006332 A1,2020.02.13
(22)申请日
原创力文档

文档评论(0)