交叉口智能信号控制.ppt

绝大多数研究以假设的静态随机环境为研究对象,采用完全孤立或部分状态合作的协调机制进行本地路口的最优化控制,这制约了网络交通控制系统的整体效益。近年来,基于动作联动的 MARL 控制方法发展迅速,其以联动协同的方式逼近全局最优的控制策略;同时,算法的验证也由假设的交通网络向现实的交通网络发展。 MARL 控制的演化发展 基于智能体的信号交叉口控制 2 * PPT课件 1)MARL控制系统的优势 从控制理论来看, MARL控制可根据控制效果的反馈信息自主学习并优化策略知识,是一种真正的闭环反馈控制。 从控制范围来看,其可精确推理多个路口间的最优联合动作,丰富了区域交通协调控制的内容及形式。 从控制实时性来看,它没有复杂的模型优化模块,采用秒级的即时决策,可实时响应时变交通流的变化。 从系统可拓展性来看,分散式 MARL 控制具有统一的结构模型,可针对特定路网结构和交通流特性进行相应改造。 从系统兼容性来看,MARL控制本身仅需要系统的输入和输出数据,对数据具体采集的技术和形式无要求。 基于智能体的信号交叉口控制 2 * PPT课件 交通信号 RL 智能体的标准模型如图 1 所示,每个路口的交通信号机被抽象为一个智能体,控制对象为道路交通网络上时变交通流。RL 智能体与被控对象在闭环系统中不断进行交互,通过观察交通环境的实时状态,提取信号控制所需的交通状态信息和反馈奖

文档评论(0)

1亿VIP精品文档

相关文档