绝大多数研究以假设的静态随机环境为研究对象,采用完全孤立或部分状态合作的协调机制进行本地路口的最优化控制,这制约了网络交通控制系统的整体效益。近年来,基于动作联动的 MARL 控制方法发展迅速,其以联动协同的方式逼近全局最优的控制策略;同时,算法的验证也由假设的交通网络向现实的交通网络发展。 MARL 控制的演化发展 基于智能体的信号交叉口控制 2 * PPT课件 1)MARL控制系统的优势 从控制理论来看, MARL控制可根据控制效果的反馈信息自主学习并优化策略知识,是一种真正的闭环反馈控制。 从控制范围来看,其可精确推理多个路口间的最优联合动作,丰富了区域交通协调控制的内容及形式。 从控制实时性来看,它没有复杂的模型优化模块,采用秒级的即时决策,可实时响应时变交通流的变化。 从系统可拓展性来看,分散式 MARL 控制具有统一的结构模型,可针对特定路网结构和交通流特性进行相应改造。 从系统兼容性来看,MARL控制本身仅需要系统的输入和输出数据,对数据具体采集的技术和形式无要求。 基于智能体的信号交叉口控制 2 * PPT课件 交通信号 RL 智能体的标准模型如图 1 所示,每个路口的交通信号机被抽象为一个智能体,控制对象为道路交通网络上时变交通流。RL 智能体与被控对象在闭环系统中不断进行交互,通过观察交通环境的实时状态,提取信号控制所需的交通状态信息和反馈奖
您可能关注的文档
- 动物的生殖与发育 .ppt
- 动物学课实验件.ppt
- 二年级-多幅图-看图写话训练--知错就改.ppt
- 二年级上册数学广角《搭配(一)》.ppt
- 发动机排气能量的利用.ppt
- 房地产管控:土地整备利益统筹政策与案例剖析.ppt
- 非均相催化反应动力学.ppt
- 非线性光学06 受激拉曼散射与受激布里渊散射a.ppt
- 肺功能在临床中的应用.ppt
- 分拆为乘和加.ppt
- 可持续设计-配套ppt教学课件-2.2 可持续-实践为终-大兴机场.pptx
- 可持续设计-配套ppt教学课件-可持续-实践为终(2).pptx
- 可持续设计-配套ppt教学课件-可持续设计-章节关系.pptx
- 可持续设计-配套ppt教学课件-2.1 可持续-实践为终.pptx
- 可持续设计-配套ppt教学课件-2.1 可持续-实践为终(2).pptx
- 可持续设计-配套ppt教学课件-5.4.1服务系统设计案例.pptx
- 可持续设计-配套ppt教学课件-分布式经济-实践为终.pptx
- 2022ZC-C-G02-2X安装使用说明书.docx
- GST-TS-Z01A消防电话主机安装使用说明书.docx
- 2022大空间自动跟踪定位射流 (消防水炮)灭火系统概述.docx
原创力文档

文档评论(0)