有限阶段马尔可夫决策的可变限速控制模型-交通运输工程学报-长安.pdf

有限阶段马尔可夫决策的可变限速控制模型-交通运输工程学报-长安.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
有限阶段马尔可夫决策的可变限速控制模型-交通运输工程学报-长安

第 卷 第 期 交 通 运 输 工 程 学 报 11 5 Vol.11 No.5     年 月 2011 10 JournalofTrafficandTransortationEnineerin Oct.2011 p g g 文章编号: ( ) 16711637201105010906 有限阶段马尔可夫决策的可变限速控制模型 1 1 2 王 薇 ,杨兆升 ,赵丁选   ( 吉林大学 交通学院,吉林 长春 ; 吉林大学 机械科学与工程学院,吉林 长春 ) 1. 130025 2. 130025     摘 要:分析了高速公路主线可变限速控制的作用,研究了现有的限速方法,将高速公路主线可变   限速控制过程看作是离散时间的马尔可夫决策过程,提出基于强化学习与有限阶段马尔可夫决策 的可变限速控制模型,通过与交通环境的交互学习进行模型的动态调整。采用有限阶段向后递归 迭代的算法对模型进行求解,运用Paramics仿真软件对长吉高速公路全程进行仿真。仿真结果表 明:在平均限速值低于设计时速 6.25%的情况下,平均流量不仅没有降低反而增加了3.20%。可 见,该模型可以有效提高交通流量,改善高速公路主线的交通状况。 关键词:交通信息工程;可变限速控制;马尔可夫决策;强化学习;高速公路主线 中图分类号: 文献标志码: U491 A     犆狅狀狋狉狅犾犿狅犱犲犾狅犳狏犪狉犻犪犫犾犲狊犲犲犱犾犻犿犻狋犫犪狊犲犱狅狀犳犻狀犻狋犲 狆 犺狅狉犻狕狅狀犕犪狉犽狅狏犱犲犮犻狊犻狅狀犿犪犽犻狀犵 1 1 2 , , WANGWei YANGZhaoshen ZHAODinxuan g g ( , , , , ; 1.SchoolofTransortation JilinUniversit Chanchun130025 Jilin China p y g , , , , ) 2.SchoolofMechanicalScienceandEnineerin JilinUniversit Chanchun130025 Jilin China g g y g :

文档评论(0)

zhaoxiaoj + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档