基于博弈学习的多Agent城市交通协调控制.docVIP

下载本文档

2
0
约9.99千字
约 14页
2016-09-30 发布于北京
举报
版权申诉

基于博弈学习的多Agent城市交通协调控制.doc

1、本文档共14页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于博弈学习的多Agent城市交通协调控制.doc

基于博弈学习的多Agent城市交通协调控制　　摘要：　　交通路口中的各Agent之间的协调问题是一个博弈问题。在有限理性的基础上，利用博弈学习思想，构建多智能体（multi-Agent）博弈学习协调算法，利用此学习协调算法对出行者行为分析并修正，实现城市交通路口的畅通，进而达到区域、全局的交通优化。最后通过实例仿真验证其可行性。　　关键词：有限理性；博弈学习；多智能体；协调算法　　中图分类号：TP18 　　文献标志码：A 　　Multi-Agent urban traffic coordination control research based on game learning 　　Abstract：　　The coordination problem between Agents in traffic intersections is a gambling problem. On the basis of bounded rationality， this paper tentatively made use of game learning thought to build the multi-Agent coordinate game learning algorithm. This learning coordination algorithm analyzed travelers unreasonable behavior and corrected it to realize the urban traffic intersections unimpeded， so as to achieve regional and global transportation optimization. At last， its feasibility is verified by means of an example and simulation. 　　Key words：　　bounded rationality； game learning； multi-Agent； coordination algorithm 　　0 引言　　随着经济的高速发展，城市交通拥挤现象日益严重，如何有效地解决城市交通问题显得愈来愈突出，它直接影响城市经济的发展和居民生活的质量。解决交通拥堵问题的主要方法是通过建立交通流的数学模型，运用运筹学和控制理论来控制和优化整个交通系统，但由于交通系统的复杂性、交通流模型的局限性等因素，控制优化的效果并不理想。因此，随着智能控制的快速发展，一些先进的控制理论和方法，特别是智能控制的方法开始应用于城市交通控制[1-3]。城市交通中的每个出行者可以建模为一个Agent，每个Agent的决策要受到其他Agent决策的影响，博弈论是描述这种相互影响的决策行为的最佳工具，因此将博弈论与多Agent结合应用于交通协调控制已经成为城市交通研究的热点[4-5]。周晶等[6]对公交网络系统的经营博弈问题进行了研究分析，以公交车车费作为经营者的决策变量，建立了经营者之间广义Nash均衡博弈模型，并将之转化成一个拟变分不等式问题再进行求解；郑长江等[7]对城市中无信号控制路段运用博弈论进行了分析；李静等[8]运用博弈论的概念与方法，剖析人们对公共道路和公交客源的利用，研究公交运营规模的相互影响，博弈结果证明了对公交运营进行宏观协调的必要性和重要性；黄园高等[9]对N个人合作博弈的Nash及演化均衡策略进行分析，通过实例运用生物动态复制理论验证演化均衡策略的有效性。Paissan等[10]主要分析了在十字路口发生交互的出行者采用不同策略下的不同支付成本，通过动态模仿受教育水平高的出行者会采取合作行为，大大减缓了交通路口堵塞的可能，指出了对出行者进行教育的必要性。不论是智能控制还是结合博弈方法，都是在完全理性人假设的基础上，把所有的出行者都归结为一类进行研究（忽视了个体出行者之间的差异性），而事实上个体之间的差异是存在的，这也是在协调过程中必须考虑的问题。　　为了处理个体之间的差异，首先介绍博弈学习理论的思想，在此基础上提出一种路口出行者之间的多Agent博弈学习协调方法，通过实例分析与仿真实验，证明该方法是可行的。　　1 博弈学习　　定理[11-12] 每个有限策略博弈，在连续的概率空间上，总存在混合纳什均衡。　　博弈学习理论（theory of learning in games）是描述具有目标的有限理性参与者，如何通过逐步的调整策略来达到某一均衡点的。博弈学习是通过博弈学习主体的策略空间S*t来影射利益函数U*t+1的过程，通过学习（Learning），