- 1、本文档共102页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2)混和型Agent 在Agent系统中包含两个子系统:一个是认知型子系统,含有用符号表示的世界模型,并用传统人工智能中提出的方法生成规则并进行相应的决策;另一个子系统为反应型,直接对环境中出现的一些紧急事件作出反应。通常,反应型子系统的优先级比认知型子系统高。 建模 决策生成 反射 规划 通讯 感知 行为 预测 一般情况 紧急或简单情况 协作与协商 Agent 外部世界 其他Agent Agent的概念 多智能体系统是一个有组织、有序的智能体群体,共同工作在特定的环境中,每个智能体根据环境信息完成各自承担的工作,也可以分工协作,合作完成特定的任务。 基于MAS的控制系统不同于传统意义上的分散控制,它是把控制器当作具有自治性和协作性的主动行为能力的智能体,通过相关智能体的通信和任务分享进行协调工作,以实现预定的目标。 Agent的概念 基于多智能体的区域控制系统结构框架 多级递阶的层次结构,每一级都由功能、结构类似的智能体(Agent)组成,主要包括3类Agent:中心控制级Agent(CTA),区域控制级Agent(ARA)和路口执行级Agent(ISA)。 各级Agent的功能 1)中心控制级Agent 整个系统的最高层, 负责系统的整体管理、各区域控制级Agent之间的协调等, 具有最高的决策权力。中心控制级Agent可对整个系统的交通运行状况进行评估, 根据各方面的汇总信息, 进行推理、规划和决策, 实现所有子区域控制系统间的协作。 2) 区域控制级Agent 控制系统的中间层, 负责本区域内各路口执行级Agent的协调工作, 也可对本控制区域的部分路口强行设置控制模式, 并实现与其他区域控制级Agent之间的信息交流及合作。 3) 路口执行级Agent 路口执行级Agent位于系统的最低层, 具有关于本交叉口以及其所连接街道几何形状、街道特点的知识和数据, 负责各交叉口的信号控制, 可与其相邻的交叉口进行实时的通讯联系, 并根据本路口实时的交通流状况以及周围的交通情况,实时自动对交通信号进行调整, 以使控制效果达到最优。 同时, 对本路口发生的异常情况能实时通知给其所属的区域控制级Agent, 并能根据需要完成区域控制级Agent下达的控制指令。 路口执行级Agent的内部结构 ISA 知识库 学习器 融合算法模型 规则库 数据库 协调模块 参数调整模型 数据预测模型 数据预处理 检测器 相邻ISA ARA 控制策略 交通流 信号灯 协调模型 一次博弈协调定义为 G={A,I,S,U} 式中:A表示博弈协调中的行为和决策主体,它是通过选择行动策略以最大化自己的效用水平,是所有Agent的集合,A={Agent1,Agent2,…,Agentn};I表示每个主体拥有的信息,包括其它主体的特征和行动策略的信息;S表示主体所有可能的策略或行动的集合,一个主体的全部可行策略称为它的策略空间。每个Agent有一个纯策略的有限集,S={东西直行,南北直行,东西左转,南北左转};U为利益函数 ,是指在既定策略组合条件下主体的得失情况,即在一个特定的策略组合下主体得到的效用水平。 协调算法 步骤1:路口Agent的车辆排队数超过阈值,则向相邻的Agent发出协调请求。 步骤2:相邻路口Agent响应请求,寻找纳什均衡。 步骤3:如果纳什均衡存在,则每个Agent按照使纳什均衡存在的策略控制本路口,协调结束;如果没有纳什均衡,则向该路口所在的区域Agent发出协调请求。 步骤4:区域Agent响应请求,对其所管辖路口Agent进行博弈协调,寻求纳什均衡;如果纳什均衡不存在,则向相邻的区域Agent发出协调请求。 步骤5:相邻的区域Agent响应请求,进行博弈协调,寻求纳什均衡;如果纳什均衡不存在,则系统的自动协调失败,需采用人工干预策略。此时各Agent保持原来的控制策略。 纳什均衡 纳什均衡是指这样一种均衡:在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。也就是说,所有人的战略都是最优的。 囚徒困境 a,b两个囚徒,a坦白b抵赖,b判10年,a判1年.若两人均坦白则各判5年,若两人均抵赖则都判2年。a,b面临抉择。 显然最好的策略是双方都抵赖,结果是大家都只被判2年。但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。 这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算; 假如我
文档评论(0)