复合熟人模型——一种多Agent合作组织方法研究.pdfVIP

复合熟人模型——一种多Agent合作组织方法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
复合熟人模型——一种多Agent合作组织方法 朱永利王平 华北电力大学计算机学院河北保定071003 e—mail:yonglipw@heinfo.net 与通信,提高求解效率、降低资源和通信开销,一直是研究者关注的问题。本文借鉴现实社会组织特点, 从分析Agent间关系入手,识别对求解具有重要影响的特征,提出了复合熟人模型,对熟人评价进行了讨 论,并分析了合作求解过程。通过实验分析一定程度上证明了这种合作组织方法的有效性。 关键词:AgentMAS(多Agent系统)复合熟人模型 1.引言 MAS中Agent之间的知识共享和信息交互是MAS具有更强解题能力的主要原因…,但是 这种知识的共享和信息的交互是以通信开销和资源耗费为代价的。而在目前对MAS的研究 中,系统的通信开销和资源限制一直是组织和构造大规模MAS的重要瓶颈。研究者从不同角 度出发提出了多种模型[2-5|但结果都不是很理想。 本文通过研究现实社会组织特点,从分析agent间关系入手,定义了三种不同的熟人关 系,提出了一种新的协作组织方法,通过识别对求解具有重要意义的信息来选择合作对象以 较小通信开销获得较高的求解能力;而对于熟人信息的建立与维护是在每个Agent内部完成 的,不需要专门的Agent负责,可以有效的降低系统资源开销。 1.Agent间关系分析 MAS是多个Agent交互形成的,在交互的过程产生大量的启发信息,Agent间也形成各 种各样的关系哺1。识别这些关系,并利用这些关系来指导MAS中Agent的合作策略可以提高 系统的求解能力。本文通过对现实社会中组织的研究,认为在合作求解中Agent的决策主要 受三类关系的影响。 (1)与系统当前状态密切相关的Agent问关系。这种关系可以认为是当前环境对Agent 行为的限制,它只能与和它有这种关系的Agent进行直接合作。识别这种关系能大大降低在 决策时的搜索空间,降低计算复杂度。 (2)与交互历史信息相关的Agent间关系。一个稳定的MAS其求解任务的性质、类型 不会发生根本性的变化,这意味着,系统经过一段时间的运行后,很多Agent可能会形成相 对稳定并且成功的合作伙伴,跟踪Agent之间合作,找出那些相对稳定的合作伙伴,以此为 依据将大大减少形成合作团队的盲目性,从而降低形成团队时的通信开销。 (3)与系统特征密切相关的Agent间关系。通常,MAS根据其求解任务的性质和类型 不同有不同的特征,存在一些对系统整体状态或性能有重要影响的因素。比如在机器人足球 比赛中,由于最终目标是进球,所以持球队员的状态对整个球队的求解目标有重要影响,是 球队中每个Agent关注的中心。这种信息的识别有利于求解过程中,Agent对全局环境的认 识,另一方面也保证了Agent在做决策时能够以系统最终共同目标为方向。 这三类关系影响了合作求解中Agent的决策,正确的识别与组合利用这些关系是MAS 合作求解的关键。 2.复合熟人模型 2.1基本定义 对应合作过程中三种重要关系定义三类熟人关系。 定义l(状态熟人关系):将Agent A和群体G具有状态熟人关系定义为: SF(A,G)三def IR(g)≠f)八IR(A)nyE(g)≠f)) 39∈G(IR(A)n VE(A):当前状态下Agent A通过感知器件所能观察到的环境,也称为可观察环境。 IR(A):当前状态下AgentA通过行动器件能够作用的范围,也称为可影响区域。 即满足群体G中存在自身的可影响区域和可观察区域与AgentA的可影响区域都具有非 空交集的个体关系。所有的AgentA的状态熟人构成AgentA的状态熟人集。 A和群体G具有普通熟人关系定义为: 定义2(普通熟人关系)将Agent OF(A,G)三rlpf(C(A,G)=1)八(T(A,G,t)£) 其中C(A,G):为0或1表示AgentA和Agent群体G是否合作过。 T(A,G,t)表示AgentA和群体G到t时刻为止合作事例中成功的比例。 e为介

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档