网站大量收购独家精品文档,联系QQ:2885784924

一个基于马尔科夫过程的多AGENT协调模型.pdfVIP

一个基于马尔科夫过程的多AGENT协调模型.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一个基于马尔科夫过程的多AGENT协调模型 楮凌昆昊朝晖 (浙江太学人工智能研究所,杭州,310027) 摘要本文提出了一个用承诺和协定刻画多AGENT交互行为的多AGENT系统协调模型·并用马 尔科夫过程对模型进行丁分析。承诺是AGENT对其行为和信仰的某种保证,而拂定蜘定了AGENT修 正承诺的前提和方法,前者保证了多AGENT系统行为的可预测性,而后者保证系统在一定程度』:具有 灵活性,两者结合可以描述多AGENT系统的协调行为。 关键词多AGENT系统协调承诺协定马尔科夫过程 I 引言 须能够独立地对子问题进行求解,所有的AGENT合起来可以解决整个问题。虽然独立 的AGENT有各自分散的目标、知识和推理过程,但是它们必须有一种方法互相协调互 相帮助找到整个系统的目标。但是.由于多AGENT交互的复杂性,使这个问题变得非 常困难,目前这方面的研究还太少,而且大多是采用非形式化的手段,很难有效地考察 多AGENT之间的协调。本文在“所有的协调技术都可以最终归结为承诺及其相关的协 定Ill”的基础上,尝试用马尔科夫过程建立多AGENT协调的形式化模型,并对其进行 了分析。 2多AGENT的协调模型 21多AGENT系统中的协调 决策有可能影晌到系统其他成员的决策,或AGENT之间的行为有可能发生冲突。2j 系统受到全局约束,若要~组AGENT共同求解一个特定的问题,就有可能需要有个全 局约束,即要解决局部最优和全局最优的问题。3)求解整个问题,单个AGENT的能 享,也能够不止成倍地增加系统的求解速度。 对协调有多种的定义”I,仞如:Sycara把协调定义为:协调过程包括通过通信或通 过对系统中其他AGENT的目前状态或意图的推理找}}{潜在的交且,并通过修改其他 互相芙信息提高对共同视图或规划的‘致认识(减少不~致性和不确定性)的过程。 中,灵活性和教率并不是都能达到的,两者必须折衷考虑。高度耦合的系统具有较高的 效率,而通过人量信息通信的松耦合系统能够适应迅速变化的复杂环境。对协调机制和 策略的更完善的评估标准有:】)对称分布,要求每个AGENT的地位都是相同的,没 性.也就是所得的解不:会与其它的解相冲突。3)稳定性,即结果是平衡的,没有一个 特别的AGENT因协调而获利,尽管AGENT群体会获利。4)简单性,即低通信代价, 低计算复杂度。 协调的目的是解决AGENT之间各种各样的冲突,促进AGENT之间的合作.提高 多AGENT系统的一致性。一个多AGENT系统有较高的一致性,这个系统的表现就更 像一个单一系统。评测系统一致性的标准有:1)解的质量,就是系统得到问题的合适 解,以及解的虽好质量的能力。2)效率,即系统求解完成后的整体效率。3)清晰性, 即系统行为在概念上的清晰性和表达的有效性。也即对系统的行为是否有一种描述表达 方法,使得系统以外的观察者能够理解系统的行为。4)良好的适应。即在系统遇到失 败或不确定性事件时,系统的行为。在环境、规范或自描述受到限制时系统如何表现。 中的一个前点所覆盖。2)连接——节点之间必须有一种交互方式,能够让节点合作解 决整个问题。3)能力——覆盖和连接以及对系统的可靠的描述必须在通信资源和计算 资源受限的网络中实现。 互的结构。2)AGENT处于动态环境中,对憝个系统没有完整和精确的认识,所以要有 灵活性。3)AGENT育足够的知识和推理能力发现可用的结构和灵活性。 Wooldrig提出将协调定义为:协调=承诺+协定十社会协定十本地推理。本文提出的 形式模型基于这个观点。 22多AGENT协调模型 标,多个AGENT的目标与或树有可能交义。根据对最终目标的影响关系,依赖性可以 分为强依赖和弱依赖,强依赖是指子目标求解失败将导致上层目标的失败:而弱依赖的 子目标却不一定,其实是与关系和或关系对上层目标的影响。根据子目标的互相影响关 系依赖性可以分为单向依籁和般向依赖,单向依赖是指~个目标能否成功依赖于另一个 目标,而反过来却未必:双向依赖即两个目标互相制约.互相影响。依赖的这些特性直 接影响到协调行为。 协作的联合目标,联合目标决定联合行为,而联合行为就是一种复杂的协调形式, 合动作有联台承诺。3)在求解联合目标的过程中,AGENT之间承诺耍互相支持。联台 目标是通过AGENT的私有目

文档评论(0)

whl005 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档