一个基于马尔科夫过程的多AGENT协调模型.pdfVIP

下载本文档

1
0
约9.4千字
约 7页
2015-08-03 发布于安徽
举报
版权申诉

一个基于马尔科夫过程的多AGENT协调模型.pdf

1、本文档共7页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一个基于马尔科夫过程的多AGENT协调模型楮凌昆昊朝晖 (浙江太学人工智能研究所，杭州，310027) 摘要本文提出了一个用承诺和协定刻画多AGENT交互行为的多AGENT系统协调模型·并用马尔科夫过程对模型进行丁分析。承诺是AGENT对其行为和信仰的某种保证，而拂定蜘定了AGENT修正承诺的前提和方法，前者保证了多AGENT系统行为的可预测性，而后者保证系统在一定程度』：具有灵活性，两者结合可以描述多AGENT系统的协调行为。关键词多AGENT系统协调承诺协定马尔科夫过程 I 引言须能够独立地对子问题进行求解，所有的AGENT合起来可以解决整个问题。虽然独立的AGENT有各自分散的目标、知识和推理过程，但是它们必须有一种方法互相协调互相帮助找到整个系统的目标。但是．由于多AGENT交互的复杂性，使这个问题变得非常困难，目前这方面的研究还太少，而且大多是采用非形式化的手段，很难有效地考察多AGENT之间的协调。本文在“所有的协调技术都可以最终归结为承诺及其相关的协定Ill”的基础上，尝试用马尔科夫过程建立多AGENT协调的形式化模型，并对其进行了分析。 2多AGENT的协调模型 21多AGENT系统中的协调决策有可能影晌到系统其他成员的决策，或AGENT之间的行为有可能发生冲突。2j 系统受到全局约束，若要～组AGENT共同求解一个特定的问题，就有可能需要有个全局约束，即要解决局部最优和全局最优的问题。3)求解整个问题，单个AGENT的能享，也能够不止成倍地增加系统的求解速度。对协调有多种的定义”I，仞如：Sycara把协调定义为：协调过程包括通过通信或通过对系统中其他AGENT的目前状态或意图的推理找}}{潜在的交且，并通过修改其他互相芙信息提高对共同视图或规划的‘致认识(减少不～致性和不确定性)的过程。中，灵活性和教率并不是都能达到的，两者必须折衷考虑。高度耦合的系统具有较高的效率，而通过人量信息通信的松耦合系统能够适应迅速变化的复杂环境。对协调机制和策略的更完善的评估标准有：】)对称分布，要求每个AGENT的地位都是相同的，没性．也就是所得的解不：会与其它的解相冲突。3)稳定性，即结果是平衡的，没有一个特别的AGENT因协调而获利，尽管AGENT群体会获利。4)简单性，即低通信代价，低计算复杂度。协调的目的是解决AGENT之间各种各样的冲突，促进AGENT之间的合作．提高多AGENT系统的一致性。一个多AGENT系统有较高的一致性，这个系统的表现就更像一个单一系统。评测系统一致性的标准有：1)解的质量，就是系统得到问题的合适解，以及解的虽好质量的能力。2)效率，即系统求解完成后的整体效率。3)清晰性，即系统行为在概念上的清晰性和表达的有效性。也即对系统的行为是否有一种描述表达方法，使得系统以外的观察者能够理解系统的行为。4)良好的适应。即在系统遇到失败或不确定性事件时，系统的行为。在环境、规范或自描述受到限制时系统如何表现。中的一个前点所覆盖。2)连接——节点之间必须有一种交互方式，能够让节点合作解决整个问题。3)能力——覆盖和连接以及对系统的可靠的描述必须在通信资源和计算资源受限的网络中实现。互的结构。2)AGENT处于动态环境中，对憝个系统没有完整和精确的认识，所以要有灵活性。3)AGENT育足够的知识和推理能力发现可用的结构和灵活性。 Wooldrig提出将协调定义为：协调=承诺+协定十社会协定十本地推理。本文提出的形式模型基于这个观点。 22多AGENT协调模型标，多个AGENT的目标与或树有可能交义。根据对最终目标的影响关系，依赖性可以分为强依赖和弱依赖，强依赖是指子目标求解失败将导致上层目标的失败：而弱依赖的子目标却不一定，其实是与关系和或关系对上层目标的影响。根据子目标的互相影响关系依赖性可以分为单向依籁和般向依赖，单向依赖是指～个目标能否成功依赖于另一个目标，而反过来却未必：双向依赖即两个目标互相制约．互相影响。依赖的这些特性直接影响到协调行为。协作的联合目标，联合目标决定联合行为，而联合行为就是一种复杂的协调形式，合动作有联台承诺。3)在求解联合目标的过程中，AGENT之间承诺耍互相支持。联台目标是通过AGENT的私有目