- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
初态学习下的多智能体一致性迭代学习控制
初态学习下的多智能体一致性迭代学习控制
摘 要 考虑重复运行的带虚拟领导者的多智能体系统在有限时间区间上的一致性问题。针对存在初始定位误差的线性时不变多智能体系统,提出一种新的初态学习律,使得多智能体系统在迭代学习过程中,无需初态定位于某一精确的具体位置上,放宽了迭代学习方法的初始定位条件。文中分别给出了初态学习律和输入学习律收敛的充分条件,与已有方法相比,初态的收敛条件与系统的输入矩阵无关,降低了系统建模要求。最后,仿真实例结果表明各智能体的输出可以完全跟踪上期望轨迹,验证了该方法的可行性。
【关键词】多智能体系统 一致性 初态学习 迭代学习控制
近年来,由于复杂系统先进理论的发展和多智能体在生物、物理、机器人、交通以及控制工程等领域的广泛应用,多智能分布式协同控制系统受到了广泛的研究。一致性、群集、编队、集结等问题成为了重要的研究热点,并且共同的目标是开发分布式的方案或协议来确保复杂全局目标的实现。特别的,一致性是多智能体系统协调控制的一类重要问题,所谓的一致性是指多智能体网络中每个多智能体所关注的状态达到一致。在一致性实现过程中,每个智能体的控制策略取决于自身状态以及相邻的多智能体信息,一般常采用拓扑图来描述多智能体之间的信息交换。由于采用分布式控制策略,相比于集中控制具有更好的鲁棒性和可扩展性。
迭代学习控制是一种被广泛应用于工程应用的学习控制策略,最早于1984由Arimoto等人正式提出。迭代学习控制适于有限时间区间上可重复运行的系统,它通过应用先前试验得到的信息来修正不理想的输入信号,改善跟踪性能。迭代学习控制方法用于解决多智能体系统问题已经有了大量的研究。最早将迭代学习控制算法用于多智能体系统协调控制问题出现在Ahn[5]的文章,主要考虑用于多智能体编队问题。之后,文献[6-9]中采用迭代学习控制算法处理多智能体系统的一致性跟踪问题。文献[10]讨论了迭代学习控制方法处理高阶多智能体系统协调控制问题。传统提法的迭代学习控制对初始定位有着严格的要求,规定在每次迭代时,初始状态都要和期望初态一致。文献[11]中给出了初态偏移下的多智能体系统在D型和PD型学习律下的极限轨迹,表明了初始定位误差对多智能体一致性跟踪型性能的影响。文献[12,13]提出带初态修正的迭代学习算法,实现了多智能体系统在给定区间上的完全跟踪。
本文讨论多智能体系统初态学习下的一致性跟踪问题。与经典迭代学习控制中要求的初始状态条件相比较,讨论放宽初始状态条件是更有工程应用意义的。初态学习可以放宽初始状态条件,它允许初始状态可以不精确定位在期望初态上。文献[12,13]分别将文献[14]中的单个系统初态学习律应用于非线性时变和线性时变多智能体系统,形象地以提出多智能体系统初态学习律这种形式放宽了初始定位条件。但该多智能体系统初态学习律要求:
(1)多智能体系统的输入矩阵精确已知;
(2)迭代过程中的初态需要严格的落在由初态学习律确定的轨迹上,仅有第一次的初态是可任意给定的。
本文针对多智能体系统,给出新的初态学习律,不对输入矩阵做要求,且初态收敛条件也与输入矩阵无关。在文献[12,13]中的初态学习律的学习增益与输入学习律的学习增益相同,因而导致了迭代过程中初始状态的严格定位。而本文中的两个学习律增益可以不同,这样使得多智能体系统在迭代过程允许初态在一定范围内变动,相比已有的初态学习律,具有更强的鲁棒性。
1 问题的提出
考虑一组由N个同类动态智能体构成的多智能体系统,且其第j个智能体的动力学方程可用如下的线性时不变模型来描述
(1)
其中k表示迭代次数,,,和分别为智能体j的状态向量,输出向量和控制输入,A,B,C是相应维数的常数矩阵且满足假设。
假设为任意给定有限时间内的期望参考轨迹,可由如下方程产生
(2)
其中为唯一且存在的期望输入,对于执行重复任务的多智能体系统(1),目标是通过迭代学习的过程,最终找到与期望输入一致的输入,使智能体运行轨迹在有限时间内对期望轨迹完全跟踪。
为阐述后续问题的需要,这里首先介绍图论的相关知识。利用图论中的无向图来描述多智能体间通信的关系拓扑结构。令表示一个带权无向图,其中该图的节点,边界。A表示邻接矩阵。对于多智能体系统来说,v中的每一个节点代表一个多智能体。两个可以相互传递信息的智能体节点i和j之间构成的边界表示为,智能体i的邻居节点表示为,而智能体节点i和j的联系用带权邻接矩阵表示,其中对角线元素,若节点i和j之间有联系,则有;否则,。图ζ的Laplacian矩阵定义为 ,
其中,
。
受限于多智能体分布式通信结构,导致只有部分跟踪智能体能直接获得领导者轨迹的信息。令跟踪多智能体之间的关系用图ζ
文档评论(0)