基于多智能体强化学习的多无人机覆盖控制.pdfVIP

基于多智能体强化学习的多无人机覆盖控制.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

摘要

多智能体系统是描述复杂问题的一种重要方法,研究多智能体系统具有非常

重大的理论和实际意义。本文重点研究多智能体系统中的覆盖控制问题,覆盖控

制指的是通过优化各个智能体在状态空间的位置,从而使得智能体能够完成对于

一个给定区域的最优覆盖。考虑覆盖控制问题是一个多约束,非线性的复杂求解

问题,本文基于多智能强化学习理论设计出了覆盖控制算法,采用集中式训练,分

布式执行的架构,实现了对无人机轨迹的在线规划。

针对覆盖控制需要最大化对目标区域的覆盖比例,考虑无人机飞行的能量损

耗,通信连通性,以及无人机之间的碰撞等问题,本文设计出了同构多智能体和异

构多智能体算法解决覆盖控制问题。在设计同构多智能体覆盖控制算法时,利用

同构情况下无人机群在全局状态空间表示的置换不变特性,本文基于图网络结构

设计了中心值函数,通过对比试验验证了算法的优越性。在解决异构多无人机对

目标区域的覆盖控制问题时,本文关注无人机的覆盖范围存在差距以及最大速度

不同的异构情况。对于异构情况下,中心智能体观测到的邻居智能体特征存在差

别,本文通过注意力网络和异构组别参数编码机制使得中心智能体可以针对不同

的邻居学习到不同的策略。另外为解决异构情况下奖励函数的信誉分配问题,本

文提出了一种奖励重构技术使得算法的效果得到了提升。最后为使得算法能在四

旋翼无人机模型上实现稳定部署,本文提出了一种轨迹跟踪控制算法使得四旋翼

的姿态能够稳定跟踪给定的目标值。

对于所提算法,本文分别在GAZEBO仿真和实物情况下对算法的有效性进行

了验证。通过对比几种常用的多智能体强化学习算法和本文所提出算法在覆盖控

制场景下的表现情况,突出了本文所提算法的优越性。使用CRAZYFLIE四旋翼

和VICON动捕系统进行了实物验证,最后通过分析数据得出结论,本文所提出的

算法能完成多无人机覆盖控制的目标。

关键词:覆盖控制,多智能体强化学习,异构多无人机,轨迹跟踪

-I-

Abstract

Abstract

Multi-agentsystemisanimportantmethodtodescribecomplexproblems,andthe

studyofmulti-agentsystemhasveryimportanttheoreticalandpracticalsignificance.This

paperfocusesonthecoveragecontrolprobleminthemulti-agentsystem.Coveragecon-

trolreferstooptimizingthepositionofeachagentinthestatespace,sothattheagentcan

completetheoptimalcoverageforagivenarea.Consideringthatthecoveragecontrol

problemisamulti-constraint,non-linearcomplexsolutionproblem,thispaperdesignsa

coveragecontrolalgorithmbasedonthetheoryofmulti-intelligencereinforcementlearn-

ing,adoptsthearchitectureofcentralizedtraininganddistributedexecution,andrealizes

theonlinetrackingofUAVtrajectory.planning.

Aimingattheneedforcoveragecontroltomaximizethecoverageratioofthetarget

area,consideringtheener

文档评论(0)

n1u1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档