山地环境下基于深度强化学习的多智能体协同搜索节能算法研究.pdfVIP

山地环境下基于深度强化学习的多智能体协同搜索节能算法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

摘要

近年来随着智能体需要解决的问题越来越复杂,学者们从研究单智能体系统

逐渐转为研究多智能体系统。多智能体系统常常被用于搜索遍历,无人监控等场

景。使用多智能体系统去搜索一个感兴趣区域已经有很多成熟的算法,但这些算

法基本都是针对平坦地形设计的,而实际应用中被搜索遍历的环境往往是不平坦

的山地地形等。在针对平坦地形设计的搜索算法中,智能体通常是采用最短路径

的方式在导航目标之间移动,在平坦地形下这样的运动即省时又节能,但在不平

坦地形上这样的运动往往会导致过度的能量消耗。然而,现有的智能体基本都是

采用便携式能源提供电力,因此应该尽量减少智能体的能量消耗,避免还没遍历

完感兴趣区域智能体就出现能源不足的情况。为了解决上述不足,本文提出了两

种针对山地环境的多智能体搜索节能算法。本文的主要工作和创新如下:

1.将深度强化学习引入到了多智能体系统中。通过设计合理的深度强化学习

奖惩函数,提前规划出每个智能体下一个要遍历的最优目标位置,尽量避免发生

重复覆盖的问题,提升了覆盖效率,降低了系统的总能耗。

2.针对多智能体系统去搜索山地环境设计了两种神经网络模型,这两种模型

使得智能体能够实时的选择下一个要遍历的最优位置。对于其他的复杂环境,也

可以参考这两个网络模型,去构造出更适合的网络模型。

3.结合山地地形的梯度特征,引入了地形适应力,地形适应力可以引导智能

体尽量走最优能耗路径。将地形适应力加入到运动学模型中,设计出了基于地形

适应力的节能覆盖算法。

4.将智能体能耗模型加入到深度强化学习的奖惩函数中,以全局总能耗最低

为目标去选择下一个要遍历的目标点,进而设计出了基于奖惩函数改进的节能算

法。

仿真结果表明,本文提出的两种算法在不平坦的山地环境下相比于传统的搜

索遍历算法有更好的节能性。并且本文提出的两种算法在系统中某些智能体出现

故障断开连接时,不会影响其他智能体继续工作,有很好的鲁棒性。

关键:多智能体,山地地形,节能,地形适应力,深度强化学习

I

ABSTRACT

ABSTRACT

Inrecentyears,astheproblemstobesolvedbyagentsbecomemoreandmorecom-

plex,scholarshavegraduallychangedfromsingleagentsystemtomulti-agentsystem.

Multi-agentsystemsareoftenusedinsearchtraversal,unmannedmonitoringandother

scenarios.Therearemanymaturealgorithmsusingmulti-agentsystemtosearchanarea

ofinterest,butthesealgorithmsarebasicallydesignedforflatterrain,andtheenviron-

mentsearchedandtraversedinpracticalapplicationisoftenunevenmountainousterrain.

Inthesearchalgorithmdesignedforflatterrain,theagentusuallyusestheshortestpath

tomovebetweennavigationtargets.Inflatterrain,suchmotionsavestimeandenergy,

butinuneventerrain,suchmotionoftenleadstoexcessiveenergyconsumption.How-

ever,theexistingagentsbasicallyuseportableenergytoprovidepower,sotheenergy

consumptionof

文档评论(0)

精品资料 + 关注
实名认证
文档贡献者

温馨提示:本站文档除原创文档外,其余文档均来自于网络转载或网友提供,仅供大家参考学习,版权仍归原作者所有,若有侵权,敬请原作者及时私信给我删除侵权文

1亿VIP精品文档

相关文档