山地环境下基于深度强化学习的多智能体协同搜索节能算法研究.pdfVIP

下载本文档

1
0
约11.67万字
约 70页
2025-06-15 发布于江西
举报
版权申诉

山地环境下基于深度强化学习的多智能体协同搜索节能算法研究.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

摘要

近年来随着智能体需要解决的问题越来越复杂，学者们从研究单智能体系统

逐渐转为研究多智能体系统。多智能体系统常常被用于搜索遍历，无人监控等场

景。使用多智能体系统去搜索一个感兴趣区域已经有很多成熟的算法，但这些算

法基本都是针对平坦地形设计的，而实际应用中被搜索遍历的环境往往是不平坦

的山地地形等。在针对平坦地形设计的搜索算法中，智能体通常是采用最短路径

的方式在导航目标之间移动，在平坦地形下这样的运动即省时又节能，但在不平

坦地形上这样的运动往往会导致过度的能量消耗。然而，现有的智能体基本都是

采用便携式能源提供电力，因此应该尽量减少智能体的能量消耗，避免还没遍历

完感兴趣区域智能体就出现能源不足的情况。为了解决上述不足，本文提出了两

种针对山地环境的多智能体搜索节能算法。本文的主要工作和创新如下：

1.将深度强化学习引入到了多智能体系统中。通过设计合理的深度强化学习

奖惩函数，提前规划出每个智能体下一个要遍历的最优目标位置，尽量避免发生

重复覆盖的问题，提升了覆盖效率，降低了系统的总能耗。

2.针对多智能体系统去搜索山地环境设计了两种神经网络模型，这两种模型

使得智能体能够实时的选择下一个要遍历的最优位置。对于其他的复杂环境，也

可以参考这两个网络模型，去构造出更适合的网络模型。

3.结合山地地形的梯度特征，引入了地形适应力，地形适应力可以引导智能

体尽量走最优能耗路径。将地形适应力加入到运动学模型中，设计出了基于地形

适应力的节能覆盖算法。

4.将智能体能耗模型加入到深度强化学习的奖惩函数中，以全局总能耗最低

为目标去选择下一个要遍历的目标点，进而设计出了基于奖惩函数改进的节能算

法。

仿真结果表明，本文提出的两种算法在不平坦的山地环境下相比于传统的搜

索遍历算法有更好的节能性。并且本文提出的两种算法在系统中某些智能体出现

故障断开连接时，不会影响其他智能体继续工作，有很好的鲁棒性。

关键：多智能体，山地地形，节能，地形适应力，深度强化学习

ABSTRACT

Inrecentyears,astheproblemstobesolvedbyagentsbecomemoreandmorecom-

plex,scholarshavegraduallychangedfromsingleagentsystemtomulti-agentsystem.

Multi-agentsystemsareoftenusedinsearchtraversal,unmannedmonitoringandother

scenarios.Therearemanymaturealgorithmsusingmulti-agentsystemtosearchanarea

ofinterest,butthesealgorithmsarebasicallydesignedforflatterrain,andtheenviron-

mentsearchedandtraversedinpracticalapplicationisoftenunevenmountainousterrain.

Inthesearchalgorithmdesignedforflatterrain,theagentusuallyusestheshortestpath

tomovebetweennavigationtargets.Inflatterrain,suchmotionsavestimeandenergy,

butinuneventerrain,suchmotionoftenleadstoexcessiveenergyconsumption.How-

ever,theexistingagentsbasicallyuseportableenergytoprovidepower,sotheenergy

consumptionof

您可能关注的文档

文档评论（0）

精品资料 + 关注: 实名认证

文档贡献者

温馨提示：本站文档除原创文档外，其余文档均来自于网络转载或网友提供，仅供大家参考学习，版权仍归原作者所有，若有侵权，敬请原作者及时私信给我删除侵权文

咨询Ta 进入空间

1亿VIP精品文档

更多 >

山地环境下基于深度强化学习的多智能体协同搜索节能算法研究.pdfVIP