在未知环境下多机器人区域覆盖任务的研究中,我们探讨了覆盖策略的构建和优化主要研究了全球信息集中的集中式强化学习网络以及基于策略的学习方法最后,我们将覆盖任务问题转化为多机器人强化学习中团队奖励值最大化化求解问题
摘要
未知环境下的多机器人区域覆盖任务是指多个机器人遍历环境中每个无障
碍物的区域,并以覆盖完整性作为优化目标。机器人区域覆盖任务作为多机器人
系统研究的重要组成部分,在灾后救援、野外勘测、森林防火等领域有着广泛的
应用,具有十分重要的研究意义。
研究人员通过强化学习技术可以让机器人学习适用于某一类环境(如草坪清
理)的覆盖策略,然而对于多机器人覆盖任务而言,任何机器人的行为都会引起
全局覆盖状态的变化。但现有的强化学习研究方法只研究了机器人个体的学习策
略,并没有考虑到团队成员行为的相
原创力文档

文档评论(0)