合作型多智能体深度强化学习研究.pdf

摘要

随着深度强化学习技术的飞速发展,特别是在多智能体系统中的应用,合作

型多智能体深度强化学习在诸如机器人群体协调、自动驾驶、传感器网络等领域

展现出了巨大的潜力。然而,合作型多智能体深度强化学习在实际应用中面临着

可扩展性、信用分配、学习效率与离线学习等挑战。基于集中训练分散执行框架

的传统方法在连续或离散场景中均存在局限性,基于值的方法难以适应连续动作

空间,而基于演员评论家架构的方法因集中式评论家需处理指数级增长的联合状

态-动作空间导致可扩展性不足,且无法有效评估个体对全局奖励的贡献。此外,

文档评论(0)

1亿VIP精品文档

相关文档