基于好奇心机制的稀疏奖励问题研究.pdf

基于好奇心机制的稀疏奖励问题研究.pdf

摘要

摘要

深度强化学习融合了深度学习强大的表示能力与强化学习的决策能力,在视

频游戏、棋类运动、多轮对话等可用模拟器进行训练的虚拟环境领域取得了显著

进展。然而,由于智能体通过与环境交互过程中获得的奖励信号来学习,在奖励

信号稀疏场景中,智能体需要长时间探索才能获得回报,传统强化学习算法表现

出收敛速度慢、探索效率低的问题。本文围绕稀疏奖励问题展开研究,针对现有

强化学习算法面对稀疏奖励问题的不足,提出了一种结合动态惩罚机制与好

文档评论(0)

1亿VIP精品文档

相关文档