摘要
基于模型的强化学习(ModelBasedReinforcementLearning,MBRL)方法利用动力学
模型执行动作规划或策略选择,在机器人学习(RobotLearning)领域显示出很大应用潜
力。尽管很多MBRL方法在样本效率和渐进性能方面取得了不错进展,但对于复杂场景
下的高维学习任务,智能体的探索能力及稳定训练能力仍有待增强。针对上述问题,本文
从策略规划和策略优化的角度出发,提出了基于自适应高斯噪声和改进
摘要
基于模型的强化学习(ModelBasedReinforcementLearning,MBRL)方法利用动力学
模型执行动作规划或策略选择,在机器人学习(RobotLearning)领域显示出很大应用潜
力。尽管很多MBRL方法在样本效率和渐进性能方面取得了不错进展,但对于复杂场景
下的高维学习任务,智能体的探索能力及稳定训练能力仍有待增强。针对上述问题,本文
从策略规划和策略优化的角度出发,提出了基于自适应高斯噪声和改进
文档评论(0)