基于自适应高斯噪声和改进信心权重的Model-based强化学习算法研究.pdf

基于自适应高斯噪声和改进信心权重的Model-based强化学习算法研究.pdf

摘要

基于模型的强化学习(ModelBasedReinforcementLearning,MBRL)方法利用动力学

模型执行动作规划或策略选择,在机器人学习(RobotLearning)领域显示出很大应用潜

力。尽管很多MBRL方法在样本效率和渐进性能方面取得了不错进展,但对于复杂场景

下的高维学习任务,智能体的探索能力及稳定训练能力仍有待增强。针对上述问题,本文

从策略规划和策略优化的角度出发,提出了基于自适应高斯噪声和改进

文档评论(0)

1亿VIP精品文档

相关文档