基于人工情感的Q-学习算法在机器人行为决策中的应用.PDFVIP

  • 3
  • 0
  • 约2.77万字
  • 约 5页
  • 2018-12-13 发布于天津
  • 举报

基于人工情感的Q-学习算法在机器人行为决策中的应用.PDF

基于人工情感的Q-学习算法在机器人行为决策中的应用.PDF

专题研究 文章编号:1001-9944(2015)07-0013-04 基于人工情感的Q-学习算法在机器人行为决策中的应用 谷学静,高贝贝,朱朝月 (华北理工大学 电气工程学院,唐山 063009) 摘要:为了提高经典强化学习算法在机器人行为最优控制策略中学习的效率和收敛速度, 在利用环境模型提高强化学习速度方法的基础上, 将人类情感具有的趋利避害生存机理 应用于环境模型经验知识的学习中,提出了基于人工情感的Q- 学习算法,并将该算法应用 于机器人的行为决策。 在有障碍的二维栅格环境下对机器人路径寻优进行了仿真测试,仿 真实验结果表明该算法较基于环境模型的Q- 学习算法具有更高的学习效率和收敛速度。 其改进算法对于提高机器人自主决策能力具有较高的理论意义及推广应用价值。 关键词:强化学习;Q -学习算法;人工情感;机器人;最优控制策略 中图分类号: 文献标志码: TP273.22 A Application of Intelligent Decision-making Research Based on Artificial Emotion and Q-learning , , GU Xue-jing GAO Bei-bei ZHU Zhao-yue ( , , , ) College of Electrical Engineering North China University of Science and Technology Tangshan 063009 China tract : order to improve the efficiency and convergence speed of classic reinforcement learning algorithm in op- Abs In timal control strategy for robot behavior learning , on the basis of increasing the speed of reinforcement learning meth- , ods in the use of environment model human emotions survival mechanism applied in environment model theory of experience knowledge of learning , s proposed Q-learning algorithm based on artificial emotion , nd applied the algo- i a rithm to the robots behavior decision-making. In disabled two-dimensional grid environment on the robot path opti- mization

文档评论(0)

1亿VIP精品文档

相关文档