- 3
- 0
- 约2.77万字
- 约 5页
- 2018-12-13 发布于天津
- 举报
基于人工情感的Q-学习算法在机器人行为决策中的应用.PDF
专题研究
文章编号:1001-9944(2015)07-0013-04
基于人工情感的Q-学习算法在机器人行为决策中的应用
谷学静,高贝贝,朱朝月
(华北理工大学 电气工程学院,唐山 063009)
摘要:为了提高经典强化学习算法在机器人行为最优控制策略中学习的效率和收敛速度,
在利用环境模型提高强化学习速度方法的基础上, 将人类情感具有的趋利避害生存机理
应用于环境模型经验知识的学习中,提出了基于人工情感的Q- 学习算法,并将该算法应用
于机器人的行为决策。 在有障碍的二维栅格环境下对机器人路径寻优进行了仿真测试,仿
真实验结果表明该算法较基于环境模型的Q- 学习算法具有更高的学习效率和收敛速度。
其改进算法对于提高机器人自主决策能力具有较高的理论意义及推广应用价值。
关键词:强化学习;Q -学习算法;人工情感;机器人;最优控制策略
中图分类号: 文献标志码:
TP273.22 A
Application of Intelligent Decision-making Research Based on Artificial Emotion
and Q-learning
, ,
GU Xue-jing GAO Bei-bei ZHU Zhao-yue
( , , , )
College of Electrical Engineering North China University of Science and Technology Tangshan 063009 China
tract : order to improve the efficiency and convergence speed of classic reinforcement learning algorithm in op-
Abs In
timal control strategy for robot behavior learning ,
on the basis of increasing the speed of reinforcement learning meth-
,
ods in the use of environment model human emotions survival mechanism applied in environment model theory of
experience knowledge of learning , s proposed Q-learning algorithm based on artificial emotion , nd applied the algo-
i a
rithm to the robots behavior decision-making. In disabled two-dimensional grid environment on the robot path opti-
mization
您可能关注的文档
最近下载
- 2025年陕西三校生单招试题真题及答案.doc VIP
- DB34_T3465-2019《连续梁桥整体同步顶升技术规程》.docx VIP
- 現代詩歌朗誦教學與訓練.ppt VIP
- 現代詩創作訓練-台灣首府大學.ppt VIP
- 2025年语文重庆春招试题及答案.doc VIP
- 部编版初中语文课本里现代文中重要的中外作家及作品等文学常识汇总(共六册).pdf VIP
- 最新大学考试复习资料-成本会计试题及答案.doc VIP
- 英国石油公司(BP)标准 GIS 62-021 - EEMUA 182 Integral Block and Bleed Valve Manifolds - 0900a866800dbfa8.pdf
- 2025年度民主生活会带头强化政治忠诚、提高政治能力(五个带头)问题原因查摆剖析整改措施8篇.docx VIP
- 2026部编人教版小学五年级语文下册课内阅读理解专项练习(附答案).pdf
原创力文档

文档评论(0)