基于组合神经网络的Sarsa(λ)学习算法.pdfVIP

  • 53
  • 0
  • 约1.56万字
  • 约 4页
  • 2017-08-10 发布于北京
  • 举报

基于组合神经网络的Sarsa(λ)学习算法.pdf

第29卷 第22期 计算机工程与设计 2008年11月 VO1.29 NO.22 ComputerEngineeringandDesign NOV.2008 基于组合神经网络的Sarsa )学习算法 殷苌茗, 付超红, 薛丽华, 李立云 (长沙理工大学计算机与通信工程学院,湖南长沙410076) 摘 要:标准的Sarsan)算法对状态空间的要求是离散的且空间较小,而实际问题 中很多系统的状态空间是连续的或尽管是 离散的但空间较大,这就需要很大的内存来存储状态动作对。为此提 出组合神经网络,首先用 自组织映射 (SOM)神经网络对 状态空间进行 自适应量化 ,然后在此基础上用BP网络拟合Q函数 。该方法实现了Sarsa(2)算法在连续和大规模状态空间的 泛化 。最后,实验结果表明了该方法的有效性。 关键词:组合神经网络;强化学习; 自组织映射;BP网络;Sarsa算法 中图法分类号:TP181 文献标识码:A 文章编号:1000.

文档评论(0)

1亿VIP精品文档

相关文档