基于组合神经网络的Sarsa（λ）学习算法.pdfVIP

下载本文档

53
0
约1.56万字
约 4页
2017-08-10 发布于北京
举报

基于组合神经网络的Sarsa（λ）学习算法.pdf

第29卷第22期计算机工程与设计 2008年11月 VO1．29 NO．22 ComputerEngineeringandDesign NOV．2008 基于组合神经网络的Sarsa )学习算法殷苌茗，付超红，薛丽华，李立云 (长沙理工大学计算机与通信工程学院，湖南长沙410076) 摘要：标准的Sarsan)算法对状态空间的要求是离散的且空间较小，而实际问题中很多系统的状态空间是连续的或尽管是离散的但空间较大，这就需要很大的内存来存储状态动作对。为此提出组合神经网络，首先用自组织映射 (SOM)神经网络对状态空间进行自适应量化，然后在此基础上用BP网络拟合Q函数。该方法实现了Sarsa(2)算法在连续和大规模状态空间的泛化。最后，实验结果表明了该方法的有效性。关键词：组合神经网络；强化学习；自组织映射；BP网络；Sarsa算法中图法分类号：TP181 文献标识码：A 文章编号：1000．

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于组合神经网络的Sarsa（λ）学习算法.pdfVIP

基于组合神经网络的Sarsa（λ）学习算法.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档