- 53
- 0
- 约1.56万字
- 约 4页
- 2017-08-10 发布于北京
- 举报
第29卷 第22期 计算机工程与设计 2008年11月
VO1.29 NO.22 ComputerEngineeringandDesign NOV.2008
基于组合神经网络的Sarsa )学习算法
殷苌茗, 付超红, 薛丽华, 李立云
(长沙理工大学计算机与通信工程学院,湖南长沙410076)
摘 要:标准的Sarsan)算法对状态空间的要求是离散的且空间较小,而实际问题 中很多系统的状态空间是连续的或尽管是
离散的但空间较大,这就需要很大的内存来存储状态动作对。为此提 出组合神经网络,首先用 自组织映射 (SOM)神经网络对
状态空间进行 自适应量化 ,然后在此基础上用BP网络拟合Q函数 。该方法实现了Sarsa(2)算法在连续和大规模状态空间的
泛化 。最后,实验结果表明了该方法的有效性。
关键词:组合神经网络;强化学习; 自组织映射;BP网络;Sarsa算法
中图法分类号:TP181 文献标识码:A 文章编号:1000.
您可能关注的文档
最近下载
- DB1302T 512-2020 林业植物保护技术规范.docx VIP
- DB1302T 513-2020 非洲菊温室鲜切花生产技术规程.docx VIP
- DB54T 0187-2020 育成牦牛补饲育肥技术规程.docx VIP
- DB54T 0186-2020 高寒牧区天然草地补播技术规程.docx VIP
- DB54T 0185-2020 苹果园生草管理技术规程.docx VIP
- 招商证券股份有限公司招聘笔试题库2025.pdf
- 新一上语文看图写话专项练习常考精选12篇(含范文24页).docx VIP
- 统编版语文五年级上册大显身手练考卷.docx VIP
- DB21_T 4396-2026 花生种质抗旱性鉴定技术规程.pdf VIP
- DB21_T 4397-2026 绒山羊B超法妊娠诊断技术规范.pdf VIP
原创力文档

文档评论(0)