在策略激励学习算法的POMDPs实验研究.pdfVIP

下载本文档

5
0
约8.18千字
约 5页
2017-08-09 发布于安徽
举报

在策略激励学习算法的POMDPs实验研究.pdf

下载本文档
关闭预览

下载本文档
收藏
分享赚钱奖
0

文本预览
常见问题

第36卷南京大学学报(自然科学) v01．36 NANJⅢGUNIVERSrrY 计算机专辑 JOU砌qAL0F Compu舫Is吼埔 2000年l NoV．2000 1月n呵ATURALSCIENCES) 在策略激励学习算法的POMDPs实验研究’ 陈焕文谢丽娟 (长沙电力学院数学与计算机系，长沙，4】0077) 谢建平 (长沙交通学院网络中心，长沙，4】0076) ■蔓SARSAlk)和Q学习算法是两类量重要的激励学习算}击．本文结合一些已有算法t提出r一个新的激自学习算法。称为P、“sARsA(k潭法．通过一系列实验．对部分可观测M-岫v (p0MDP)环境下无记忆策略的确定目匿进行r检验．结果表明，在一定条件下，智能件可

您可能关注的文档

杂种优势机理研究的进展.pdf
灾害天气机理和预测理论研究.pdf
载波多普勒对扩频码捕获的影响.pdf
载波家庭网络控制系统.pdf
载荷分布对亚声速涡轮平面叶栅性能影响的对比研究.pdf
载荷试验在高架桥轨质量检测中的应用.pdf
载体多孔玻璃微球的制备及其表面特性.pdf
再论“大振动”现象及“振动利用”初探.pdf
再论地理学的四大传统.pdf
再论乡镇船舶的安全管理.pdf

50万吨汽油调和技改项目环评报告书.pdf
河北省文安县第一中学2025-2026学年高一上学期10月月考英语试题（解析版）.docx
河南省TOP二十校205—2026学年高一上学期10月联考生物试题（原卷版）.docx
河南省安阳市第一中学、鹤壁市高中、新乡市第一中学三校2025-2026学年高一上学期第一次联考数学试题（解析版）.docx
河南省部分高中2025-2026学年高一上学期第二次月考数学试卷（解析版）.docx
河南省百师联盟2025-2026学年高二10月联考数学试题（北师大版）（解析版）.docx
河南省部分学校2025-2026学年高一上学期期中考试数学试题（解析版）.docx
河南省部分重点中学2025~2026学年高二上学期10月末质量检测数学试题（解析版）.docx
河南省部分重点中学2025-2026学年高二上学期10月末质量检测英语试题（解析版）.docx
桥梁伸缩缝安装工艺（可编辑）.pptx

文档评论（0）

1亿VIP精品文档

更多 >

在策略激励学习算法的POMDPs实验研究.pdfVIP

在策略激励学习算法的POMDPs实验研究.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档