从知识的表达和运用综述强化学习研究 overview of reinforcement learning from knowledge expression and handling.pdfVIP
- 18
- 0
- 约3.57万字
- 约 9页
- 2017-10-15 发布于上海
- 举报
从知识的表达和运用综述强化学习研究 overview of reinforcement learning from knowledge expression and handling
第23卷第9期 控 制 与 决 策 2008年9月
V01.23No.9 ControlandDecision Sep.2008
文章编号:1001—0920(2008)09—0961—08
从知识的表达和运用综述强化学习研究
陈宗海,杨志华,王海波,盛 捷
(中国科学技术大学自动化系,合肥230027)
摘 要:为推进强化学习研究的进一步深入和扩大其实际应用范围,从强化学习研究的理论基础——知识表示和运
用的角度对强化学习进行分类,并就经典随机强化学习、模糊强化学习、定性强化学习以及灰色强化学习作了较详细
的探讨与比较.最后从知识表达和运用的角度对强化学习的发展进行了展望.
关键词:强化学习;知识表示;模糊理论;定性推理;灰色系统理论
中图分类号:TP24 文献标识码:A
ofreinforcementfrom and
Ov
您可能关注的文档
- vague时间段关系与vague区域关系的表示和复合推理 representation and compound reasoning of the vague temporal interval relations and the vague region relations.pdf
- vdns:一种跨平台的固件漏洞关联算法 vdnsan algorithm for cross-platform vulnerability searching in binary firmware.pdf
- vc++2008虚拟鼠标程序设计.pdf
- vfrs一种面向虚拟计算环境的入侵容忍方法 vfrsa novel approach for intrusion tolerance in virtual computing environment.pdf
- visio故障树图并行转换方法研究及实现 the research and implementation of visio fault tree diagram parallel conversion method.pdf
- vgi集成于中文数字地名词典的研究 research on integrating vgi into chinese digital gazetteer.pdf
- vrpstw的混合改进蚁群优化算法 hybrid improved ant algorithm for vrpstwcui.pdf
- vpm列存储系统中基于带值路径的物化技术 vpm materialization based on path with values in column-stores.pdf
- voxlink—combining sparse volumetric data and geometry for efficient rendering.pdf
- v-系统与radon变换相结合的纹理分类算法 novel algorithm for image texture classification combined the v-system with radon transform.pdf
- 从图数据库中挖掘频繁跳跃模式 mining frequent jump patterns from graph databases.pdf
- 催化裂化装置分离系统稳态优化及其动态实现 operation optimization and its control implement of fccu separation system.pdf
- 催化重整装置仿真培训系统开发 operator training simulator development of catalytic reforming plant.pdf
- 代数约简的知识粒度表示及其高效算法 knowledge granularity representation and efficient algorithm of algebraic reduction.pdf
- 代价驱动的服务组合 cost-drive service composition.pdf
- 创新发展引领互联网时代的软件变革.pdf
- 从单幅图像获取三维场景材质风格 3d material style extraction from a single image.pdf
- 单相有源电力滤波器非线性统一控制策略 nonlinear unified control for single-phase active power filter.pdf
- 催化重整装置产品能耗的动态划分方法 dynamic energy consumption allocation approach for products from catalytic reforming plant.pdf
- 单训练样本人脸识别技术综述 a survey of face recognition using single training sample.pdf
最近下载
- 2025云南省安全员B证考试题库及答案.docx VIP
- 专题二十四 细胞工程.pptx VIP
- 人岗匹配培训课件.ppt VIP
- GB T 176-2025 水泥化学分析方法标准更新要点深度解读.pdf VIP
- 喷墨部分自学-页宽产品培训更换打印头.pptx VIP
- 工程施工劳务合同(附工程量清单).docx VIP
- 2026年工会考试主要内容及考试练习题及答案.docx VIP
- 2025至2030中草药种植产业深度调研及行业发展趋势与行业运营态势与投资前景调查研究报告.docx VIP
- 2025云南省安全员-B证考试题库及答案.docx VIP
- 中考英语作文必背范文共50篇.pdf VIP
原创力文档

文档评论(0)