- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要强化学习是学习环境状态到动作的一种映射并且能够获得最大
第40 卷 计 算 机 学 报 Vol. 40
2017 年 论文在线出版号 No.1 CHINESE JOURNAL OF COMPUTERS Online Publishing No. 1
深度强化学习综述
刘 全+ 翟建伟 章宗长 钟珊 周 倩 章 鹏 徐 进
1)(苏州大学计算机科学与技术学院 江苏 苏州 215006)
2)(软件新技术与产业化协同创新中心 南京 210000)
摘 要 深度强化学习是人工智能领域的一个新的研究热点.它以一种通用的形式将深度学习的感知能力与强化学习的决
策能力相结合,并能够通过端对端的学习方式实现从原始输入到输出的直接控制.自提出以来,在许多需要感知高维度原
始输入数据和决策控制的任务中,深度强化学习方法已经取得了实质性的突破.该文首先阐述了 3 类主要的深度强化学习
方法,包括基于值函数的深度强化学习、基于策略梯度的深度强化学习和基于搜索与监督的深度强化学习;其次对深度强
化学习领域的一些前沿研究方向进行了综述,包括分层深度强化学习、多任务迁移深度强化学习、多智能体深度强化学
习、基于记忆与推理的深度强化学习等.最后总结了深度强化学习在若干领域的成功应用和未来发展趋势.
关键词 人工智能;深度学习;强化学习;深度强化学习
中图法分类号 TP18
论文引用格式:
刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进,深度强化学习综述,2017,Vol.40,在线出版号 No.1
LIU Quan, ZHAI Jian-Wei, ZHANG Zong-Zhang, ZHONG Shan, ZHOU Qian, ZHANG Peng, XU Jin, A Survey on Deep Reinforcement
Learning, 2017,Vol.40,Online Publishing No.1
A Survey on Deep Reinforcement Learning
LIU Quan ZHAI Jian-Wei ZHANG Zong-Zhang ZHONG Shan ZHOU Qian ZHANG Peng XU Jin
1)(School of Computer Science and Technology, Soochow University, Suzhou, Jiangsu 215006)
2)(Collaborative Innovation Center of Novel Software Technology and Industrialization, Nanjing 210000)
Abstract Deep reinforcement learning (DRL) is a new research hotspot in the artificial intelligence community.
By using a general-purpose form, DRL integrates the advantages of the perception of deep learning (DL) and the
decision making of reinforcement learning (RL), and gains the output control directly based on raw inputs by the
end-to-end learning process. DRL has made substantial breakthroughs in a variety of tasks requiring both rich
perceptio
您可能关注的文档
- 我国矿井人员位置监测技术的现状与发展-上海工业自动化仪表研究院.PDF
- 我国细菌耐药问题的现状和防控策略TheStatusand-中国工程科学.PDF
- 我国级主体功能区划的资源环境承载力指标体系与评价方法-地理学报.PDF
- 我国耕地资源的资产价值核算研究-西南大学学报.PDF
- 我国赤潮频发现象分析与海藻栽培生物修复作用-水产学报.PDF
- 我国豆科植物属的地理分布型及其结瘤固氮性-地理科学进展.PDF
- 我国野生动物资源商业价值的动态评价方法设计及应用.PDF
- 我国金融业-学报编辑部-湖北经济学院.PDF
- 我国预算会计改革可行性的问卷调查研究-陈工孟个人网站.PDF
- 我国飞秒激光小切口角膜基质透镜取出手术规范专家共识-中国眼网.PDF
- 摘要智利北部外海地震概况-国家灾害防救科技中心.PDF
- 摩托车塑料覆盖件油漆解决方案方案一单组份塑料漆-华辉涂料.PDF
- 摩擦学更新第28期-2013年6月-PhoenixTribologyLtd.PDF
- 摺纸认识纸张—发现黄金与白银比例.PDF
- 操作条件反射学习自动机及其在机器人平衡控制中的应用-控制与决策.PDF
- 操作説明No4778.PDF
- 操作说明书-SITRANSLG270-ProfibusPA同轴测量探针-196.PDF
- 操作指引规格4和6的垂直轴安全制动系统-Güdel.PDF
- 攀西地区地壳和上地慢中的电性结构.PDF
- 操作说明书UnistatT300-Seriezh-HUBER.PDF
最近下载
- 教你如何破解软件OD破解软件OD使用教程.doc VIP
- 施工重大危险源辨识与防控措施月报表.pdf VIP
- 人教版(部编版)小学语文五年级上册 圆明园的毁灭第二课时 名师教学PPT课件.pptx VIP
- 一体机-柯尼卡美能达-bizhubC220说明书.pdf VIP
- BS EN 60079-32-2-2015 国外国际规范.pdf VIP
- 急诊科患者转运途中突然病情变化应急预案.pptx VIP
- G30连云港至霍尔果斯高速景家口至清水驿段扩容改造报告书.pdf VIP
- 股骨粗隆间骨折护理查房——护理问题及措施与健康指导.ppt VIP
- 零星工程 投标方案(技术方案).docx
- 一种比色法检测金黄色葡萄球菌活菌的Cu-MOF材料及其制备方法和应用.pdf VIP
文档评论(0)