结合强化学习与推理系统建构机器人的空间感.PDFVIP

下载本文档

2
0
约6.25千字
约 22页
2019-04-13 发布于天津
举报
版权申诉

结合强化学习与推理系统建构机器人的空间感.PDF

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

毕业设计开题报告结合强化学习与推理系统建构机器人的空间感姓名徐鼎班级无学号指导老师魏琦报告提纲研究背景课题目标计划安排研究背景强化学习研究背景强化学习强于人类玩家研究背景强化学习强于人类玩家研究背景强化学习弱于人类玩家研究背景强化学习弱于人类玩家研究背景强化学习的改进在原始算法上进行拓展研究背景强化学习的改进学习具体对象的性质研究背景强化学习的改进辅以语义网理解对象间的关系研究背景强化学习的改进发现可操作的对象报告提纲研究背景课题目标计划安排课题目标总目标资源受限环境变化自身能力变化问题困难在这

毕业设计开题报告结合强化学习与推理系统建构机器人的空间感姓名：徐鼎班级：无37 学号：2013011220 指导老师：魏琦 1 报告提纲 • 研究背景 • 课题目标 • 计划安排 2/21 研究背景——强化学习 25 February 2015 27 January 2016 3/21 研究背景——强化学习强于人类玩家： Video Pinball (2539%) 4/21 研究背景——强化学习强于人类玩家： Star Gunner (598%) 5/21 研究背景——强化学习弱于人类玩家： Ms. Pac-Man (13%) 6/21 研究背景——强化学习弱于人类玩家： Montezuma’s Revenge (0%) 7/21 研究背景——强化学习的改进在原始算法上进行拓展 Van Hasselt H, Guez A, Silver D. Deep Reinforcement Learning with Double Q-Learning[C]//AAAI. 2016: 2094-2100. 8/21 研究背景——强化学习的改进学习具体对象的性质 Zhu Y, Mottaghi R, Kolve E, et al. Target-driven visual navigation in indoor scenes using deep reinforcement learning[C]//Robotics and Automation (ICRA), 2017 IEEE International Conference on. IEEE, 2017: 3357-3364. 9/21 研究背景——强化学习的改进辅以语义网，理解对象间的关系 Liang X, Lee L, Xing E P. Deep variation-structured reinforcement learning for visual relationship and attribute detection[J]. arXiv preprint arXiv:1703.03054, 2017. 10/21 研究背景——强化学习的改进发现可操作的对象 Machado M C, Bellemare M G, Bowling M. A Laplacian Framework for Option Discovery in Reinforcemen