强化学习及其在主机器人行为学习中的应用.pdfVIP

下载本文档

117
0
约 77页
2016-03-30 发布于贵州
举报
版权申诉

强化学习及其在主机器人行为学习中的应用.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

强化学习及其在主机器人行为学习中的应用

摘要 Y{3s019 摘要 L ／ l强化学习是从动物学习、参数扰动自适应控制等理论发展而来的。强化学习作为一种非监督学习，不需要有先验知识，而是通过与环境的不断交互获得知识，自主地改进行为策略，具有自学习的能力。强化学习由于自身特点，在自主机器人行为策略的学习中受到了国内外的越来越多的重视，已渐渐成为自主机器人行为学习时首选的一种方法：) 近年来，强化学习发展迅速，国，内外的学者在其理论、方法和思想技术方面进行了广泛的研究。由于强化学习研究的核心问题是算法的收敛速度，对提高了强化学习的速度和效率，国内外学者提出了各种方法。然而，已有的研究仍然存在一些局限性：首先，研究大多是在结构化的环境中进行的；其次，已有的方法对所有的状态的值函数要全部记忆，随着强化学习的进行会导致不断增长的状态动作空间和记忆容量；再次，这些方法没有考虑强化学习存在的风险性和学习经验利用率低的问题。弋针对现有研究的局限性，我们提出了两点改进：(1)用遗忘规则加快强化学身：(2)将强化学习与基于案例的推理相结合的方法。通过将遗忘规则引入强化学习．将长期不被利用的状态一动作对遗忘，对状态空间进行及时的更新，以提高搜索和学习效率；基于案例的推理方法，依靠对过去的经验进行学习及问题的求解。由于工作空间的环境具有某种程度的相似性，因而可以对过去的求解结果进行复用。通过将强化学习与基于案例的推理相结合，可以充分利用强化学习通过试错获得的经验，提高学习的效率，降低学习的风险性。本文详细论述了所提出方法的可行性与优越性、讨论了方法的原理、关键性技术，以及算法的描述与分析，实验结果证明了所提方法的有效性和优越性。琦7 ，／粼讯龇翱譬剃丫引搠默融翱 1 强化学习及其在自主机器人行为学习中的应用 Abstract the Reinforcement from animal learningdevelops learning and theories．Asan control other unsupervisedlearning perturbation theory adaptive notneed it does prioriknowledge，and method，reinforcement learning withthe obtained itsbehavior knowledgebycontinuouslyinterplaying improves policy hasthe of its withtheenvironment．Soreinforcement learning self-learning．For ability has moreandmoreattention intrinsic