基于高斯过程分类器的连续空间强化学习 reinforcement learning for continuous spaces based on gaussian process classifier.pdfVIP

  • 16
  • 0
  • 约2.07万字
  • 约 6页
  • 2017-08-13 发布于上海
  • 举报

基于高斯过程分类器的连续空间强化学习 reinforcement learning for continuous spaces based on gaussian process classifier.pdf

基于高斯过程分类器的连续空间强化学习 reinforcement learning for continuous spaces based on gaussian process classifier

第6期 电 子 学 报 Ⅷ.37No.6 SINICA 2009年6月 ACrAⅡECIRONICA Jun.2009 基于高斯过程分类器的连续空间强化学习 王雪松1,一,张依阳1,程玉虎1 (1.中国矿业大学信息与电气工程学院,江苏徐州221116;2.中国科学院自动化研究所,北京100190) 摘要: 如何将强化学习方法推广到大规模或连续空间,是决定强化学习方法能否得到广泛应用的关键.不同 于已有的值函数逼近法,把强化学习构建为一个简单的二分类问题,利用分类算法来得到强化学习中的策略,提出一 种基于高斯过程分类器的连续状态和连续动作空间强化学习方法.首先将连续动作空间离散化为确定数目的离散动 作,然后利用高斯分类器对系统的连续状态一离散动作对进行正负分类,对判定为正类的离散动作按其概率值进行加 权求和,进而得到实际作用于系统的连续动作.小船靠岸问题

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档