基于高斯过程分类器的连续空间强化学习 reinforcement learning for continuous spaces based on gaussian process classifier.pdfVIP
- 16
- 0
- 约2.07万字
- 约 6页
- 2017-08-13 发布于上海
- 举报
基于高斯过程分类器的连续空间强化学习 reinforcement learning for continuous spaces based on gaussian process classifier
第6期 电 子 学 报 Ⅷ.37No.6
SINICA
2009年6月 ACrAⅡECIRONICA Jun.2009
基于高斯过程分类器的连续空间强化学习
王雪松1,一,张依阳1,程玉虎1
(1.中国矿业大学信息与电气工程学院,江苏徐州221116;2.中国科学院自动化研究所,北京100190)
摘要: 如何将强化学习方法推广到大规模或连续空间,是决定强化学习方法能否得到广泛应用的关键.不同
于已有的值函数逼近法,把强化学习构建为一个简单的二分类问题,利用分类算法来得到强化学习中的策略,提出一
种基于高斯过程分类器的连续状态和连续动作空间强化学习方法.首先将连续动作空间离散化为确定数目的离散动
作,然后利用高斯分类器对系统的连续状态一离散动作对进行正负分类,对判定为正类的离散动作按其概率值进行加
权求和,进而得到实际作用于系统的连续动作.小船靠岸问题
您可能关注的文档
- 基于改进位能脊的电力系统暂态稳定快速识别算法 an improved potential energy ridge based fast recognition algorithm for power system transient stability.pdf
- 基于改进微粒群算法的pid控制器参数优化设计 optimization design based on modified particle swarm optimization algorithm for pid controller.pdf
- 基于改进细菌群体趋药性算法的电力系统无功优化 reactive power management based on improved bacterial colony chemotaxis algorithm.pdf
- 基于改进稀疏表示法的谐波源定位 improved sparse representation-based location of harmonic sources in power system.pdf
- 基于改进细菌群体趋药性算法的无功优化 reactive power optimization based on the improved bacterial colony chemotaxis algorithm.pdf
- 基于改进微分环节控制策略的研究及其应用 study on new type control strategy based on improved differential link and application thereof.pdf
- 基于改进下垂法的微电网逆变器并联控制技术 paralleling control technique of microgrid inverters based on improved droop method.pdf
- 基于改进微分进化算法的电压稳定约束最优潮流 voltage stability constrained optimal power flow based on improved differential evolution algorithm.pdf
- 基于改进下垂控制的分布式电源并联运行技术 parallel operation technology of distributed generations based on improved droop control.pdf
- 基于改进相似日的超短期负荷预测法 a method for ultra-short term load forecast based on improved similar historical day data.pdf
原创力文档

文档评论(0)