自适应RBF网络Q学习控制.pdfVIP

  • 20
  • 0
  • 约2.08万字
  • 约 4页
  • 2015-09-19 发布于安徽
  • 举报
第 25 卷 第 2 期 控  制  与  决  策  20 10 年 2 月 Vol . 25 No . 2 Cont rol an d D ecis ion   Feb . 20 10   文章编号 : 100 10920 (20 10) 自适应 RBF 网络 Q 学习控制 徐明亮 , 须文波 (江南大学 信息工程学院 , 江苏 无锡 2 14 122) 摘  要 : 利用 RB F 网络逼近连续空间的 Q 值函数, 实现连续空间的 Q 学习. RB F 网络输入为状态动作对, 输出为该 状态动作对的 Q 值. 状态由系统的状态转移特性确定, 动作由优化网络输出得到的贪婪动作与服从高斯分布的噪 声干扰动作两部分叠加而成. 利用 RN A 算法和梯度下降法 自适应调整网络的结构和参数. 倒立摆平衡

文档评论(0)

1亿VIP精品文档

相关文档