基于平均报酬模型全过程Rλ学习的互联电网CPS最优控制.pdfVIP

  • 8
  • 0
  • 约2.73万字
  • 约 7页
  • 2017-08-07 发布于重庆
  • 举报

基于平均报酬模型全过程Rλ学习的互联电网CPS最优控制.pdf

基于平均报酬模型全过程Rλ学习的互联电网CPS最优控制.pdf

第34卷第21期 电力系统自动化 V01.34No.21 Power 2010年11月10日 AutomationofElectric Systems NOV.10。2010 余 涛,袁 野 (华南理工大学电力学院,广东省广州市510640) 摘要:提出了一种新颖的基于平均报酬模型的全过程R(A)学习互联电力系统CPS最优控制方法。 该方法与电网自动发电控制(AGC)追求较高的考核时间段内的10min平均控制性能标准(CPS) 指标合格率的目标相吻合,且所提出的基于平均报酬模型的R(A)学习算法与基于折扣报酬模型的 Q(A)学习算法相比,在线学习收敛速度更快,可获得更佳的CPS指标。此外,所提出的改进的 R(A)控制器具有全过程在线学习的特点,其预学习过程被一种新型的在线“模仿学习”所代替,克 服了以往强化学习控制需要另外搭建仿真模型来进行预学习收敛的严重缺陷,提高了R(A)控制器 的学习效率及其在实际电力系

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档