基于深度强化学习的电网拓扑优化和潮流控制的方法.pdfVIP

  • 18
  • 0
  • 约1.15万字
  • 约 10页
  • 2023-04-25 发布于北京
  • 举报

基于深度强化学习的电网拓扑优化和潮流控制的方法.pdf

本发明提供了一种基于深度强化学习的电网拓扑优化和潮流控制的方法,包括:构建智能体;获取历史断面潮流数据,并对多历史断面潮流数据进行模仿学习,以确定智能体的参数的初始值;对t时刻的在线断面潮流数据进行训练,得到N个动作价值排在前列的控制策略;在电网环境仿真器中验证N个价值排在前列的控制策略,获得回报最高的控制策略;执行回报最高的控制策略,得到执行该控制策略的奖励值;t的取值加1;循环求奖励值的步骤,每求得M次奖励值,根据动作价值函数的目标值更新智能体参数,完成所有时刻的在线断面潮流数据的智能体训练

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114065452 A (43)申请公布日 2022.02.18 (21)申请号 202111362751.4 (22)申请日 2021.11.17 (71)申请人 国家

文档评论(0)

1亿VIP精品文档

相关文档