- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第42卷第3期计算机应用与软件Vol42No.3
2025年3月ComputerApplicationsandSoftwareMar.2025
基于状态降维的快速强化学习电力网络系统控制
童涛陈海宾甄昊涵沈华林文浩
(国网上海市电力公司电力科学研究院上海200051)
摘要为了避免大规模电力网络系统控制的维数灾,提升其可控性,提出一种基于状态降维的快速强化学习
方法。通过投影矩阵投影测量状态来构造压缩状态向量,捕获开环网络模型的主要可控子空间,从而利用网络可
控性的低秩属性避免了维数灾难;提出降维状态深度学习控制器,从而使结果成本接近最优LQR成本。通过一
致性网络系统和IEEE广域控制实验结果,验证了提出的方法能够显著加快学习时间,同时保证了较好的优化
性能。
关键词状态降维强化学习网络系统维数灾难
中图分类号TP391.41文献标志码ADOI:10.3969/j.issn.1000386x.2025.03.014
FASTREINFORCEMENTLEARNINGPOWERNETWORKSYSTEMCONTROL
BASEDONSTATEDIMENSIONREDUCTION
TongTaoChenHaibinZhenHaohanShenHuaLinWenhao
(StateGridShanghaiElectricPowerCompanyElectricPowerResearchInstitute,Shanghai200051,China)
AbstractInordertoavoiddimensiondisasterandimprovecontrollability,afastreinforcementlearningcontrol
methodforlargescalepowernetworksystembasedonstatedimensionreductionisproposed.Thecompressedstatevector
wasconstructedbyprojectingthemeasuredstatethroughtheprojectionmatrix,andthemaincontrollablesubspaceofthe
openloopnetworkmodelwascaptured,sothedimensiondisasterwasavoidedbyusingthelowrankattributeofnetwork
controllability.Areduceddimensionstatedepthlearningcontrollerwasproposedtomaketheresultcostclosetothe
optimalLQRcost.TheexperimentalresultsofconsensusnetworksystemandIEEEwideareacontrolshowthatthe
proposedmethodcansignificantlyacceleratethelearningtimeandensurebettersuboptimalperformance.
KeywordsStatedimensionalityreductionReinforcementlearningNetworksystemDimensiondisaster
度信念网络(DeepBeliefNetwork,DBN)算法和比例积
0引言分微分反馈的控制器,并有效地利用于具有非线性和
[4]
开环不稳定性的磁悬浮列车。He等基于深度神经
深度学习理论一经提出就被应用于控制系统领
您可能关注的文档
- 基于注意力机制的BiLSTM动物声音情绪识别.pdf
- 基于注意力机制的CNN-LSTM模型的碳市场价格预测.pdf
- 基于注意力机制的车辆轨迹预测模型.pdf
- 基于注意力机制的车辆异常轨迹检测.pdf
- 基于注意力机制的传感器标定算法.pdf
- 基于注意力机制的点云语义分割方法.pdf
- 基于注意力机制的端到端轻量化星图识别算法研究.pdf
- 基于注意力机制的短期光伏功率预测.pdf
- 基于注意力机制的多图神经网络交通预测模型.pdf
- 基于注意力机制的高分辨率自动实时绿幕抠像方法.pdf
- 安徽省合肥市望龙中学2024~2025学年九年级上学期化学期中模拟试题(解析版).pdf
- 安徽省淮北市2024-2025学年七年级上学期期末语文试题(解析版).pdf
- 第三单元 课题1 第2课时 分子可以分为原子.ppt.pptx
- 安徽省淮北市部分学校2024-2025学年九年级上学期1月期末数学试题(解析版).pdf
- 安徽省淮北市部分学校2024-2025学年八年级上学期期末语文试题(解析版).pdf
- 安徽省淮北市部分学校2024-2025学年九年级上学期1月期末物理试题(解析版).pdf
- 安徽省淮北市部分学校2024-2025学年七年级上学期期末生物试题(解析版).pdf
- 安徽省淮北市部分学校2024-2025学年九年级上学期11月期中历史试题(解析版).pdf
- 安徽省淮北市部分学校2024-2025学年九年级上学期期末语文试题(解析版).pdf
- 安徽省淮北市2024-2025学年上学期七年级期中考试数学试题卷(解析版).pdf
原创力文档


文档评论(0)