基于马尔可夫过程的电力设备故障分析及优化.docxVIP

下载本文档

18
0
约4.68千字
约 5页
2023-09-22 发布于广东
举报
版权申诉

基于马尔可夫过程的电力设备故障分析及优化.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于马尔可夫过程的电力设备故障分析及优化 1 现场检修决策人员的口误随着技术水平的提高，维修人员选择了现场维护电气设备的各种手段。例如,对于由绝缘油的劣化和污染而导致的变压器油tgW异常升高,既可以通过对油的净化吸附处理降低tgW,也可以更换新油,使变压器恢复所要求的绝缘强度。两种方法费用不同,达到的效果也有差异:采用净化吸附处理,所花费的成本较低,但是面临的故障风险也大一些;更换新油,处理效果一般比净化吸附处理好,但费用高得多。如何根据设备状态的不同,选取不同的处理手段,达到可靠性和经济性之间的平衡,是现场检修决策人员必须考虑的问题。迄今为止,其决策在很大程度上还是依赖决策人员的经验积累,并没有一种定量的分析方法帮助检修决策人员做出正确的选择。电力设备的老化过程是一个随机过程,存在许多不确定因素,例如同类型的设备在相同的时间内,老化的程度并不一样。过去在设备检修决策中采用的确定性模型对这些不确定性因素只能进行定性分析,甚至产生完全错误的结果,而概率模型可以考虑元件可靠性的统计特性,更加符合设备老化的实际情况,而且可以对风险进行定量分析。在概率模型中,考察的系统根据一定的概率分布在各个状态间转移,未来某个时间的状态是不确定的,这与设备的老化过程很相似,因此建立设备老化的概率模型可望取得更为真实的结果。本文尝试用马尔可夫模型来模拟电力设备的老化过程,用马尔可夫决策方法对设备的检修方案进行优化,为最佳检修策略的选取提供一种定量计算的方法。这种方法还可以考虑不同方案的风险因素,便于决策人员综合考虑风险和经济两个因素,确定应该采用的维修策略。 2 马尔可夫决策马尔可夫决策方法是建立在马尔可夫过程基础上的一种动态优化方法,适用于无后效性结构的动态随机系统的序贯性决策。所谓的序贯性决策,就是需要在一系列时间点上做出决策,而系统向下一个时刻的状态转移是随机的。在每个观测时刻,决策者根据掌握的信息,对当前状态选取适用的决策行为,然后系统随机转移到下一个状态,决策者收集新的信息,做出新的决策。当系统的状态转移具有无后效性(或称马尔可夫性)结构时,决策行为只与当前状态有关,而与系统转移至此状态的过程无关,这样,就可以根据系统的状态转移模型制定出控制系统运行的最优策略。马尔可夫决策方法将系统的状态变化作为一个马尔可夫过程来处理,在马尔可夫过程的每一个状态上,决策者可以采取不同的决策行为,根据状态和决策行为的不同,决策者可以获得一定的收益,这种收益可以是负值,决策者将遭受一定的损失。马尔可夫决策的目标是找到一种策略,该策略定义了不同状态上应该采取的决策行为,使得最终的收益最大或是损失最小。用数学语言描述基于马尔可夫过程的马尔可夫决策方法。一个马尔可夫决策过程包含以下4个元素:{S,(A(i),i∈S),P,R},其中: (1)S是可列非空状态集,是系统所有可能状态的集合; (2)A(i)和i∈S是系统处于状态时所有可能的决策行为的集合; (4)P是决策行为对系统状态影响的描述,P={p(j|i,a),a∈A(i),i∈S,j∈S}。p(j|i,a)表示在任意时刻t(t=0,1,2,…)系统处于状态i,采取决策行为a∈A(i)的条件下,系统在t+1时刻转移到状态j的概率,它与系统在t以前所处的状态无关,也与时刻t无关。一种策略是一组决策行为组成的向量,设系统由m个状态组成,则D={d1,d2,…,dm},di∈A(i)。D定义了处于状态i时所采取的决策行为,当每一个状态上的决策行为确定以后,系统的概率转移矩阵也就确定了,这样每一种策略实际上就确定了系统的一个马尔可夫过程。假设cD是系统在策略D下所确定的马尔可夫过程的平稳分布,马尔可夫决策过程所要解决的就是选取一组决策行为,使得系统的总收益最大。一般来讲,被考察系统的状态是一个可数集,每一个状态所能采取的决策行为也是有限的,因此,在理论上这种平稳策略是存在并可以求出的。但是,所搜索的状态空间个数将是A(i)所包含元素数目的乘积,计算量很大,所以通常采用的方法是被称为“策略迭代法”的动态规划求解方法。对于系统阶段无限的马尔可夫过程,考虑收益的时间价值,引入折扣率U来表示未来收益在当前时间点的“现值”,则系统的期望收益可以用迭代方式表示为由式(1)得到马尔可夫决策的“策略迭代法”求解步骤如下: (1)取初值任取一种初始策略D,一般取分别使各个状态当前收益最大的决策行为组成初始策略,以缩短迭代运算次数; (2)策略的评估根据当前策略确定的马尔可夫过程参数,求解式(1)所示的线性方程组,得到当前策略的期望收益值v(i,D),i∈S; (3)策略的改进利用策略评估得到的期望收益值,对各个状态i找出使估值函数最大的决策行为d,由这些决策行为组成一种新的策略D′; (4)若前后两种策略相同,则停