- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
电力变压器状态监测数据聚类的分析
精品论文 参考文献
电力变压器状态监测数据聚类的分析
(1深圳市康拓普信息技术有限公司 518034;2南方电网科学研究院 510080)
摘要:在绝大多数情况下,电力变压器油色谱的在线监测数据是正常的,近似故障或者故障类数据是非常少的,数据样本的不平衡就为电力变压器故障诊断增加了难度。基于尽可能早的发现电力变压器内部的发展程度及其潜伏性故障的目的,通过利用ISODATA算法对其油中气成分数据进行聚类分析。实践表明,该算法的具有较强的实用价值。
关键字:聚类分析;状态监测数据;电力变压器;ISODATA算法
引言
数据库中的数据挖掘和知识发现在数据库界和人工智能领域收到了广泛的关注,数据挖掘的目的在于将重要的、有价值的及人们感兴趣的信息从海量的数据中提取出来,聚类则是数据挖掘中一个非常重要方面。聚类指的是将抽象或者物理的集合分组成为了类似的对象组成的多个类的过程。在对一个完全未知的结构和连续、复杂、较大的数据库进行分析时候,聚类发挥着重要的作用。在数据挖掘开始阶段,聚类体现出较强的应用价值。因此,对电力变压器状态监测数据聚类分析进行研究显得尤为重要。
一、ISODATA算法
该算法是在K-means的基础上进行改进得到的,通过自动合并和分裂就可以得到较为合理的聚类数,同时,该算法在每次将全部的样本都调整完成之后才会对各类样本的均值进行重新计算,而并非是每调整一个样本的类别就要对各类样本的均值进行重新计算。
变量说明:
Step8:按照公式4对每类中分量的标准差进行计算:
式中:L表示的是每次允许合并的类的对数。
Step14:当在迭代过程中的参数变化在限差以内或者迭代次数大于1时,则迭代结束,否则转向“Step2”,继续进行迭代处理。
二、聚类分析在电力变压器状态监测中的应用
为了提高供电的可靠性,确保电力系统中变压器的安全正常运行,本文以电力变压器油中气体样本数据进行聚类分析,对变压器故障(高能放电、高温过热、中低温过热、低能放电、正常)进行识别,尽可能早的将其故障检测出来,实践应用表明,该算法具有较强的实用性。
(一)算法实现
对于电力变压器中五种气体参数(C2H4、C2H2、C2H6、CH4、H2)的处理,本文选用模糊ISODATA聚类方法,并求出聚类结果,为电力变压器中油中气的复分析提供依据。
1、创建原始数据表
利用Delphi软件的Database Desktop建立实时数据表格。
2、数据预处理
(1)聚类数据的预处理。大量的不一致数据、空缺数据和噪声数据存在于数据库中,利用多种数据预处理技术都可以纠正数据中的不一致,将数据中的噪声去除。为了使聚类算法的有效性和精度得到有效地提高,可以采取一些数据规范化的方法。
(2)数据清理。通常情况下,数据库中都会存在着一些噪音数据和空缺值。针对噪音数据,可以采用一些数据平滑技术对数据进行平滑;对于空缺值既可以使用该空缺值所在属性的平均值来进行空缺值的填充,也可以通过人工填写空缺值。
(3)数据规范化。当数据库中各属性的单位和量纲不同时,在对对象之间距离进行计算之前,务必将不同的量度单统一成为相同的量度单位。在现实中存在很多种规范化的方法,本文所选用的规范化的方法是标准化方法,也就是归一化方法:
3、聚类结果
根据该算法的要求进行聚类,其中类倍数为5,并取初始分类矩阵R(0)如下所示:
按照该算法进行编程计算,最后得到的的隶属度矩阵R如下所示:
聚类中心矩阵V为:
(二)模糊ISODATA聚类法的讨论
1、在实际应用中,该算法与其他聚类算法相比较而言,对样本数据规格化预处理的要求比较低,并且初始分类矩阵的选取对聚类结果的影响比较小,这也是该算法的优点之一,但是初始分类矩阵的元素的取值越是两极分化,聚类中心就越是精确。
2、虽然概算法也需要k值的输入,但是其能够自动地调整到合适的类别数,具有较强的实用价值。该算法中参数的选取直接关系着该算法的有效性和适用性,参数值的选取如果不恰当极易影响最终聚类结果的好坏。
3、距离类型受D值选取直接影响,从实际应用结果上来分析,D值的选取对聚类结果的影响比较小,但是仍然存在差异,
您可能关注的文档
最近下载
- 小学数学名师工作室年度工作计划 .docx VIP
- 青少年保健专科建设和管理指南.pptx
- LNG购销总协议-中英文对照.pdf
- 全球及中国婴幼儿辅食行业蓝皮书-CIC灼识咨询-2025.pptx
- 2025中国南水北调集团新能源投资有限公司第一批中层及职员岗位社会招聘模拟试卷含答案解析.docx VIP
- 2025中国南水北调集团新能源投资有限公司第一批中层及职员岗位社会招聘模拟试卷含答案详解.docx VIP
- 部编版五年级语文上册语文园地三.ppt VIP
- 食材配送应急预案.docx VIP
- 《GBT 97.4-2002 平垫圈用于螺钉和垫圈组合件》知识培训.pptx VIP
- 现代化工导论 课件(化工)第10章.pptx VIP
文档评论(0)