- 2
- 0
- 约7.14千字
- 约 12页
- 2026-03-14 发布于湖北
- 举报
PAGE2
基于k-means聚类的局部放电诊断方法分析案例
目录
TOC\o1-3\h\u
45031.1k-means聚类算法 1
94361.2基于k-means的局部放电诊断模型 5
244161.3结果与分析 11
1.1k-means聚类算法
k-means聚类算法是常用的聚类算法之一,指的是利用数据集中样本的相似性等规律,根据样本之间的欧式距离的不同将其归类为多个不相交的子集来达到分类的目的,通常这些子集称作簇(Clusters)。其中“k”指的是算法最终将实现聚类的簇数,“means”指的是每个簇的聚类中心由该组数据的均值决定。
k-means算法流程如如下:
1)自定义聚类的类别数量k,并随机在数据中选取k个点作为聚类簇的初始中心点;
2)根据计算数据集中每个点到各聚类中心的欧式距离,将每个点按照“就近原则”分别划分到距离最近的簇中心,形成k个簇;
3)分别计算这k个簇中所有点的均值作为新的簇中心;
4)不断重复2)和3)部分,直到选定的簇中心不再变化为止,此时的k个簇为根据数据集的相似性得出的最终聚类结果。
k-means聚类算法的关键在于如何将数据集中的点划分到距离最近的聚类中心所在的簇中,其中相似性度量函数的选取很大程度的影响了k-means的聚类效果。以两个k维向量和为例,常见的相似性度量函数如表4-1所示。
表STYLEREF1\s4SEQ表\*ARABIC\s11常见的相似性度量函数及其表达式
相似性度量函数
表达式
欧氏距离
马氏距离
曼哈顿距离
兰氏距离
图STYLEREF1\s4SEQ图\*ARABIC\s11k-means算法流程图
根据所提取的多光谱局部放电特征量的数据集特性,本文选用欧氏距离作为相似性度量函数,对k-means聚类算法中相关参数描述如下:
数据集,其中,是一个n维向量,指的是第i个数据的n种特征量,m是数据集中样本的个数。
每个簇的中心,其中,第j个簇的中心为,每个簇中心也包含n个特征量,k表示簇数。
点与簇中心间的距离可由式(4-1)计算:
(4-1)
每个簇的聚类中心可由式(4-2)计算:
(4-2)
式中:——同一簇中点的个数。
典型的k-means聚类过程如图4-2所示,为了将如图4-2(a)所示的原始数据通过k-means分为四类,首先应在数据集中随机选取四个点作为初始的中心,经过两次迭代计算并更新聚类中心后得出的最终结果如图4-2(e)所示。
(a)原始数据
(b)随机选择初始聚类中心
(c)第一次迭代
(d)第二次迭代
(e)聚类结果
图STYLEREF1\s4SEQ图\*ARABIC\s12k-means聚类过程示意图
对于本局部放电诊断模型而言,待聚类的数据集为7个光谱波段下的放电脉冲数占比、脉冲最大幅值占比和脉冲平均幅值占比,是一个高维数组。为了使k-means聚类运行更高效并且能更直观的看到聚类结果,首先应对数据集进行降维。目前常用的降维方法有:主成分分析法(PrincipalComponetAnalysis,PCA)、独立分量分析(IndependentComponentAnalysis,ICA)、局部线性嵌入(LocallyLinearEmbedding,LLE)、连续投影(SuccessiveProjectionsAlgorithm,SPA)等,本文采用PCA对数据集进行预处理。
PCA降维的目的是寻找一个合适的低维空间,通过线性变换对原始数据在此空间上进行投影并使得投射平均均方误差最小,从而实现在尽可能多的保留原始数据信息的同时降低维度。实现步骤如下:
1)计算协方差矩阵
将数据集表示为一个的矩阵,原始数据集中样本的个数为n,每个样本的维数为m。其协方差矩阵可由式(4-3)和(4-4)计算:
(4-3)
(4-4)
2)计算协方差矩阵的特征向量和特征值
求出协方差矩阵V后,将矩阵对角化求出它的特征值及相应的特征向量。然后按照特征值大小,以从大到小的顺序,将其对应的特征向量依次从上到下重新排列,得到矩阵,将原始的特征矩阵A与相乘即可得到映射变换后新的特征参数矩阵B,如式(4-5所示)
(4-5)
3)提取主成分
在PCA计算中,特征值越大表示U中相应的新特征参量贡献率越大,贡献率的计算式如式(4-6)所示
(4-6)
矩阵U中的前k行向量即为要求的前k个主成分,也就是将原始数据集A降维至k维后的数据。
1.2基于k-means的局部放电诊断模型
对于局部放电的精细化诊断包括局部放电类型识别和局部放电的严重程度划分两个方面,根据第三章局部放电多光谱特征参数的初步分析可知对于不同放电缺陷,各波段下放电
您可能关注的文档
- 2026《虚拟现实技术在高中物理教学中的应用问卷调查研究(附问卷)》8400字.docx
- 2026《深度学习算法在推荐系统中的应用分析》8600字.docx
- 2026《一款汽车的前悬架结构设计》9500字.doc
- 2026《运输车驱动主减速器结构设计计算》8100字.docx
- 2026《某厢式运输车驱动主减速器结构计算设计与校核》8300字.docx
- 2026《BIM技术在建设工程进度管理中的应用研究》11000字.docx
- 2026《基于Android系统的校园体育资讯系统设计》11000字.docx
- 2026《中轧线材轧机设计》13000字.doc
- 2026《金尾矿混凝土抗冻性能研究报告》3800字.docx
- 2026《点目标识别电路系统的软件设计及电路调试分析案例》7000字.docx
最近下载
- 《将进酒》说课课件(12张PPT)_20211215205119.pdf VIP
- 山西省教师晋升副高职称考试题库.pdf VIP
- 接触网设计规范(综合版).docx
- 统编版语文六年级下册第三单元教材解读+课件.pptx VIP
- 英语六级高频核心词汇速记.pdf VIP
- 中医护理的整体观念和辨证施护.pptx VIP
- 2025年中外历史纲要下 第二单元 第 4 课中古时期的亚洲(共38张PPT).ppt VIP
- 2026年江西旅游商贸职业学院单招综合素质考试题库及答案解析.docx VIP
- 2025年广东省广州市中考物理试卷及答案.docx VIP
- 2026年内蒙古化工职业学院单招(计算机)测试模拟题库附答案解析.docx VIP
原创力文档

文档评论(0)