K―means改进算法在电力企业同业对标中应用.docVIP

下载本文档

4
0
约3.89千字
约 8页
2018-08-11 发布于福建
举报
版权申诉

K―means改进算法在电力企业同业对标中应用.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

K―means改进算法在电力企业同业对标中应用

K―means改进算法在电力企业同业对标中应用　　摘要：　　在电力企业同业对标管理中，K-means聚类算法作为一种无监督分类算法，无需任何先验知识就能够实现对企业的分类功能，确立标杆企业。但是，K-means算法的聚类数目k和初始聚类中心都需要人为事先给出。为了解决这些不足，提出了一种对K-means聚类改进算法：先分别通过两阶聚类法和最大距离法确定聚类数目和初始聚类中心，然后再使用K-means算法完成聚类。通过实例表明此算法可以选出优秀企业，并能发现其他企业与标杆企业之间的差距。　　关键词：　　同业对标；两阶段聚类；最大距离法；K-means 　　中图分类号：F27 　　文献标识码：A 　　文章编号2015 　　1 引言　　同业对标管理作为电力企业管理模式的创新应用，通过选定最强竞争性的标杆企业，使得其他企业发现自身管理上的优势和劣势，从而加强电力企业的供电服务，提高电力企业运行管理水平。在众多电力企业中如何选择标杆企业在同业对标管理中是至关重要的。因此，许多学者对此提出了各种模型与方法。　　Borge Hess，Astrid Cullmann将非参数的数据包络分析（DEA）和参数的随机前沿分析（SFA）方法应用于同业对标中，对比分析了德国东部电力公司和西部电力公司的输电效率指标，结果证实了两家电力公司在技术差异上的稳健性；杨大晟、冯瑞明和吴大军等运用灰色局势决策模型对所辖某县供电公司12个供电所对标数据进行了分析计算，详解了标杆单位选择方法，较好地解决了供电所标杆单位选取问题，是电力企业开展同业对标管理的有益探索和实践；薛万磊，刘晓立和李雪亮等提出鉴于K-means的聚类算法在电力企业同业对标中的应用，以供电质量为指标对各省电力公司进行企业分类，确定标杆企业，并寻求与行业标杆企业之间的差距；刘晓立提出引力搜索和K-means算法相结合的混合聚类算法在电力企业同业对标中的应用，并通过实际电力公司的对标验证该算法的有效性和可行性。　　K-means聚类算法虽然简单高效，但是聚类结果对初始聚类中心十分敏感，并且用户必须事先给出聚类数目和初始聚类中心，而人为确定初始聚类中心往往使得聚类结果产生误差。因此，为了解决这些缺点，提出了一种基于改进的K-means算法，先通过使用两阶聚类法确定聚类数目，然后利用最大距离法选定初始聚类中心，最后运用K-means算法根据各省供电质量指标数据对这13个省电力公司进行聚类，优选出专业标杆，并找出其他电力公司与专业标杆之间的不足和差距，有助于电力公司提高工作效率和企业的管理建设。　　2 原K-means算法　　2.1 算法基本思想　　K-means属于一种无监督学习算法，适合处理大样本数据。需要事先制定分类数k，并选择k个初始聚类中心，根据数据点到初始聚类中心距离最小的原则将其他数据分配到这k个类中。然后计算每一个类中数据点距离初始聚类中心点的平均值，从而得到新的k个聚类中心。若新的聚类中心与上一次迭代的聚类中心的准则函数没有明显变化，则聚类结束。否则，就进入下一个迭代，再次计算此聚类中心之外的每个数据点与它的距离，并将不同对象归到与自身距离最近的类中。算法的计算结果依赖于初始聚类中心的选择，准确地选取初始中心将大大缩减迭代步骤。　　2.2 算法基本步骤　　3 改进的K-means算法　　3.1 算法思想　　因为两阶段聚类算法是通过构造聚类特征树和贝叶斯信息判别式自动确定最优聚类数，且最大距离法是利用取尽可能离得远的对象作为聚类中心的思想提高划分初始数据集的效率，因此改进的K-means算法通过两阶段聚类算法和最大距离法客观确定最优聚类数和初始聚类中心。　　该算法的主要思想是：通过两阶段聚类算法和计算BIC自动确定最优聚类数，根据最大距离法确定初始聚类中心，最后通过K-means将电力企业根据指标数据聚类，选出标杆企业。　　3.2 算法基本步骤　　由于改进的K-means算法只是增加了确定聚类数目和初始聚类个数的算法，聚类步骤与原K-means算法相似，因此聚类步骤在此不再赘述。　　改进的K-means算法具体步骤如下：　　设d维样本集X=[x1，x2，…，xN]T为输入样本。　　（1）采用Birch算法对所有样本点预聚类，生成CF树。　　（2）根据预聚类的CF-tree进行凝聚的层次聚类。　　（3）计算聚类方案的BIC，BIC的变化率和距离测度的变化率。BIC值相对较小且BIC的变化率和距离测度的变化率相对较大所对应的聚类数目为最优聚类数目k。　　（4）利用原K-means算法进行聚类。　　4 算例分析　　算例是以13个省电力公司2014年度指