FCM聚类算法与改进层次聚类算法的结合.pdfVIP

下载本文档

11
0
约7.17千字
约 4页
2017-04-15 发布于北京
举报
版权申诉

FCM聚类算法与改进层次聚类算法的结合.pdf

1、本文档共4页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

FCM聚类算法与改进层次聚类算法的结合.pdf

第 9~接第 17 期 2(阴年9 月 1671-1819(2∞9)17.5∞8-04 科学技术与工程 Science Technology and 览ngineeri吨 VoL 9 No. 17 Sep. 2(削 @ 2009 Sci. Tech. En问 FCM 聚类算法与改进层次聚类算法的结合陈亚平呆陈 (江苏科技大学，镇江 212∞的摘事模糊 c- 均值果提算法(fuzzy C-means 简称 FCM)和层次聚类算法是两种非常1重要的.类算法。由于 FCM 算法对初始聚类中心敏感，并且需要人为确定果提类别数，这样收敛结果易陷入局部最优解。通过对这两种聚类算法的分析，首先对传统的凝聚层次廉类算法提出了改进，然后用改进的凝聚层次聚集算法得到最佳廉类数和初始聚类中心，最后用 FCM 算法进行再次自棠，以此得到更好的聚集结果并且减少了执行时间和迭代次数。关键词凝聚屡次聚类模糊。均值聚樊初始聚类中心全链接中罔端分樊号TP311.13j ::t献标志同 A 聚类分析是依据样本间关联的最度标准将其自动分成几个群组，且使同一群组内的样本相似，阳属于不同群组的样本相异的一组方法[1] 。果类分析巳钝广泛地用在许多应用中，包括模式识别、数据分析、回像处理，以及市场研究。通过襄樊，能够识别密集的和稀疏的区城，因而发现全局的分布模式，以及数据属性之间的有趣的相互关系[2] 。模糊 c-均值骤类算法( fu町 ιmeans 简称 FCM)和层次襄樊算法是两种非常熏耍的襄樊算挫，然而两种算法都存在着一些缺点。通过对两种廉类算法的分析，本文将层次聚类算法与 FCM 算法结合，先用改进的凝廉层次算法得到最佳襄樊数和初始聚类中心，然后再用 FCM 算法进行聚棠，以此得到更好的架类结果。 1 凝聚居次聚类算法 1.1 摄黯层次黯提算法介绍在层次聚类分析中，不需要在输入中指定要分成的类的个数，一个层次的襄樊方法将数据对象组筑朋年5 月 17 日收到第一作者简介:陈亚平(1984一) ，舅，汉族，江苏省镇江市人，硕士研究生，研究方向:数据库应用系统。 E-mail: chenyapir明34@hot- mail. 创棚。成一棵聚类的树，根据层次分解是自底向上还是自顶向下形成，层次的聚类方法可以进一步分为凝聚的和分裂的层次聚类。凝聚础层次廉类又称为合并型层次聚类，是一种白鹿向上的方法。首先将每一个对象看作一个簸，然后根据某些准则合并这些原子簇为越来越大的簸，直到所有的对象都在一个簸中，或者某个终结条件被满足。算法中簇间合并准则有以下几种: (1)单链接 :d( 叭， C2 ) =min(d,,); $ e C 20 (2)金链接:d( 叭， C2 ) 窑 m皿(d，，) ; $eC2 。仰平均链接:机 re C 1 ,$ e C20 reC 1 , reC 1 , (4)囊心法 :d( 叭， Cz ) = d( 第l 那2); Xll X2 分别为叭， C2 的重心。其中叭， C2 是两个样本樊， ?1 表示 C1 中的样本个数，叫表示 C2 中的样本个数， d表示叭， Cz 之间的距离的字母简称。本文采用全链接法计算类问距离，在全链接算法中，两个类间的距离般每对样本的距离中的最大值。层次聚类方法尽管简单，但是一且一组对象被 17 期陈]E平，等 :FCM 攘提算法与改进膳次襄樊算法的结合 5以)9 合并或分裂，就不能修正。如果在某一步没有很好地选择合并成分裂的决定，可能会导致低质量的廉类结果。而且，这种聚类方法不具有很好的可伸缩性，因为合并或分裂的决定需要检查和估算大量的对象或簸。所以通常会将股次襄樊算法与其他聚樊算法结合，以达到更好的聚类质量。 1.2 凝黯膳次黯提篝法改进层次聚樊算法每合并完一个提对象盾，就必须重新计算合并后类间的距离，对于有大量数据的样本集而亩，计算最是惊人的。假定廉类的对象有 n 个，那么按照层次襄樊算法的思想，第一次合井之前距离矩阵大小为 nz ，当合并完一个类之后，剩下的类数为 n -1 ，在第二次合并之前必须意新计算樊与类之间的距离，距离组阵大小变为(n -1 沪，依次递推，直至所有类合并为一个费为止，由此可以看出层次聚类算黯所需的距离矩阵存储空间是 n2 阶，而类问距离每次又要重新计算，相应计算盘为 n2 阶。对于海量数据来说，这需要路费大蠢的存储空间和计算时间(3) 。基于以上考虑，本文对算法做了一些改进。改进后的凝聚居次聚樊算法描述如下: (1)输入 n 个用于分类的样本叭，叫，…，凡，把一个样本作为一个类，即 Ci = lx.1 (i = 1 ， 2 ，…，时