基于引力和小类合并的fcm聚类算法分析-fcm clustering algorithm analysis based on gravitation and small class merging.docxVIP

  • 9
  • 0
  • 约3.27万字
  • 约 47页
  • 2018-08-14 发布于上海
  • 举报

基于引力和小类合并的fcm聚类算法分析-fcm clustering algorithm analysis based on gravitation and small class merging.docx

基于引力和小类合并的fcm聚类算法分析-fcm clustering algorithm analysis based on gravitation and small class merging

③1974年,Dunn提出了有效的模糊聚类算法[5],而后Bezdek建立了模糊c均值聚类算法的理论;④1980年,Bezdek先后两次证明了模糊c均值算法的收敛性。模糊聚类分析理论的形成与发展的时间虽然不长,但已被应用于很多领域中,国内外学者对聚类分析给予了充分的关注。我国作为模糊数学研究的大国,不仅在基础理论研究上取得了丰硕的成果,而且在模糊聚类等的应用研究上亦令人瞩目,比如基于模糊聚类的图像处理、模式识别、矿藏识别和医学诊断等等。1.3本文的研究目的和意义模糊聚类分析是依据客观事务间特征、亲疏程度和相似性,通过建立模糊相似关系对客观事物进行分类的方法,模糊聚类算法具有较好的分类精度和泛化能力,因此能客观地反映现实世界,从而成为了聚类分析研究的主流。模糊聚类已经在诸多领域获得了广泛的应用,并取得了满意的效果和客观的效益[7]。其应用范围涉及到通信系统中的信道均衡、医学诊断、食品分类、水质分析等众多领域,通常情况下最常见的是把模糊聚类应用在模式识别中的特征提取和图像处理中的图像分割和图像匹配[8]。随着应用的发展,对模糊聚类理论又提出了许多新的要求,因此必须进一步丰富和完善聚类理论,指导实际应用,使模糊聚类更好地服务于人类[11]。从模糊聚类理论的研究现状来看,人们已经提出了诸多算法,这也恰恰说明了现有算法还存在着种种不尽如人意的地方。在众多的算法中模糊c均值(FCM)算法因为其深厚的数学基础和完善的理论成为关注的焦点,但是它也不是无懈可击的,本文主要针对模糊c均值聚类算法(FCM)进行了分析,并在此基础上进行改进,希望获得更好的聚类效果。1.4本文研究内容、方法与文章结构1.4.1研究内容与方法模糊聚类是一个很活跃的研究领域,新的方法也层出不穷。本论文的研究内容有以下几个方面:①数据预处理阶段。作为聚类分析的第一个阶段,该阶段的好坏直接影响着聚类的结果。在本文中,数据的预处理主要是指噪声的剔除、离群点的识别,因为现有的很多算法对噪声都比较敏感,如果不能让算法在“干净”的数据上进行计算将得到错误或质量较低的聚类结果。以往提出的很多识别离群点的算法往往都是基于距离或密度的,虽然能在一定程度上表现出好的识别效果,但往往需要在算法过程中设值阈值,阈值的设置没有规律可循,对于一些特征不明显的离群点很难识别。利用离群点和引力的特征提出了基于引力的离群点识别方法。该方法和其他离群点识别方法相比,其优点是识别结果对阈值的敏感度降低。②传统FCM算法对初始聚类中心依赖性比较大,如果初始聚类中心选取不当,聚类目标函数容易陷入局部极值点。针对这一现象,本文提出了选择引力和较大的点作为初始聚类中心,利用该方法选取的聚类中心大都在簇的中心位置,减小了算法陷入局部极值的可能性。③在确定了近邻测度和聚类准则的基础上,为了更好的揭示数据集的聚类结构,针对传统FCM算法聚类个数c需要人为设定这一现象,提出通过小类合并方法来获得最佳聚类个数c,降低了算法所需的先验知识。④为了检验改进算法的有效性和可行性,采用五组比较有代表性的数据集进行实验,对比改进FCM算法和传统FCM算法的聚类效果。通过实验验证了改进算是在聚类质量和聚类稳定性上都优于传统算法,从而验证了本文提出的改进的FCM算法是有效的、可行的。1.4.2文章结构第一章绪论本章首先介绍了模糊聚类的研究背景及研究意义,其次分析了国内外聚类研究现状以及应用领域,再次给出了本文的主要研究内容,最后给出了本文的整体组织结构。第二章聚类分析本章的主要内容有以下几个个方面:首先从聚类分析的基础知识进行阐述;然后介绍了常用的五种常用的聚类方法,并详细的介绍了这几种算法的思想、处理流程及它们的优缺点;最后重点介绍了聚类目标函数、FCM算法以及它的缺点。第三章基于引力和小类合并的FCM聚类算法研究本章针对传统FCM算法的不足之处,提出了改进的FCM算法,该算法主要是利用万有引力先对数据集识别离群点,并找出聚类中心,然后利用传统FCM算法迭代优化的思想对数据集进行聚类,最后利用小类合并的思想进行类合并得出最终的聚类结果。其中详细介绍了每个步骤的思想和处理流程。第四章实验结果与分析本章采用了五组比较具有代表性的数据集,通过五个对比实验证明了改进算法相对与传统的FCM算法不管在聚类过程还是聚类结果上都远优于传统的算法。第五章总结和展望总结了本文的研究工作,并对今后的研究做出了展望。2聚类分析2.1聚类分析概述2.1.1聚类分析的基本概念聚类分析是人类活动中的一个重要内容,它起源于分类学,也是分类研究的方法之一。聚类分析就是对给定的大量样本在没有先验知识的情况下按照“物以类聚”的方法进行多元统计分析,原则是被分入同一类中的对象有较大的共性,而被分入不同类中的个体有较大的异性。聚类分析是数据预处理的一种重要手段和工具,在数据集和聚

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档