FCM模糊均值与改进算法.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
精心整理 精心整理 精心整理 精心整理 模糊 C 均值聚类算法的实现 研究背景 聚类分析是多元统计分析的一种, 也是无监督模式识别的一个重要分支, 在模式分类图像处理和模 糊规则处理等众多领域中获得最广泛的应用。 它把一个没有类别标记的样本按照某种准则划分为若 干子集, 使相似的样本尽可能归于一类, 而把不相似的样本划分到不同的类中。 硬聚类把每个待识 别的对象严格的划分某类中,具有非此即彼的性质,而模糊聚类建立了样本对类别的不确定描述, 更能客观的反应客观世界,从而成为聚类分析的主流。 模糊聚类算法是一种基于函数最优方法的聚类算法, 使用微积分计算技术求最优代价函数, 在基于 概率算法的聚类方法中将使用概率密度函数, 为此要假定合适的模型, 模糊聚类算法的向量可以同 时属于多个聚类,从而摆脱上述问题。 模糊聚类分析算法大致可分为三类 分类数不定,根据不同要求对事物进行动态聚类,此类方法是基于模糊等价矩阵聚类的,称为 模糊等价矩阵动态聚类分析法。 分类数给定,寻找出对事物的最佳分析方案,此类方法是基于目标函数聚类的,称为模糊 C 均值聚类。 在摄动有意义的情况下,根据模糊相似矩阵聚类,此类方法称为基于摄动的模糊聚类分析法 我所学习的是模糊 C 均值聚类算法,要学习模糊 C均值聚类算法要先了解虑属度的含义,隶属 度函数是表示一个对象 x隶属于集合 A的程度的函数,通常记做μ A(x) ,其自变量范围是所有可能 属于集合 A的对象(即集合 A所在空间中的所有点) ,取值范围是 [0,1] ,即0=μA(x)=1 。μA(x)=1 表示 x完全隶属于集合 A,相当于传统集合概念上的 x∈A。一个定义在空间 X={x} 上的隶属度函数 就定义了一个模糊集合 A,或者叫定义在论域 X={x} 上的模糊子集 A 。对于有限个对象 x1,x2,??, xn模糊集合 A 可以表示为: A~ {( A(xi),xi) |xi X} (6.1) 有了模糊集合的概念,一个元素隶属于模糊集合就不是硬性的了,在聚类的问题中,可以把聚 类生成的簇看成模糊集合,因此,每个样本点隶属于簇的隶属度就是 [0 ,1]区间里面的值。 FCM算法需要两个参数一个是聚类数目 C,另一个是参数 m。一般来讲 C 要远远小于聚类样本 的总个数,同时要保证 C1。对于 m,它是一个控制算法的柔性的参数,如果 m过大,则聚类效果 会很次,而如果 m过小则算法会接近 HCM聚类算法。 算法的输出是 C个聚类中心点向量和 C*N的一个模糊划分矩阵, 这个矩阵表示的是每个样本点 属于每个类的隶属度。 根据这个划分矩阵按照模糊集合中的最大隶属原则就能够确定每个样本点归 为哪个类。聚类中心表示的是每个类的平均特征,可以认为是这个类的代表点。 从算法的推导过程中我们不难看出, 算法对于满足正态分布的数据聚类效果会很好, 另外, 算法对 孤立点是敏感的。 聚类算法是一种比较新的技术,基于曾次的聚类算法文献中最早出现的 Single-Linkage 层次 聚类算法是 1957年在 Lloyd 的文章中最早出现的,之后 MacQueen独立提出了经典的模糊 C均值聚 类算法, FCM算法中模糊划分的概念最早起源于 Ruspini 的文章中,但关于 FCM的算法的详细的分 析与改进则是由 Dunn和 Bezdek 完成的。 模糊 c均值聚类算法因算法简单收敛速度快且能处理大数据集, 解决问题范围广, 易于应用计 算机实现等特点受到了越来越多人的关注,并应用于各个领域。 精心整理 精心整理 精心整理 算法描述 模糊 C 均值聚类算法的步骤还是比较简单的,模糊 C 均值聚类( FCM),即众所周知的模糊 ISODATA,是用隶属度确定每个数据点属于某个聚类的程度的一种聚类算法。 1973年,Bezdek 提出 了该算法,作为早期硬 C均值聚类( HCM)方法的一种改进。 FCM把 n个向量 xi (i=1,2, ?,n )分为 c 个模糊组,并求每组的聚类中心,使得非相似性指标 的价值函数达到最小。 FCM与 HCM的主要区别在于 FCM用模糊划分,使得每个给定数据点用值在 0, 1 间的隶属度来确定其属于各个组的程度。 与引入模糊划分相适应, 隶属矩阵 U 允许有取值在 0,1 间的元素。不过,加上归一化规定,一个数据集的隶属度的和总等于 1: c uij 1, j 1,..., n (6.9) i1 那么, FCM的价值函数(或目标函数)就是式( 6.2 )的一般化形式: c c n J(U,c1,...,cc) Ji uimj di2j ,(6.10) i 1 i 1 j 这里 uij 介于 0,1 间; ci为模糊组 I 的聚类中心, dij =||c i-xj|| 为第 I 个聚类中心与第

文档评论(0)

capt + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档