网站大量收购独家精品文档,联系QQ:2885784924

基于层次聚类的改进FM算法C.pdfVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于层次聚类的改进FM算法C.pdf

第l3卷 第2期 山东交通学院学报 V01.13No.2 2005fi-6月 JOURNAL OF SHANDONG JIAOTONG UNIVERSITY Jun.2005 基于层次聚类的改进 FCM算法 马志民 ,张 军 ,钟 亮 (1.东南大学计算机科学与工程系,江苏 南京 210096;2.华南师范大学 计算机科学系,广东广州 510631) 摘要 :针对基本 FCM算法只适用于球形或者类球形数据分布的特点,提出了基于层次聚类的改进 FCM算法 ,首 先对数据进行过划分 ,然后再进行凝聚 ,使之适用于不规则分布的数据。并且引入 Ksoko子集度量使合并操作 在计算时间上可 以接受 。 关 键 词 :模糊划分 ;FCM;层次聚类 ;聚类有效性 中圈分类号 :TP301.6 文献标识码 :A 文章编号 :1672—0032(2005)02—0067—03 将物理或者抽象对象几何分组成为由类似对象组成的多个类的过程称为聚类…。由聚类生成的簇 是一组数据对象的集合,同一个簇中的对象相似 ,不同簇问的对象相异 。一个聚类分析系统 的输入是 一 组样本和一个度量两个样本问相似度 (或相异度)的标准。聚类分析的输出是数据集的几个组(类),这 些组构成一个分区或一个分区结构。聚类分析的附加结果是对每个类的综合描述 ,这种结果对于进一步 分析数据集的特性是尤其重要的。一般而言,传统的聚类分析方法可以分为主要的两类:基于划分 的方 法与基于层次的方法 “。 1 基于划分的模糊 C聚类算法 传统的聚类分析是一种硬划分 ,把每个待分析的对象严格划分到某个类 中,一旦一个对象属于某个 类那么它就不可能属于另外的一个类 ,这种类别的划分界限是分明的。但在现实中大多数对象并没有严 格的隶属关系 ,更多的是相对模糊的定义。也就是说很多对象具有亦此亦彼的特性 ,因此更适合软划分。 模糊理论的提出为这种软划分提供了有力的分析工具 ,人们开始用模糊数学处理聚类问题 ,并称之为模 糊聚类分析。由于模糊聚类得到了样本属于各个类别的不确定程度 ,建立起了样本对于类别的不确定描 述,更能客观的反映现实世界,从而成为聚类分析的主流。因此我们把隶属度 函数从 {0,1}扩展到区间 [0,1],从而把硬 C划分概念扩展到模糊C划分 ]。 定义 1 X的模糊C划分空间为 = { I∑ =1,Vk;0∑ n,V ; ∈[0,1]). 定义2 令 P,(i=1,2,…,C)表示第 i类的聚类中心,定义模糊 c聚类的目标 函数为 r,‘(U,P)=∑ ∑ ikmd ,m∈[1, ) i∈ 一 ’ 式中 为划分矩阵;P为聚类原型;m为加权指数 ,又称为平滑指数或模糊参数 ,当 m=1时该 目标函 数变为硬 C聚类的 目标函数 ,m越大分类的结果越模糊,当前对 m的选择缺乏理论指导,更多的是凭经 验 ,一般 m的取值在 1.5~2.5之间,在很多情况下直接将 m的值定为 2;C为类的个数 ,需要根据数据的 先验知识确定。样本 与第 i类的距离函数定义为 d =lf 一P }l, 即欧氏距离 ,当然也可采用其他度量方式。 收稿 日期 :2004—12—10 作者简介:马志民(1975一),男,湖南岳阳人 ,东南大学硕士研究生,主要研究方向为数据挖掘 山东交通学院学报 2005年6月 第13卷 根据 目标函数 ,用拉格朗 日乘数法得出基于迭代的模糊 C一均值聚类算法 (FCM)。使用 FCM算法对 呈球形或类球形分布的数据进行聚类分析时,可以得到令人满意的聚类结果。而且当存在很少的孤立点 时,使用 FCM算法进行聚类分析后得到的聚类中心和没有孤立点的情况相比只有较小的偏移,这说明该 算法的抗噪性 比较强,少数的孤立点并不影响聚类的质量。 但是当数据呈如图

文档评论(0)

ziyouzizai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档