- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种判断聚类有效性的新指标.pdf
计算机研究与发展 ISSN1000—1239/CN11-1777/TP
of Researchand
JournalComputer Development 42(增刊):38~42,2005
一种判断聚类有效性的新指标
安 静 姜青山
(厦门大学软件学院厦门361005)
(ancui8003@126.tom)
ANew for ClusterNumber
ValidityDetermining
An and
Jing Jiang
Qingshan
(SchoolofSoftware,溉amenUniversity,Xiamen361005)
Abstract indexisthe in orbad.Ifthereisanunsuitable
Clusteringvalidity keyjudgingclusteringgood
initial resultisnotconformedtothedatasetanditcancausea
clusteringnumber,clustering largediversity.
Anewcluster indexbased c—means is candowellin
validity fuzzy algorithmproposed,which combining
cohesionand resultsobtainedshowthenew indexcan the cluster
discrepancy.The validity give optimal
number and onthree datasetsand toothercluster
throughtestinganalysis representativecomparing validity
index.
words c—means
Key validityindex;fuzzyclustering;fuzzy
摘要聚类有效性问题是判断聚类结果优劣的关键问题,如果初始聚类数选取得不合适,会使聚类结
果与数据集的真正结构不相符,从而导致聚类结果产生较大的差异性.针对模糊C一均值(FCM)聚类算
法提出了一种判断聚类有效性的新指标,它可以对类闻有交叠或多孤立点的情况做出准确的判断.通
过对大量的有代表性的数据进行了测试分析并与当前较广泛使用的其他聚类有效性指标进行了比较,
实验结果表明,新的有效性指标能够准确地给出最优的聚类数.
关键词有效性指标;模糊聚类;模糊C均值(FCM)
中图法分类号TP391
似性质的样本尽可能地在不同的类别中.目前常用
1 引 言 的聚类分析方法有k均值(志.Means)、模糊C一均值
(FCM)聚类算法、统计的方法、神经网络方法等.
聚类是按照一定的规律和要求对事物进行区分 随着模糊集理论的形成和发展,模糊聚类的方
和分类的过程,是要让生成的类内的任意两个对象 法日趋成熟,因此,在众多的聚类分析方法中,基于
之间具有较高的相似度,而属于不同类的两个对象 目标函数的模糊C.均值(FCM)聚类算法是较为完
问具有较高的相异度Llj.聚类分析则是利用数学的 善、应用最为广泛的聚类方法,该方法能够较好地适
方法研究和处理给定对象的分类.它把一组样本按 用于大数据量的情况,并且具有设计简单、易于实
照某种规则划分成若干个子集,
文档评论(0)