几种聚类方法比较.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
几种聚类方法的比较 李世蜂 黄磊 铷昌平 中国科学院自动纯研究所 E-maih shifengJi@maiLia.ac.cn 摘要:聚类已经不仅仅限于经典的模式识别领域,而广泛应用于统计理论、机 器学习和数据挖掘.除了提取样本的统计分布特征作为识别的有力手段,聚类在 高维、大规模数据库的数据分析方面也发挥着越来越重要的作用,推动了相关理 论的快速发展.本文介绍了聚类中常用的若干方法及其改进,提出一种新的聚类 方法,并应用于脱机手写数字的识副,以期通过比较反映这些方法的某些特性. 关键词:聚类算法,合法性. Evaluationof ClusteringAlgorithms LIShi-feng,HUANGLei,LIUChang-ping Abstract:lnadditionto toclassicaI domain. application patternrecognition hasbeen usedinstatisticaI and clustering widely theory,machineIearning data wellasa toolin statistical mining.As powerfulrecognitionbyextracting featuresin is amoreandmore lyinginputpatterns.clusteringplaying important roleindata analysisofhigh—dimensional,large.scaledatabases,thus a theoretic summarizessome promotingrapid development.Thepaper used andnew in one cqmmonlyalgorithmsimprovement whichisadvancedforthefirsttimeus.whichare Inoff-line by implemented hand-written evaluatethe digitsrecognition.to property. words:Clusteringalgorithm,Evaluation. Key 1.引言 聚类可以定义为将一群数据组织为若干个内部成员相似的群体的过程:作为一种反映 数据特征的手段.聚类的目的是使数据样本的类内相似性晟大.而使类问相似性最小.总体 上来说。聚类方法分为两种:分割聚类(Partitional Clustering). 分割聚类是一种平面聚类.其本质是将所有输入样本用若干个具有代表意义的中心点来 表征。这些中心点形成字典用于匹配.在定义花费函数c:{z:xES)—÷婀+后,分割聚 .103. 类转化为使总花费函数yc(S。)最小化的优化过程.常用的花费函数如平方和函数.分割 百 聚类优化准则的普遍缺陷是聚类结果偏于超球型结构.同时对“噪声”处理程度不够.K. 均值作为一种典型的分割聚类,因其理论简单且易于实现得到了广泛的应用,但只能逼近局 部最优而非全局最优,且对初值的选取敏感

文档评论(0)

0520 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档