网站大量收购独家精品文档,联系QQ:2885784924

半监督聚类算法其应用研究.pdf

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
半监督聚类算法其应用研究

摘要 摘 要 聚类是一门非常重要的技术。所谓聚类就是按照菜种度量(楣似性度量、不相似性 度量或距离),根据一定的准则将个体集合分成若干类,使得同类个体之间的相似程度 大予不同类个体之间的胡似程度即徽到’’物以类聚”。半监督聚类算法研究无监督学习 中如何利用少量的监督信息来提高聚类性能,目前正得到不断应用。 本文首先介绍了聚类的发展概况和聚类过程中的相关技术,重点介绍了距离度量、 常用聚类方法以及评价准则等等,为后续章节的研究提供了理论和实验基础。针对前入 提出的半监督模糊C均值聚类算法,本文对其进行了详细介绍并用实验来证明了该算 法。 其次,为了验证该种半监督学习方法是否可以用于其它聚类算法,本文对极大熵算 法进行了改进,将半监督距离学习孳|入极大熵聚类,生成半监督极大熵聚类算法,并通 过实验证明极大熵聚类算法通过半监督方法改进之后确实有效。 对于团状、每类样本数相差较大的数据集,FCM算法与半监督模糊C均值聚类算法 的最优解可能都不是对数据集的雁确划分,因为这两种算法对数据集有等划分趋势。针 对这个问题,最后本文利用样本点分布密度大小作为权值,结合前面的半监督学习方法, 提出了半监督点密度加权模糊C均值聚类算法,并通过实验证隳了该算法确实麓提高聚 类精度。 关键词:数据挖掘;聚类分析;模糊C均值聚类;极大熵聚类;点密度加权;半监 督学习;标签数据;距离学习 Abstract Abstract is onone technologyvery metric(similaritymetric, Clustering important.Based metricor called istodividesetofindividualsintosome dissimilaritydistance),SOclustering subsetSOthatitismoresimilarbetweenindividualsinthesamesubsetthanindifferent the whichisto theinformationfrom subsets to certain of mine according criteria,the purpose dataset.Semi learnshowtouseasmallamountof Supervisedclusteringalgorithm informationto the is used. improveclusteringperformance,whichwidely Thethesis introduces of andsome of firstly generaldevelopmentclustering technologies the introduceaboutmetric methodused clustering.Specially,some learning,clustering commonandvaluecriticandSO basictheoreticaland forthe on,laying experimental

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档