基于密度峰值的聚类算法优化研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于密度峰值的聚类算法优化研究

摘要

密度峰值聚类算法因其简单高效的特点而备受关注。该算法不仅能够适应

各种形状的数据集,还可以直观地确定类簇数目,并且参数唯一,具有很好的

鲁棒性。但随着研究的深入,密度峰值聚类算法的缺陷也逐渐显现出来,如存

在全局参数敏感,对截断距离的依赖性较高,不能实现聚类中心的自适应选取,

样本点分配错误容易引发多米诺骨牌效应以及对复杂数据集进行聚类时效果不

理想等问题。本文针对上述问题提出相应的改进策略。

针对密度峰值聚类算法在选择聚类中心时的主观性较强以及样本点的分配

容易出现连续错分等问题,提出一种基于共享有效近邻的密度峰值聚类算法。

首先,该算法结合k近邻思想进一步提出有效近邻,并给出新的局部密度的计

算方式;其次,结合有效近邻筛选潜在聚类中心,找出符合条件的样本点,实

现聚类中心的自适应选取;最后,提出共享有效近邻与样本点关联度的概念,

并根据关联度将剩余样本点分配到相应的簇中,提高聚类的准确度。通过在人

工数据集与真实数据集上进行实验对比,结果表明该算法不仅能够实现聚类中

心的自适应选取而且能得到较好的聚类结果。

针对密度峰值聚类算法计算局部密度的方式受输入参数影响较大以及对复

杂数据集进行聚类时效果不理想等问题,提出一种基于代表点与簇中心自适应

选择的密度峰值聚类算法。首先,该算法通过引入自然邻居实现样本点局部密

度的自适应计算,然后通过代表点刻画样本点的全局分布,提出新的代表点密

度代替局部密度;其次,提出新的聚类中心参数指标,并通过计算指标斜率的

方式来确定聚类中心;最后,提出两阶段分配策略以及密集点的概念,以提高

算法在分配剩余点时的效率与准确率。通过实验对比,结果表明该算法能够有

效地避免截断距离参数对局部密度的影响,并且在处理复杂数据集时得到的聚

类效果较好。

关键词k近邻;共享有效近邻;自然邻居;代表点;簇中心自适应

-I-

ResearchonOptimizationofClusteringAlgorithms

BasedonPeakDensity

Abstract

Thedensitypeakclusteringalgorithmisahighlyciteddensity-basedclustering

methodknownforitssimplicityandefficiency,distinguishingitfromother

clusteringalgorithms.Thisalgorithmcanrecognizedatasetsofanyshape,intuitively

determinethenumberofclusters,andhasuniqueparameters,whichmakesitrobust.

However,withthedeepeningofresearch,thedefectsofthedensitypeakclustering

algorithmgraduallyemerge,suchasbeingsensitivetoglobalparameters,havinga

highdependenceonthetruncationdistance,notbeingabletoautomatically

determinetheclusteringcenter,theerroneousallocationofsamplepointseasily

causingadominoeffect,andbeingunabletohandlecomplexdatasetswithuneven

density.Thisarticlesuggestspertinentstrategiesforaddressingtheaforem

文档评论(0)

n1u1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档