网站大量收购独家精品文档,联系QQ:2885784924

基于信息传递的快速无参聚类.docx

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

中国科学:信息科学2025年第55卷第2期:284–296

SCIENTIASINICAInformationis

论文

论文

《中国科学》杂志社SCIENCECHINAPRESS

crossMark

基于信息传递的快速无参聚类

薛菁菁1,2,聂飞平1*,于为中1,李学龙1

1.西北工业大学光电与智能研究院,西安710072

2.西北工业大学计算机学院,西安710072

*通信作者.E-mail:feipingnie@

收稿日期:2023–10–14;修回日期:2024–04–22;接受日期:2024–07–30;网络出版日期:2025–01–22

国家自然科学基金(批准号:和国家资助博士后研究人员计划(批准号:GZ资助项目

摘要聚类分析是数据挖掘领域的重要分支,其目的是通过挖掘数据的内在性质将这些数据划分为不同的簇.现有的图聚类方法面临着时间复杂度较高的问题,从而难以处理大规模数据集,并且,现有的大多数方法面临着由于各种正则化项的引入导致的棘手的超参问题.此外,许多图聚类模型需要额外的后处理步骤,导致得到的解远离直接求解原问题得到的离散解.为解决上述问题,本文提出了一种基于信息传递的快速无参聚类模型.该模型引入平衡聚类的思想,不仅避免了额外正则化项的引入,而且还可以利用二部图的先验知识来处理大规模数据.此外,块坐标下降法使得该模型无需后处理步骤即可直接获得原始离散问题的解.多个数据集上的实验结果表明,所提方法在大多数情况下都能取得相较于对比方法更好的性能.

关键词图聚类模型,平凡解,快速聚类,离散优化,块坐标下降法

1引言

随着新一代信息技术的快速发展,各个领域积累的数据呈现出规模大、种类多、结构复杂等特点.如何挖掘这些数据的潜在本质结构引起了研究者们广泛的研究兴趣.聚类分析技术[1~4]是数据挖掘领域中十分强大的工具,它根据一定的相似度准则,通过挖掘数据的潜在分布,将数据对象划分为不同的簇,使得同一簇中的数据对象之间有较大的相似性,不同簇间的数据对象之间有较大的相异性,该技术已广泛应用于图像分割[5]、人脸识别[6,7]等领域.

现有的聚类模型可以分为以下两类[8]:(1)基于特征驱动的聚类模型;(2)基于关系驱动的聚类模型.基于特征驱动的聚类模型以特征数据为输入,根据特征之间的显示表达来对样本进行聚类,例如,k均值(k-means,KM)[9]和模糊c均值(fuzzyc-means,FCM)聚类模型,由于它们的简单性和高效性而广受欢迎.虽然基于坐标下降法的k均值算法(coordinatedescentmethodfork-means,CDKM)和基于迭代重复加权法的模糊c均值算法(iterativelyreweightedalgorithmforfuzzyc-means,IRW-FCM)

引用格式:薛菁菁,聂飞平,于为中,等.基于信息传递的快速无参聚类.中国科学:信息科学,2025,55:284–296,doi:10.1360/SSI-2023-0302

XueJJ,NieFP,YuWZ,etal.Fastparameter-freeclusteringviainformationtransmission.SciSinInform,2025,55:284–296,doi:10.1360/SSI-2023-0302

?c2025《中国科学》杂志社

/doi/10.1360/SSI-2023-0302

薛菁菁等中国科学:信息科学2025年第55卷第2期285

考虑了使用更好的优化方法,鲁棒且稀疏的模糊k均值聚类算法(robustandsparsefuzzyk-meansclustering,RSFKM)考虑了提升模糊聚类模型的鲁棒性,这些方法都可以在某种程度上获得更好的性能,但是,由于模型思想的限制,这类算法还是只能在线性可分的简单数据上表现更优.而基于关系驱动的图聚类方法因其能够在任意形状的数据空间上挖掘

您可能关注的文档

文档评论(0)

我爱分享 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档