- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
流形上的非线性判别K均值聚类
?フ? 要:为提高具有流形结构的高维数据的聚类性能,提出非线性判别??K??均值聚类算法(NDisKmeans)。该方法通过引入流形上的谱正则化技术,将数据的低维嵌入表示成数据流形上平滑函数的线性组合,然后通过最大化低维空间中聚类类间的散度与总体散度的比值,来实现对高维数据的聚类。还设计了一种收敛的迭代求解方法来求解最优组合系数矩阵和聚类赋值矩阵。NDisKmeans方法由于考虑了数据的流形结构,??克服了判别K均值算法中线性映射的不足,??从而提高了对高维数据聚类的性能。最后在数据集上的广泛实验表明,NDisKmeans方法能有效实现对高维数据的聚类。
?ス丶?词:聚类; 流形; ??K均值聚类;??谱正则化;谱聚类
?ブ型挤掷嗪?: TP311.13 文献标志码:A
Abstract: In order to improve the performance of clustering algorithm on high dimensional data by using the manifold structure, a novel clustering algorithm called Nonlinear Discriminant ??K????means Clustering (NDisKmeans) was proposed. By introducing the spectracl regularization technology, NDisKmeans first represented the desired low dimensional coordinates as linear combinations of smooth vectors predefined on the data manifold; then maximized the ratio between inter??clusters scatter and total scatter to cluster the high dimensional data. A convergent iterative procedure was devised to solute the matrix of the combination coefficient and clustering assignment matrix. NDisKmeans overcomed the limitation of linear mapping of DisKmeans algorithm; therefore, it significantly improved the clustering performance. The systematic and extensive experiments on UCI and real world data sets show the effectiveness of the proposed NDisKmeans method.
Key words: clustering; manifold; ??K????means clustering; spectral regularization;spectral clustering
??
0 引言??
在模式识别、计算机视觉和数据挖掘等领域的很多实际问题中,都涉及到对高维数据的处理。由于高维数据的稀疏性,现有数据聚类算法直接对高维数据进行聚类,效果仍不能令人满意????[1]??。??
针对高维数据的聚类问题,目前存在两类比较流行的处理方法。一类是先采用维数归约方法对数据降维后,再利用现有的聚类算法如??K?Ь?值聚类等对数据进行聚类,如文献[2-3]中提出的自适应的维数归约方法,这类方法存在的一个突出问题是现有的高维数据的维数归约方法并不是针对数据的聚类任务而设计,也即维数归约方法和聚类算法在目标上存在天然的隔阂????[4-7]??,从而导致在降维过程中,原始数据的聚类结构不能较好地保持,甚至会受到破坏,从而直接影响到最后聚类算法在获取的低维数据上的聚类性能????[8]??。??
另一类方法是将线性维数归约方法和对高维数据的聚类融合到同一个过程中,同时实现对高维数据的线性降维和聚类,代表性的方法有判别??K??均值聚类(DisKmeans)????[9]??和谱嵌入聚类????[10]??等。这类方法由于在对数据进行维数归约时,考虑了对数据的聚类任务,因此最后能提高对高维数据的聚类性能。然而由于是采用线性维数归约方法,当数据存在非线性的流形结构时,这类方
您可能关注的文档
最近下载
- 具身智能——决定机器人泛化能力天花板的“大小脑”.pptx
- 统编版(2019)高中历史必修中外历史纲要下册第一单元综合测试卷(与参考答案解析).pdf VIP
- 课件-空气洁净技术:第五章 洁净空调系统设计.ppt VIP
- SY∕T 5587.9-2021 常规修井作业规程 第9部分:换井口装置.pdf
- 【智慧水务解决方案】水务运营及智慧水务解决方案.docx VIP
- 2023中国幽门螺杆菌感染治疗指南(全文).pdf VIP
- 被皮系统课件(共34张PPT)《畜禽解剖生理(第四版)》同步教学(高教版).pdf VIP
- 施工单位外部协调管理.pptx VIP
- 2025年[参考]法拍房成交确认书范本.docx VIP
- 机修土坎水平梯田工程施工方案.docx VIP
文档评论(0)