- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于局部保持的深度聚类研究
中文摘要
聚类在机器学习和模式识别领域被广泛地研究,其以无监督的方式将数据
按照相似性划分为不同的类别.特征学习是聚类任务中一个关键步骤,旨在将
原始高维数据映射到低维的特征表示,同时保留数据的重要信息,使得聚类性
能实现显著的提升.随着深度学习的兴起,深度神经网络凭借其强大的特征表
示能力促进了深度聚类任务的发展.然而,现存的大部分深度聚类算法在特征
学习的过程中忽略了特征之间的局部连接关系,使得原始数据到特征低维映射
的过程中破坏了特征空间的本征结构,从而影响了聚类的性能.为了解决这一
问题,本文分别针对两个先进的深度聚类算法进行基于局部结构保持的改进,
提出利用局部保持正则项来约束深度特征学习,通过考虑特征之间的局部连接
关系保持特征空间的本征结构,从而实现聚类性能的有效提升.具体来说,本
文提出的改进算法分别为:
(1)基于局部保持的深度子空间聚类算法:首先将图像数据输入深度卷积
自编码器进行预训练,学习数据潜在的初始特征;然后利用预训练特征学习一
个代表特征之间相似性的初始亲和图矩阵,并将其作为网络微调训练中特征的
先验图结构信息;在微调训练中,该算法在预训练深度自编码器模型的基础上,
加入一层基于数据自表达属性构造的全连接层网络,即自表达层,用于学习特
征之间表示关系的自表达矩阵.该算法设计了一个新颖的损失函数对整个模型
进行微调训练,在这个损失函数中,除了必要的深度自编码器的重构损失以外,
还加入了一个局部保持损失函数对特征进行结构化约束,在网络进行微调的过
程中,这个局部保持损失函数保持了预训练特征空间到微调特征空间的本征结
构,改善了自表达层学习特征表示矩阵的质量,最终利用该矩阵构造亲和图并
将其应用于谱聚类算法,可以有效地提升深度聚类任务的性能.
(2 )基于局部保持的深度嵌入聚类算法:该算法可以实现聚类任务与基于
局部结构保持的特征学习在同一个深度学习框架中进行端对端的训练,同时实
现深度特征学习与聚类任务.该算法首先利用逐层预训练策略预训练一个深度
自编码器,分别得到网络的初始参数、潜在的预训练特征,并应用k-means 算
法得到初始聚类中心;然后将深度编码器作为深度特征学习的工具,利用最小
I
化聚类软分配函数和辅助分配函数的 KL 散度构造聚类损失函数,并基于保持
特征之间的局部连接关系加入一个局部保持正则项,在两个损失函数的共同作
用下对深度模型进行微调训练,同时得到优化的特征以及聚类结果.
本文首先介绍深度特征学习与聚类任务的研究背景和重要意义,分析典型
的深度聚类算法的框架模型;然后,本文提出两个基于局部保持的深度聚类算
法,分别对局部结构保持理论、数据的自表达属性、以及基于 KL 散度的聚类
损失函数进行深入的推导,对算法的网络结构以及训练过程进行总结;最后本
文在相关的数据集上与先进的聚类算法进行实验对比,证明了本文提出算法的
有效性.
关键词:聚类,深度学习,特征学习,局部保持
II
Locality Preserving based Deep Clustering
Algorithm Analysis
Abstract
Clustering is widely studied in the field of machine learning and pattern
recognition, and it divides data into different clusters according to their similarity
in an unsupervised manner. Feature learning is of vital importance in clustering
task, which aims to map the original high-dimensional data to low-dimensional
feature representation while preserving
您可能关注的文档
- 基于关系感知的物体可供性学习.pdf
- 基于缓存的地面与空地无线异构网络容量分析与优化.pdf
- 基于机器学习的金属载体相互作用和分子吸附研究.pdf
- 基于近似模型的两类采样数据随机非线性系统的稳定性研究.pdf
- 基于精益生产的东莞威雅利公司物料流优化研究.pdf
- 基于精益生产的凯杰生物公司生产过程管理优化研究.pdf
- 基于精益生产的迈图南通公司硅油产线生产管理优化研究.pdf
- 基于精益生产的南通鑫源新材料有限公司生产管理优化研究.pdf
- 基于卷积经网络的细粒度图你识别方法研究.pdf
- 基于卷积神经网络的实时动物行为识别及定量分析.pdf
- 2026年度新疆生产建设兵团医院高层次人才引进20人备考题库及一套参考答案详解.docx
- 中国农业科学院2026年度第一批统一公开招聘备考题库——兰州畜牧与兽药研究所含答案详解.docx
- 中国电建集团昆明勘测设计研究院有限公司招聘20人备考题库完整参考答案详解.docx
- 浙商银行金华分行2025年四季度社会招聘备考题库及参考答案详解一套.docx
- 天津市红桥区卫生健康委所属事业单位2026年公开招聘工作人员备考题库及完整答案详解1套.docx
- 2025年雅安市人民医院/四川大学华西医院雅安医院健康管理中心医师招聘备考题库完整答案详解.docx
- 武汉市第六医院120急救站医生、护士招聘备考题库含答案详解.docx
- 中化地质矿山总局地质研究院2026年高校应届毕业生招聘备考题库有答案详解.docx
- 2025年陆军军医大学西南医院招聘护士备考题库及参考答案详解.docx
- 国家药品监督管理局新闻宣传中心2026年度编制外人员公开招聘备考题库及完整答案详解1套.docx
原创力文档


文档评论(0)