- 1、本文档共75页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于局部保持的深度聚类研究
中文摘要
聚类在机器学习和模式识别领域被广泛地研究,其以无监督的方式将数据
按照相似性划分为不同的类别.特征学习是聚类任务中一个关键步骤,旨在将
原始高维数据映射到低维的特征表示,同时保留数据的重要信息,使得聚类性
能实现显著的提升.随着深度学习的兴起,深度神经网络凭借其强大的特征表
示能力促进了深度聚类任务的发展.然而,现存的大部分深度聚类算法在特征
学习的过程中忽略了特征之间的局部连接关系,使得原始数据到特征低维映射
的过程中破坏了特征空间的本征结构,从而影响了聚类的性能.为了解决这一
问题,本文分别针对两个先进的深度聚类算法进行基于局部结构保持的改进,
提出利用局部保持正则项来约束深度特征学习,通过考虑特征之间的局部连接
关系保持特征空间的本征结构,从而实现聚类性能的有效提升.具体来说,本
文提出的改进算法分别为:
(1)基于局部保持的深度子空间聚类算法:首先将图像数据输入深度卷积
自编码器进行预训练,学习数据潜在的初始特征;然后利用预训练特征学习一
个代表特征之间相似性的初始亲和图矩阵,并将其作为网络微调训练中特征的
先验图结构信息;在微调训练中,该算法在预训练深度自编码器模型的基础上,
加入一层基于数据自表达属性构造的全连接层网络,即自表达层,用于学习特
征之间表示关系的自表达矩阵.该算法设计了一个新颖的损失函数对整个模型
进行微调训练,在这个损失函数中,除了必要的深度自编码器的重构损失以外,
还加入了一个局部保持损失函数对特征进行结构化约束,在网络进行微调的过
程中,这个局部保持损失函数保持了预训练特征空间到微调特征空间的本征结
构,改善了自表达层学习特征表示矩阵的质量,最终利用该矩阵构造亲和图并
将其应用于谱聚类算法,可以有效地提升深度聚类任务的性能.
(2 )基于局部保持的深度嵌入聚类算法:该算法可以实现聚类任务与基于
局部结构保持的特征学习在同一个深度学习框架中进行端对端的训练,同时实
现深度特征学习与聚类任务.该算法首先利用逐层预训练策略预训练一个深度
自编码器,分别得到网络的初始参数、潜在的预训练特征,并应用k-means 算
法得到初始聚类中心;然后将深度编码器作为深度特征学习的工具,利用最小
I
化聚类软分配函数和辅助分配函数的 KL 散度构造聚类损失函数,并基于保持
特征之间的局部连接关系加入一个局部保持正则项,在两个损失函数的共同作
用下对深度模型进行微调训练,同时得到优化的特征以及聚类结果.
本文首先介绍深度特征学习与聚类任务的研究背景和重要意义,分析典型
的深度聚类算法的框架模型;然后,本文提出两个基于局部保持的深度聚类算
法,分别对局部结构保持理论、数据的自表达属性、以及基于 KL 散度的聚类
损失函数进行深入的推导,对算法的网络结构以及训练过程进行总结;最后本
文在相关的数据集上与先进的聚类算法进行实验对比,证明了本文提出算法的
有效性.
关键词:聚类,深度学习,特征学习,局部保持
II
Locality Preserving based Deep Clustering
Algorithm Analysis
Abstract
Clustering is widely studied in the field of machine learning and pattern
recognition, and it divides data into different clusters according to their similarity
in an unsupervised manner. Feature learning is of vital importance in clustering
task, which aims to map the original high-dimensional data to low-dimensional
feature representation while preserving
您可能关注的文档
- 基于关系感知的物体可供性学习.pdf
- 基于缓存的地面与空地无线异构网络容量分析与优化.pdf
- 基于机器学习的金属载体相互作用和分子吸附研究.pdf
- 基于近似模型的两类采样数据随机非线性系统的稳定性研究.pdf
- 基于精益生产的东莞威雅利公司物料流优化研究.pdf
- 基于精益生产的凯杰生物公司生产过程管理优化研究.pdf
- 基于精益生产的迈图南通公司硅油产线生产管理优化研究.pdf
- 基于精益生产的南通鑫源新材料有限公司生产管理优化研究.pdf
- 基于卷积经网络的细粒度图你识别方法研究.pdf
- 基于卷积神经网络的实时动物行为识别及定量分析.pdf
- 水墨风中小学教师师德师风专题培训课件PPT模板.pptx
- 科技感商务汇报商业计划书项目展示通用PPT模版.pptx
- 橘色季度工作绩效考核报告工作汇报PPT模版.pptx
- 中国非物质文化遗产糖画介绍PPT.pptx
- 科技感项目融资计划书PPT模版.pptx
- 绿色中国风新中式毕业论文答辩开题报告通用PPT模板.pptx
- 非物质文化遗产糖画历史知识介绍PPT.pptx
- 互联网科技通用PPT模版PPT.pptx
- 2025年山西省原平市事业单位考试(中小学教师类D类)职业能力倾向测验试卷完美版.docx
- 2025年山东省荣成市事业单位考试(中小学教师类D类)职业能力倾向测验重点难点精练试题推荐.docx
文档评论(0)