- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
重庆师范大学硕士学位论文中文摘要
基于vMF分布的深度聚类算法研究
摘要
近年来,随着计算机技术的迅猛发展,聚类技术取得了显著进展。尤其在过去二十
年,计算机技术和数据挖掘的急剧发展推动了深度聚类方法的涌现,为我们提供了更为优
越的解决方案。基于变分自编码器(VariationalAuto-Encoders,VAE)的深度聚类方法因其
卓越的生成能力和聚类性能引起了广泛关注。然而,目前基于VAE的聚类算法往往需要
处理具有挑战性的证据下界(EvidenceLowerBound,ELBO)以实现聚类。并且大多数依赖
于高斯分布或高斯混合模型作为潜在空间嵌入。此外,还需要先验信息来处理类别分布。
总体而言,当前基于VAE的深度聚类方法在模型构建和聚类效率方面存在挑战。
为解决基于VAE的深度聚类方法的限制,本文探索了基于vMF分布(vonMisesFisher,
vMF)的深度聚类算法,并建立了两套简单、高效、准确率高的深度聚类模型。为复杂数
据特征学习、聚类分析提供一套新的方法,同时也拓展变分推断方法在深度聚类上的应
用。本文的研究内容和贡献具体如下:
1.提出了一种基于超球面变分自编码(HypersphericalVariationalAuto-Encoders,HVAE)
的深度聚类模型——深度超球面变分聚类网络(DeepHypersphericalVariationalClustering
Network,DHVC)。在DHVC模型中,首先我们通过将vMF混合分布(vonMisesFisherMix-
tureModel,vMFMM)作为潜在空间嵌入,打破以往将高斯分布或高斯混合分布作为潜空
间嵌入的传统。其次提出用优化可计算的两个后验分布之间的KL散度(Kullback-Leibler
divergence),代替以往用ELBO进行优化的方法。最后,我们最大化了潜在表示和聚类分
配之间的扩展互信息,以实现更有区分性和平衡性的分配。通过与最先进的深度聚类技
术在基准数据集上进行比较,验证了所提出的深度聚类方法的有效性。值得注意的是,我
们的方法在F-MNSIT数据集上的聚类精度突破了70%。
2.提出了一种基于HVAE的深度聚类模型——具有增强球面嵌入的深度超球面变
分聚类网络(DeepSphericalVariationalClusteringNetworkwithAugmentedSphericalLatent
Embeddings,DSVC)。在DSVC模型中,首先与DHVC一样,我们在用vMFMM分布约
束潜在空间嵌入。其次,通过合理的假设对ELBO进行重新推导、解释,提出一种全新的
随机变分推断框架,并以此构建DSVC网络模型。最后,我们提出一种全新的双边增强
策略(包含数据增强和聚类增强)以增广潜在嵌入,有效提高了聚类性能的同时也增强了
整体网络的鲁棒性。此外,也同样使用了扩展互信息以实现更有区分性和平衡性的分配。
值得提及的是,我们的方法在MNSIT数据集上的聚类精度突破了99%。
关键词:深度聚类,变分自编码器,超球面变分自编码器,vMF混合分布,KL散度,证
据下界,扩展化互信息,双边增强策略
I
重庆师范大学硕士学位论文英文摘要
ResearchonDeepClusteringAlgorithmsbasedonvMF
Distributions
ABSTRACT
Inrecentyears,propelledbytherapidadvancementofcomputertechnology,clusteringtech-
niqueshaveachievedsignificantprogress.Particularly,theswiftdevelopmento
您可能关注的文档
- 基于POPBL的跨学科主题学习在初中信息科技的设计与实践.pdf
- 基于PVT-SE的微表情识别方法研究与应用.pdf
- 基于Scrum敏捷框架的YD公司软件项目管理优化研究.pdf
- 基于T球面模糊集和高斯云的动态不确定因果图研究.pdf
- 基于UbD理论的高中“数列”单元教学设计研究.pdf
- 基于UbD模式的初中数学单元教学设计研究——以“相似”为例.pdf
- 基于UbD模式的初中信息科技大单元教学设计与应用.pdf
- 基于巴渝文化的高中地理研学旅行方案设计研究.pdf
- 基于产出导向法的初中英语应用文写作教学研究.pdf
- 基于单元整体教学设计的高中生英语学科核心素养思维品质培养研究.pdf
- 基于地理核心素养的高中地理社团活动设计研究.pdf
- 基于动态阈值和差异性检验的自训练算法研究.pdf
- 基于多孔碳负载氧化锰纳米颗粒的类氧化酶催化活性的研究.pdf
- 基于多模态的产出导向法在高中英语应用文写作教学中的应用研究.pdf
- 基于多特征融合的行人过街意图检测研究与应用.pdf
- 基于多序列MRI和深度学习的脑胶质瘤CDKN2A_B基因分型方法研究.pdf
- 基于翻转课堂的英语核心素养培养应用研究——以高中英语阅读教学为例.pdf
文档评论(0)