- 1、本文档共62页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
摘要
摘要
密度峰值聚类(DensityPeaksClustering,DPC)算法能够发现任意形状的簇并且
具有较强的鲁棒性,被广泛应用于机器学习、模式识别和图像分割等领域。然而,
DPC算法存在需要人工选取聚类中心、在大规模数据集上聚类性能不佳等问题。
针对上述问题,本文提出了相应的解决策略,旨在提升DPC算法的聚类性能,并
将改进的DPC算法应用于路面裂纹检测中。具体研究内容如下:
(1)针对DPC算法需要人工选取聚类中心的问题,本文提出了一种基于高斯
分布的自适应密度峰值聚类算法(AdaptiveDensityPeaksClusteringAlgorithmbased
onGaussianDistribution,GD-DPC)。首先,计算每个样本局部密度和相对距离的乘
积,通过Z-score标准化方法将规范到符合标准高斯分布的二维空间中。其次,γγ
利用高斯分布的标准偏差来自适应选取聚类中心,分配剩余样本得到初步划分。最
后,根据子簇规模和簇间共享近邻信息提出缝合因子模型,逐步合并初步划分中的
最相似簇,得到最终的聚类结果。实验结果表明,GD-DPC算法不仅能够自适应选
取聚类中心,聚类性能也有所提升。
(2)针对GD-DPC算法在大规模数据集上聚类性能不佳的问题,本文提出了
一种基于峰群融合的自适应密度峰值聚类算法(AdaptiveDensityPeaksClustering
AlgorithmbasedonPeakGroupFusion,GF-DPC)。首先,根据共享最近邻集合和k
近邻距离计算相似度矩阵,将相似度最高的k个点的相似度之和作为当前点的局
部密度。其次,计算任意点i与密度比其高的点j之间欧氏距离,并将欧氏距离与
其k近邻距离和相乘,取乘积的最小值作为点i的相对距离。然后,通过高斯分布
的标准偏差提取局部密度较高的密度峰,形成密度峰群集合。最后,依据近邻传播
算法对密度峰群进行合并,分配剩余样本,得到最终的聚类结果。实验结果表明,
GF-DPC算法在大规模数据集上的聚类效率有所提升并且优于对比算法。
(3)针对当前路面裂纹检测技术需要耗费大量时间标注标签的问题,本文在
深度残差自编码器提取路面裂纹关键特征的基础上,在下游任务中应用GF-DPC算
法对特征数据进行聚类分析,最后利用路面裂纹信息提取程序量化裂纹几何特征,
实现了全过程的无监督学习,为无监督路面裂纹检测领域开拓了一种新思路。实验
结果表明,基于GF-DPC算法的路面裂纹检测模型有效并且具有较好的性能表现。
关键词:密度峰值聚类;高斯分布;峰群融合;深度残差自编码器;裂纹检测
I
目录
目录
第1章绪论1
1.1研究背景和意义1
1.2国内外研究现状分析3
1.2.1密度峰值聚类算法研究现状分析3
1.2.2路面裂纹检测技术研究现状分析5
1.3研究内容与章节安排7
第2章相关理论介绍9
2.1密度峰值聚类算法9
2.2k近邻与共享近邻11
2.3聚类评价指标12
2.4自编码器14
2.5本章小结15
第3章基于高斯分布的自适应密度峰值聚类算法16
3.1GD-DPC算法16
3.1.1自适应选取聚类中心16
3.1.2缝合因子18
3.1.3GD-DPC算法设计19
3.1.4算法复杂度分析19
3.2实验结果与分析20
3.2.1实验环境与数据集20
3.2.2人工数据集21
3.2.3UCI数据集25
3.2.4参数敏感性
文档评论(0)