结合局部核心和共享概念的数据挖掘层次聚类算法研究.pdfVIP

结合局部核心和共享概念的数据挖掘层次聚类算法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第41卷第2期齐齐哈尔大学学报(自然科学版)Vol.41,No.2

2025年3月JournalofQiqiharUniversity(NaturalScienceEdition)March,2025

结合局部核心和共享概念的数据挖掘层次

聚类算法研究

12

赵宏岩,邬昌兴

(1.仰恩大学工程技术学院,福建泉州362000;2.华东交通大学信息与软件工程学院,江西南昌330013)

摘要:聚类算法存在计算难度大、计算时间长等问题。为此,研究基于自然邻居搜索算法和改进局部核心点搜索

算法搜索局部核心点,并结合共享概念对簇进行分类,实现对数据集的层次化分析。结果表明,所提算法的运行

时间最短,在4个数据集上的运行时间分别为0.0744,2.2903,5.1121,90.7067s。所提算法在5个数据集中的聚类

准确度分别为99.57%,100%,100%,89.58%,98.75%,在NMI指标方面的表现仍然优于另外3种算法。

关键词:局部核心;数据挖掘;聚类算法;共享;自然邻域图

中图分类号:TP311文献标志码:A文章编号:1007-984X(2025)02-0046-07

互联网技术的快速发展加剧了信息爆炸问题,为应对这一情况,数据挖掘技术应运而生。数据挖掘是

数据库和人工智能领域的研究热点,是从大量的数据中通过算法搜索隐藏于其中信息的过程[1]。聚类分析

是数据挖掘的一个重要算法,将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程,目

标是在相似的基础上收集数据来分类[2]。这种分类有利于帮助相关人员理解和描述数据,发现数据中的模

式和关系,进而做出更有效的决策。许多学者对聚类算法进行了大量的研究。张清华等[3]针对密度峰值聚

类算法仅考虑全局分布而影响聚类效果的问题,基于代表点与K近邻提出了一种改进密度峰值聚类算法。

结果表明,所提算法能更准确地识别类簇中心并且获得更好的聚类结果。司伟建等[4]针对复杂多变的信号

环境中的信号分选问题,在模糊聚类算法的基础上提出了连通K近邻聚类算法,实验结果验证了所提算法

的高效性和稳定性。早期的聚类算法主要针对小规模数据集进行研究,随着计算机技术的发展聚类算法的

研究也逐渐扩展到大规模数据集。聚类算法大致可分为基于层次、分割、密度、网格和模型等框架体系,

需根据不同的应用场景和数据特征进行相关算法的选择和融合。基本的聚类算法包括K-means、基于密度

的噪声应用空间聚类(Density-BasedSpatialClusteringofApplicationswithNoise,DBSCAN)和层次聚类等,

聚类算法正向着多样性、高效性、多模态和可扩展性等方向发展。尽管现有的聚类算法在同密度数据上可

以表现出很好的聚类效果,但在多密度数据上难以有效识别多密度结构。为此,研究基于局部核心点搜索

算法和自然邻居搜索算法,提出一种数据挖掘层次聚类算法。研究旨在提出一种高效、高精度的聚类算法,

为数据挖掘技术提供支持。本文提出一种改进的局部核心点搜索算法,并基于自然邻居搜索算法和改进局

部核心点搜索算法搜索局部核心点,使数据更容易进行比较和分析。

1数据挖掘层次聚类算法

1.1改进局部核心点搜索算法

聚类算法是一种无监督学习算法,主要用于将相似的样本自动归聚到同一个类别中,传统的聚类算法

可分为基于划分、模型、密度、层次和网格的5种方法。其中,基于密度的聚类算法通过识别数据点密度

文档评论(0)

教师资格证、公共营养师持证人

本人专注ppt制作、办公模板编辑六年有余,可以根据客户需求做出高品质ppt、办公表格等模板,以及文案等。

领域认证该用户于2024年07月07日上传了教师资格证、公共营养师

1亿VIP精品文档

相关文档