引力聚类及其应用的研究.pdfVIP

  • 13
  • 0
  • 约6.2万字
  • 约 51页
  • 2016-03-17 发布于江苏
  • 举报
摘要 摘要 数据挖掘是近年来热门的计算机应用技术,聚类是数据挖掘中重要的研究分 支。聚类技术是将未分类的样本,通过其相似度进行分类,使得类簇内部样本间 相似度最大,而不同类簇间相似度最小,从而发现数据集的特性和内部模式。然 而,一些数据集的结构和分布呈现高度复杂性,数据挖掘也为聚类带来了大量亟 待解决的问题。因此,聚类分析方法进一步研究的空间还很大。 层次聚类方法是一种常用的聚类算法,通过分解目标数据集来创建一个层次。 按照层次的分解方向,它分为自下而上(凝聚方法)和自上而下(分裂方法)两 种类型。 覆盖算法是构造型学习算法,通过找到一组覆盖,使得属于同一类的样本属 于同一覆盖,不同类的样本不属于同一覆盖。覆盖聚类算法借鉴覆盖算法的构造 性思想,找出一组覆盖,使得属于同一覆盖的样本间距离较小,不同覆盖间的样 本间距离较大。我们生活的宇宙,从最初的宇宙大爆炸,宇宙所有的物质都处于 混沌状态中,杂乱无章。由于万有引力的作用,使得宇宙中的物质相互吸引、靠 近,进而融合形成了星系,恒星,行星等天体。这一过程和数据聚类过程极为相 似,都是从最初混沌,通过对混沌中的个体进行某种聚类运算,最终得到结构清 晰的聚类结果。

文档评论(0)

1亿VIP精品文档

相关文档