基于中心定位算子遗传算法的动态层次聚类方法.pdfVIP

  • 6
  • 0
  • 约1.38万字
  • 约 4页
  • 2018-05-09 发布于福建
  • 举报

基于中心定位算子遗传算法的动态层次聚类方法.pdf

第 23卷第 3期 音鸟职甚技术净 学报 Vo1.23No.3 2010年 6月 JournalofQingdaoTechnicalCollege Jun.2010 基于中心定位算子遗传算法的 动态层次聚类方法 刘 园园 (青岛职业技术学院软件与服务外包学院,山东青岛266555) 摘要:针对聚类算法易陷入局部优化的缺点,将中心定位算子遗传算法与层次聚类方法动态结合, 通过遗传算法的全局寻优特点弥补层次聚类算法的不足。在算法的后期融入 Chameleon思想,提高了 算法的准确性。通过对 UCI中的三个数据集样本进行测试,表明聚类效果优于传统聚类方法。 关键词:遗传算法;中心定位算子;层级聚类;变色龙算法 中图分类号 :TP18 文献标志码 :A 文章编号 :1672—2698(2010)03—0052—03 一 、 引言 样本集逐层进行划分,直到各个叶子节点所代表 的样本集的类 内相似度满足阈值要求,当类 内相 目前绝大多数聚类算法要求用户预先给出聚 类的个数,l】]但是通常情况下,用户在没有任何信 似度阈值为 (随算法运行动态变化)或分裂层 数达到最大阈值 为止。在针对每个节点的样本 息的情况下很难确定理想的聚类个数。从而,用 集进行划分时,采用遗传聚类算法实现样本集的 户在用这些聚类算法时,不得不尝试用不同的聚 局部聚类,并找到各个子聚类 的聚类中心 。 类个数进行聚类,这个过程效率低下,当在 比较多 的聚类个数存在 的情况下,聚类效果不尽人意。 三、数据结构 另外聚类问题实际上是一个寻求最优划分的问 本算法的数据结构通过树形结构来表示:整 题,一方面最优划分的标准有很多种,另一方面寻 体的聚类数据构建根结点,通过层次聚类的方法 找最优划分通常是复杂度很高的NP难题,一般 将产生的子聚类构成树的叶子结点,新的叶子结 只能给出近似最优解 ,因此如何适应不同的最优 点成为下次层次聚类的根结点。每一个结点表示 化 目标及高效地搜索近似最优解也是聚类算法需 一 个聚类,图1是结点的数据结构。 要解决的问题。 缩点 ’\ , 洼释 、 为了解决上述问题,本文提出一种基于中心 ID ID号 定位遗传算法 (geneticalgorithm withagene— Fa f F 父绪点ID № 成曼内容 Nu categories 宁 centerorientation,GCOGA)的动态层次聚类分

文档评论(0)

1亿VIP精品文档

相关文档