- 6
- 0
- 约1.38万字
- 约 4页
- 2018-05-09 发布于福建
- 举报
第 23卷第 3期 音鸟职甚技术净 学报 Vo1.23No.3
2010年 6月 JournalofQingdaoTechnicalCollege Jun.2010
基于中心定位算子遗传算法的
动态层次聚类方法
刘 园园
(青岛职业技术学院软件与服务外包学院,山东青岛266555)
摘要:针对聚类算法易陷入局部优化的缺点,将中心定位算子遗传算法与层次聚类方法动态结合,
通过遗传算法的全局寻优特点弥补层次聚类算法的不足。在算法的后期融入 Chameleon思想,提高了
算法的准确性。通过对 UCI中的三个数据集样本进行测试,表明聚类效果优于传统聚类方法。
关键词:遗传算法;中心定位算子;层级聚类;变色龙算法
中图分类号 :TP18 文献标志码 :A 文章编号 :1672—2698(2010)03—0052—03
一 、 引言 样本集逐层进行划分,直到各个叶子节点所代表
的样本集的类 内相似度满足阈值要求,当类 内相
目前绝大多数聚类算法要求用户预先给出聚
类的个数,l】]但是通常情况下,用户在没有任何信 似度阈值为 (随算法运行动态变化)或分裂层
数达到最大阈值 为止。在针对每个节点的样本
息的情况下很难确定理想的聚类个数。从而,用
集进行划分时,采用遗传聚类算法实现样本集的
户在用这些聚类算法时,不得不尝试用不同的聚
局部聚类,并找到各个子聚类 的聚类中心 。
类个数进行聚类,这个过程效率低下,当在 比较多
的聚类个数存在 的情况下,聚类效果不尽人意。 三、数据结构
另外聚类问题实际上是一个寻求最优划分的问
本算法的数据结构通过树形结构来表示:整
题,一方面最优划分的标准有很多种,另一方面寻
体的聚类数据构建根结点,通过层次聚类的方法
找最优划分通常是复杂度很高的NP难题,一般
将产生的子聚类构成树的叶子结点,新的叶子结
只能给出近似最优解 ,因此如何适应不同的最优
点成为下次层次聚类的根结点。每一个结点表示
化 目标及高效地搜索近似最优解也是聚类算法需 一
个聚类,图1是结点的数据结构。
要解决的问题。
缩点 ’\ , 洼释 、
为了解决上述问题,本文提出一种基于中心
ID ID号
定位遗传算法 (geneticalgorithm withagene— Fa f F 父绪点ID
№ 成曼内容
Nu categories 宁
centerorientation,GCOGA)的动态层次聚类分
您可能关注的文档
最近下载
- 商务星球版2025-2026学年七年级下册地理教学工作计划(及进度表).docx
- TCL 移动空调KYR-35 KY使用说明书.pdf
- 工业机器人离线编程与仿真 教案 项目1--4 仿真软件的安装与工作站的构建---仿真软件的应用.docx VIP
- 人文艺术欣赏ppt课件(优质ppt).pptx VIP
- 伤口评估与护理记录PPT课件.pptx
- 骨科手术高龄患者并发症及相关护理措施-来源:现代养生(下半月版)(第2018001期)-河北省医疗气功医院.pdf VIP
- 小学一二年级全册体育教案.pdf VIP
- 大数据环境下网络安全问题探讨.doc VIP
- 论司法确认程序审查规则检视与优化.docx VIP
- 2022年中国社会科学院法律史考博真题、考博参考书,考博资料,难度分析.pdf VIP
原创力文档

文档评论(0)