- 5
- 0
- 约1.45万字
- 约 4页
- 2019-04-08 发布于天津
- 举报
计 算 机 系 统 应 用 2011 年 第 20 卷 第 1 期
①
基于KD 树子样的聚类初始化算法
潘章明
(广东金融学院 计算机科学与技术系,广州 510521)
摘 要: 在处理大数据集聚类初始化问题时,随机子样法是一种重要的数据约简操作。对随机取样的过程、特征
及缺陷进行了分析,提出一种基于 KD 树子样的聚类初始化方法。该方法利用 KD 树将样本空间以递归方式细分
成多个子空间,并分别在各子空间中随机取样形成 KD 树子样,有效避免了随机子样分布有偏的不足,使得子样
中好的聚类初始点也能很好的表达整个数据集的聚类结构。仿真结果表明,该方法选择的聚类初始点更加接近
期望的聚类中心,能获得更高的聚类精度。
关键词: 聚类初始化;KD 树;子样;K 均值算法
Initialization Algorithm of Clustering Using Subsample for KD-Tree
PAN Zhang-Ming
(Department of Computer Science and Technology, Guangdong University of
原创力文档

文档评论(0)