基于kd树子样的聚类初始化算法①.pdfVIP

  • 5
  • 0
  • 约1.45万字
  • 约 4页
  • 2019-04-08 发布于天津
  • 举报
计 算 机 系 统 应 用 2011 年 第 20 卷 第 1 期 ① 基于KD 树子样的聚类初始化算法 潘章明 (广东金融学院 计算机科学与技术系,广州 510521) 摘 要: 在处理大数据集聚类初始化问题时,随机子样法是一种重要的数据约简操作。对随机取样的过程、特征 及缺陷进行了分析,提出一种基于 KD 树子样的聚类初始化方法。该方法利用 KD 树将样本空间以递归方式细分 成多个子空间,并分别在各子空间中随机取样形成 KD 树子样,有效避免了随机子样分布有偏的不足,使得子样 中好的聚类初始点也能很好的表达整个数据集的聚类结构。仿真结果表明,该方法选择的聚类初始点更加接近 期望的聚类中心,能获得更高的聚类精度。 关键词: 聚类初始化;KD 树;子样;K 均值算法 Initialization Algorithm of Clustering Using Subsample for KD-Tree PAN Zhang-Ming (Department of Computer Science and Technology, Guangdong University of

文档评论(0)

1亿VIP精品文档

相关文档