基于网格和最近邻居的聚类算法.pdfVIP

  • 5
  • 0
  • 约2.23万字
  • 约 6页
  • 2015-07-21 发布于重庆
  • 举报
基于网格和最近邻居的聚类算法.pdf

第 17卷 第 1期 计 算 机 辅 助 工 程 Vol. 17 No. 1 2008年 3月 Compu ter A ided Engineering M ar. 2008 文章编号 : 1006 - 087 1 (2008) 0 1008106 基于网格和最近邻居的聚类算法 陈义如 ,  孙广中 ,  许胤龙 (中国科学技术大学 省部共建高性能计算与应用重点实验室 ,合肥  230027) 摘  要 : 针对 目前已有的聚类算法不能很好地处理包含不同密度的簇数据 ,或者不能很好地区分 相邻的密度相差不大的簇的问题 ,提出 1种新的基于严格最近邻居和共享最近邻居的聚类算法. 通过构造共享严格最近邻图 ,使样本点在密度一致的区域保持连接 ,而在密度不同的相邻区域断开 连接 ,并尽可能去除噪声点和孤立点. 该算法可以处理包含有不同密度的簇数据 ,而且在处理高维 数据时具有较低的时间复杂度. 实验结果证明 ,该算法能有效找出不同大小 、形状和密度的聚类. 关键词 : 聚类算法 ; 相似度 ; 密度 ; 网格 ; 最近邻居 中图分类号 : TP30 1. 6   文献标志码 : A C luster ing a lgor ithm ba sed on gr id and nearest ne ighbors CH EN Yiru , SUN Guangzhong, XU Yin long (A nhu i ProvinceMO ST Key CoL ab of H igh Perform ance Comp uting and its App lication, U n iv. of Sci. Tech. of Ch ina, H efei 230027, Ch ina) A b stract: Due to the fact that the cu rren t clu stering algorithm s can not p erform well wh ile p roce ssing clu stering data sets wh ich con tain clu sters w ith d ifferen t den sitie s or distingu ish ing adjacen t clu sters w ith sim ilar den sitie s, a new clu stering algorithm is p ropo sed ba sed on strict neare st neighbors and shared nea re st neighbors. The algorithm keep s the link s in region s of un iform den sity and b reak s the link s in region s of d ifferen t den sity and remove s the no ise s and iso lated po in ts by con structing the shared strict neare st neighbor grap h. It p roce

文档评论(0)

1亿VIP精品文档

相关文档