- 5
- 0
- 约2.23万字
- 约 6页
- 2015-07-21 发布于重庆
- 举报
基于网格和最近邻居的聚类算法.pdf
第 17卷 第 1期 计 算 机 辅 助 工 程 Vol. 17 No. 1
2008年 3月 Compu ter A ided Engineering M ar. 2008
文章编号 : 1006 - 087 1 (2008) 0 1008106
基于网格和最近邻居的聚类算法
陈义如 , 孙广中 , 许胤龙
(中国科学技术大学 省部共建高性能计算与应用重点实验室 ,合肥 230027)
摘 要 : 针对 目前已有的聚类算法不能很好地处理包含不同密度的簇数据 ,或者不能很好地区分
相邻的密度相差不大的簇的问题 ,提出 1种新的基于严格最近邻居和共享最近邻居的聚类算法.
通过构造共享严格最近邻图 ,使样本点在密度一致的区域保持连接 ,而在密度不同的相邻区域断开
连接 ,并尽可能去除噪声点和孤立点. 该算法可以处理包含有不同密度的簇数据 ,而且在处理高维
数据时具有较低的时间复杂度. 实验结果证明 ,该算法能有效找出不同大小 、形状和密度的聚类.
关键词 : 聚类算法 ; 相似度 ; 密度 ; 网格 ; 最近邻居
中图分类号 : TP30 1. 6 文献标志码 : A
C luster ing a lgor ithm ba sed on gr id and nearest ne ighbors
CH EN Yiru , SUN Guangzhong, XU Yin long
(A nhu i ProvinceMO ST Key CoL ab of H igh Perform ance Comp uting and its App lication,
U n iv. of Sci. Tech. of Ch ina, H efei 230027, Ch ina)
A b stract: Due to the fact that the cu rren t clu stering algorithm s can not p erform well wh ile p roce ssing
clu stering data sets wh ich con tain clu sters w ith d ifferen t den sitie s or distingu ish ing adjacen t clu sters w ith
sim ilar den sitie s, a new clu stering algorithm is p ropo sed ba sed on strict neare st neighbors and shared nea
re st neighbors. The algorithm keep s the link s in region s of un iform den sity and b reak s the link s in region s
of d ifferen t den sity and remove s the no ise s and iso lated po in ts by con structing the shared strict neare st
neighbor grap h. It p roce
原创力文档

文档评论(0)