- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
36 卷 6 期 四川大学学报 (工程科学版) Vol.36 No.6
2004 年11 月 JOURAL OF SICHAUN UNIVERSITY (ENGINEERING SICENCE EDITION) Nov. 2004
基于最近邻优先的高效聚类算法1
1 1 1,2 1,3 1 4
胡建军 唐常杰 李川 彭京 元昌安 陈安龙 蒋永光
1 2
(四川大学计算机学院,成都610064) ) (成都市公安局科技处,成都 610017 )
3 (广西师范学院信息技术系,南宁,530001).4 成都中医药大学 四川成都610075
{huji anj un ,tangchangjie }@cs.scu.edu.cn
摘要:高维空间中的任意形状的多层次聚类,是数据挖掘领域中一个具有挑战性的问题。针对这一问题,
基于 “同类相近”的思想,提出并实现了最近邻优先聚类算法NNAF (Nearest Neighbors Absorbed First)算
法。主要工作包括:(1)证明了最近邻点搜索定理,基于这一定理又提出了SNN(Searching Nearest Neighbors)
算法和GSNN(Grid-based Searching Nearest Neighbors)算法,其时间复杂度为O(n*log(n)) ,当用扫描图像所
得数据时,时间复杂度会降为O(n) ;而使用传统的搜索算法,时间复杂度为O(n 2 ) ;(2 )提出了实现任意
形状高维空间聚类的NNAF 算法,时间复杂度为O(n) ;(3 )提出了MLCA(Multi -Layer Cluster Algorithm)
算法并证明了两个相关的定理,在改变阈值后重新聚类时,使用MLCA 算法可以节省90% 以上的时间。实
验结果显示,以上算法适应于任意形状的高维空间数据的聚类,可以有效过滤噪声数据,且用户需要的先
验知识少、可快速获得各种层次的聚类结果。
关键词:数据挖掘;聚类分析;最近邻优先;多层次聚类
中图分类号:TP311.13 文献标识码:A
A Efficient Multi-Layer Clustering Algorithm Based on Nearest Neighbors
First
1 1 1 1,2 1,3 1
HU Jian-jun , TANG Chang-jie , LI Chuan , PENG Jing , YUAN Chang-an , CHEN An-long
1
(Computer School, Sichuan University, Chengdu 610064, China)
2
(Department of Science and Technology, Chengdu Public Security Bureau, Chengdu 610017,China)
3
(Department of Information Technology, Guangxi Teachers Education University, Nanning, Guangxi
530001,China)
Abstract: The mu
文档评论(0)