- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于多维空间超球体的快速聚类算法
第38 卷第6 期 南 京 航 空 航 天 大 学 学 报 V o l. 38 N o. 6
2006 年 12 月 Jou rn a l o f N anj in g U n iver sity o f A eron au t ics A st ron au t ics D ec. 2006
一种基于多维空间超球体的快速聚类算法
吕宗磊 王建东
(南京航空航天大学信息科学与技术学院, 南京, 2 100 16)
摘要: 提出了一种基于多维空间超球体的快速聚类算法。这种算法结合密度聚类和层次聚类两种思想。首先利用
密度聚类方法将小范围内的数据对象聚合成超球体, 然后再按照层次聚类中的凝聚思想, 根据超球体之间的位
置关系产生最终聚类。实验表明, 该算法对于数值型数据集不仅在效率、噪声敏感性等方面均有较好的表现, 同
时还可以通过诸如“双环测试”等带有刁难性的特殊测试集。以往, 常常简单的以距离来刻画的数据间“相似性”,
而所提出的快速聚类算法则改由超球体之间连接的紧密程度来描述这种性质。实验表明, 这种修改使得算法的
性能得到了很好的改善。
关键词: 数据挖掘; 聚类算法; 密度; 超球体
中图分类号: T P 181 文献标识码: A 文章编号: 100526 15 (2006)
Fa st C luster in g A lgor ithm Ba sed on Hyper sphere of
M ult id im en s iona l Space
L ü Z ong le i, W ang J iand ong
(Co llege o f In fo rm at ion Scien ce an d T echno logy, N anj ing U n iver sity o f A eron au t ics
A st ron au t ics, N anj ing, 2 100 16, Ch in a)
A bstract: A fa st clu ster in g a lgo r ithm b a sed on hyp er sp h ere o f th e m u lt id im en sion a l sp ace is p re sen ted.
. ,
T h e clu ster in g m etho d com b in e s th e den sity an d th e h ierarch ica l clu ster in g m etho d s F ir st ly it m ak e s
th e hyp er sp h ere s by th e data in a sm a ll area. T h en it w o rk s acco rd in g to th e agg lom erat ive h ierarch ica l
clu ster in g m etho d. T h e f in a l clu ster related to th e relat ion sh ip o f d ifferen t hyp er sp h ere s is p ro du ced.
Exp er im en t s show th at th e a lgo r ithm h a s don e w ell in th e eff icien c
文档评论(0)