CLOPE-快速有效的聚类算法【荐】.docVIP

  • 38
  • 0
  • 约4.63千字
  • 约 15页
  • 2015-07-19 发布于河南
  • 举报
CLOPE-快速有效的聚类算法【荐】.doc

CLOPE:针对交易的数据快速有效聚类算法 摘要 本文研究分类数据的聚类问题,特别针对多维和大型的交易数据。从增加聚簇直方图的高宽比的方法得到启发,我们开发了一种新的算法---CLOPE,这是一种非常快速、可伸缩,同时又非常有效的算法。我们展示了算法两个现实数据集聚类的技术k-means[11]和CLARANS[12]都是对低维的数值型数据有效。但是对于高维分类数据的处理效果却通常不那么令人满意[7]。像ROCK这类的分层聚类算法在分类数据聚类中表现的非常有效,但是他们在处理大型数据库时表现出先天的无效。 LargeItem[13]算法通过迭代优化一个全局评估函数对分类数据进行聚类。这个评估函数是基于大项概念的,大项是在一个聚簇内出现概率比一个用户自定义的参数——最局部评估函数是根据相似性定义的方法小的,其中包含交易数据这些结果显示为几何上的直方图LUSTERING WITH SLOPE(具有倾斜的聚类) 符号:在整篇文章中,我们使用以下符号。交易数据集D是一组交易{t1, ...,tn}的集合。每条交易是一些项{i1, ..., im}的集合。一个聚簇{C1, ... Ck}是{t1, ..., tn}的一个划分,也就是说,C1 ∪ … ∪ Ck ={t1, ..., tn}而且对任意1?≤?i,?j?≤?k,满足Ci ≠ φ ∧ Ci∩Cj = φ。每一个Ci叫做一

文档评论(0)

1亿VIP精品文档

相关文档