- 4
- 0
- 约 15页
- 2015-12-24 发布于安徽
- 举报
CLOPE:针对交易的数据快速有效聚类算法
摘要
本文研究分类数据的聚类问题,特别针对多维和大型的交易数据。从增加聚簇直方图的高宽比的方法得到启发,我们开发了一种新的算法---CLOPE,这是一种非常快速、可伸缩,同时又非常有效的算法。我们展示了算法两个现实数据集聚类的技术k-means[11]和CLARANS[12]都是对低维的数值型数据有效。但是对于高维分类数据的处理效果却通常不那么令人满意[7]。像ROCK这类的分层聚类算法在分类数据聚类中表现的非常有效,但是他们在处理大型数据库时表现出先天的无效。
LargeItem[13]算法通过迭代优化一个全局评估函数对分类数据进行聚类。这个评估函数是基于大项概念的,大项是在一个聚簇内出现概率比一个用户自定义的参数——最局部评估函数是根据相似性定义的方法小的,其中包含交易数据这些结果显示为几何上的直方图LUSTERING WITH SLOPE(具有倾斜的聚类)
符号:在整篇文章中,我们使用以下符号。交易数据集D是一组交易{t1, ...,tn}的集合。每条交易是一些项{i1, ..., im}的集合。一个聚簇{C1, ... Ck}是{t1, ..., tn}的一个划分,也就是说,C1 ∪ … ∪ Ck ={t1, ..., tn}而且对任意1?≤?i,?j?≤?k,满足Ci ≠ φ ∧ Ci∩Cj = φ。每一个Ci叫做一
您可能关注的文档
最近下载
- The-Policy-Implementation-Process(政策执行过程英文版原文-托马斯·B·史密斯).pdf VIP
- _七彩虹RTX3070-GA104H8-E70原理图电路图、图纸参考.pdf VIP
- _七彩虹RTX3070-GA104H8-E70位置图电路图、图纸参考.pdf VIP
- 中职《餐饮服务与管理》考试题(附答案).doc VIP
- 园艺专业机测题目及答案.docx VIP
- 胡希恕经方医学理论体系.pptx
- 单招江苏语文试卷及答案.doc VIP
- 语文单招试卷.docx VIP
- 常州市九洲JSD08伺服说明书.pdf VIP
- 2026年正德职业技术学院单招《数学》真题及答案详解(真题汇编).docx VIP
原创力文档

文档评论(0)