- 6
- 0
- 约2.81万字
- 约 4页
- 2018-12-20 发布于天津
- 举报
一种基于抽样的大规模混合数据聚类集成算法.PDF
第 43 卷第9 期 计算机科学 Vo1. 43 No.9
2016 年 9 月 Computer Science Sep 2016
一种基于抽样的大规模混合数据聚类集成算法
庞天杰1 梁吉业1 , 2
(太原师范学院计算机系 太原 030619)1
(山西大学计算智能与中文信息处理教育部重点实验室 太原 030006)2
摘 要 混合数据聚类是聚类分析中一个重要的问题。现有的混合数据聚类算法主要是在全体样本的相似性度量的
基础上进行聚类,因此对大规模数据进行聚类时,算法效率不高。基于此,设计了一种新的抽样策略,在此基础上,提
出了一种基于抽样的大规模混合数据聚类集成算法。该算法对利用新的抽样策略得到的多个样本子集分别进行聚
类,并将结果集成得到最终聚类结果。实验证明,与改进的 K-prototypes 算法相比,该算法的效率有了显著提高,同时
聚类有效性指标基本相同。
关键词 聚类,大规模混合数据,聚类集成,抽样,有效性指标
中图法分类号 TP391 文献标识码 A 001 10. 11896/j. issn. 1002-137叉 2016.9.041
Clustering Ensemble Algorithm for Large-scale Mixed Data ßased on Sampling
1 1 2
PANG Tian-jie LIANG li-ye •
(Department of Computer Science ,Taiyuan Normal University ,Taiyuan 030619 ,China)1
(Key Laboratory of Computational Intelligence and Chinese Info口nation Processing of Ministry of Education ,
Shanxi University ,Taiyuan 030006 ,China) 2
Abstract In clustering analysis ,one of the important problems is mixed data clustering. The clustering of existing algo
rithms is mainly based on similarity measurement of all samples. Therefore , the efficiency of clustering for large-scale
data is not high. so we designed a new sampling strategy and proposed an ensemble algorithm for large-scale mixed data
based on sampling. This new algorithm clusters subsets which are obtained by the use of the new sampling strategy re
spectively and the final clustering results can be gotten by clustering ensemble. Experiment shows that the efficiency of
algorithm is improved significantl
您可能关注的文档
- GsBP气相色谱柱.doc
- GUCY1A3基因位点rs7692387单核苷酸多态性与冠状动脉粥样硬化性.PDF
- HBV感染与非霍奇金淋巴瘤的关系-ChineseJournalofCancer.PDF
- INCONTROLTOUCHMAPUPDATER的用户指南-Jaguar.PDF
- LoopAnalysis回路电流法.ppt
- MARS检索流程.ppt
- MTTM系列涡轮流量计.doc
- NDJSNB系列旋转粘度计使用说明书.PDF
- OneNET平台接入流程简述.PDF
- PDF430.10K-海洋科学.PDF
- (正式版)DB51∕T 1867-2014 《袋栽黑木耳生产技术规程》.docx
- (正式版)DB51∕T 2413-2023 《油橄榄密植丰产栽培技术规程》.docx
- (正式版)DB51∕T 2436-2017 《川菜东坡一品肉烹饪工艺技术规范》.docx
- (正式版)DB51∕T 2396-2017 《农村电子商务服务站(点)服务与管理规范》.docx
- (正式版)DB51∕T 2419-2017 《桢楠扦插育苗技术规程》.docx
- CN105145773B 一种无花果曲奇饼干及其制作方法 (江苏农林职业技术学院).docx
- CN105203825A 微测量电极的制作方法和热电势的测量方法及相关装置 (国家纳米科学中心).docx
- CN105137533B 一种啁啾光纤光栅及其制作方法 (南京航空航天大学).docx
- (正式版)DB51∕T 2453-2018 《巴山新居公共管理指南》.docx
- (正式版)DB51∕T 1892-2014 《川西北地区沙化土地治理技术规程》.docx
原创力文档

文档评论(0)