- 15
- 0
- 约1.07万字
- 约 5页
- 2017-07-10 发布于浙江
- 举报
一种Hadoop平台下的树形聚类算法_张波
JournalofChineseComputerSystemsVol.37No.82016一种Hadoop平台下的树形聚类算法张波,徐蔚鸿,陈沅涛,朱玲(长沙理工大学计算机与通信工程学院,长沙410114)E-mai:653083866@qq.com摘要:针对现有算法在大数据背景下聚类效果差,以及由于迭代等原因导致处理性能低等问题,提出一种在Hadoop平台高效并行的聚类算法PAClustering.先提出一种基于权重的方法,将整体数据按分布划分成若干数据块,并针对每个数据块将紧凑的数据抽象成一个向量,形成微团,最后通过树形合并进行聚类,在提高聚类准确度的同时有效避免了传统算法在聚类过程中的迭代运算.在不同大小数据集上的实验表明,PAClustering算法不仅具有较高的聚类准确度和稳定性,同时具有良好的处理性能.关键词:大数据;Hadoop;并行聚类;微团;树形合并中图分类号:TP399文献标识码:A文章编号:1000-1220(2016)08-1770-05ArborescenceClusteringAlgorithmBasedonHadoopPlatformZHANGBo,XUWei-hong,CHENYuan-tao,ZHULing(SchoolofComputer&CommunicationEngineering,ChangshaUniversityofScience&T
您可能关注的文档
最近下载
- 石城县志(卷之1-9)蒋廷桂 主修,光绪18[1892]-7.pdf VIP
- B∕T 37758-2019 高矿化度矿井水处理与回用技术导则(高清可复制).pdf VIP
- 2025年四川教师招聘考试(数学专业知识)历年参考题库含答案详解.docx VIP
- 打屁股作文共九篇.doc VIP
- (2026年)实施指南《NBT 11030—2022 煤矿低浓度瓦斯发电机组通用要求》(2025年)实施指南.pptx VIP
- 【毕业论文致谢结尾】毕业论文致谢收尾.docx VIP
- (2026年)实施指南《NBT 51026-2014 煤矿矿井水深度处理 反渗透工艺技术要求》.pptx VIP
- 自动跟随智能小车的定位与跟随系统设计.doc VIP
- NSW毕设改.docx VIP
- 湖北武汉四中2025-2026学年高三下学期2月月考生物试卷 .docx VIP
原创力文档

文档评论(0)