- 70
- 0
- 约3.83千字
- 约 33页
- 2016-12-06 发布于湖北
- 举报
一个实验 所有实验都是在实验室搭建的Hadoop平台 上运行的.平台有5 台机器,都是四核Intel Corei3处理器,4GB内存.Hadoop版本0.20.2, java版本1.6.25.每台机器之间用千兆以太网 卡,通过交换机连接.实验所用的数据是人工数 据,维度是48维.为了测试算法的性能,实验中构 造了分别含有10^4,10^5,10^6,2*10^6 条 记录的数据来进行测试.由于KMeans算法中有 随机初始化中心点的操作,因此对每一组实验重 复执行25次,取其平均执行时间作为最终实验结 果 算法改进后的实效 可以看出:基于MapReduce的KMeans算法 的运行效率要远远高于传统的KMeans算法 QA LOGO The algorithm of Kmeans 小组成员:徐佳、张俊飞、刘志伟、孔祥玉 主要内容: Kmeans实战 聚类算法简介 Kmeans算法详解 Kmeans算法的缺陷及若干改进 Kmeans的单机实现与分布式实现策略 聚类算法简介 1 2 3 聚类的目标:将一组向量分成若干组,组内数据是相似的,而组间数据是有较明显差异。 与分类区别:分类与聚类最大的区别在于分类的目标事先已知,聚类也被称为无监督机器学习 聚类手段:传统聚类算法 ①划分法 ②层次方法 ③基于密度方法 ④基于网络方法 ⑤基于模型方法 什么是Kme
您可能关注的文档
最近下载
- AP宏观经济学 2004年真题 附答案和评分标准 AP Macroeconomics 2004 Real Exam with Answers and Scoring Guidelines.pdf VIP
- 五邑大学-本科-毕业论文-理科-格式模板范文.docx VIP
- 行政审批系统使用手册.pdf VIP
- 《透明式LED显示屏通用技术规范》.pdf
- 视频会议系统使用说明书.doc VIP
- 销售行业述职报告5篇.docx VIP
- 2026广东清远市阳山县融媒体中心招聘新闻人员4人备考题库及答案详解(最新).docx VIP
- 数据科学与大数据技术专业建设方案(汇报PPT).pptx
- 2025各地融媒体中心招聘笔试历年真题+模拟题答案汇总.doc VIP
- U盘接口芯片CH378在音乐播放器设计中的应用.pdf VIP
原创力文档

文档评论(0)