- 0
- 0
- 约3.83千字
- 约 33页
- 2017-10-18 发布于浙江
- 举报
大数据十的大经典算法讲解1
一个实验 所有实验都是在实验室搭建的Hadoop平台 上运行的.平台有5 台机器,都是四核Intel Corei3处理器,4GB内存.Hadoop版本0.20.2, java版本1.6.25.每台机器之间用千兆以太网 卡,通过交换机连接.实验所用的数据是人工数 据,维度是48维.为了测试算法的性能,实验中构 造了分别含有10^4,10^5,10^6,2*10^6 条 记录的数据来进行测试.由于KMeans算法中有 随机初始化中心点的操作,因此对每一组实验重 复执行25次,取其平均执行时间作为最终实验结 果 算法改进后的实效 可以看出:基于MapReduce的KMeans算法 的运行效率要远远高于传统的KMeans算法 QA LOGO The algorithm of Kmeans 小组成员:徐佳、张俊飞、刘志伟、孔祥玉 主要内容: Kmeans实战 聚类算法简介 Kmeans算法详解 Kmeans算法的缺陷及若干改进 Kmeans的单机实现与分布式实现策略 聚类算法简介 1 2 3 聚类的目标:将一组向量分成若干组,组内数据是相似的,而组间数据是有较明显差异。 与分类区别:分类与聚类最大的区别在于分类的目标事先已知,聚类也被称为无监督机器学习 聚类手段:传统聚类算法 ①划分法 ②层次方法 ③基于密度方法 ④基于网络方法 ⑤基于模型方法 什么是Kme
您可能关注的文档
- 城市综合的治安监控系统.ppt
- 城市轨道的交通安全管理之安全文化.ppt
- 城市轨道的交通工程风险管理.ppt
- 城市认知的地图.pptx
- 城市道路的纵断面线型规划设计1.ppt
- 城市轨道的交通车辆限界.ppt
- 城市轨道的交通结构设计与施工4第四章.ppt
- 城市轨道的交通车辆 中国北车.ppt
- 城市道路的纵断面线型规划设计.ppt
- 城市轨道的交通车辆与结构(第一章车辆形式、组成、限界).ppt
- 2024-2025学年湖南省邵阳市新宁县回龙寺镇人教版一年级下册期中测试数学试卷.docx
- 2024-2025学年山东省德州市平原县王杲铺中小、王凤楼中小、腰站镇中小青岛版一年级下册3月月考数学试卷.docx
- 第四单元 课题3 物质组成的表示-初中化学新教材预习学案(人教版2024九年级上册).docx
- 2024-2025学年山东省济宁市梁山县人教版一年级下册期中测试数学试卷.docx
- 2024-2025学年山东省德州市德州经济技术开发区长河小学等校青岛版一年级下册期中考试数学试卷.docx
- 2026《基于国产开源单片机GD32VF103的输变电设备物联网传感器设计》8300字.docx
- 2024年中考道德与法治真题完全解读(北京卷).docx
- 2026《基于机器视觉识别的工件边缘曲线重构方法分析》9000字.docx
- 课时9.4 物体的浮与沉【一大题型】八年级全一册物理(沪科版2024).docx
- 2024-2025学年广东省江门市开平市人教版一年级下册期中综合素养评价数学试卷.docx
最近下载
- 农产品市场细分与定位.ppt VIP
- (2026春新版)大象版三年级科学下册3.1《食物中的营养》PPT课件.pptx VIP
- 电子元器件识别与检测电子元器件识别与检测.pptx VIP
- GBZT201.2-2011 放射治疗机房的辐射屏蔽规范 第2部分:电子直线加速器放射治疗机房.pdf VIP
- 人教版数学六年级下册:圆柱和圆锥单元测试题.docx VIP
- 临床试验项目经理.pptx VIP
- 【精品】校企合作协议.doc VIP
- 2026年盐城工业职业技术学院单招《数学》通关题库及参考答案详解【培优B卷】.docx VIP
- 临床复用器械、器具及物品的预处理PPT.pptx
- 2025年初级注册安全工程师试卷及答案.docx VIP
原创力文档

文档评论(0)