聚类:概要与基于MapReduce的简单实现.pptVIP

  • 1
  • 0
  • 约小于1千字
  • 约 53页
  • 2017-04-22 发布于湖北
  • 举报

聚类:概要与基于MapReduce的简单实现.ppt

聚类:概要与基于MapReduce的简单实现

聚类:概要与基于MapReduce的简单实现 ;摘要;什么是聚类?;;医院记录 科学图像 生物学家探索DNA的组合, 天文图像分析 市场研究 市场与产品定位 社会网络分析 知识发现 网页搜索引擎…;集合中两元素之间的相似度可以通过以下方法来计算: 欧几里德(Euclidean)距离 曼哈坦(Manhattan)距离 切比雪夫(Chebyshev)距离 点积空间 或其它自定义的距离量度…;算法分类;层次聚类;同时把数据集分配到所有簇中. ;划分聚类;K-Means聚类 ;K-Means聚类;但是!;此外;Canopy聚类;Canopy聚类;canopy聚类之后…;MapReduce实现: ;距离量度;步骤!;数据传递;选择canopy中心;把数据分配到Canopy中;K-Means Map;Elbow准则;总结

文档评论(0)

1亿VIP精品文档

相关文档