商务智能理论与应用6- 数据聚类.pptVIP

  • 4
  • 0
  • 约1.88千字
  • 约 20页
  • 2017-01-30 发布于湖北
  • 举报
数据仓库与数据挖掘 数据仓库与数据挖掘 * 数据仓库与数据挖掘 * 数据聚类 * 数据仓库与数据挖掘 * 6.1 引例 聚类分析的定义 聚类分析是将物理的或者抽象的数据集合划分为多个类别的过程,聚类之后的每个类别中任意两个数据样本之间具有较高的相似度,而不同类别的数据样本之间具有较低的相似度 * 数据仓库与数据挖掘 * 6.1 引例 聚类分析示例数据集 样本序号 描述属性1 描述属性2 x1 1 3 x2 1 6.5 x3 1.5 4 x4 4.5 7.5 x5 4 8.5 x6 5.5 9 x7 4.5 8 聚类分析的数据集没有类别属性 * 数据仓库与数据挖掘 * 6.2 聚类分析概述 数据挖掘技术对聚类分析的要求: 可伸缩性 处理不同类型属性的能力 发现任意形状聚类的能力 减小对先验知识和用户自定义参数的依赖性 处理噪声数据的能力 可解释性和实用性 * 数据仓库与数据挖掘 * 6.2 聚类分析概述 通常聚类算法可以分为以下几类: 划分聚类方法 层次聚类方法 基于密度的聚类方法 基于网格的聚类方法 * 数据仓库与数据挖掘 * 6.3 聚类分析中相似度的计算方法 6.3.1 连续型属性的相似度计算方法 6.3.2 二值离散型属性的相似度计算方法 6.3.3 多值离散型属性的相似度计算方法 6.3.4 混合类型属性的相似度计算方法 * 数据仓库与数据

文档评论(0)

1亿VIP精品文档

相关文档