数据挖掘-p09-聚类.pptVIP

  • 24
  • 0
  • 约4.66千字
  • 约 53页
  • 2018-01-21 发布于河北
  • 举报
数据挖掘-p09-聚类

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 第9章 聚类分析 9.1 聚类概述 9.2 聚类分析中的相似度计算 9.3 基于划分的聚类方法 9.4 基于层次的聚类算法 9.5 谱聚类方法 9.6 利用SQL Server 2005进行聚类分析 * 聚类结果应满足条件 给定一个n 个对象或元组的数据源,划分方法将数据构建k 个划分,每个划分表示一个聚簇,并且 k≤n,同时满足如下要求: (1)每个组至少包含一个对象 (2)每个对象必须属于一个组 * 划分聚类方法聚类时的要点: 划分聚类方法聚类时的要点: 选定某种距离作为数据样本间的相似性度量 选择评价聚类性能的准则函数 选择某个初始分类,之后用迭代的方法得到聚类结果,使得评价聚类的准则函数取得最优值 * 9.3.1 k-平均聚类算法 基本思想: 将各个聚类子集内的所有数据样本的均值作为该聚类的代表点 通过迭代过程把数据集划分为不同的类别,使得评价聚类性能的准则函数达到最优,从而使生成的每个聚类类内紧凑,类间独立 * k-平均聚类算法描述 * 9.3.2 k-中心点算法 基本思想: 选择簇中最接近簇中心的对象作为簇的代表点 通过迭代过程把数据集划分为不同的类别,同时不断调整簇的代表点,以改进进行聚类的质量 * k-中心点算法描

文档评论(0)

1亿VIP精品文档

相关文档