第九章 聚类分析.pptVIP

  • 29
  • 0
  • 约8.93千字
  • 约 90页
  • 2017-09-05 发布于江苏
  • 举报
* K-中心点聚类算法 每当重新分配发生时,替换的总代价是所有非中心对象产生的代价之和: 如果总代价是负的,则Oj可被Orandom代替; 否则,则认为当前的中心点Oj是可接受的,在本次迭代中没有变化。 * K-中心点聚类算法 * 两种划分方法的关系 关系: k-中心点方法比k-均值方法更健壮,因为其不易受到极端数据的影响; 但k-中心点方法比k-均值方法的执行代价高; 两种方法都需要用户提前指定聚类结果的数目k。 9.5 基于层次的聚类方法 大体上,主要的聚类算法可以划分为如下几类: (1)划分方法; (2)层次方法; (3)基于密度的方法; (4)基于网格的方法; (5)基于模型的方法。 * 层次方法 层次方法: 该方法对给定的数据对象集合进行层次分解,根据层次分解的方式,层次的方法被分为凝聚的和分裂的: 凝聚层次方法:也称自底向上方法,一开始将每个对象作为单独的一组,然后相继地合并相近的对象或组,直到所有的组合并为一个,或达到某个终止条件,代表:AGNES算法; 分裂层次方法:也称自顶向下方法,一开始所有对象置于一个簇中,在迭代的每一步,一个簇被分裂为更小的簇,直到最终每个对象单独为一个簇,或达到某个终止条件,代表:DIANA算法。 * * 距离计算方法 AGNES算法 AGNES 算法:最初将每个对象作为一个簇,然后这些簇根据某些准则被一步步地合并

文档评论(0)

1亿VIP精品文档

相关文档