Chap5-3 聚类分析.pptxVIP

  • 34
  • 0
  • 约1.54万字
  • 约 42页
  • 2016-08-21 发布于湖北
  • 举报
Chap5-3 聚类分析

Taking obstacles into accountNot Taking obstacles into account5.3 聚类分析Cluster analysis目录基本概念 划分方法( K-均值, K-中心点) 层次方法 (BIRCH,CHAMELEON )基于密度的方法 基于格网的方法 高级聚类分析聚类评估 1. 基本概念AAKKQQJJAAKKQQJJ簇: 一个数据对象集合。簇中对象彼此相似; 与其他簇不相似聚类分析:将对象分为相对同质群组的统计分析技术分类与聚类的区别分类:用已知类别的样本训练集来设计分类器聚类:事先不知样本类别,利用样本先验知识来构造分类器聚类分析的基本思想n个样品的p个指标样品号x1x2…xp123…n样品聚类(Q)变量(指标)聚类(R)相似系数最大的原则距离最近的原则距离计算……闵可夫斯基距离 欧氏距离(L2 norm) 曼哈顿距离(city block, L1 norm) 上确界距离(Lmax norm, L? norm) 距离度量XXXXXXXX单链接:两簇元素间的最小距离全链接:两簇元素间的最大距离平均距离:两簇元素间的平均距离中心点距离:两簇的中心点的距离簇的中心、半径和直径 中心 半径直径2. 划分方法 将包含n个对象的数据集 D 分配到k 个簇,所有对象Ci 和形心之间的误差平方和最小 给定 k,划分k簇的优化算法:K-均值(k-

文档评论(0)

1亿VIP精品文档

相关文档