第五章 信息整序法1.pptVIP

  • 0
  • 0
  • 约4.67千字
  • 约 45页
  • 2018-05-22 发布于江苏
  • 举报
第五章 信息整序法1

聚类分析原理介绍 相似性Similar的度量(统计学角度) 距离Q型聚类(主要讨论) 主要用于对样本分类 常用的距离有(只适用于具有间隔尺度变量的聚类): 明考夫斯基距离(包括:绝对距离、欧式距离、切比雪夫距离) 兰氏距离 马氏距离 斜交空间距离 此不详述,有兴趣可参考《应用多元分析》(第二版)王学民 相似系数R型聚类 用于对变量分类,可以用变量之间的相似系数的变形如1-rij定义距离 这里不详细介绍这种聚类度量方法 聚类分析原理介绍 变量按测量尺度(Measurement Level)分类 间隔(Interval)尺度变量 连续变量,如长度、重量、速度、温度等 有序(Ordinal)尺度变量 等级变量,不可加,但可比,如一等、二等、三等奖学金 名义(Nominal)尺度变量 类别变量,不可加也不可比,如性别、职业等 凝聚的方法 一开始将每个对象作为单独的一组,然后根据同类相近,异类相异的原则,合并对象,直到所有的组合并成一个,或达到一个终止条件为止。 分裂的方法 一开始将所有的对象置于一类,在迭代的每一步中,一个类不断地分为更小的类,直到每个对象在单独的一个类中,或达到一个终止条件。 定义:对给定的数据进行层次的分解 等级聚类法(hierarchical method) 广泛采用的类间距离: 最小距离法(single linkage method) 极小异常值在实际中

文档评论(0)

1亿VIP精品文档

相关文档