第8章 因子分析与聚类分析(含SPSS)精要.pptVIP

  • 16
  • 0
  • 约 55页
  • 2017-05-09 发布于湖北
  • 举报

第8章 因子分析与聚类分析(含SPSS)精要.ppt

第8章 因子分析与聚类分析(含SPSS)精要

(三)聚类分析的几点说明 1、所选择的变量应符合聚类的要求 可根据实际工作经验和所研究问题的特征人为的选择变量,这些变量应该和分析的目标密切相关,反映分类对象的特征。 2、各变量的变量值不应有数量级上的差异 为了避免对变量单位选择的依赖,数据应当标准化。 3、各变量间不应有较强的线性相关关系 如果所选变量之间存在较高的线性关系,有两种处理方法:(1)首先进行变量聚类,从每类中选一代表性变量,再进行样本聚类;(2)进行主成分分析或因子分析,降维,使之成为不相关的新变量,再进行样本聚类。 二、聚类分析中“亲疏程度”的度量 (一)个体间“亲疏程度”的度量 聚类分析中,对“亲疏程度”的测度一般有两个角度:第一,个体之间的相似程度;第二,个体之间的差异程度。在SPSS中,对不同度量类型的数据采用了不同的测定亲疏程度的统计量。 1、定距型变量个体间距离的计算方式 通常有欧式距离(Euclidean distance)、平方欧式距离(Squared Euclidean distance)、夹角余弦(Cosine)距离、相关系数距离(Pearson correlation)、切比雪夫距离(Chebychev:Chebychev)、Block距离(City-Block )或Manhattan 距离、明考斯基距离(Minkows

文档评论(0)

1亿VIP精品文档

相关文档