- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS软件聚类分析过程的图文解释及结果的全
面分析
SPSS聚类分析过程
聚类的主要过程一般可分为如下四个步骤:
1. 数据预处理(标准化)
2. 构造关系矩阵(亲疏关系的描述)
3. 聚类(根据不同方法进行分类)
4. 确定最佳分类(类别数)
SPSS软件聚类步骤
1. 数据预处理(标准化)
→Analyze →Classify →Hierachical Cluster
Analysis →Method 然后从对话框中进行如
下选择
从 Transform Values 框中点击向下箭头,此为
标准化方法,将出现如下可选项, 从中选一即可:
标准化方法解释: None:不进行标准化,这是系
统默认值; Z Scores :标准化变换; Range –1 to
*
1:极差标准化变换( 作用:变换后的数据均值为 0 ,极差为 1,且 | xij |1 ,消
去了量纲的影响;在以后的分析计算中可以减少误差的产生。 );Range0 to 1 (极
差正规化变换 / 规格化变换);
2. 构造关系矩阵
在 SPSS中如何选择测度(相似性统计量) :
→Analyze →Classify →Hierachical Cluster
Analysis →Method 然后从对话框中进行如
下选择
常用测度(选项说明) :Euclidean distance :
欧氏距离(二阶 Minkowski 距离),用途:聚类
分析中用得最广泛的距离; Squared Eucidean
distance :平方欧氏距离; Cosine :夹角余弦 ( 相
似性测度; Pearson correlation :皮尔逊相关
系数;
3. 选择聚类方法
SPSS中如何选择系统聚类法
常用系统聚类方法
a)Between-groups linkage 组间平均距离连接
法
方法简述:合并两类的结果使所有的两两项对之
间的平均距离最小。 (项对的两成员分属不同类)
特点:非最大距离,也非最小距离
b)Within-groups linkage 组内平均连接法
方法简述: 两类合并为一类后, 合并后的类中所
有项之间的平均距离最小
C)Nearest neighbor 最近邻法(最短距离法)
方法简述:用两类之间最远点的距离代表两类之
间的距离,也称之为完全连接法
d)Furthest neighbor 最远邻法(最长距离法)
方法简述:用两类之间最远点的距离代表两类之
间的距离,也称之为完全连接法
e)Centroid clustering 重心聚类法
方法简述:两类间的距离定义为两类重心之间的
距离,对样品分类而言, 每一类中心就是属于该
类样品的均值
特点:该距离随聚类地进行不断缩小。 该法的谱
系树状图很难跟踪, 且符号改变频繁, 计算较烦。
f )Median clustering 中位数法
方法简述:两类间的距离既不采用两类间的最近
距离,也不采用最远距离, 而采用介于两者间的
距离
特点:图形将出现递转,谱系树状图很
文档评论(0)