- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
SPSS聚类分析过程
聚类的主要过程一般可分为如下四个步骤:
1.数据预处理(标准化)
2.构造关系矩阵(亲疏关系的描述)
3.聚类(根据不同方法进行分类)
4.确定最佳分类(类别数)
SPSS软件聚类步骤
1.数据预处理(标准化)
→Analyze(分析)→Classify(分类,归类)→HierachicalClusterAnalysis(层序聚类分析)→Method
(方法,条理,)然后从对话框中进行如下选择
从TransformValues框中点击向下箭头,此为标准化方法,将出现如下可选项,从中选一即
可:
标准化方法解释:None:不进行标准化,这是系统默认值;ZScores(
Z-Scores,英文名又叫
StandardizedPopulationData,是以标准差单位来表现的一组观察值):标准化变换;Range–1to
1:极差标准化变换(作用:变换后的数据均值为0,极差为1,且|x*|1,消去了量纲的影响;在以后
ij
的分析计算中可以减少误差的产生。);Range0to1(极差正规化变换/规格化变换);
2.构造关系矩阵
在SPSS中如何选择测度(相似性统计量):
→Analyze→Classify→HierachicalClusterAnalysis→Method然后从对话框中进行如下选择
常用测度(选项说明):Euclideandistance:欧氏距离(二阶Minkowski距离),用途:聚
类分析中用得最广泛的距离;SquaredEucideandistance:平方欧氏距离;Cosine:夹角余弦
(相似性测度;Pearsoncorrelation:皮尔逊相关系数;
3.选择聚类方法
SPSS中如何选择系统聚类法
常用系统聚类方法
a)Between-groupslinkage组间平均距离连接法
方法简述:合并两类的结果使所有的两两项对之间的平均距离最小。(项对的两成员分属不
同类)特点:非最大距离,也非最小距离
b)Within-groupslinkage组内平均连接法
方法简述:两类合并为一类后,合并后的类中所有项之间的平均距离最小
C)Nearestneighbor最近邻法(最短距离法)
方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法
d)Furthestneighbor最远邻法(最长距离法)
方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法
e)Centroidclustering重心聚类法
方法简述:两类间的距离定义为两类重心之间的距离,对样品分类而言,每一类中心就是属
于该类样品的均值
特点:该距离随聚类地进行不断缩小。该法的谱系树状图很难跟踪,且符号改变频繁,计算
较烦。
f)Medianclustering中位数法
方法简述:两类间的距离既不采用两类间的最近距离,也不采用最远距离,而采用介于两者
间的距离
特点:图形将出现递转,谱系树状图很难跟踪,因而这个方法几乎不被人们采用。
g)Ward’smethod离差平方和法
方法简述:基于方差分析思想,如果分类合理,则同类样品间离差平方和应当较小,类与类
间离差平方和应当较大
特点:实际应用中分类效果较好,应用较广;要求样品间的距离必须是欧氏距离。
谱系分类的确定
经过系统聚类法处理后,得到聚类树状谱系图,Demirmen(1972)提出了应根据研究的目
的来确定适当的分类方法,并提出了一些根据谱系图来分类的准则:
A.任何类都必须在临近各类中是突出的,即各类重心间距离必须极大
B.确定的类中,各类所包含的元素都不要过分地多
C.分类的数目必须符合实用目的
D.若采用几种不同的聚类方法处理,则在各自的聚类图中应发现相同的类
实例分析
SPSS19.0分析软件聚类分析
4.2聚类分析——系统聚类法
在数据编辑窗口的主菜单中选择“分析(A)”→“分类(F)”→“系统聚类(H)”(如图-4所示),
弹出“系统聚类分析”对话框,将“地区”变量选入“标注个案
文档评论(0)