- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章聚类分析解析
第三章 聚类分析
一、填空题
1.在进行聚类分析时,根据变量取值的不同,变量特性的测量尺度有以下三种类型: 间隔尺度 、 顺序尺度 和 名义尺度 。
2.Q型聚类法是按___样品___进行聚类,R型聚类法是按_变量___进行聚类。
3.Q型聚类统计量是____距离_,而R型聚类统计量通常采用_相似系数____。
4.在聚类分析中,为了使不同量纲、不同取值范围的数据能够放在一起进行比较,通常需要对原始数据进行变换处理。常用的变换方法有以下几种:__中心化变换_____、__标准化变换____、____规格化变换__、__ 对数变换 _。
5.距离一般应满足以下四个条件:对于一切的i,j,有、 时,有、对于一切的i,j,有、对于一切的i,j,k,有。
6.相似系数一般应满足的条件为: 若变量与 成比例,则、 对一切的i,j,有 和 对一切的i,j,有。
7.常用的相似系数有 夹角余弦 和 相关系数 两种。
8.常用的系统聚类方法主要有以下八种: 最短距离法 、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法、离差平方和法。
9.快速聚类在SPSS中由__K-mean_____________过程实现。
10.常用的明氏距离公式为:,当时,它表示 绝对距离 ;当时,它表示 欧氏距离 ;当趋于无穷时,它表示 切比雪夫距离 。
11.聚类分析是将一批 按照它们在性质上进行分类为维总体,均值向量为,协差阵为,则样品与总体的马氏距离定义为 。
15.使用离差平方和法聚类时,计算样品间的距离必须采用 欧氏距离 。
16.在SPSS中,系统默认定系统聚类方法是 类平均法 。
17.在系统聚类方法中, 中间距离法和 重心法 不具有单调性。
18.离差平方和法的基本思想来源于 方差分析 。
19.最优分割法的基本步骤主要有三个:第一,定义类的直径 ;第二, 定义目标函数 ;第三, 求最优分割 。
20.最优分割法的基本思想是基于 方差分析的思想 。
二、判断题
1.在对数据行进中心化变换之后,数据的均值为0,而协差阵不变,且变换后后的数据与变量的量纲无关。 ( )
2.根据分类的原理,我们可以把聚类分为样品聚类和变量聚类。 ( )
3.兰氏距离不仅克服了明氏距离与各指标的量纲有关的缺点,而且也考虑了变量间的相关性。 ( )
4.当各变量之间相互独立时,马氏距离就退化为欧氏距离。 ( )
5.在几种系统聚类法中,最短(长)距离法、(可边)类平均法、重心法和离差平方和法都具有单调性,只有中间距离法不具有单调性。 ( )
6.重心法比离差平方和法使空间扩张。 ( )
7.离差平方和法的思想来源于方差分析.如果类分得比较合理,同类样品之间的离差平方和应当较大,类与类之间的离差平方和应当较小. ( )
8.使用离差平方和法时,计算样品间的距离必须采用欧氏距离. ( )
9.快速聚类法又称为动态聚类法,是一种非谱系聚类法,它可以应用于比系统聚类法大得多的数据组. ( )
10.明氏距离的优点在于考虑了各个指标之间的相关性,而缺点在于它的值与各指标的量纲有关。 ( )
11.马氏距离考虑了便了之间观测变量之间的相关性。 ( )
12.兰氏距离对大的奇异值不敏感,适合高度偏倚的数据,但是它没有克服与各指标的量纲有关的缺点。 ( )
三、简答题
1.简述聚类分析的基本思想和基本步骤?
2.系统聚类法的基本思想是什么?
3.系统聚类法的基本步骤是什么?
4.简述最长聚类法的聚类步骤。
5.简述快速聚类的基本思想及主要步骤。
6.简述最优分割法的步骤
7.简述Ward离差平方和法的基本思想.
8.在数据处理时,为什么通常要进行标准化处
文档评论(0)