- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第五章聚类分析
判别分析和聚类分析有何区别?
答:即根据一定的判别准则,判定一个样本归属于哪一类。具体而言,设有n个样本,对每个样本测得p项指标(变量)的数据,已知每个样本属于k个类别(或总体)中的某一类,通过找出一个最优的划分,使得不同类别的样本尽可能地区别开,并判别该样本属于哪个总体。聚类分析是分析如何对样品(或变量)进行量化分类的问题。在聚类之前,我们并不知道总体,而是通过一次次的聚类,使相近的样品(或变量)聚合形成总体。通俗来讲,判别分析是在已知有多少类及是什么类的情况下进行分类,而聚类分析是在不知道类的情况下进行分类。
试述系统聚类的基本思想。
答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。
对样品和变量进行聚类分析时,所构造的统计量分别是什么?简要说明为什么这样构造?
答:对样品进行聚类分析时,用距离来测定样品之间的相似程度。因为我们把n个样本看作
p维空间的n个点。点之间的距离即可代表样品间的相似度。常用的距离为
ij(一)闵可夫斯基距离:d
ij
q取不同值,分为
绝对距离(q?1)
(q)?(?p X
ik
k?1
X q)1/qjk
d (1)??p X ?X
ij ik jk
k?1
欧氏距离(q?2)
d (2)?(?p X
ij ik
k?1
?X 2)1/2
jk
切比雪夫距离(q??)
d (?)?maxX ?X
ij 1?k?p ik jk
X ?
X ?X
ik jk
(二)马氏距离 d
ij
(L)?
?
p
k?1
X ?X
ik jk
(三)兰氏距离 d2(M)?(X
ij i
?X)?Σ?1(X
j i
X)
j
对变量的相似性,我们更多地要了解变量的变化趋势或变化方向,因此用相关性进行衡量。
将变量看作p维空间的向量,一般用
(一)夹角余弦
cos? ?
ij
?p
k?1
?p
X X
ik jk
?p
( X2)( X2)
ik jk
k?1 k?1
(二)相关系数
?p(X
ik
X)(X
i jk
X)
j
r?
ij ?p
k?1
(X
ik
?X)2?p
i
(X ?X)2
jk j
k?1 k?1
在进行系统聚类时,不同类间距离计算方法有何区别?选择距离公式应遵循哪些原则?
d答:设
d
ij
表示样品 与
XXi j
X
X
之间距离,用
Dij
D
表示类 与
GGi j
G
G
之间的距离。
(1).最短距离法
D ? min d
ij X?G,X?G ij
i i j j
D ? min d
?min{D ,D }
kr X?G,X?G ij
kp kq
i k j r
最长距离法
D ? max d
pq X?G,X?G ij
i p j q
D ? max d
?max{D ,D }
kr X?G,X?G ij
kp kq
i k j r
中间距离法
1 1
D2? D2? D2??D2
kr 2 kp 2 kq pq
其中
重心法
D2 ?(X
pq p
?X )?(X
q p
X )
Xq r
X
?1(nXn p p
r
nX )
q q
qD2?npD2
q
n
qD2
npn D2
kr n
r
kp n kq n2 pq
r r
类平均法
D2 ? 1
? ?d2
D2? 1
? ?d2?npD2
n
qD2
pq n
p
n ij
qX?GX?G
q
i p j j
kr n
k
n
rX?G
r
i k
ij
X?G
j r
n kp
r
n kq
r
可变类平均法
n n
D2?(1??)( pkr n
r
D2? qkp n
r
D2)??D2
kq pq
其中?是可变的且?1
可变法
1??
D2?
kr
(D2
2 kp
D2
kq
)??D2
pq
其中?是可变的且?1
离差平方和法
S ??nt(X
t it
t?1
?X)?(X
t it
X)
t
kD2?n ?npkr n ?n
k
D2?n ?n
kqkp n ?n
k
q
D2? n D2
kkq n ?n pq
k
r k r k r k
通常选
您可能关注的文档
- 银行反洗钱知识测试题及答案.docx
- 银行工作心得体会.docx
- 银行汇票结算方式.docx
- 银行会计试题答案 1.docx
- 银行健身房管理制度.docx
- 银行结算制度.docx
- 银行卡免年费落地一年 银行不主动告知仍暗自收费.docx
- 银行开销户申请表.docx
- 银行理财产品监测月度报告.docx
- 银行绿色信贷实施情况自评价报告.docx
- 青岛版九年级下册数学《函数与它的表示法》研讨说课复习课件拔高.pptx
- 北师大版四年级下册数学《方程》认识方程研讨说课复习课件.pptx
- 青岛版七年级下册数学《垂直》培优说课教学复习课件.pptx
- 冀教版三年级上册数学《万以内数的大小比较》生活中的大数培优说课教学复习课件.pptx
- 冀教版四年级下册数学《组合图形》多边形的认识说课教学课件复习.pptx
- 北师大版七年级下册数学《两条直线的位置关系》平行线与相交线说课教学课件复习.pptx
- 冀教版二年级下册数学《混合运算》三位数加减三位数说课教学课件复习.pptx
- 青岛版八年级上册数学《怎样判定三角形全等》研讨说课复习课件拔高.pptx
- 人教高中数学必修二B版《概率》统计与概率说课复习(事件之间的关系与运算).pptx
- 冀教版四年级上册数学《两点间的距离》线和角教学说课复习课件.pptx
文档评论(0)