第4章-聚类分析资料.ppt

主编:费宇 中国人民大学出版社;*;4.1 相似性的度量; 常用的六种距离可表示如下: 欧式距离: 绝对距离:;*; 兰氏距离: 其中 扩展的兰氏距离:;对变量进行聚类,即根据变量间的“相似”度来进行聚类. 相关系数 其中p为变量数,n为个体数 ;变量的夹角余弦 其中p为变量数,n为变量维数 ;4.2 系统聚类法; 设Gs、Gt为两个类,dij为Gs中第i样品与Gt中第j样品之间的距离,Dst为Gs与Gt之间的距离. (1)最小距离法:;(2)最大距离法: (3)中间距离法: (4)重心距离法: 其中, 和 分别表示Gs和Gt的重心. ;(5)类平均距离法: (6)离差平方和法(Ward法): 其中,; 设Gs和Gt为两个类,用rij表示Gs中第i个样品与Gt中第j个样品之间的相似系数,则Gs与Gt间的相似度通常用Rst度量: ;*; 表4.2 10种红葡萄酒最小距离法和最大距离法??合并顺序;*; 这个过程绘制的聚类树形状图如图4.1 图4.1 10种红葡萄酒最小距离法系统树状图 ;*;HC-hclust(d,method=complete) #采用最大距离(complete)聚类 plot(HC) #绘制聚类树状图 ;

文档评论(0)

1亿VIP精品文档

相关文档