网站大量收购闲置独家精品文档,联系QQ:2885784924

聚类分析的案例分析教程.ppt

  1. 1、本文档共76页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

(2)最长距离(1)最短距离类平均距离(4)重心距离离差平方和距离2谱系聚类与K均值聚类单击此处添加正文,文字是您思想的提炼,为了演示发布的良好效果,请言简意赅地阐述您的观点。谱系聚类法是目前应用较为广泛的一种聚类法.谱系聚类是根据生物分类学的思想对研究对象进行分类的方法.在生物分类学中,分类的单位是:门、纲、目、科、属、种,其中种是分类的基本单位,分类单位越小,它所包含的生物就越少,生物之间的共同特征就越多.利用这种思想,谱系聚类首先将各样品自成一类,然后把最相似(距离最近或相似系数最大)的样品聚为小类,再将已聚合的小类按各类之间的相似性(用类间距离度量)进行再聚合,随着相似性的减弱,最后将一切子类都聚为一大类,从而得到一个按相似性大小聚结起来的一个谱系图.2.1谱系聚类1谱系聚类的步骤01(1)从02个样品开始作为距离或相似系数,得到实对称矩阵03计算两两之间的(相似系数),设该元素是个类,的非主对角线上找最小元素(距离)或最大元素则将合并成一个新类在中去掉所在的两行、两列,并加上新类之间的距离或相似系数,得到与其余各类阶矩阵(3)从出发重复步骤(2)的做法得到,再由出发重复上述步骤,直到两个样品聚为一个大类为止.(4)在合并过程中要记下合并样品的编号及两类合并时的水平,并绘制聚类谱系图.例2.1从例1.1算得的样品间的欧氏距离矩阵出发,用下列方法进行谱系聚类.最短距离,(2)最长距离.解:我们用1,2,3,4,5分别表示北京,上海,安徽,陕西和新疆,将欧氏距离矩阵除以单击此处添加小标题1单击此处添加小标题,记为2(1)最短距离法:将各个样品看成一类,即,从可以看出各类中距离最短的是,因此将在水平上合成一个,计算与之间的最短距离,得新类将计算结果作为第一列,从,剩余元素作为其余各列得到中去掉第4、5行与4、5列与与合成一类,即,计算与之间的最短距离,得中划掉与从将计算结果作为第一列,从可以看到所在的行与列,剩余元素作为其他列得的距离最小,因此在的水平上将从可以看出最接近,在的水平上合并成一类,至此只剩下两类他们之间的距离为:故在此水平上将合成一类,包含了全部的五个样品.2谱系聚类的MATLAB实现为了方便快捷地实现大样本的聚类分析,我们将利用MATLAB软件实现谱系聚类的方法.(1)谱系聚类命令linkage。调用格式:Z=linkage(Y,method)输入Y是一个距离矩阵,例如Y是由pdist命令生成的欧氏距离向量。Method是一个可选项,如最长距离,最短距离等。single----最短距离(缺省状态)complete----最长距离average----类平均距离weighted----加权平均距离centroid----重心距离ward----离差平方和距离输出Z是一个矩阵(N-1行,3列),Z的第一列和第二列均为正整数,第3列表示聚类的水平,每一行表示在相同的聚类水平上将个体合并成新的一类,每生成一个新的类,其编号将在现有基础上增加1。(2)作谱系聚类图命令dendrogram,其调用格式H=dendrogram(z,N)输入Z是一个(N-1)行3列的矩阵,由linkage命令生成,N是样本容量。输出产生一个树谱系聚类图,每两类通过线段连接,高度表示类间的距离。此命令作出m个样本的图形,缺省时默认为30。(3)输出聚类结果命令cluster,调用格式T=cluster(z,k)输入Z是一个(N-1)行3列的矩阵,由linkage命令生成,N是样本容量。k是分类数目.输出T是一个列向量(N行1列),每一个元素均为正整数,且最大的数字不超过k,第i行的数字l表示第i个个体属于第l类。如果遇到大样本数据,为了便于得到每一类样本的编号,可以利用如下命令:find(T==l)%找出属于第l类的样品编号例2.2利用MATLAB软件对例中的5个省、区、市进行聚类解:x=[18738.96778.36452.757707.8721791.111399.14369.126199.779302.38959.4

文档评论(0)

135****6917 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档