2011暑期集训专题七聚类分析专题20110713.pptVIP

2011暑期集训专题七聚类分析专题20110713.ppt

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2011暑期集训专题七聚类分析专题20110713

1.3 linkage函数 调用格式:Z=linkage(Y,’method’) 说 明:用‘method’参数指定的算法计算系统聚类树。 Y:pdist函数返回的距离向量; method:可取值如下: ‘single’:最短距离法(默认); ‘complete’:最长距离法; ‘average’:未加权平均距离法; ‘weighted’: 加权平均法; ‘centroid’:质心距离法; ‘median’:加权质心距离法; ‘ward’:内平方距离法(最小方差算法) 返回:Z为一个包含聚类树信息的(m-1)×3的矩阵。 1.4 dendrogram函数 调用格式:[H,T,…]=dendrogram(Z,p,…) 说明:生成只有顶部p个节点的冰柱图(谱系图)。 1.5 cophenet函数 调用格式:c=cophenetic(Z,Y) 说明:利用pdist函数生成的Y和linkage函数生成的Z计算cophenet相关系数。 1.7 clusterdata函数 调用格式:T=clusterdata(X,…) 说明:根据数据创建分类。 T=clusterdata(X,cutoff)与下面的一组命令等价: Y=pdist(X,’euclid’); Z=linkage(Y,’single’); T=cluster(Z,cutoff); 2. Matlab程序 2.1 一次聚类法 X=[11978 12.5 93.5 31908;…;57500 67.6 238.0 15900]; T=clusterdata(X,0.9) 2.2 分步聚类 Step1 寻找变量之间的相似性 用pdist函数计算相似矩阵,有多种方法可以计算距离,进行计算之前最好先将数据用zscore函数进行标准化。 X2=zscore(X); %标准化数据 Y2=pdist(X2); %计算距离 Step2 定义变量之间的连接 Z2=linkage(Y2); Step3 评价聚类信息 C2=cophenet(Z2,Y2); //0.94698 Step4 创建聚类,并作出谱系图 T=cluster(Z2,6); H=dendrogram(Z2); 3. 例子 tic clear clc close all disp(please input Matrix A)? x=input(A=) %x矩阵由n个类的m个特征所组成! y1=pdist(x); y2=pdist(x,seuclid); y3=pdist(x,mahal); y4=pdist(x,cityblock); z1=linkage(y1); z2=linkage(y2); z3=linkage(y3); z4=linkage(y4); a1=cophenet(z1,y1); a2=cophenet(z2,y2); a3=cophenet(z3,y3); a4=cophenet(z4,y4); a=[a1 a2 a3 a4] ma=max(a) %以上是求相似系数,哪种做法的相似系数最大,以下就选用哪种做法! if a(1)==ma;??? y1=pdist(x);??? z1=linkage(y1)??? h1=dendrogram(z1)??? t1=cluster(z1,3)??? d1=cluster(z1,0.5) elseif a(2)==ma;??? y2=pdist(x,seuclid);??? z2=linkage(y2)??? h2=dendrogram(z2)??? t2=cluster(z2,3)??? d2=cluster(z2,0.5) elseif a(3)==ma;??? y3=pdist(x,mahal);??? z3=linkage(y3)??? h3=dendrogram(z3)??? t3=cluster(z3,3)??? d3=cluster(z3,0.5) else y4=pdist(x,cityblock);??? z4=linkage(y4)??? h4=dendrogram(z4)??? t4=cluster(z4,3)??? d4=cluster(z4,0.5) end t

文档评论(0)

tmd2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档