分级聚类(谱系聚类).docxVIP

下载本文档

49
0
约5.61千字
约 10页
2016-12-31 发布于重庆
举报

分级聚类(谱系聚类).docx

分级聚类(谱系聚类)

matlab提供了两种方式来做分级聚类一、直接聚类此时调用的是clusterdata函数，而clusterdata函数可以视为pdist、linkage与cluster的综合，也就是说它们的参数在调用时使用的都是默认值，不能调，这就是直接聚类的含义。其缺点为可供用户选择的面较窄，不能更改距离的计算方法，该方法的使用者无需了解聚类的原理和过程，但是聚类效果受限制。下面介绍clusterdata函数的具体使用。clusterdata函数的调用格式：T=clusterdata(X,cutoff)?输出参数T是一个包含n个元素的列向量，其元素为相应观测所属类的类序号。输入参数X是的矩阵,一定要注意矩阵的每一行对应一个观测（样品），每一列对应一个变量。Cutoff 为阈值，它有两种含义，如下：（1）当0cutoff2时，T=clusterdata(X,cutoff)?? 等价于调用了Y=pdist(X,’euclid’); Z=linkage(Y,’single’); T=cluster(Z,’cutoff’，cutoff)?；（此时‘cutoff’指不一致系数或距离的阈值，参数值为正实数。即此时clusterdata等价于最后T=cluster(Z‘cutoff’,c,’depth’,d)，是按照不一致系数的规则来聚类的，并没有指定希望分成几类。这有别于下面的（2））（2）Cutoff2时

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

分级聚类(谱系聚类).docxVIP