分级聚类(谱系聚类).docxVIP

  • 49
  • 0
  • 约5.61千字
  • 约 10页
  • 2016-12-31 发布于重庆
  • 举报
分级聚类(谱系聚类)

matlab提供了两种方式来做分级聚类一、直接聚类此时调用的是clusterdata函数,而clusterdata函数可以视为pdist、linkage与cluster的综合,也就是说它们的参数在调用时使用的都是默认值,不能调,这就是直接聚类的含义。其缺点为可供用户选择的面较窄,不能更改距离的计算方法,该方法的使用者无需了解聚类的原理和过程,但是聚类效果受限制。下面介绍clusterdata函数的具体使用。clusterdata函数的调用格式:T=clusterdata(X,cutoff)?输出参数T是一个包含n个元素的列向量,其元素为相应观测所属类的类序号。输入参数X是的矩阵,一定要注意矩阵的每一行对应一个观测(样品),每一列对应一个变量。Cutoff 为阈值,它有两种含义,如下:(1)当0cutoff2时,T=clusterdata(X,cutoff)?? 等价于调用了Y=pdist(X,’euclid’); Z=linkage(Y,’single’); T=cluster(Z,’cutoff’,cutoff)?;(此时‘cutoff’指不一致系数或距离的阈值,参数值为正实数。即此时clusterdata等价于最后T=cluster(Z‘cutoff’,c,’depth’,d),是按照不一致系数的规则来聚类的,并没有指定希望分成几类。这有别于下面的(2))(2)Cutoff2时

文档评论(0)

1亿VIP精品文档

相关文档