第6章 聚类分析方法与应用.pptVIP

  • 17
  • 0
  • 约1.34万字
  • 约 71页
  • 2017-09-05 发布于江苏
  • 举报
6.3.4 DIANA聚类方法 在聚类中,用户能定义希望得到的簇数目作为一个结束条件。同时,它使用下面两种测度方法。 1. 簇的直径:在一个簇中的任意两个数据点都有一个距离(如欧氏距离),这些距离中的最大值是簇的直径。 2. 平均相异度(平均距离): (6.8) 其中:davg(x,C)表示点x在簇C中的平均相异度,n为簇C中点的个数,d(x, y)为点x与点y之间的距离(如欧式距离)。 6.3.4 DIANA聚类方法 DIANA算法描述: 输入:包含n个数据对象的数据库,终止条件簇的数目k输出:达到终止条件规定的k个簇 处理流程: Step1 将所有对象整个当成一个初始簇; Step2 在所有簇中挑出具有最大直径的簇; Step3 找出所挑簇里与其他点平均相异度最大的一个点放入splinter group,剩余的放入old party中; Step4 在old party里找出到splinter group中点的最近距离不大于到old party中点的最近距离的点,并将该点加入splinter group。 Step5 循环Step2到Step4直到没有新的old party的点分配给splinter group; Step6 splinte

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档