数据挖掘算法-Chameleon算法.pptVIP

  • 161
  • 0
  • 约1.44千字
  • 约 15页
  • 2018-09-04 发布于河北
  • 举报
数据挖掘算法-Chameleon算法

2003.5.26 Chameleon: Hierarchical Clustering Using Dynamic Modeling ——变色龙:一个利用动态模型的层次聚类算法 梁敏 2003.5.26 内容简介 与以往算法的比较 变色龙算法 聚类步骤 稀疏图 相对互连性 相对近似性 聚类 对比试验 总结 与以往算法的比较 以往算法的不足 只处理符合某静态模型的簇 忽略了不同簇间的信息 忽略互连性 互连性:簇间距离 较近数据对的多少。 忽略近似性 近似性:簇间数据对 的相似度(最近距离)。 变色龙算法同时考虑了互连性和近似性 变色龙算法的聚类步骤 步骤 稀疏图 节点表示数据项 边表示数据项的相似度 图的表示基于k-最近邻居图的方法 节点表示数据项 边表示边的一个节点v在另一个节点u的k个最相似点中。 好处: 距离很远的数据项完全不相连 边的权重代表了潜在的空间密度信息 在密集和稀疏区域的数据项都同样能建模 表示的稀疏便于使用有效的算法 相对互连性(RI) 相对互连性函数: EC( Ci, Cj):连接簇Ci和Cj的所有边的权重和。 EC( Ci):把簇Ci划分为两个大致相等部分的最小等分线切断的所有边的权重和。 相对互连性能处理簇间形状不同和互连程度不同的问题。 相对近似性(RC) 相对近似性函数:

文档评论(0)

1亿VIP精品文档

相关文档