数据挖掘算法-Chameleon算法.pptVIP

下载本文档

161
0
约1.44千字
约 15页
2018-09-04 发布于河北
举报

数据挖掘算法-Chameleon算法.ppt

数据挖掘算法-Chameleon算法

2003.5.26 Chameleon: Hierarchical Clustering Using Dynamic Modeling ——变色龙：一个利用动态模型的层次聚类算法梁敏 2003.5.26 内容简介与以往算法的比较变色龙算法聚类步骤稀疏图相对互连性相对近似性聚类对比试验总结与以往算法的比较以往算法的不足只处理符合某静态模型的簇忽略了不同簇间的信息忽略互连性互连性：簇间距离较近数据对的多少。忽略近似性近似性：簇间数据对的相似度(最近距离)。变色龙算法同时考虑了互连性和近似性变色龙算法的聚类步骤步骤稀疏图节点表示数据项边表示数据项的相似度图的表示基于k-最近邻居图的方法节点表示数据项边表示边的一个节点v在另一个节点u的k个最相似点中。好处：距离很远的数据项完全不相连边的权重代表了潜在的空间密度信息在密集和稀疏区域的数据项都同样能建模表示的稀疏便于使用有效的算法相对互连性(RI) 相对互连性函数： EC( Ci, Cj):连接簇Ci和Cj的所有边的权重和。 EC( Ci):把簇Ci划分为两个大致相等部分的最小等分线切断的所有边的权重和。相对互连性能处理簇间形状不同和互连程度不同的问题。相对近似性(RC) 相对近似性函数：

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

数据挖掘算法-Chameleon算法.pptVIP