数据挖掘2015最新精品课程完整课件(第14讲)---基于密度的聚类.ppt

数据挖掘2015最新精品课程完整课件(第14讲)---基于密度的聚类.ppt

数据挖掘2015最新精品课程完整课件(第14讲)---基于密度的聚类

* OPTICS:通过点排序识别聚类结构 Step 1:有序种子队列初始为空.结果队列初始为空 ; Step 2:如果所有点处理完毕.算法结束;否则选择一个未处理对象(即不在结果队列中)放入有序种子队列: Step 3:如果有序种子队列为空,返回Step 2,否则选择种子队列中的第一个对象P进行扩张: Step 3.1:如果P不是核心节点.转Step 4;否则,对P 的E邻域内任一未扩张的邻居q 进行如下处理 Step 3.1.1:如果q已在有序种子队列中且从P到 q的可达距离小于旧值,则更新q的可达距离,并调整q到相应位置以保证队列的有序性; Step 3.1.2:如果q不在有序种f队列中,则根据P 到q的可达距离将其插入有序队列; Step 4:从有序种子队列中删除P.并将P写入结果队列中,返回Step 3 OPTICS:通过点排序识别聚类结构 数据集的排序可以用图形描述,有助于可视化和理解数据集中聚类结构,例如下图是一个简单的二维数据集的可达图。其中三个高斯“凸起”反映数据集中比较稠密的部分。 * 参数的影响 ?减小,则可达距离为无穷大的点增多; MinPts减小,核心对象增多,图象更尖锐 不同密度、形状、大小的簇 * * 基于密度的聚类方法 * * 基于密度的聚类方法 划分和层次方法旨在发现球状簇。他们很难发现任意形状的簇。 改进思想,将簇看作数据空间中由低

文档评论(0)

1亿VIP精品文档

相关文档