DBSCAN基于密度的聚类算法剖析.ppt

基于密度的聚类算法 DBSCAN聚类算法 DBSCAN DBSCAN是一个基于密度的聚类算法.(他聚类方法大都是基于对象之间的距离进行聚类,聚类结果是球状的簇) 基于密度的聚类是寻找被低密度区域分离的高密度区域。 密度的定义 传统的密度定义:基于中心的方法 传统基于中心的密度定义为: 数据集中特定点的密度通过该点Eps半径之内的点计数(包括本身)来估计。 显然,密度依赖于半径。 DBSCAN 基于密度定义,我们将点分为: 稠密区域内部的点(核心点) 稠密区域边缘上的点(边界点) 稀疏区域中的点(噪声或背景点). DBSCAN 核心点(core point) :在半径Eps内含有超过MinPts数目的点,则该点为核心点 这些点都是在簇内的 边界点(border point):在半径Eps内点的数量小于MinPts,但是在核心点的邻居 噪音点(noise point):任何不是核心点或边界点的点. DBSCAN: 核心点、边界点和噪音点 DBSCAN: 核心点、边界点和噪音点 DBSCAN算法概念示例 如图所示,Eps用一个相应的半径表示,设MinPts=3,请分析Q,M,P,S,O,R这5个样本点之间的关系。 DBSCAN算法原理 DBSCAN通过检查数据集中每点的Eps邻域来搜索簇,如果点p的Eps邻域包含的点多于MinPts个,则创建一个以p为核

文档评论(0)

1亿VIP精品文档

相关文档