DBSCAN

基于密度的聚类算法 DBSCAN聚类算法 DBSCAN DBSCAN是一个基于密度的聚类算法.(他聚类方法大都是基于对象之间的距离进行聚类,聚类结果是球状的簇) 基于密度的聚类是寻找被低密度区域分离的高密度区域。 密度的定义 传统基于中心的密度定义为: 数据集中特定点的密度通过该点Eps半径之内的点计数(包括本身)来估计。 显然,密度依赖于半径。 传统的密度定义:基于中心的方法 基于密度定义,我们将点分为: 稠密区域内部的点(核心点) 稠密区域边缘上的点(边界点) 稀疏区域中的点(噪声或背景点). DBSCAN 核心点(core point) :在半径Eps内含有超过MinPts数目的点,则该点为核心点 这些点都是在簇内的 边界点(border point):在半径Eps内点的数量小于MinPts,但是在核心点的邻居 噪音点(noise point):任何不是核心点或边界点的点. DBSCAN DBSCAN: 核心点、边界点和噪音点 Original Points Point types: core, border and noise Eps = 10, MinPts = 4 DBSCAN: 核心点、边界点和噪音点 DBSCAN算法概念 Eps邻域:给定对象半径Eps内的邻域称为该对象的Eps邻域,我们用 表示点p的Eps-半

文档评论(0)

1亿VIP精品文档

相关文档