第八章聚类分析解析.ppt

9.5 基于层次的聚类方法 大体上,主要的聚类算法可以划分为如下几类: (1)划分方法; (2)层次方法; (3)基于密度的方法; (4)基于网格的方法; (5)基于模型的方法。 * 基于密度的聚类方法 密度方法: 绝大多数聚类方法基于对象之间的距离进行聚类,这样的方法只能发现球状的簇,而在发现任意形状的簇上遇到了困难。 基于密度的方法:只要一个区域中点的密度(对象或数据点的数目)超过某个阈值,就将其加到与之相近的聚类中去。 这种方法可以过滤噪声孤立点数据,发现任意形状的簇。 代表算法有:DBSCAN、OPTICS、DENCLUE算法等。 * 基于密度的方法:DBSCAN 基于密度的聚类算法。该算法将具有足够高密度的区域划分为簇,并可以在带有噪声的空间数据中发现任意形状的聚类。 在该方法中,簇被定义为密度相连的点的最大集合。 先介绍该方法中涉及到的一些基本的定义。 * 基于密度的方法:DBSCAN 定义 1: 对象的ε-临域:给定对象在半径ε内的区域。 定义2: 核心对象:如果一个对象的ε-临域至少包含最小数目MinPts个对象,则称该对象为核心对象。 例如,在下图中,设定ε=1cm,MinPts=5,则q是一个核心对象。 边界点:边界点不是核心点,但落在某个核心点的邻域内; * 基于密度的方法:DBSCAN 定义 3: 直接密度可达:给定一个对象集合D,如

文档评论(0)

1亿VIP精品文档

相关文档