基于密度方法的聚类全解.ppt

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
OPTICS 算法 由于在 DBSCAN 算法中,变量 ε , MinPts 是全局惟一的, 当 空间聚类的密度不均匀、聚类间距离相差很大时,聚类质 量较差。 ? 许多现实的数据集内在的聚类结构不能够通过全局的密度 参数来描述,数据空间中不同区域的聚类需要不同的局部 密度。 OPTICS 算法 ? 尽管 dbscan 能够根据给定的输入参数 ε ,和 MinPts 聚类对象, 但是它把选择能产生可接受的聚类结果的参数值的责任留 给了用户。这是许多其他算法都存在的问题。但是对于高 维数据而言设定准确的参数非常困难。参数设置有细微的 不同都可能导致差别很大的聚类结果。全局参数不能很好 地刻画其内在的聚类结构。 OPTICS 算法 下图中所描述的数据集不能通过一个全局密度参数同时区分出簇 A 、 B 、 C 、 C1 、 C2 和 C3 ,只能得到 A 、 B 、 C 或 C1 、 C2 和 C3 ,对于 C1 、 C2 和 C3 而言 A 、 B 、 C 都是噪声。 对于固定的 MinPts 值,和两个 ε1 < ε2 ,关于 ε1 的 MinPts 簇 C 一定是关于 ε2 和 MinPts 簇 C 的子集,这就意味着。如果两个对象在同一个基于密度的簇中,则它们也是在同一 个具有较低密度要求的簇中。 OPTICS 算法 ? 为了克服在聚类分析中使用一组全局参数的缺点,提出了 OPTICS 聚类分析 方法。 ? P 为对象,数据集 D , ? 为距离值, N ? (q) 为邻域, MinPts 。 两个定 义: ? P 的核心距离 : 使得 P 成为核心对象的最小 ? ‘, ? ‘是使 p 称为核心对象 的最小半径阈值。 若 | ( N ? (q) ? MinPts ,即 P 不是核心对象,核心距离则无定义。 ? q 关于对象 P 的可达距离 :是使 q 从 p 密度可达的最小半径。 p 的核心距离和 p,q 的欧几里得距离之间的较大值, p 必须是核心对象且 q 在 p 的邻域内。 ? 若 |N ? (p)| ? MinPts ,即 P 不是核心对象,则无定义 ? 否则,定义为 Max (核心距离, | ( p,q ) | ) OPTICS 算法 ? 例 核心距离与可达距离 , 假设 ? =6mm , MinPts =5 。 P 的核心距离是 p 于第四个最近的数据对象之间的距离 ? ‘, q1 到 p 的可达距离是 p 的核心距离 ( ? ‘ =3mm ),因为它比 q1 到 p 的欧氏距离大。 q2 关于 p 的科大距离是 p 到 q2 的欧氏距离,它大于 p 的核心距离。 OPTICS 算法 ? OPTICS 算法并不显式的产生数据及聚类,而是输出簇排序 ( cluster ordering ),这个排序是所有分析对象的线性表, 并且代表数据基于密度的聚类结构。 ? 较稠密簇中的对象在簇排序中相互靠近。这个排序等价于 从较广泛的参数设置中得到基于密度的聚类。这样 optics 不需要用户提供特定密度阈值。 ? 簇排列可以用来提取基本聚类信息,导出内在的聚类结构, 也可以提供聚类的可视化。 OPTICS 算法 ? 为了构造不同的类,对象需要按特定的次序处理,这个次 序选择这样的对象,及关于最小的 ? 值,它是密度可达的, 以便较高密度(较低 ? 值)的簇先完成。 ? optics 算法计算给定数据库中所有对象的排序,并且存储 每个对象核心距离和相应的可达距离。 ? optics 维护一个称作 order seeds 的表来来产生输出排列, orderseeds 中的对象按到各自的最近核心对象的可达距离 排序,及按每个对象的最小可达距离排序。 OPTICS 算法 寻找簇 Reachabilit y-distance ? ? undefined ? ‘ Cluster-order of the objects ? 数据集的簇排序可以

文档评论(0)

ailuojue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档