聚类67课件讲解.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

项目9聚类

汇报人:人工智能专业

项目目标

l掌握聚类的概念及距离的度量方法。

l了解聚类的类型。

知识目标l掌握k均值聚类算法的基本原理及其Sklearn实现方法。

l掌握层次聚类算法的基本原理及凝聚层次聚类算法的Sklearn实现方法。

l掌握DBSCAN聚类算法的基本原理及其Sklearn实现方法。

l能够使用k均值聚类算法、凝聚层次聚类算法和DBSCAN聚类算法训练模型。

技能目标l能够编写程序,寻找k均值聚类模型参数的最优值。

l能够编写程序,寻找DBSCAN聚类模型参数的最优值。

素养目标l掌握常用的聚类算法,提高自主学习能力、数据分析能力和创新能力。

l强化数据安全意识,提高信息技术应用能力。

目录9.1

9.2

01.02.03.04.

聚类任务k均值聚类层次聚类算DBSCAN

9.3算法法聚类算法

9.4

PARTONE

DBSCAN聚

类算法

9.4DBSCAN聚类算法

DBSCAN(density-basedspatialclusteringof

applicationswithnoise)聚类算法是密度聚类算法(基于密度的聚类)

的代表,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域

划分为簇,并进行任意形状的聚类。

在计算机图像识别领域,经常进行图像分割,而图像中的像素点往往会聚集

成非凸形状(如环形或月牙形)的图像。对这样的数据进行聚类时,使用密度聚

类算法往往会得到更好的聚类效果。

5

9.4.1DBSCAN聚类算法的基本原理

1.DBSCAN聚类算法中的几个定义

DBSCAN算法是一种基于密度的聚类算法。在学习该算法的原理前,需要先明确几个定义。

(1)密度。数据集中特定点的密度是指以该点为圆心,指定数据为半径的区域内点的个数,

如果该区域内点的个数超过指定阈值,就认为该点所在区域是稠密区域。

(2)密度的度量方法。DBSCAN算法度量密度的参数有两个,分别是领域半径(eps)和区

域内所包含点的最小数量(MinPts)。

(3)ε-邻域。对于样本集合D中的对象,其ε-邻域是包含样本集合D中与的距离不大于

ε的样本。

(4)核心对象。对于样本集合D中的对象,若的ε-邻域内至少包含MinPts个样本,则

该对象为一个核心对象。

(5)密度直达。对于样本集合D,若样本点在的ε-邻域内,并且是核心对象,则

称样本点由密度直达。

(6)密度可达。对于样本集合D中的对象和,若存在样本序列,,,,其

中,,且由密度直达,则称由密度可达,即多个方向相同的密度直

达可连接在一起称为密度可达。

(7)密度相连。对于样本集合D中的对象和,若存在对象,使得与均由

密度可达,则称与密度相连。6

9.4.1DBSCAN聚类算法的基本原理

1.DBSCAN聚类算法中的几个定义

例如,图10中,虚线表示ε-邻域,如果定义MinPts值为

文档评论(0)

方世玉 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6101050130000123

1亿VIP精品文档

相关文档