- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
项目9聚类
汇报人:人工智能专业
项目目标
l掌握聚类的概念及距离的度量方法。
l了解聚类的类型。
知识目标l掌握k均值聚类算法的基本原理及其Sklearn实现方法。
l掌握层次聚类算法的基本原理及凝聚层次聚类算法的Sklearn实现方法。
l掌握DBSCAN聚类算法的基本原理及其Sklearn实现方法。
l能够使用k均值聚类算法、凝聚层次聚类算法和DBSCAN聚类算法训练模型。
技能目标l能够编写程序,寻找k均值聚类模型参数的最优值。
l能够编写程序,寻找DBSCAN聚类模型参数的最优值。
素养目标l掌握常用的聚类算法,提高自主学习能力、数据分析能力和创新能力。
l强化数据安全意识,提高信息技术应用能力。
目录9.1
9.2
01.02.03.04.
聚类任务k均值聚类层次聚类算DBSCAN
9.3算法法聚类算法
9.4
PARTONE
DBSCAN聚
类算法
9.4DBSCAN聚类算法
DBSCAN(density-basedspatialclusteringof
applicationswithnoise)聚类算法是密度聚类算法(基于密度的聚类)
的代表,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域
划分为簇,并进行任意形状的聚类。
在计算机图像识别领域,经常进行图像分割,而图像中的像素点往往会聚集
成非凸形状(如环形或月牙形)的图像。对这样的数据进行聚类时,使用密度聚
类算法往往会得到更好的聚类效果。
5
9.4.1DBSCAN聚类算法的基本原理
1.DBSCAN聚类算法中的几个定义
DBSCAN算法是一种基于密度的聚类算法。在学习该算法的原理前,需要先明确几个定义。
(1)密度。数据集中特定点的密度是指以该点为圆心,指定数据为半径的区域内点的个数,
如果该区域内点的个数超过指定阈值,就认为该点所在区域是稠密区域。
(2)密度的度量方法。DBSCAN算法度量密度的参数有两个,分别是领域半径(eps)和区
域内所包含点的最小数量(MinPts)。
(3)ε-邻域。对于样本集合D中的对象,其ε-邻域是包含样本集合D中与的距离不大于
ε的样本。
(4)核心对象。对于样本集合D中的对象,若的ε-邻域内至少包含MinPts个样本,则
该对象为一个核心对象。
(5)密度直达。对于样本集合D,若样本点在的ε-邻域内,并且是核心对象,则
称样本点由密度直达。
(6)密度可达。对于样本集合D中的对象和,若存在样本序列,,,,其
中,,且由密度直达,则称由密度可达,即多个方向相同的密度直
达可连接在一起称为密度可达。
(7)密度相连。对于样本集合D中的对象和,若存在对象,使得与均由
密度可达,则称与密度相连。6
9.4.1DBSCAN聚类算法的基本原理
1.DBSCAN聚类算法中的几个定义
例如,图10中,虚线表示ε-邻域,如果定义MinPts值为
原创力文档


文档评论(0)