模式识别 课件8-第八章 密度聚类法.pptx

模式识别 课件8-第八章 密度聚类法.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第八章密度聚类法

主要内容密度聚类法基于密度的聚类DBSCAN算法(DensityBasedSpaicalClusteringofApplicationswithNoise)OPTICS算法OrderingPointsToIdenfifytheClusteringStructure问题:数据往往存在着密度不均匀的情况,有的区域稠密,有的区域密度很低。是否可以利用空间中数据点的密集程度来实现聚类?

8.1基于密度的聚类基于密度的聚类的基本思想:通过计算样本密度及样本之间的连通性来进行聚类。其前提假设为聚类内部的密度高于类外的密度,且类内的噪声密度低于所有类别外的密度。问题:数据往往存在着密度不均匀的情况,K-means算法存在何种问题?

8.1基于密度的聚类???

8.1基于密度的聚类基本概念:(2)直接密度可达;(3)密度可达;?

8.2DBSCAN算法基本概念:(4)密度相连;(5)聚类;?

8.2DBSCAN算法?分析三种不同数据分布情况下的DBSCAN算法过程。

8.2DBSCAN算法8.2.1算法基本流程(1)?分析DBSCAN聚类过程

8.2DBSCAN算法8.2.1算法基本流程(2)算法讨论问题:一个聚类产生的开始点为?噪声点符合什么条件?x邻域中的哪些点被认为和x同类?Queue_list存储了哪些点?为何要对搜索Queue_list的邻域?3.2.3是否是一个递归过程?DBSCAN受哪些因素影响?邻域搜索速度如何提升?算法复杂度如何计算?是否存在某个数据点同时可能同时属于两个相邻类?访问数据点的顺序是否影响分类??

8.2DBSCAN算法?

8.3OPTICS聚类问题1:聚类的任务除了将数据分为不同的组别,分析分类结果的数据特性,如何生成一种基于密度的聚类结构所表征的有序的数据排序?问题2:DBSCAN如何处理聚类时数据密度发生变化的情况??

8.3OPTICS聚类????????

8.3OPTICS聚类算法流程??分析OPTICS算法过程

8.3OPTICS聚类?分析种子列表更新过程

8.3OPTICS聚类???

8.3OPTICS聚类8.3.2识别聚类结构OPTICS算法的结果表示为如下形式:设DB是一个包含n个数据点的集合。OPTICS算法生成点的一个排序o:{1…n}→DB,以及相应的可达距离r:{1…n}→R?0。问题:如何分析数据的结构?是否存在子集?(1)可达区域和参数-1

8.3OPTICS聚类(1)可达区域和参数-2????

8.3OPTICS聚类(2)从聚类序列中生成聚类结构结合OPTICS对数据点的排序方式可知,聚类在可达性图中表现为凹陷形式。第一个以不那么陡峭的点A开始,在陡峭的点B结束,而第三个以非常陡峭的C开始、陡峭的D结束。为了捕捉不同程度的陡峭度。如何定义陡度?

8.3OPTICS聚类定义:陡度点,陡度区???

8.3OPTICS聚类??聚类分析条件(1)-(2)指出聚类开始于?陡度下降区D,终止于陡度上升区域U;条件3(a)说明每个聚类至少包含MinPts个点;条件3(b)指出聚类中所有点的可达距离必须比D中第一个点和U区之后第一个点的可达距离小?%;条件(4)定义了起点和终止点。?

8.3OPTICS聚类如何聚类?

基于上述定义,通过遍历可达性图,查找符合陡升和陡降条件的区间,将这些区间链接起来形成聚类,并为这些聚类建立父子关系来表现层次结构。改进方法:基于陡度下降区检索的聚类算法(数据集,数据个数n)While(索引indexn)IF(一个新的陡度向下区开始于index)将该区加入陡度下降区域集合SDASet,取其右侧数据点继续执行;ELSEIF(一个新的陡度向上区开始于index)将该区与SDASet中的每一个陡度向下区合并,检查合并结果是否满足聚类条件,如果满足,则将其保存,取该陡度区的右侧对象继续执行;ELSEindex+1分析:(1)一个新的陡度向下区开始于index,意味着什么?(2)一个新的陡度向上区开始于index,意味着什么?(3)为何能形成聚类?实际上许多组合并不能形成真正的聚类,因此采用两种算法优化计算过程:一是去除掉不可能形成真正聚类的组合,二是去除对所有点的循环。

8.3OPTICS聚类聚类抽取算法(数据集)1.设陡度下降区域集合SDASets=?2.设聚类集合ClusterSets=?3.设index=0,mib=04.WHILE(indexn)4.1mib=max(mib,r(index))4.2IF(index为陡度下降区域D的起始点)4.2.1更新mib-values

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档