- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机应用技术研究所1机器学习Machine Learning 汪荣贵 教授合肥工业大学 计算机与信息学院
计算机应用技术研究所第4章 无监督学习
主分量分析2 稀疏编码与学习3 聚类分析1 本章学习内容
计算机应用技术研究所聚类分析
计算机应用技术研究所 聚类分析 划分聚类 密度聚类
划分聚类划分聚类的基本思想:对样本数据进行划分,实现对样本数据的聚类分析。划分聚类方法首先需要确定划分块的个数即聚簇的个数,然后通过适当方式将样本数据聚集成指定个数的聚簇。
划分聚类?
k-均值聚类?
k-均值聚类?
k-均值聚类?
k-均值聚类?
k-均值聚类?
k-均值聚类 图4-2展示了K-均值算法从选择初始聚类中心经过迭代到收敛的过程。
【例题4.1】表4-1为某机构15支足球队在2017-2018年间的积分,各队在各赛事中的水平发挥有所不同。若将球队的水平分为三个不同的层次水平,试用k–均值聚类方法分析哪些队伍的整体水平比较相近。队伍赛事15028172528505050赛事2509154040504040赛事394352199队伍?赛事140505050404050?赛事240505050403250?赛事359599179?? 例题
? 例题
队伍赛事110.300.240.3111赛事2100.150.760.7610.760.76赛事30.50.190.130.250.0600.50.5队伍?赛事10.71110.70.71?赛事20.761110.760.681?赛事30.250.50.250.50.510.5??? 例题
?队伍1.259400.34070.76470.77101.23541.07871.078700.91310.99950.52350.59460.63060.30000.30000.34071.25941.36360.83530.86090.50000.24000.2400队伍?0.86091.25941.22211.25940.91311.13071.2594?0.25000.38420.45840.384200.50640.3842?0.458400.250000.38420.66510? 例题
? 例题
?队伍1.30140.17040.17040.69670.70831.26641.14341.14340.54410.80920.84430.33080.41970.67680.48040.48040.11131.19181.30400.79650.80140.41070.20300.2030队伍?0.88311.30141.25951.30140.94201.17221.3014?0.23680.54410.56090.54410.19390.61600.5441?0.38320.11130.16740.11130.36220.71420.1113? 例题
? 例题
模糊c-均值聚类 ?
模糊c-均值聚类?
模糊c-均值聚类 ?
模糊c-均值聚类?
模糊c-均值聚类?
模糊c-均值聚类?
模糊c-均值聚类?
模糊c-均值聚类?
模糊c-均值聚类?
?34914182131068117? 例题
? 例题
? 例题
? 例题
? 例题
计算机应用技术研究所 聚类分析 划分聚类 密度聚类
密度聚类密度聚类与划分聚类的区别:基于划分的聚类算法:主要通过样本数据之间的距离进行聚类操作,主要适合于对类圆形聚簇的聚类,如果将其用于对具有任意形状的聚簇进行聚类则有时不能获得满意的效果。密度聚类算法:将聚簇看作是数据空间中被稀疏区域分开的稠密区域,由此得到以密度为度量标准的样本数据聚类方法。下面介绍三种具有代表性的密度聚类算法,即DBSCAN算法、OPTICS算法和DENCLUE算法。
DBSCAN算法?
DBSCAN算法?
DBSCAN算法?
DBSCAN算法?
序号123456789101112属性A251234561252属性B112222223334? 例题
? 例题
? 例题
? 例题
? 例题
? 例题
? 例题
OPTICS算法?
OPTICS算法?
OPTICS算法 OPTICS算法在同时构建不同的聚类时,以特定的顺序来处理对象,优先选择最小的?值密度可达的对象, 以便高密度的聚类能被首先完成。每个对象需要存储两个值: 对象p的核心距离(core-distance)是使得p成为核心对象的最小?。如果p不是核心对象, p的核心距离没有定义 对象q关于另一个对象p的可达距离(reachability-distance )是p的核心距离和p与q的欧几
文档评论(0)