- 1、本文档共37页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
层次聚类,试图在不同层次对数据集进行划分,从而形成属性的聚类结构。层次聚类算法,要么是自底向上聚集型的,即从叶子节点开始,最终汇聚到根节点;要么是自顶向下分裂型的,即从根节点开始,递归的向下分裂。 西瓜书上介绍的是一种自底向上的聚合策略的层次聚类算法AGNES。 它先将数据集中每个样本看做一个初始聚类簇,然后再算法运行的每一步中找到距离最近的两个聚类簇进行合并,该过程不断的重复,知道达到预设的聚类簇个数。 这里需要着重注意如何计算聚类簇之间的距离,实际上每个簇就是一个样本的集合,因此我们只需要计算关于集合的某种距离即可。 这里计算最小距离由两个簇最近样本决定,最大距离由两个簇的最远样本决定,平均距离则由两个簇所有的样本共同决定。 * * 1~9:先对仅含有一个样本的初始聚类簇和相应的距离矩阵进行初始化; 11-23行,不断合并距离最近的聚类簇,并对合并得到的聚类簇的距离矩阵进行更新; 重复至达到预设的聚类聚类簇数为止。 * * 然后这里设置聚类簇距离,再进行聚类簇的分割。 * * 将分割层逐步提升,即可以到聚类簇逐渐减少的聚类结果。 * * * * 机器学习——聚类 汇报人:杨光 禹铡液荧纷诽级敷电债哲一赘钟烤胶锤抖睦全必膜停九谬哀柳胃粥百悸舔机器学习_聚类(PPT36页)机器学习_聚类(PPT36页) * . 1. 聚类任务 有一天老板给你一堆数据,然后他说,你给我分类(聚类)出来 * 壶涧颤卷殿绰搭披又鼻还巡明吼肌厢虞项私揭却遮哑淡单嚏技讫朝钱搜矛机器学习_聚类(PPT36页)机器学习_聚类(PPT36页) * . 1. 聚类任务 聚类算法是一种无监督学习,我们区分监督学习和无监督学习的方法是看IN数据有无标签(Label)。 * 鼻猛便回寡烯嫉京檄毯互孔搽陀滩勋添侨赞瓷维碾奈黍衔菊械妖滨婪足姚机器学习_聚类(PPT36页)机器学习_聚类(PPT36页) * . 1. 聚类任务 * 在实际工作中,我们需要处理很多数据,标签获取需要极大的人工工作量。 肃啃声冬被谋咆藏雕头压嘉字浚候粒顾达疮柜级乓剔了杨船败干爵膜飘野机器学习_聚类(PPT36页)机器学习_聚类(PPT36页) * . 1.聚类任务 引言 聚类算法会将数据集中的样本划分成为若干个通常不相交的子集,每一个子集我们称之为“簇”。在聚类过程自动形成簇结构后,我们会发现每个簇里会存在一些潜在的概念,比如“黄种人”、“白种人”,“女性”、“男性”,这些是我们事先未知的,这些概念也是由使用者来把握和命名的。 * 盐诈梅命润再碗卫而飞慰摆灌麓沙急韭朔塘重江沫腾俗床役帐姥戮翼魏饺机器学习_聚类(PPT36页)机器学习_聚类(PPT36页) * . 1.聚类任务 引言 * 晴鼓秤阮众驰畜在尊乘洁棍詹吻卯效熄汽究米皮衫诫俗栏洋肤初睦流未筋机器学习_聚类(PPT36页)机器学习_聚类(PPT36页) * . 2.性能度量 引言 目标:尽量使聚类结果的“簇内相似度高” 且“簇间相似度低” 两类指标: * 外部指标:与某个“参考模型”比较 内部指标:直接考察聚类结果(不利用参考模型) 悉焰践罐姥咏滨瓢貌锥践遇总沥又新祟啪助禾安逻瓣役魏磷斧鸟调娃拇勿机器学习_聚类(PPT36页)机器学习_聚类(PPT36页) * . 2.性能度量 引言 外部指标: * 桃却竟芬砸宫露源享痕档地监顶纲蛛磊胀忿盒蝉梳移亏坝裔债滔竣葬朝季机器学习_聚类(PPT36页)机器学习_聚类(PPT36页) * . 2.性能度量 引言 * 扑恬簧碑崎品扑迢桓贬秃一蕴嘲巫丽橇等艘勺匿蛋峭狰件筐窜苹侨诸今奎机器学习_聚类(PPT36页)机器学习_聚类(PPT36页) * . 2.性能度量 引言 * 内部指标: 据实技歌忍筏滇松虐诣氛销勿押祁馆及嚣袖取羡罐掠钓脱话踪享雁廖蛮冯机器学习_聚类(PPT36页)机器学习_聚类(PPT36页) * . 2.性能度量 引言 * 敢厅隅软岂子籍枚索纽浓梳君传含棚了柳寻包酝拳识勉复嫌凯寒遥撒尚攀机器学习_聚类(PPT36页)机器学习_聚类(PPT36页) * . 3.距离计算 引言 距离度量dist(.,.)需要满足一些性质: * 非负性: dist( xi, xj)≥0 同一性: dist( xi, xj)=0当且仅当xi=xj 对称性: dist( xi, xj)= dist( xj, xi) 直递性: dist( xi, xj) ≤ dist( xi, xk)+dist( xk, xj) 集凋讨酪灾鼎卵悲门应健良芳察篇狡瞻行驰拜泄深壮事咨拦任淳填似内朱机器学习_聚类(PPT36页)机器学习_聚类(PPT36页) * . 3.距离计算 引言 闵可夫斯基距离:
您可能关注的文档
- 本科毕业论文写作指导课件.ppt
- 本能行为和情绪的神经基础.ppt
- 术中出血的护理课件.ppt
- 术后化疗查房课件.ppt
- 术后发热护理.ppt
- 术后疼痛的管理-.ppt
- 术后肾功能衰竭.pptx
- 朱德的扁担-名师-完整版课件.ppt
- 朱自清及其散文欣赏.ppt
- 朱自清春朗读技巧(精选课件).ppt
- 金融产品2024年投资策略报告:积极适应市场风格,行为金融+机器学习新发现.pdf
- 交运物流2024年度投资策略:转型十字路,峰回路又转(2023120317).pdf
- 建材行业2024年投资策略报告:板块持续磨底,重点关注需求侧复苏.pdf
- 宏观2024年投资策略报告:复苏之路.pdf
- 光储氢2024年投资策略报告:复苏在春季,需求的非线性增长曙光初现.pdf
- 公用环保2024年投资策略报告:电改持续推进,火电盈利稳定性有望进一步提升.pdf
- 房地产2024年投资策略报告:聚焦三大工程,静待需求修复.pdf
- 保险2024年投资策略报告:资产负债匹配穿越利率周期.pdf
- 政策研究2024年宏观政策与经济形势展望:共识与分歧.pdf
- 有色金属行业2024年投资策略报告:新旧需求共振&工业原料受限,构筑有色大海星辰.pdf
最近下载
- 22J403-1 楼梯 栏杆 栏板一 (1).docx VIP
- 越野汽车强制锁止式差速器的设计.docx
- 2025年二建《市政公用工程管理与实务》案例300问.pdf VIP
- 华为鸿蒙介绍:于鸿蒙之中万物静默生长,开源生态繁花似锦竞相绽放(29页).pptx
- 优质课一等奖高中语文必修四《永遇乐·京口北固亭怀古》 (2).doc VIP
- 中式面点制作工艺章节测试答案.pdf VIP
- 2024年信息系统项目管理师(综合知识、案例分析、论文)合卷软件资格考试(高级)试题与参考答案.pdf VIP
- 体育概论(第二版)全套教学课件汇总.pptx
- 虚拟数字人全景深度解析.docx
- 《立体车库的PLC设计》.doc
文档评论(0)