* * * 两个不同的K-means聚类 次最优聚类 最优聚类 原始数据点 * 选取初始中心点的重要性 * 选取初始中心点的重要性 * 层次型聚类 产生嵌套的簇组织成的一棵层次树 可以可视化为树状图解 * 层次型聚类的优点 无需设定簇的个数 在合适的层次上分割树状图解可以产生任意个数的簇 可能对应于多个有意义的分类 如生物学中的例子 (如: 动物王国, 进化演变系统重构…) * 层次型聚类 两类主要层次型聚类 聚集型: 开始时每个点都为单独一个簇 每步合并最近的两个簇直到只剩一个簇 (或k个簇) 分裂型: 开始时, 所有点都在同一个簇中 每步分裂一个簇, 直到每个簇包含一个点 (或者有k个簇) 传统的层次型算法使用一个相似度或距离矩阵 每次合并或分裂一个簇 * 聚集型层次聚类 更常见的层次型聚类技术 基本算法 Compute the proximity matrix Let each data point be a cluster Repeat Merge the two closest clusters Update the proximity matrix Until only a single cluster remains 关键操作是计算两个簇之间的相似度 不同的算法定义了不同的簇之间的距离 * 开始状态 开始时每个点为一个簇, 并给定一个相近矩阵 p1 p3 p5 p4 p2 p1 p2 p3 p4 p5 . . . . . . Proximity Matrix * 中间状态 经过一些合并步骤后, 有了一些稍大的簇 C1 C4 C2 C5 C3 C2 C1 C1 C3 C5 C4 C2 C3 C4 C5 Proximity Matrix * 中间状态 合并最近的两个簇(C2和C5), 并更新相近矩阵 C1 C4 C2 C5 C3 C2 C1 C1 C3 C5 C4 C2 C3 C4 C5 Proximity Matrix * 合并后 问题: 如何更新相近矩阵? C1 C4 C2 U C5 C3 ? ? ? ? ? ? ? C2 U C5 C1 C1 C3 C4 C2 U C5 C3 C4 Proximity Matrix * 如何定义簇之间的相似度 p1 p3 p5 p4 p2 p1 p2 p3 p4 p5 . . . . . . 相似度? MIN MAX 组平均 中心点距离 由目标函数驱动的其他方法 Ward方法使用了平方误差 Proximity Matrix * 如何定义簇之间的相似度 p1 p3 p5 p4 p2 p1 p2 p3 p4 p5 . . . . . . Proximity Matrix MIN MAX 组平均 中心点距离 由目标函数驱动的其他方法 Ward方法使用了平方误差 * 如何定义簇之间的相似度 p1 p3 p5 p4 p2 p1 p2 p3 p4 p5 . . . . . . Proximity Matrix MIN MAX 组平均 中心点距离 由目标函数驱动的其他方法 Ward方法使用了平方误差 * 如何定义簇之间的相似度 p1 p3 p5 p4 p2 p1 p2 p3 p4 p5 . . . . . . Proximity Matrix MIN MAX 组平均 中心点距离 由目标函数驱动的其他方法 Ward方法使用了平方误差 * 如何定义簇之间的相似度 p1 p3 p5 p4 p2 p1 p2 p3 p4 p5 . . . . . . Proximity Matrix MIN MAX 组平均 中心点距离 由目标函数驱动的其他方法 Ward方法使用了平方误差 ? ? * 簇相似性: MIN 或 Single Link 两个簇之间的相似度基于不同簇中最相似的两个点 由一对点确定, 即相近图中个一条link. 1 2 3 4 5 * 层次型聚类: MIN Nested Clusters Dendrogram 1 2 3 4 5 6 1 2 3 4 5 * 簇相似性: MAX 或 Complete Linkage 两个簇之间的相似度基于不同簇中最不相似的两个点 由两个簇中所有点确定 1 2 3 4 5 * 层次型聚类: MAX Nested Clusters Dendrogram 1 2 3 4 5 6 1 2 5 3 4 * DIANA (DIvisive ANAlysis) 初始时,所有对象在一个簇中 一步步分裂形成小的簇 * MST: 分裂型层次聚类 构造MST (最小生成树) 由任意某个点组成的树开始 以下的每一步, 找到p在树中而q
您可能关注的文档
- 广谱半胱氨酸蛋白酶抑制剂减轻小鼠噪声性耳聋的-中华耳科学杂志.PDF
- 应用多分类多核学习支持向量机的变压器故障诊断-中国电机工程学报.PDF
- 应用现代远程教育进行小学语文学科教学研究-云南电化教育馆.PPT
- 延续护理在预防带管出院患者气管导管并发症中的-西南医科大学学报.PDF
- 延续护理对炎症性肠病患者自我管理能力及生活质量的-F6出版系统.PDF
- 建宇PC秤技术说明-NHSoftConfluence.PPT
- 延续护理对冠心病PCI术后康复患者的影响-海南医学.PDF
- 建设工程施工图设计文件重大变更报审表.DOC
- 建设项目所在地自然环境社会环境简况-第二师铁门关.DOC
- 建设项目环境影响评价报告表-沈阳城建设管理局.PDF
最近下载
- 2025年无人机驾驶员执照欧洲(EASA)无人机法规对比专题试卷及解析.pdf VIP
- 2025年AWS认证DedicatedHosts支持的AMI类型与启动模式专题试卷及解析.pdf VIP
- 美容院服务合同(2025年最新规范).docx
- 上海市住建委《上海市建筑和装饰工程预算定额沪建标定〔2025〕1162号.docx VIP
- 2025年无人机驾驶员执照飞行监管责任体系专题试卷及解析.pdf VIP
- 2025年无人机驾驶员执照悬停失控应急处置流程专题试卷及解析.pdf VIP
- 2025年金融风险管理师利率风险结构易错题解析专题试卷及解析.pdf VIP
- 《最优控制与状态估计6》-公开课件.ppt VIP
- 标准图集-22G101-3 混凝土结构施工图平面整体表示方法制图规则和构造详图-独立基础、条形基础、筏形基础、桩基础.pdf VIP
- 2024黑龙江林业职业技术学院单招《数学》通关题库及答案详解【各地真题】.docx VIP
原创力文档

文档评论(0)