第10章 聚类分析Ⅱ:分层聚类与密度聚类;10.1 引 言; 聚类分析的优点: (1)简单、直观; (2)主要应用于探索性的研究,其结果可以提供多个可能的解,选择最终的解需要研究者的主观判断和后续分析; (3)不管实际数据中是否真正存在不同的类别,利用聚类分析都能得到分成若干类别的解; (4)聚类分析的解完全依赖于研究者所选择的聚类变量,增加或删除一些变量对最终的解都可能产生实质性的影响。; 聚类分析的缺点: (1)不能自动发现分成多少个类———属于无监督分析方法; (2)期望能很清楚地找到大致相等的类或细分是不现实的; (3)对样本聚类时,变量之间的关系需要研究者决定; (4)不会自动给出一个最佳的聚类结果。; 问题1:K-均值算法有哪些典型的缺陷? 是否存在有效的解决方法? 提示:噪声敏感、非凸结构,如第9章表9 3所示。 本章阐述的分层聚类与基于密度的算法可以克服 K-均值算法的缺陷,其中分层聚类主要解决初始值选择与敏感性高的问题,而密度聚 类 主 要 解 决 非 凸 结 构 的 问 题,如 表10-1所示。;;10.2 分 层 聚 类;10.2.1 算法流程 分层聚类法首先将每个数据对象看成一个类,计算类之间的距离(如何计算类之间的距离将在10.2.2节中进行详细描述),每次将距离最近的数据对象合并成一个类。然
您可能关注的文档
- 汽车维修服务接待 课件 第1章 汽车维修服务接待概述.pptx
- 汽车维修服务接待 课件 第2章 汽车维修服务接待概述.pptx
- 汽车维修服务接待 课件 第3章 汽车维修服务接待的知识储备.pptx
- 汽车维修服务接待 课件 第4章 汽车维修服务接待流程及标准规范.pptx
- 汽车维修服务接待 课件 第5章 客户沟通与接待技巧.pptx
- 数据挖掘基础及其应用 课件 第3章 数据预处理.pptx
- 数据挖掘基础及其应用 课件 第4章 分类I概念与决策树算法.pptx
- 数据挖掘基础及其应用 课件 第5章 分类Ⅱ支持向量机.pptx
- 数据挖掘基础及其应用 课件 第6章 分类Ⅲ概率分类与回归.pptx
- 数据挖掘基础及其应用 课件 第7章 关联规则Ⅰ频繁模式挖掘.pptx
- 2026年区块链金融行业应用市场竞争报告.docx
- 2026年啤酒品牌产品创新市场分析报告.docx
- 2026年酒店行业绿色环保与可持续发展战略分析报告.docx
- 2026年度全国会计专业技术资格(初级)考试初级会计实务每日一练实战卷.docx
- 2026年度全国会计专业技术资格(初级)考试初级会计实务每日一练刷卷.docx
- 2026年医疗芯片技术标准与行业规范研究报告.docx
- 2026年水产品加工行业市场需求质量安全发展方向.docx
- 2026年广告设计行业广告设计行业设计趋势报告.docx
- 2026年土壤传感器行业市场规模及发展趋势预测.docx
- 2026年鲜味剂行业消费者购买行为研究.docx
原创力文档

文档评论(0)