- 1、本文档共34页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DMCh数据挖掘算法——聚类分析
Introduced in Kaufmann and Rousseeuw (1990) Implemented in statistical analysis packages Inverse order of AGNES Eventually each node forms a cluster on its own DIANA (分裂式聚类分析) 什么是聚类分析? 聚类分析的数据类型 主要聚类分析方法分类 划分方法 层次方法 总结 Ch06 数据挖掘算法——聚类分析 聚类分析基于群组对象的相似性,具有广泛的应用领域 不同类型数据的相似性度量方法 聚类反复可以分为划分方法、层次方法、基于密度的反复、基于网格的反复和基于模型的方法 划分聚类分析 层次聚类分析 总结 思考题 1。 什么是聚类?简单描述划分的聚类方法(partitioning) 和层次的聚类方法(hierarchical)。 2。 聚类被普遍认为是一种重要的数据挖掘方法, 有着广泛的应用。对如下的每种情况给出一个应用 例子: (a). 把聚类作为主要的数据挖掘方法的应用。 (b). 采用聚类作为预处理工具, 为其它数据挖掘 任务作数据准备的应用。 * * * * * * * 第 * 页 Z S T U ZHEJIANG SCI-TECH UNIVERSITY 经济管理学院管理科学与工程系 本章学习目的 学习完本章后,需要了解和掌握的内容: 聚类的概念和聚类分析的过程 确定不同类型数据相似性度量 掌握一些主要的聚类方法 划分聚类分析方法 层次聚类分析方法 什么是聚类分析? 聚类分析的数据类型 主要聚类分析方法分类 划分方法 层次方法 总结 Ch06 数据挖掘算法——聚类分析 簇:数据对象的集合 聚类原则: 在同一个簇中的对象彼此相似 与其它簇中的对象相异 聚类分析 将数据集对象分类到簇中 聚类是无监督分类:没有预定义的分类 典型应用 作为独立工具获取数据分布的知识 作为其它算法的预处理步骤 (i.e., 关联分析和分类etc) 什么是聚类分析? 模式识别 空间数据分析 图像处理 经济科学 (特别是市场研究) WWW:文档分类 聚类: -- 发现总体的分布模式 -- 发现数据属性中感兴趣的关联 聚类分析的典型应用 Marketing市场: Help market analysts discover distinct groups in their customer databases, and then use this knowledge to develop targeted marketing programs Land use国土利用: Identification of areas of similar land use in an earth observation database City-planning城市规划: Identifying groups of houses according to their house type, value, and geographical location Earth-quake studies地震研究: Observed earth quake epicenters(震中) should be clustered along continent faults(大陆断层) Etc… 聚类分析应用的一些例子 一个好的聚类方法应该形成高质量的簇: high intra-class similarity(类内高相似) low inter-class similarity(类间低相似) 聚类结果的质量依赖于聚类方法的相似性指标以及它的实现 聚类方法的质量通过它能发现一些或所有隐含模式的能力进行评估 什么是好的聚类 可扩展性 处理不同类型属性的能力 发现任意形状的簇 对于决定输入参数的领域知识需求最小 能处理噪声数据 增加聚类和对输入记录的次序不敏感 高维性 ( 3) 与用户定义的约束的协同能力 可解释性和可用性 数据挖掘对聚类的要求 什么是聚类分析? 聚类分析的数据类型 主要聚类分析方法分类 划分方法 层次方法 总结 Ch06 数据挖掘算法——聚类分析 数据矩阵 对象-变量(元组与属性) 结构(two modes:n x p) 相异度矩阵 对象-对象结构 (one mode) 两种典型的数据结构 如何度量相异性d(i, j) -- 相异性的度量 (距离的度量) 与数据类型相关: Interval-scaled type (区间标值型) Binary type(二元型) Categorical/Nominal type 标称型 Mixed types(上述类型的组合型) 聚
您可能关注的文档
最近下载
- GB7231-2016《工业管道的基本识别色、识别符号和安全标识》 GB 7231-2003文档撰写.pptx VIP
- 八年级下册道德与法治教材课后习题参考答案(修改版).pdf VIP
- 化工公司综合应急预案.pdf
- 《中医诊断学》——四诊(课堂PPT).ppt
- 《企业架构分析》课件.ppt VIP
- TIA-604-18-2015 国外国际标准.pdf
- 运动营养学(第三版)课件全套 第1--10章 运动营养学基础、 健身运动的合理膳食营养---运动.pptx
- 钢琴谱 泰坦尼克号主题曲 原版 我心永恒 My heart will go on 五线谱 带指法.pdf VIP
- 英语说课稿(全英版)(精选范文).doc
- Lingumi单词卡level1-3(幼儿英语适合2-6岁幼儿).pdf VIP
文档评论(0)