网站大量收购闲置独家精品文档,联系QQ:2885784924

系统工程 第三部分(二) 聚类分析.pdf

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
系统工程 第三部分(二) 聚类分析

聚类分析 统计分组或分类可以深化人们的认识。实际应用中 有的分组比较容易,分组标志确定了,分组也就得 到了。但有些分组不那么容易。 聚类分析为我们提供了一种对于复杂问题如何分组 的统计方法。 2 聚类分析(cluster analysis )是统计学中研究“物 以类聚”问题的有效方法。它建立一种分类方法, 能够将一批数据按照他们在性质上的亲密程度在没 有先验知识的情况下自动进行分类。“类”是一个 具有相似性的个体的集合,不同类之间具有明显区 别。 聚类分析就是按照对象之间的“相似”程度把对象 进行分类。 3 聚类分析的统计思想 样本(或变量)间存在着相似性,根据多个观测指 标,找出能度量样本之间相似程度的统计量,以其 为依据,把相似程度较大的样本聚合为一类,关系 密切的聚合到一个小的分类单位,关系疏远的聚合 到一个大的分类单位,直到把所有的样本都聚合完 毕,把不同的类型一一划分出来,形成一个由小到 大的分类系统。 4 聚类分析的主要方法 层次聚类法 基本特征是:先将m个研究对象各自看成一类,是 初始分类,记为C 。然后根据类与类之间的距离来 0 合并,将C 中距离最近的类合并成一类,得到一组 0 新的类,记为C 。在C 这层分类的基础上,再重复 1 1 以上C —C 的过程,得到一组新的类,记为C , 0 1 2 以上聚类过程可以不断重复进行,得到一个聚类层 的序列C ,C ,C ,C 。其中C 中只有一类,即 0 1 2 k k 包含所有m个研究对象的类。 5 非层次聚类 其共同特点是:先给定一个粗糙的初始分类,然后 按照某种原则反复进行修正,直到分类较为合理为 止。 6 聚类分析的准备工作 聚类分析是以完备的数据文件为基础的,这一数据 文件除观测变量比较完备之外,一般还要求各个观 测变量的量纲一致,即各变量取值的数量级一致, 否则各变量在描述客观事物某方面特征差异性的作 用有被夸大或缩小的可能。 所以,聚类分析前要检查各变量的量纲是否一致, 不一致则需进行转换,如将各变量均作标准化转换 就可保证量纲一致。 7 8 在对样本进行分类时,度量样本之间的相似性常使 用点间距离 9 点间距离的计算方法主要有 • 欧氏距离(Euclidean distance) • 平方欧氏距离(Squared Euclidean distance) • Block距离(Block distance) • Chebychev距离(Chebychev distance) • 明科夫斯基距离(Minkovski distance) • 最常用的是平方欧氏距离 10 样本点间距离的计算方法 p Euclidean距离 (x y )2 i i

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档