第五章 聚类分析.pdf

  1. 1、本文档共87页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章 聚类分析 聚类分析概述 系统聚类分析 动态聚类法 模糊聚类分析 图论聚类分析  统计分组或分类可以深化人们的认 识。实际应用中,有些情况下进行统计分 组比较容易,分组标志确定了,分组也就 得到了,但是,有些情况下进行统计分组 却比较困难,特别是当客观事物性质变化 没有明显标志时,用于确定分组的标志和 组别就很难确定。聚类分析实际上给我们 提供了一种对于复杂问题如何分组的统计 方法。 第一节 聚类分析概述 一、聚类分析的定义 二、聚类分析的种类 三、聚类分析中样品或变量亲疏 程度的测定 聚类分析的定义 聚类分析是将样品或变量按照它们在性 质上的亲疏程度进行分类的多元统计分析方 法。聚类分析时,用来描述样品或变量的亲 疏程度通常有两个途径,一是把每个样品或 变量看成是多维空间上的一个点,在多维坐 标中,定义点与点,类和类之间的距离,用 点与点间距离来描述样品或变量之间的亲疏 程度;另一个是计算样品或变量的相似系 数,用相似系数来描述样品或变量之间的亲 疏程度。 聚类分析的种类  (一)聚类分析按照分组理论依据的不同,可分为系统 聚类法,动态聚类法,模糊聚类、图论聚类、聚类预报等 多种聚类方法。  1、系统聚类分析法。是在样品距离的基础上定义类 与类的距离,首先将个样品自成一类,然后每次将具有最 小距离的两个类合并,合并后再重新计算类与类之间的距 离,再并类,这个过程一直持续到所有的样品都归为一类 为止。这种聚类方法称为系统聚类法。根据并类过程所做 的样品并类过程图称为聚类谱系图。  2、动态聚类分析法。是将个样品初步分类,然后 根据分类函数尽可能小的原则,对初步分类进行调整优 化,直到分类合理为止。这种分类方法一般称为动态聚类 法,也称为调优法。  3、模糊聚类分析法。是利用模糊数学中模糊集 理论来处理分类问题的方法,它对经济领域中具 有模糊特征的两态数据或多态数据具有明显的分 类效果。  4、图论聚类分析法。是利用图论中最小支撑树 (MST)的概念来处理分类问题,是一种独具风 格的方法。  5、聚类预报法。是利用聚类方法处理预报问题 的方法。主要应用于处理一些出现异常数据的情 况,如气象中的灾害性天气的预报,这些异常数 据采用回归分析或判别分析处理的效果不好,而 聚类预报可以弥补回归分析及判别分析方法之不 足,是一个很值得重视的方法。  (二)按照分析对象不同,可以分为Q型聚类分 析和R型聚类分析。 Q型聚类分析法是对样品进行的分类处理, 可以揭示样品之间的亲疏程度。R型聚类分析法 是对变量进行的分类处理,可以了解变量之间, 以及变量组合之间亲疏程度。 根据R型聚类的结果,可以选择最佳的变量 组合进行回归分析或者Q型聚类分析。其中,选 择最佳变量的一般方法是,在聚合的每类变量 中,各选出一个具有代表性的变量作为典型变 量,其中选择的依据是 r2 。 2 ri 2 i r k 1 r 2 :表示每个变量与其同类的其它变量的 相关系数的平方的均值。k为该类中变量的 2 个数。应用中,挑选 r 值最大的变量xi 作 为该类的典型变量。 聚类分析中样品或变量 亲疏程度的测定  1、变量类型与数据变换 通常变量类型按照计量尺度的不同,分为定

文档评论(0)

xingyuxiaxiang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档