聚类分析培训报告.ppt

  1. 1、本文档共88页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
聚类分析培训报告

(1)最优二分割 对m=6,5,4,3,2计算 J=1,2, m-1 (2)最优三分割 (3)最优四分割 W L 三、最优分割的简化方法---每次二分法 当样品数N很大时候,最优分割法的计算量很大。 1 首先确定最优二分割点 其次,对每个二分段再进行最优二分割,选择其中最小的作为三分点。 再次,对这三段,分别进行最优二分割,选择其中最小的 。。。 1 样品和变量的选择 N》P,样品类可不知,有已知类样品掺入,分类的含意更明确,变量要与研究问题有关,具有较强的分辨力。 2 相似性统计量的选择 一般:样品(Q型)用 ,变量(R型)用r。 距离系数要求变量独立,用主要成分分析后才处理后再计算。相似系数结果不理想可改用距离系数。 问题讨论 3 聚类结果无点群时 对R型是变量是相互独立或正交,对样品Q型是无分辨力的变量或样品的点在空间呈均匀分布。 敬请交流指导! * 有序样品的聚类——最优分割法 样品是按顺序排列,在分类中不允许打破样品的顺序 。 例如对于二分 原则:段类离差小,段间离差大。 类间区别最大(段间区别最大),类内区别最小(段间区别最大) 有序样品的聚类原则—方差分析法 段类离差平方和 段间离差平方和 2 1)最优二分割 ? 这N种方法中究竟哪种分法最优,只须分别计算这N种分法所对应的总变差,找出使总变差达到最小的那种分法即可 如果记 为N个样品在第N点进行二分割的总变差,其中:N表示被分割的数目;2表示分割成两段;j表示以第j个样品为分割点,对于上述种分割法的总变差分别为 其中: 2)最优三分割 为两个分割点 总变差计算公式: 如果有 为最优三分割,则 必为最优二分割 因若不然必存在另外一个最优二分割 满足 要求N个数的最优三分割,必须先求出前 个数的最优二分割 和 构成一个三分割。 3)最优L分割 确定最优L分割,如上可先确定前j个数的最优L-1分割 与 构成L分割 不一定是最优的L分割 +dj,n 为最小 因为最后加上的dj,导致不一定最小。所以,对于前面的j个点,就要计算j=n-1,j=n-2。。。的最优L-1分割 设 时, 最小 4)多指标的最优分割 对于每个样品如果有2个以上的指标即P≥2的情况,其原始资料矩阵为 此时,样品段 的变差可定义如下: 其中: 5)计算步骤 (1)数据正规划 将矩阵 中的元素 变换为 (2)计算变差矩阵 由矩阵计算全部分两类的各种分割相应的总变差,即对每一个 求出相应的总变量 找出最小值 确定各子段的最优二分割 (3)进行最优三分割 (4)最优L分割 在最优三分割的基础上产生最优四分割,在最优四分割的基础上可以产生最优五分割,继续做下去,如果已经做了L-1最优分割,则可以求最优K分割。由 找出最小值,就可以确定最优K分割。 有时,可以用极差来衡量样品段的 差异情况,即对样品段 对单指标情况,则 例子 P130 数据正规化 N个样品,P个指标 R型:变量?P个指标 Q型:样品?N个指标 将N个样品的两两间的距离系数求出来,可排一个距离系数矩阵 相似系数是衡量空间两个向量相似性的一个指标,相似系数越大,两个向量越相似。 相似系数 2、 将N个样品相似系数求出来,排成一个相似系数矩阵 相关系数 相关系数是衡量变量之间相关程度的一个指标,变量xi与xj的相关系数定义为: 3、 三、方法和步骤 0 原始数据变换 1 分类原则 统一分类原则为(样品、变量): ◆若选出的一对样品在已分好的类中都未出现过,则把它们形成一个新类。(形成新类) ◆若选出的一对样品,一个是在已分好的类中出现过,则把另一个也加入到该类中。(加入类中) ◆若选出的一对样品,都分别出现在已分好的两类中,则把这两个类联结成一类。(合并两类) ◆若选出的一对样品都出现在同一类中,则这对样品不用分类了。(不再分类) 2 一次形成法 1)对原始数据进行变换(取对数) 2)计算相似系数 3)用一次形成法形成分群图 1 X1 X4 0.9907 划去4行4列 X1 X 2 X3 X4 X5 X6 X1 X 2 X3 X4 X5 X6 2 X5 X6 0.9886 划去6行6列 X1 X 2

您可能关注的文档

文档评论(0)

小茗同学 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档