- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚类分析j
聚类分析法 ——BY 刘景娜 聚类分析的原理 定义 种类 聚类分析中样品或变量亲疏程度的测定 1.基本思想和分析步骤 (1)基本思想 系统聚类分析的基本思想是,把n个样品看成p维(p个指标)空间的点,而把每个变量看成p维空间的坐标轴,根据空间上点与点的距离来进行分类。 (2)系统聚类分析的一般步骤 1)对数据进行变换处理; 2)计算各样品之间的距离,并将距离最近的两个样品合并成一类; 3)选择并计算类与类之间的距离,并将距离最近的两类合并,如果累的个数大于1,则继续并类,直至所有样品归为一类为止; 4)最后绘制系统聚类谱系图,按不同的分 类标准,得出不同的分类结果。 2.常用系统聚类分析方法 (1)最短距离法 (2)最长距离法 (3)中间距离法 (4)重心法 (5)类平均法 (6)可变类平均法 (7)可变法 (8)离差平方和法 3. 系统聚类分析方法的统一公式 由于聚类方法的合并类原则和步骤是完全一样的,所不同的是类与类之间的距离公式有不同的定义,所以可得到不同的递推公式。 1969年维希特提出了统一的公式,这为编制统一的计算机程序提供了极大的方便性。 其中系数对不同聚类方法有不同的取值。如表所示: 动态聚类分析法 (1)选择凝聚点 凝聚点就是一批有代表性的点,是待形成类的中心。凝聚点的选择直接决定初始分类,对分类结果也有很大影响,通常选择凝聚点的方法为: 1)凭经验选择凝聚点。 2)根据数据情况将全部样品人为地凭经验分成k类,之后计算每一类的重心,将这些重心作为凝聚点。 3)用密度法选择凝聚点。 4)用前k个样品作为凝聚点。 (2)初始分类 有了凝聚点以后接下来就要进行初始分类,同样获得初始分类也有不同的方法。需要说明的是,初始分类不一定非通过凝聚点确定不可,也可以依据其他原则分类。 以下是其他几种初始分类方法: 1)人为分类,凭经验进行初始分类。 2)选择一批凝聚点后,每个样品按与其距离最近的凝聚点归类。 3)选择一批凝聚点后,每个凝聚点自成一类, 将样品依次归入与其距离最近的凝聚点那一类,并立即 重新计算该类的重心,以代替原来的凝聚点,在计算下 一个样品的归类,直至所有样品都划到相应的类中为止。 (2)初始分类 4)做数据标准化处理。 令 对每一个样品分别计算 5)用其他聚类方法得到一个分类,这个分类就作为初始分类。 (3)分类函数 按照修改原则不同,动态聚类方法有按批修改法、逐个修改法、混合法等。这里主要介绍逐步聚类法中按批修改法。按批修改法分类的原则是,每一步修改都将使对应的分类函数缩小,趋于合理,并且分类函数最终趋于定值,即计算过程是收敛的。 (3)分类函数 2.动态聚类分析步骤 (1)首先将原始数据进行标准化处理; (2)选择预定数目凝聚点进行初始分类; (3)计算每一类的重心,将重心作为凝聚点,然后计算每一个样品与重心凝聚点的距离,并将它归入与凝聚点距离最近的那一类别。每归入一个样品之后,重新计算该类的重心,并用新计算的 重心替代原凝聚点,如果新凝聚点与老凝 聚点重合,则分类过程终止。 模糊聚类分析法 1.模糊聚类分析的基本思想 模糊聚类法是将模糊集的概念应用到聚类分析中所产生的一种聚类方法。它是根据研究对象本身的属性而构造的一个模糊矩 阵,在此基础上根据一定的隶属度来 确定其分类关系,根据分类关系得到 相应的聚类结果。 2.模糊聚类分析步骤 第一步:对原始数据进行变换 2.模糊聚类分析步骤 第二步:建立模糊相似矩阵。 2.模糊聚类分析步骤 第三步:获得模糊分类关系。 2.模糊聚类分析步骤 第四步:进行模糊聚类。 对满足传递性的模糊相似矩阵 进行聚类处理。将类逐渐合并,最后得到聚类谱系图,从而进行 合理的分类。 图论聚类分析法 1.图论聚类分析的基本思想 图论聚类法又称为最小支撑树聚类方法。图论聚类法的基本思想为,一个多变量的样品可以用多维 空间中的一个来代表。在多维空间中,如 果样品点在某些区域密度很高,而在另一 些区域密度很低,甚至空白,
文档评论(0)