- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
YOUR SITE HERE 3. 多步形成法(逐步计算成群法) 与一步形成法基本步骤相似,唯一的区别是每一步分类后,要把分过类变量合并成为一个新的变量,即在相关系数矩阵中划出最大的元素,将相应的变量合并,赋予新的记号,把合并的变量的数据加权平均作为新的变量的数据,再计算合并后新变量与其余各变量的相关系数,建立新的相关矩阵,再进行下一步分类,重复这一过程直到把所有变量都合并为一类。最后按归类作谱系图。 以距离作为聚类统计量(Q型聚类)情形:见前关于类间距离的系统聚类方法 以相关系数作为聚类统计量(R型聚类)情形: (1) 转换成距离来处理 (2) 连续计算相关系数矩阵 YOUR SITE HERE X1 x2 1 2 3 4 5 1 1 6 8 9 1 2 3 2 0 例:五个销售员的销售量x1与教育水平x2 聚类统计量:欧氏聚类 聚类方法:最短距离法 第四节 动态聚类法 也叫快速聚类法、逐步聚类、迭代聚类 quick cluster method, k-means model 样本量很大,用系统聚类法计算的工作量极大,作出的树状图也十分复杂, 不便于分析 YOUR SITE HERE (1)选取若干样品作为初始凝聚点(给出允许分类的最大个数k); (2)计算各样品与各凝聚点的距离,并作初始分类; (3)根据初始分类,计算各类重心,用重心代替初始凝聚点,进行第二次分类; (4)重复(2)步,直至所有样品都不再调整,分类达到稳定为止(称为聚类过程收敛) 动态聚类的基本思想 首先将样品粗略地分为若干类,然后在按照某种原则逐步修改直到合理的分类为止。 计算步骤: 选凝聚点,作初始分类 调整不适合点——修改分类 YOUR SITE HERE 小 结 与多元分析的其他方法相比,尽管聚类分析较为粗糙,没有明显的理论性,但应用方面取得了很大成功,确实是模式识别研究中非常有用的一类技术。 (1)综合性:Q型聚类分析可以利用多个变量的信息对样本进行分类,克服单一指标分类的弊端。 (2)形象性:聚类分析可以利用聚类图直观地表现其分类形态,及类与类之间的内在关系。 (3)客观性:聚类分析结果克服主观因素,比传统分类方法更客观、细致、全面和合理。 聚类分析方法与传统的统计分组方法相比,具有如下优点: YOUR SITE HERE 应用中须注意的问题 同一批数据采用不同的聚类统计量,有时会得到不同的分类结果。 同一批数据采用相同的聚类统计量,但采用不同的聚类方法,有时会产生不同的分类结果。 采用不同的数据变换方法可得到不同的分类结果。 在进行Q型聚类时,采用的变量并非越多越好,要选择对研究的分类问题具有价值的变量。 YOUR SITE HERE 应用中须注意的问题 对聚类分析结果的解释要谨慎。聚类分析是一种数字分类法,数字上相似,地质上不一定相似。 聚类分析是一种探索性技术,对于同一问题,可获得多种结果,解释需要结合专业知识。统计标志及数量特征上的相似,决不等于地质环境的相似——要选取能反映地质环境特征的变量及合理取值(要加强地质分析研究,这是一切定量方法必须遵守的共同点) YOUR SITE HERE (1)平移变换:将某一指标的数据同减去一数,一般是减去均值。 (2)极差变换:将某一指标的数据同除以该指标的极差。 (3)标准差变换:将某一指标的数据同除以该指标的标准差。 (4)主成分变换:将数据用它们的主成分代替,有时为了简化,只取前几个主成分、舍去次要的主成分。 (5)对数变换:将数据取对数,当数据之间数量级相差较大时常采用这一变换。 以上的变换有时同时采用,例如将数据标准化,就是先作变换(1),后作变换(3) 。 在实际问题中,不同的变量一般取的量纲不同,为了使不同的量纲也能放在一起比较,通常需要对数据作一些变换,有时即使变量用的同一量纲,为了使数据更适用某种数学模型,也需要将数据变换。 常用的变换有: 缩放坐标轴会映现最小聚类聚类方法的聚类结果 如果特征空间是各向同性的并且数据大致均匀地分布在各个方向上,选择欧氏距离作为相似性度量一般是合理的。 选用欧氏距离的分类结果不会因特征空间的平移和旋转而改变(点作刚体运动)。但是,一般地说,对线性变换或其它扭曲距离关系的变换是不能保证的。 YOUR SITE HERE LOGO YOUR SITE HERE 聚类分析法预测(Cluster Analysis) 第十讲 YOUR SITE HERE 第一节 引言 第二节 聚类统计量 第三节 系统聚类法 第四节 动态聚类法 主要内容 YOUR SITE HERE 第一节 引言 YOUR SITE HERE 人类认识事物、认识世界,往往从分
原创力文档


文档评论(0)