- 1、本文档共44页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3.4-聚类分析的
第四节 聚类分析;聚类分析起源于分类学,在考古的分类学中,人们主要依靠经验和专业知识来实现分类。
随着生产技术和科学的发展,人类的认识不断加深,分类越来越细,要求也越来越高,有时光凭经验和专业知识是不能进行确切分类的,往往需要定性和定量分析结合起来去分类。
于是数学工具逐渐被引进分类学中,形成了数值分类学。后来随着多元分析的引进,聚类分析又逐渐从数值分类学中分离出来而形成一个相对独立的分支。;与其他多元分析方法相比,聚类分析方法较为粗糙,理论上还不够完善,正处于不断发展阶段。
但是,由于该方法应用方便,分类效果较好,因此越来越为人们所重视。近些年来聚类分析的方法发展较快,内容越来越丰富。
;社会经济领域中存在着大量分类问题;又如:若对某些大城市的物价指数进行考察。
物价指数很多,有农用生产物价指数、服务项目物价指数、食品消费物价指数、建材零售价格指数等等。由于要考察的物价指数很多,通常先对这些物价指数进行分类。
因此聚类分析这个有用的数学工具越来越受到人们的重视,它在许多领域中都得到了广泛的应用。
值得提出的是将聚类分析和其它方法联合起来使用,如判别分析、主成分分析、回归分析等往往效果更好。;二、距离和相似系数;三、变量的类型;;不同类型的变量,在定义距离和相似系数时,其方法有很大差异,使用时必须注意。
研究比较多的是间隔尺度,因此本节主要给出间隔尺度的距离和相似系数的定义。;Evaluation only.
Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.
Copyright 2004-2011 Aspose Pty Ltd.;问题转变为矩阵的行与行、列与列向量间的相似关系的讨论;问题转变为矩阵的行与行、列与列的向量间的相似关系的讨论; 四、对样品分类(称为Q—型聚类分析)常用的距离和相似系数定义;i)明氏(Minkowski)距离;采用明氏距离时要注意:;在明氏距离中,最常用的是欧氏距离。
主要优点:当坐标轴进行正交旋转时,欧氏距离是保持不变的。因此,如果对原坐标系进行平移和旋转变换,则变换后样本点间的相似情况(即它们间的距离)完全同于变换前的情形。
不足之处:
第一、它与各指标的量纲有关
第二、它没有考虑指标之间的相关性;举例说明欧氏距离的明显的不足之处;这时讨论距离时需要进行加权,加权的办法之一是从X的分量的离散程度考虑,离差大的分量在距离中应相应地削弱它的影响程度。为此引入马氏距离。
马氏距离是由印度统计学家马哈拉诺比斯于1936年引入的,故称为马氏距离。这一距离在多元统计分析中起着十分重要的作用,下面给出定义。;ii)马氏(Mahalanobis)距离;马氏距离的优缺点;距离矩阵;2、相似系数; i)夹角余弦;相似矩阵; ii)相关系数;相似矩阵; 五、对指标分类(称为R-型聚类分析) ;常用的距离和相似系数定义; 聚类分析内容;六、系统聚类法;在如上的并类过程中出现这样一个问题:两类之间如何度量其相似程度?为此,需要引进两类之间的“距离”或“相似系数”的概念。
正如样品之间的距离可以有不同的定义方法一样,类与类之间的距离也有各种定义。例如可以定义类与类之间的距离为两类之间最近样品的距离,或者定义为两类之间最远样品的距离,也可以定义为两类重心之间的距离等等。类与类之间用不同的方法定义距离,就产生了不同的系统聚类方法。; 八种系统聚类方法;系统聚类法的具体步骤:;Evaluation only.
Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.
Copyright 2004-2011 Aspose Pty Ltd.;Evaluation only.
Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.
Copyright 2004-2011 Aspose Pty Ltd.;Evaluation only.
Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.
Copyright 2004-2011 Aspose Pty Ltd.;Evaluation only.
Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0.
Copyright 2004-2011 Aspose Pty Ltd.;Evaluation only.
Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.
您可能关注的文档
- 25G车真空集便系统的.ppt
- 2cpu讲的.ppt
- 2_集合与关系的.ppt
- 2、护理学2011年专业牡科目学习教材(解压缩后阅读).doc
- 2、建筑平面设计的.ppt
- 2_中国本土私募股权的基金的投资管理及退出.ppt
- 2、条件转移指令的.ppt
- 2、程序控制的.doc
- 2、问卷调查法课件的.ppt
- 2化学反应速率的.ppt
- 金融产品2024年投资策略报告:积极适应市场风格,行为金融+机器学习新发现.pdf
- 交运物流2024年度投资策略:转型十字路,峰回路又转(2023120317).pdf
- 建材行业2024年投资策略报告:板块持续磨底,重点关注需求侧复苏.pdf
- 宏观2024年投资策略报告:复苏之路.pdf
- 光储氢2024年投资策略报告:复苏在春季,需求的非线性增长曙光初现.pdf
- 公用环保2024年投资策略报告:电改持续推进,火电盈利稳定性有望进一步提升.pdf
- 房地产2024年投资策略报告:聚焦三大工程,静待需求修复.pdf
- 保险2024年投资策略报告:资产负债匹配穿越利率周期.pdf
- 政策研究2024年宏观政策与经济形势展望:共识与分歧.pdf
- 有色金属行业2024年投资策略报告:新旧需求共振&工业原料受限,构筑有色大海星辰.pdf
文档评论(0)