- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
对运动员聚类而非对指标聚类同时给出统计分析结果与作图结果第30页,共44页,星期日,2025年,2月5日要求给出聚类进度表,将输出凝聚过程中每一步的结果第31页,共44页,星期日,2025年,2月5日第1页,共44页,星期日,2025年,2月5日12.1聚类分析的作法12.1.1概述聚类分析(ClusterAnalysis)是依据研究对象的个体特征,对其进行分类的方法。分类在经济、管理、社会学、医学等领域,有着广泛的应用。[例]为制定我国成年女子的服装标准,选了14项身体指标:(1)总的体高Y1(2)身高Y2(3)上体长Y3(4)手臂长Y4(5)肩宽Y5(6)胸围Y6(7)颈围Y7(8)前胸Y8(9)后背Y9(10)前腰节Y10(11)后腰节Y11(12)下体长Y12(13)腰围Y13(14)臀围Y14对3454个成年女子分别进行了测量。如何根据样本的测量数据制定合乎中国国情的成年女子服装标准。第2页,共44页,星期日,2025年,2月5日3454名成年女子14个部位的谱系聚类图(类平均法)上体长y1手臂长y2下体长y12总体高y10身高y11前腰节y8后腰节y9胸围y3腰围y13臀围y14颈围y4前胸宽y6后背宽y7总肩宽y5距离00.10.20.30.40.50.60.7相关系数10.90.80.70.60.50.40.3第3页,共44页,星期日,2025年,2月5日问如何将下述卡通人物分类?第4页,共44页,星期日,2025年,2月5日管理实际中经常会遇到类似的问题。一般地,设有p个指标(变量),n个对象,依据这n个对象在这p个指标下的数据,对这n个对象进行聚类。设数据为指标:1,2,…,p对象1对象2…对象nP维空间中的一个点聚类问题,就是对p维空间中的n个点的聚类问题。第5页,共44页,星期日,2025年,2月5日一些要注意的问题变量(指标)并非越多越好。变量太多,就难以判断聚类结果的实际意义。例如对企业按照技术能力的各项指标(变量)聚类,可以在技术能力等方面把企业分为不同的类别。但如果把企业相关的所有指标都包括进来,对分类结果的含义就难以判断了。只要指标间有一定相关关系(不必高度相关),就可以对所观察的一群个体分类(Q-型聚类)。从而可以对个体进行进一步研究。例如可以对消费者的偏好进行分类;可以依据不同地区的有关经济特征(变量)对地区进行分类;等等。如果指标(变量)过多,也可以对指标进行分类(R-型聚类),把含义相近的指标聚在一起,将所有指标分为若干类。第6页,共44页,星期日,2025年,2月5日10.1.2聚类分析的作法1.将数据标准化为了消除不同变量的单位对聚类的影响,应当首先将所有的数据标准化。对上述数据矩阵X而言,按列进行标准化,就可解决不同数据单位问题。其中分别表示第j列数据的均值与标准差。第7页,共44页,星期日,2025年,2月5日2.计算对象之间的“距离”直观地,应将“相似”的对象分为一类,但如何刻画“相似”。根据前面的讨论,聚类实际上是对n维空间的点进行的,因此“相似”的点的“距离”也近。具体来说,先计算第i个对象与第j个对象之间的距离rij,就可得到对象之间“相似关系”矩阵:对象1对象2…对象n1,2,…,n对象,对象,…,对象对通常的距离而言,rij=rji,因此该矩阵为对称矩阵。第8页,共44页,星期日,2025年,2月5日聚类分析中的“距离”(1)欧氏距离:欧氏距离的平方为(2)偏差距离:第9页,共44页,星期日,2025年,2月5日(3)明考夫斯基(Minkowski)距离(的q次方):(4)马氏(Mahalanobis)距离(的平方):其中V是协方差矩阵。在聚类分析中,(1)、(2)中的常数因子(1/p)可以去掉,这样它们就是明氏距离的特殊情况。在具体应用时,可根据实际问题选用其中一种距离。第10页,共44页,星期日,2025年,2月5日(1)相关系数:(2)余弦:相似系数第11页,共44页,星期日,2025年,2月5日3.选择
原创力文档


文档评论(0)