河北省各市经济类型的聚类和判别分析.doc

河北省各市经济类型的聚类和判别分析.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
河北省各市经济类型的聚类和判别分析 学 号:SY0801313 姓 名:杨连锋 摘要 本文采用聚类分析和判别分析这两类方法对河北省各市进行经济类型的分类,其中选取了8项经济指标作为决定经济类型的影响因素。首先应用SPSS软件的聚类分析,对各市所属的经济类别进行了归纳,然后对聚类分析的结果进行判别分析检验,重新判断其所属的经济类型。 关键词:聚类分析、判别分析、经济类型 1、引言 聚类分析是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称,它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。系统聚类分析又称集群分析,是聚类分析中应用最广的一种方法,它根据样本的多指标(变量)、多个观察数据,定量地确定样品、指标之间存在的相似性或亲疏关系,并据此连结这些样品或指标,归成大小类群,构成分类树状图或冰柱图。 判别分析是根据多种因素(指标)对事物的影响来实现对事物的分类,从而对事物进行判别分类的统计方法。判别分析适用于已经掌握了历史上分类的每一个类别的若干样品,希望根据这些历史的经验(样品),总结出分类的规律性(判别函数)来指导未来的分类。 聚类分析与判别分析都是研究分类的,但是它们有所区别: (1)聚类分析一般寻求客观的分类方法,在进行聚类分析以前,对总体到底有几种类型并不知道。判别分析则是在总体类型划分已知,在各总体分布或来自总体训练样本的基础上,对当前的新样本判定它们属于哪个总体。 (2)两类方法的建立的模型不一样,因此在处理某些特定的问题时,就会得出不一样的结果,就本题看来,出现了经济类型上的判别不一致的细微差异,但是作为分类方法来说,两种方法在大部分情况下都能取得一致的效果。 (3)聚类分析与判别分析也是有联系的。如我们对研究的多元数据的特征不熟悉,当然要先进行聚类分析,才能考虑判别分析的问题。 上至国家,下至各省市,在制定国民经济和社会发展 750.41 406.60 40.73 33.8015 19.20 28.64 唐山市 20.09 334.29 33.52 16.02 125.12 3.40 2.70 秦皇岛市 3.67 217.26 19.09 7.44 60.82 6.35 3.64 保定市 34.90 395.54 23.49 13.76 96.48 4.23 3.40 承德市 14.22 221.56 16.81 12.62 63.10 9.75 5.24 廊坊市 16.43 164.71 15.01 6.60 48.0 5.27 6.34 沧州市 34.52 280.93 61.11 16.68 101.85 5.03 5.22 衡水市 70.50 458.54 35.22 14.85 143.40 5.77 5.33 邯郸市 19.96 94.81 30.99 2.79 58.10 5.66 4.20 邢台市 40.01 578.57 58.00 5.48 115.33 6.26 7.36 张家口市 19.96 274.75 12.73 12.94 73.10 5.94 4.56 2.2 聚类分析 进入SPSS13.0 for windows分析程序,选择Analyze→Classify→Hierarchical Cluster,进行系统聚类分析(Hierarchical Cluster Analysis),引入的变量是X1至X7。采取对样品(个案)进行聚类,即Q型聚类分析(对研究对象本身分类)。聚类方法使用Between-groups linkage(类间平均链锁法),距离测量技术选择Squared Euclidean distance(EuclideanQ型聚类),得出以下计算结果。 Cluster 样品(Q型)聚类分析 表2 个案处理综合分析 Case Processing Summary(a,b) Cases Valid Missing Total N Percent N Percent N Percent 11 100.0 0 .0 11 100.0 a Squared Euclidean Distance used b Average Linkage (Between Groups) 表2中分别为有效个案(Valid)、缺失个案(Missing)和个案总数(Total)的个数和百分数。脚注显示聚类时采用的是距离度量方法,具体聚类方法为默认设置,即欧氏距离平方值。 Average Linkage (Between Groups) 类间平均链锁法 表3 凝聚顺序表 表3所列各项的意义如下:Stage聚类步骤号;Cluster Combined在某步中合并的个案;Coefficients距离或相似系数;Stag

文档评论(0)

ktj823 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档