全国各省经济的聚类分析及判别分析.docxVIP

下载本文档

114
3
约1.17万字
约 15页
2019-08-05 发布于广东
举报
版权申诉

全国各省经济的聚类分析及判别分析.docx

1、本文档共15页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

全国各省经济的聚类分析及判别分析唐鹏钧 (DY1001109) 摘要：利用 SPSS 软件对全国 31 个省、直辖市、自治区(浙江、湖南、甘肃除外)的主要经济指标进行聚类分析，将其经济分成 4 种类型，并对浙江、湖南、甘肃进行类型判别分析。通过这两个方法对全国各省进行经济分类。本文选取了 7 项经济指标作为决定经济类型的影响因素，各项数据均来自 2010 年国家统计年鉴。分析结果表明：北京市和上海市为第一类经济类型；江苏省和山东省为第三类型；广东省为第四类经济；其他 25 个省、直辖市、自治区均属于第二类型。关键词：聚类分析、判别分析、经济类型引言聚类分析是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称。它直接比较各事物之间的性质，将性质相近的归为一类，将性质差别较大的归入不同的类。系统聚类分析又称集群分析，是聚类分析中应用最广的一种方法，它根据样本的多指标（变量）、多个观察数据，定量地确定样品、指标之间存在的相似性或亲疏关系，并据此连结这些样品或指标，归成大小类群，构成分类树状图或冰柱图。判别分析是根据多种因素(指标)对事物的影响来实现对事物的分类，从而对事物进行判别分类的统计方法。判别分析适用于已经掌握了历史上分类的每一个类别的若干样品，希望根据这些历史的经验（样品），总结出分类的规律性（判别函数）来指导未来的分类。聚类分析与判别分析都是研究分类的，但是它们有所区别： (1)聚类分析一般寻求客观的分类方法，在进行聚类分析以前，对总体到底有几种类型并不知道。判别分析则是在总体类型划分已知，在各总体分布或来自总体训练样本的基础上，对当前的新样本判定它们属于哪个总体。 (2)两类方法的建立的模型不一样，因此在处理某些特定的问题时，就会得 1 出不一样的结果，就本题看来，出现了经济类型上的判别不一致的细微差异，但是作为分类方法来说，两种方法在大部分情况下都能取得一致的效果。 (3)聚类分析与判别分析也是有联系的。如我们对研究的多元数据的特征不熟悉，当然要先进行聚类分析，才能考虑判别分析的问题。随着改革开放的进行，我国进入了一个前所未有的经济飞速发展时期，整体经济实力与日俱增。但是，我们也应该看到各个地区的发展不平衡，沿海地区发展较快，经济增长也较快，而中西部发展相对较慢。因此，基于这种现状，本文对全国各地区的经济进行聚类分析。首先对除浙江、湖南、甘肃三省的其他各省经济进行聚类，然后对浙江、湖南、甘肃三省的经济类型进行判别分析。通过本文的分析研究，可以清楚地认识到我国经济类型构成，以及各地区的发展差异，最终对国家以及各地区的发展及政策制定实施起到指导作用。本文采用多元统计分析方法，对全国 31 个省、直辖市、自治区的 7 项经济指标进行聚类分析和判别分析，从而能够比较客观地反映了当前各地区的经济类型。实验方案 1.1 数据统计本文根据 2010 年国家统计年鉴，选取了 2009 年 31 个省、直辖市、自治区的 7 项经济指标[1]，如表 1 所示。其中包括：各省的国内生产总值 X1、农业生产总值 X2、工业生产总值 X3、建筑业生产总值 X4、进出口总值 X5、批发企业销售额 X6 和餐饮业 X7。 1.2 聚类分析将表 1 所示的 31 个省、直辖市、自治区(除浙江、湖南和甘肃) 2009 年的各项数据导入 SPSS。为了便于分析，在聚类分析前，先对数据进行标准差标准化处理，其过程为：“Analyze→Descriptive Statistics→Descriptives…”，然后对标准差标准化后的数据进行聚类分析(Hierarchical Cluster Analysis)。其过程为：依次选择“Analyze→Classify→Hierarchical Cluster”，引入的变量是 X1 至 X7。从而对样品(个案)进行聚类，即 Q 型聚类分析(对研究对象本身分类)。聚类方法使 2 Between-groups linkage( 类间平均链锁法 ) ，距离测量技术选择 Squared Euclidean distance(Euclidean 距离平方，即两观察单位间的距离为其值差的平方和，该技术用于 Q 型聚类)。最终得出聚类分析结果。值得注意的是本文选择的聚类类型共分 4 类。 1 2009 年我国 31 个省、直辖市、自治区的各项经济指标数据统计单位：亿元国内生产农业生工业生建筑业生进出口总批发企餐饮地区产总值产总值产总值值业销售业总值(X1) (X2) (X3) (X4) (X5) 额(X6) (X7) 北京 12153.03 315.0 11039.135334148 22558.0 3