网站大量收购独家精品文档,联系QQ:2885784924

基于聚类分析的吉林省2010年经济发展状况研究.doc

基于聚类分析的吉林省2010年经济发展状况研究.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于聚类分析的吉林省2010年经济发展状况研究 摘要:本文以吉林省内的9个市级地区为研究对象,选取了反映经济发展水平的9个指标,应用聚类分析的方法,利用SPSS软件对这些地区2010年的发展状况进行了统计分析。结果显示长春和吉林市的发展水平比较高,其他城市发展较为缓慢。为提高吉林省全省的发展水平提供了参考的依据,为促进全省共同发展提出了具有参考价值的分析。 关键词:聚类分析;吉林;经济发展 引言 改革开放以来,东北地区一直是我国最重要的工业基地和发达地区,也在社会主义建设中起到了中流砥柱的作用。东北经济发展在改革开放之后取得了很多值得称赞的成就,但是相比经济发展更快的沿海地区以及正在崛起的中部地区,东北地区的经济发展还是略显疲态。GDP和工业增加值也由改革开放初期的近15%和20%下降到现在的10%。而吉林作为东北地区经济发展相对较慢的地区更面临着极大的挑战。本文选择吉林省各个地区2010年经济发展的相关数据,采用聚类的方法,将各个地区分按发展状况分类,并针对于处于不同类别的地区采取不同的经济刺激方案,以求更加合理的利用资源,实现总体经济的快速增长。 1.聚类分析的概念及分类 聚类分析(Cluster Analysis)又称群分析,是对样品或指标进行类的一种多元统计方法。聚类分析将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。目的在于使类间对象的同质性最大化和类与类间对象的异质性最大化。 聚类分析给人们提供了丰富多彩的分类方法,这些方法一般包括,系统聚类法,模糊聚类法,K-均值法等等。本文采用的分类方法为K-均值法。K-均值法也被称为快速聚类法,它是一种非谱系聚类法,它是把样本聚集成k个类的集合。类的个数k可以预先给定或者在聚类过程中确定。K-均值算法是常用的很经典的基于划分的聚类算法,采取距离作为相似性的评指标,即认为两个对象的距离越近,其相似性就越大。该类算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。 2.聚类技术的一般步骤 第一步是特征提取。它的输入是原始样本。特征提取的结果是输出一个矩阵,每一行是一个样本,每一列是一个样本矩阵。 第二步是执行聚类算法,获得聚类谱系图。聚类的输入是一个样本矩阵,它把单个样本想象成为特征变量空间中的点。聚类算法的目的就是获得能够反映N维空间中这些样本点的最本质的“簇”的性质。 第三步是选取合适的分类阀值。在得到了聚类谱系图后,就能够从聚类谱系图上直接看出分类方案。 3.数据整理 本文收集了2010年吉林省各市及自治区的主要经济指标。数据来源于吉林市各级人民政府公布的政府工作报告。对所有数据的运算,运用SPSS软件,采用欧式距离(squard Euclidean distance)(欧式距离具有简单、直观的特点)为Measure对数据进行分析。 2010年吉林市各市及自治州发展状况 地区 地区生产总值(亿元) 农林牧渔业总产值(亿元) 工业增加值(亿元) 规模以上工业总产值(亿元) 固定资产投资(亿元) 社会消费品零售总额(亿元) 进出口总额(亿美元) 全口径财政收入(亿元) 城镇新增就业人口(万人) 长春市 3329 474.7 1476.2 5750.8 3001.5 1286.7 132.2 563.4 10.8 吉林市 1800.6 299.9 626 2124.7 1950.1 684.02 84.3 192.2 9.5 白山市 370 62.8 170 255.8 410 117 1.65 36.4 4 白城市 441.5 155.3 183.8 260.9 490.1 162.2 0.8149 32.8 4 辽源市 410 78.2 180.5 592.6 542 107.5 0.725 28.1 3.5 四平市 810 220 294 1100 660 290 2.51 56 5.76 松原市 1102.8 191 495.7 1186.3 1000.02 329.7 0.8821 75.1 5.5 通化市 600 137 262 895 800 249.4 6.17 61.7 5 延边朝鲜族自治州 545 86 213 585 738 261 15.2 88 4.5 表一 从表一可以看出长春市是吉林省发展最快的地区,吉林市紧随其后,而其它地区则相对落后。由于以上指标的数量级有一定的差异,所以有必要先对数据进行标准化处理,然后再进行聚类。将所选数据用k-均值聚类方法分成四类,分类过程及结果如下: 初始聚类中心 聚类 1 2 3 4 Zscore(地区生产总值(亿元)) 2.35575 .77904 -.69678 .05918 Zscore(农林牧渔业总产值(亿元)) 2.17563 .

文档评论(0)

企业资源 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档