用聚类分析法分析我国区域经济发展水平.docVIP

用聚类分析法分析我国区域经济发展水平.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用聚类分析法分析我国区域经济发展水平.doc

PAGE  PAGE 6 用聚类分析法分析我国区域经济发展水平   摘要: 本文首先对聚类分析进行简要概述,然后针对省会城市和计划单列市主要经济指标来研究我国城市的经济状况,通过SPSS软件聚类分析的K-均值算法将36个城市分成三类,通过分类结果讨论城市之间的经济发展差距,为进一步研究经济发展做好分析工作。   Abstract: At first, this paper simply expounds the cluster analysis. Then, aimed at the major economic indicators of the capital cities and the cities specifically designated in the state plan, the paper studies the economy situation of the cities in China. The 36 cities are divided into three categories by K-means algorithm of the cluster analysis of SPSS software. The economic development gap among the cities is discussed by the classification results to do a good job for the further study of economic development.   关键词: 区域经济;发展水平;聚类分析   Key words: regional economy;developmental level;cluster analysis   中图分类号:F127 文献标识码:A 文章编号:1006-4311(2016)02-0072-02   0 引言   在理论研究和实际工作中经常要进行分类。当只有一个指标时, 按大小单排序即可;当有多个指标时, 就不能进行单排序了,需要用聚类分析方法进行综合评估。聚类分析是一种来源于数值分类学且运用多元统计分析技术对数据样本或者变量进行分类的方法。本文主要是针对省会城市和计划单列市主要经济指标来研究我国城市的经济状况,将城市指标数据通过SPSS软件进行聚类分析,对我国不同城市的经济发展做一个比较和分类,其处理方式是使用SPSS中的K-均值算法,将36个城市分成三类, 得出区域经济发展水平的分类情况。   1 聚类分析概述   1.1 聚类分析基本思想   聚类分析是研究对样品或指标进行分类问题的一种多元统计分析方法。其基本思想是通过一个大的对称矩阵把需要研究分类的对象看作多维空间的一些向量,按照各类聚类算法的各自准则定性或者定量的求出这些数据(或者变量)间的相似程度值,同时又按照这些样本(或者变量)的内在联系等因素合理的逐步将它们分类到不同的类或者簇,形成一个亲疏关系谱系图,用以更直观地显示分类对象的差异和联系,进而能够更加客观的反映样本(或者变量)间的相关关系,便于对实际问题进行具体分析。   1.2 聚类分析方法   传统的聚类分析算法有五类:划分方法、层次方法、基于密度方法、基于网格方法和基于模型方法。本文使用的是基于划分方法的K-均值算法,介绍如下。   给定一个n个对象或元组的数据库,一个划分方法构建数据的k个划分,每一个划分表示一个聚簇,而且有k≤n。也就是说,它将数据划分为k个组,同时满足要求:每一个组最少包含一个对象;每个对象必须属于且只属于一个组。典型的此类算法如k-均值算法,k-中心点算法等。   K-均值算法是以k为输入参数,将n个对象的集合分为k个类,使得类内相似度高,类间相似度低,类的相似度是类中对象的均值度量,可以看做类心(簇心)。   其中,E是数据集中全部对象的平方误差和,p是空间中的点,mi是类Ci的均值,也就是对于每个类种的每一个对象,求对象到其类心距离的平方再求和。   K-均值算法步骤:   ①人为主观选取k个对象作为初始的类中心;   ②按照与每个中心的距离,根据就近原则,将每个对象赋给最近的类;   ③重新计算每一个簇的平均值;   ④重复执行②、③,如此反复,直到E的值改变很小或收敛(中心的改变量为0)为止。   2 聚类分析的过程   2.1 数据来源及标准化   《中国统计年鉴》是国家统计局出版发行的全面反应中华人民共和国经济和社会发展情形的资料性年刊,收录上一年全国和各省、自治区、直辖市每年经济和社会各方面大批的统计数据,和历史重要年份以及近二十年的全国主要统计数据,是最全面、最具权威性的综合统计年鉴。

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档