对我国各省市2008年经济状况聚类分析.docVIP

对我国各省市2008年经济状况聚类分析.doc

此“经济”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
对我国各省市2008年经济状况聚类分析

对我国各省市2008年经济状况的聚类分析   摘 要:按经济发展水平,我国习惯上被分成东、中、西三个大经济区域。文章选取除我国港、澳、台之外的31个省市为样本,基于2008年第一、二、三产业和地区人均生产总值等综合反映各省市经济发展状况的指标,采用欧氏距离、离差平方和法对所选样本进行聚类分析,将样本空间分为四类,并对所分类别进行讨论。   关键词:经济状况 聚类分析 经济区域   中图分类号:F207文献标识码:A   文章编号:1004-4914(2010)03-087-02      一、引言   按经济发展水平,如果不考虑我国香港特别行政区、澳门特别行政区,以及我国台湾地区,余下的31个省区市结合地理位置因素大体可以分成东、中、西部三个大的区域,并习惯上认为东部经济发展水平高于中部,中部又高于西部。一直以来,我国各省之间由于历史累积、资源禀赋、经济基础、政策倾斜等方面存在差异,造成了经济发展不平衡的问题。因此,对各省经济发展水平层次的分析显得犹为重要,以便准确识别区域经济的现状、变化,从而因地制宜,制订出适合区域经济发展的政策。根据《中国统计年鉴》2008年的数据, 本文以农林渔牧业、工业、建筑业、交通运输业、批发零售业、住宿餐饮业、金融业、房地产业和其他服务业的年均总值为对象,利用聚类分析功能进行经济区划分。   二、聚类分析   1.原理。聚类分析的基本原理是把某种性质的对象归于同一类,而不同类之间存在较大差异。为此,首先需要刻画各个变量之间或者各个样本点之间的相似性。   聚类分析包含的内容很广泛,有系统聚类法、K均值聚类法、动态聚类法、分裂法、最优分割法、模糊聚类法等多种方法。其中系统聚类法是聚类分析中应用最广的一种方法,其基本原理是:首先将一定数量的样品或指标各自看成一类,然后根据样品或指标的亲疏程度,将亲疏程度最高的两类进行合并。然后考虑合并后的类与其它类之间的亲疏程度,再进行合并。重复这一过程,直至将所有的样品或指标合并为一类。衡量亲疏程度的指标有两种:距离和相似系数。定义样本点之间的距离可以采用欧氏距离、明考夫斯基距离、马氏距离、兰氏距离等侧度,定义个变量之间的相似系数则多采用样本相关系数、夹角余弦等侧度。   2.指标体系。进行经济区域划分,应考虑的指标因素是很多的。既要以经济因素为主,又要考虑自然因素和社会因素;既要有影响经济发展的指标,又要有经济现象引起的指标;既要考虑经济发展的现状,又要考虑经济发展的过程和经济发展的未来方向。参考有关资料,给出了31个省市进行经济区划分的指标。各省市的指标数据如表1所示。   本文基于离差平方和法主要介绍分层聚类分析,就是通过对变量的测量,将比较接近的个案找出来归为一类,进一步再将比较接近的类合并成新的类,逐层合并直到最后合并成一类。分层聚类产生的结果不在聚类的开始,也不在聚类的最终,而是在其过程中。研究者将根据聚类过程适当截取聚类结论。聚类过程用树状图可以很清楚地看出来。   图1清晰地表示了聚类的全过程。它将实际距离按比例调整到(上接第87页)0-25的范围内,用逐级连线的方式连结性质相近的个案或新类,直至并为一类。在该图上部的距离标尺上根据需要粗分或细分选定一个划分类的距离值,然后垂直标尺划线,该垂线将与水平连线相交,则相交的交点数即为分类的类别数,相交水平连线所对应的个案聚成一类。例如,选标尺值为5,则所有个案分为4类;若选标尺值为10或15,则聚为两类。实际的聚类情况如图1中所示。   三、结论   据前所述,可以把这些省市分为以下四类情况,如表2所示。   通过对全国31个省市2008年地区经济状况的分析,利用聚类功能进行经济区域划分,将这31个样本数据分作四类,分类结果如表2所示。对该分类结果作如下总结:   经济发达地区(1类):这类地区毫无疑问包括京、津、沪。作为全国最早成立的直辖市,国家政策的扶持有着非常显著的作用。北京和上海是全国最大的两个城市,其经济发展水平已经接近发达国家的水平;天津经济虽然发展较慢一些,但是由于濒海,进出口贸易和工业相当发达,且人口相较其余两个城市少,因此该地区的经济发展水平也是很高的。   经济较发达地区(3类):这类地区包括江、浙、粤、鲁。江、浙、粤三省历来就是经济强省,属于东部经济发达地区,山东省靠海的城市多港口多,属于工、农业大省,尽管人口多,但其经济发展水平仍然处于一个很高的位置,可以和其余三省归为一类。   经济中等发达地区(2类):包括东北三省(黑、吉、辽)、中部大部分地区(冀、豫、晋、内蒙古、鄂)以及一个沿海省市(闽)。福建省本来属于东部省市,但由于福建山区多,工业和农业都不发达,尽管厦门、福州这类城市经济发展迅猛,但就全省经济发展状况而言与上面二类地区仍有较大差距

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档