网站大量收购闲置独家精品文档,联系QQ:2885784924

主成分分析和灰色关联聚类分析的湖南经济发展差异.doc

主成分分析和灰色关联聚类分析的湖南经济发展差异.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主成分分析和灰色关联聚类分析的湖南经济发展差异

湖南省各州、市经济发展水平的比较分析 [摘要] 本文以湖南省各、州市(包括湘西土家族自治州(吉首市))为研究对象,结合了湖南省2009年统计年鉴和部分州市的年末工作报告,选取了地区生产总值、固定资产投资、在岗职工年均工资和地方财政收入等14个衡量综合经济发展的指标,运用了灰色关联聚类分析、主成分分析和系统聚类分析的方法,对湖南省14个州市的经济发展差异进行定量分析。 [关键词] 主成分分析;灰色关联聚类;系统聚类;湖南;经济发展 0 引言 湖南省,简称湘,地处我国中部,位于长江中游南部地级行政区单位14个(包括13个地级市、1个自治州)县级行政区单位122个(包括35个市辖区、16个县级市、65个县、7个自治县)是荆楚文化的重要发源地。省辖域面积21.1829万平方公里。由于地理位置差异、资源分布不均以及国家政策偏向等原因,湘中各州市的经济发展有着明显的差异。 一般的主成分分析方法基于数据全体,在对全体指标笼统综合的同时忽视了指标之间的类别性差异问题,也就是是否有若干个指标关系十分密切而同属一类。而本文在处理指标数据时,创新地将灰色关联聚类分析和主成分分析法有机结合,即首先对指标进行灰色关联聚类分析,将14个衡量经济的指标分成可以定义的两类,每个聚类代表同一类指标;其次对每个聚类进行主成分分析,提取主成分因子,获得该类指标的主成分集合;最后基于权重思想综合所有聚类的主成分集合,形成既反映全体指标信息又体现指标聚类差异性的综合指标。这种方法有效的解决了传统主成分提取后进行聚类分析所忽视的指标之间的类别性差异问题。最后,再根据得到的两类主成分,运用系统聚类方法对所得分类地区进行分析,并针对分析的结论提出相应的对策。这使得本文的研究更具科学性、准确性和创新性。 1 材料与方法 1.1 统计指标和数据 根据“湖南省统计年鉴(2009年)”所统计的各项经济指标,以及部分州市年末的工作报告,提取了共14个衡量经济发展的指标和对应的数据,具体如表1.1和附录中的表1.2所示。 表1.1 14个衡量经济发展的指标 变量 指标名 单位 变量 指标名 单位 X1 总人口 万人 X8 农林牧渔业总产值 元 X2 从业人员 万人 X9 地区财政收入 万元 X3 在岗职工年均工资 元 X10 地方财政支出 万元 X4 农民人均纯收入 元 X11 城乡居民年末储蓄 亿元 X5 地区生产总值GDP 亿元 X12 规模工业总产值 亿元 X6 人均GDP 元 X13 固定资产投资 亿元 X7 耕地面积 千公顷 X14 社会消费品零售总额 亿元 1.2 多元统计方法 1.2.1 灰色关联聚类 灰色关联聚类是根据灰色关联矩阵将一些观测指标聚集成若干个可以定义的类,目的是使复杂系统得到相应的简化。一个聚类可看作是属于同一类的观测指标的集合。灰色关联聚类分析的基本思路是如果两个指标的关联程度足够大就认为同属一类。本文中应用该方法的步骤大致为:先将14项指标不同量纲的数据标准化;取分别系数为0.5,计算出它们的关联度矩阵;再取临界值为0.92,将14项指标分成两大类。 1.2.2 主成分分析 主成分分析是把原来多个变量划分为少数几个综合指标的一种统计分析方法,从数学的角度来看,这是一种降维处理技术。主成分分析的基本方法是通过构造原指标的适当的线性组合,以产生一系列互不相关的新综合指标,从中选出少数几个新指标并使它们含有尽可能多的原指标集合带有的信息,从而使得用这几个新指标代替原指标分析问题和解决问题成为可能。综合指标是原来多个指标的线性组合,虽然这些线性综合指标不能直接观测到,但综合指标间相互不相关,又能反映多个指标的信息。 如果原指标为,,…, ,主成分分析后得到的新,,…, 均是,,…, 的线性组合(nm): (1.1) 按一定原则求出系数,则称新指标,,…, 为原指标,,…, 的第一,第二,…,第m主成分。 1.2.3 系统聚类 系统聚类分析,是在数据点分类过程中按照某种距离模式对数据点类型归属一次性判别。。 2 结果与分析 2.1 指标的分类 根据灰色关联分析原理,得到各指标间的关联矩阵,取临界值为0.92,将所有指标分成两类:C1、C2。据表2.1,临界值大于或等于0.92的为C1=,其他的为C2=。即对于14项衡量经济发展的指标中,X1总人口、X2从业人员、X7耕地面积和X8农林牧渔业总产值作为一类C1,而X3在岗职工年均工资、X4农民人均纯收入、X5地区生产总值、X6人均GDP 、X9地区财政收入

文档评论(0)

xjj2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档