- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
各省份发展水平的主成分及聚类分析.doc
各省份发展水平的主成分及聚类分析
摘 要:运用数理统计方法对全国29个省份的综合发展水平进行综合评价,建立评价指标体系,运用主成分方法对原始数据进行数学处理,得出省份综合发展水平的综合指标,再用聚类分析方法进行指标聚类分析,找出影响城市发展的主要因素,并对如何提高城市发展提出合理性建议。
关键词:主成分分析;聚类分析;综合发展
中图分类号:C81 文献标志码:A 文章编号:1002-2589(2013)12-0062-03
引言
如今,一句“你幸福吗?”已是全中国老百姓最常被问到的话题,然而现在人们的幸福感已经不单单是几十年前的吃得饱、穿得暖,人们对待幸福的定义更加注重于民生,医疗、教育、经济、环境、食品等等,已成为人们判定幸福的新标准。据统计,浙江杭州连续7年蝉联“最幸福感城市”桂冠,其次是成都、长沙,相反对于中国的顶级城市上海和北京却很少入围,近10年中仅一次入围“最幸福感城市”,因此一个城市发展得好坏已从从前单一的经济时期过渡到了如今的综合发展阶段,为全面具体地了解一个省份的发展水平,现我们将从6个方面来综合地分析全国29个省份的综合发展情况,并根据得出的客观结果提出可行性建议。
一、方法介绍
(一)主成分分析
主成分分析也称主分量分析,旨在利用降维的思想,是把多指标转化为少数几个综合指标的一种多元统计分析方法。在用统计分析方法研究多变量的课题时,变量个数太多会增加课题的复杂性,因此,人们自然希望用较少的综合变量来代替。在很多情形下,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息[1]。
主成分分析是设法将原来众多具有一定相关性的(比如p个)指标,重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来p个指标做线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表全体数据信息,则可逐步增加第二、第三等主成分,共同表示总体信息。
(二)聚类分析
1.聚类分析的概念
聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。
聚类是将数据分类到不同的类或者簇这样的一个过程[2],所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类分析的目的是把类对象按照一定的规则分成若干类,这些类不是事先给定的,而是根据数据的征确定的,对类的数目和类的结构不必做任何假定。聚类分析依赖于对观测间的近程度(距离)或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果。聚类分析的内容十分丰富,按其聚类的方法可分为:系统聚类法,动态聚类法,有序样品聚类法,模糊聚类法,图论聚类法,聚类预报法。
2.系统聚类法
系统聚类又称谱系聚类,是一种逐次合并类的聚类分析方法,最后得到一个聚类的谱系图,可以把系统聚类的过程形象地表示出来。系统聚类法是目前在实际应用中使用最多的一类方法。
二、实例分析
(一)指标选取
根据综合评价的代表性原则、综合性原则、系统性原则以及我国各地区经济发展的实际,选取以下6个指标:x1为人均gdp(元)反映区域经济平均发展水平;x2为建设总规模(亿元),反映区域内设施建设能力;x3为平均工资income(元),反映职工工资水平的主要指标;x5为教育经费(万元),反映区域文化教育资金投入;x6为城镇人均医疗保健支出(元),数据汇总如下表所示:
(二)主成分分析
将上述数据整理后运用SAS软件进行主成分分析后得到方差分解主成分提取表(如表2)。
相关系数的特征值及各主成分的方差,可以看出第一主成分的方差为55.4%,第二主成分的方差为29.8%,第三主成分的方差为8.21%,前两个主成分的累计贡献率为85.26%,可见前两个主成分已经具有足够多的方差贡献率来概括该组数据。
根据所选主成分所代表的主轴长度之和占了所有主轴长度之和的大部分的原则我们选取了4个主成分,分别用prin1,prin2,prin3,prin,4表示。
可见第一主成分中NETINC最高gdp、income、capital系数相对较高,且系数均为正数,第二主成分中eduheal具有较高的整系数,由此可以把第一主成分看成由gdp、capital、incom
您可能关注的文档
最近下载
- 八项规定回头看自查报告.pdf VIP
- 2012北京 第一册市政道路、桥梁工程预算定额.pdf VIP
- 华为LTC流程IPD流程ITR流程三大核心流程变革一篇文章就全明白啦V2.0!.pdf VIP
- 普洱哈尼族彝族自治县2025年数学五年级第二学期期末学业质量监测试题含答案.doc VIP
- D-ZD2010发电厂汽水管道支吊架设计手册制造图册-中国电力规划.pdf VIP
- 产科急救应急预案.docx VIP
- 关于社区卫生服务中心五年发展规划十五五发展规划2025.docx VIP
- NBT 25085-2018 核电厂常规岛焊接技术规程.pdf VIP
- 烟草代办合同范本6篇.docx VIP
- 危险废物污染防治责任制度.docx VIP
文档评论(0)