- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于多元统计分析武汉城市圈农业经济发展水平研究-本科毕业论文
基于多元统计分析武汉城市圈农业经济发展水平研究
摘要:本文首先介绍了主成分分析和聚类分析的基本原理,然后运用数理统计中的多元统计分析方法对湖北武汉城市圈各地市农业经济发展水平进行综合评价和区域研究分析,首先建立评价指标体系,然后运用SPSS(统计分析软件)和EXCEL进行一系列的数学处理和分析。在数据分析中运用了主成分分析和因子分析方法分析了各地市在湖北武汉城市圈的农业经济中的地位,同时作出综合评价以及提出了利用聚类分析的方法来评价各地市农业经济地位等级的设想以及分区研究。最后分析了各地市农业经济存在差异的原因,并且提出了湖北武汉城市圈发展区域经济以及平衡区域经济差异的基本策略。
关键词:主成分分析;因子分析;聚类分析;武汉城市圈
一、前言
近年来,国务院对各省各地市的农业经济高度重视,农业经济是整个国民经济的基础,农业经济的发展水平、发展步伐决定整个国民经济发展。不同地市的资源和环境条件有很大的差别,资源的利用也有早有晚,湖北武汉城市圈各地市的农业经济发展水平表现出明显的区域差异。长期以来,人们仅以农作物播种面积和粮食总产量为依据将不同地市的农业经济进行区域划分,在过去这种方法在整个农业经济发展的规划中起了重要的作用。但是,近几年,随着各地农业经济形势的巨大变化,这种简单的划分已不能再反映湖北武汉城市圈农业经济发展的区域差异现状。因此,为了对湖北武汉城市圈各地市农业经济发展情况和发展水平正确、合理地分析,在农业经济发展水平评价中运用新的方法是十分必要的。本文运用科学的多元统计分析方法对湖北武汉城市圈各地市的农业经济发展水平进行综合评价和分区研究。
二、主成分分析原理和模型
(一)主成分分析原理
主成分分析是设法将原来众多具有一定相关性 (比如 P 个指标) , 重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来 P 个指标作线性组合, 作为新的综合指标。最经典的做法就是用 F1(选取的第一个线性组合, 即第一个综合指标) 的方差来表达, 即 Var(F1)越大, 表示 F1 包含的信息越多。因此在所有的线性组合中选取的 F1 应该是方差最大的, 故称F1 为第一主成分。如果第一主成分不足以代表原来 P 个指标的信息, 再考虑选取 F2 即选第二个线性组合, 为了有效地反映原来信息, F1 已有的信息就不需要再出现在 F2中, 用数学语言表达就是要求 Cov(F1, F2)=0, 则称 F2 为第二主成分, 依此类推可以构造出第三、 第四, ……, 第 P 个主成分。
(二)主成分分析数学模型
F1=a11ZX1+a21ZX2+……+ap1ZXp
F2=a12ZX1+a22ZX2……+ap2ZXp
……
Fp=a1mZX1+a2mZX2+……+apmZXp
其中 a1i, a2i, ……,api(i=1,……,m)为 X 的协方差阵Σ的特征值多对应的特征向量, ZX1, ZX2, ……, ZXp 是原始变量经过标准化处理的值, 因为在实际应用中, 往往存在指标的量纲不同, 所以在计算之前须先消除量纲的影响,而将原始数据标准化, 本文所采用的数据就存在量纲影响。
A=(aij)p× m=(a1,a2, …am,), Rai=λ iai, R 为相关系数矩阵, λ i、ai是相应的特征值和单位特征向量,λ 1≥λ2≥…≥λ p≥0 。进行主成分分析主要步骤如下:
1.根据研究问题选取指标与数据;
2.进行指标数据标准化( SPSS 软件 Factor 过程自动执行) ;
3.进行指标之间的相关性判定;
4.确定主成分个数m;
5.确定主成分Fi表达式;
6.进行主成分 Fi命名;
7.计算综合主成分值并进行评价与研究。
(三)聚类分析原理
聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。
从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等。
三、研究思路与方法
评价农业经济发展水平和分区研究的方法有很多种,为了能反映各地市农业经济发
文档评论(0)