数理统计第二次作业——聚类与判别分析.docVIP

数理统计第二次作业——聚类与判别分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数理统计第二次作业——聚类与判别分析

地区生产总值及经济发展状况的统计分析 学号:姓名:引言 生产总值是领土面积内的经济情况的度量。是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标。它不但可反映一个国家的经济表现,更可以反映一国的国力与财富。 地是指由地方政府组织、支配的。是地方经济建设、政府机器运行和各方面事业发展的关键因素和物质基础。分地区可以较为准确反映地区经济发展状况,通过建立地区模型,对各地区经济发展状况进行分类,具有一定的准确性和合理性。 本文应用数理统计软件SPSS对各地区进行聚类和判别分析,分析和评定各地区经济发展情况,同时对各地区进行分类,确定经济优势地区和薄弱地区。 地区经济发展的聚类分析 分地区主要包括的内容有: : 包农、林、牧、渔业。 : 包括工业及建筑业。 第三产业: 包括交通运输、仓储和邮政业。 相关自变量的选择 从分析地区的内容出发对地区经济发展的聚类分析地区为了便于分析,我们部分合为一类交通运输、仓储和邮政业元素作为自变量进行聚类分析和判别分析。需要聚类和判别的地区为北京、上海等31省市自治区直辖市(不包括港澳地区)。 我们选用2007年度地区的数据进行分析(数据来自中国统计年鉴2007数据来自中国统计年鉴2008)。 (二)聚类分析 首先采取系统聚类法(hierarchical cluster)进行对所有31个地区聚类分析(2007年度地区): 表表示所有观测量都加入聚类判别分析,没有遗漏。 聚类进度表,表中列出了测量或类合并的详细步骤。 图1 树状谱系图 图中横向聚类表示差异的大小,从图中可以清晰的看出整个的观测量的聚类过程。 分析结果显示,青海、宁夏、可以划归一类,它们在经济发展中处于不利地位,是经济欠发达地区。、浙江、江苏等作为经济较发达地区,可以划归另一类。其余省份划归第三类,为中等发达地区。 做好分类对结果进行判别分析,确定聚类结果的准确性。 (三)判别分析 为了鉴别聚类结果的准确性,我们选用2006年相同地区的数据对上述分类进行判别分析。 在这里我们选用Fisher判别法构造判别函数。 分析结果如下: 表3表明所有变量都进入了判别分析。 用逐步分析方法选择用于构造判别函数的变量。 表6 特征值 Eigenvalues代表用于分析的前两个典则判别函数的特征值, 是组间平方和与组内平方和之比值。 最大特征值与组均值最大的向量对应, 第二大特征值对应着次大的组均值向量。 标准化的典则判别函数系数 标准化的典则判别函数系数(使用时必须用标准化的自变量)。由图可知Fisher判别法构造的两个典则判别函数为: Y1=1.75X1+1.824X2-1.654X3 Y2=-0.639X1-0.815X2-0.065X3 表8 结果 预测分类结果小结,可以看率。 从图中我们可以看出,有个观测量错误地分到了第类上,这个观测量是。预测结果应是第类,但不排除地区2006年发展经济的结果。 观测量分类点图,从图中我们可以清楚地看到观测量的分类情况,类距离较远,区分效果较好。 问题的总结及研究意义 SPSS 16.0为分析工具,通过地区对地区经济发展进行聚类和判别分析,对我国各地区经济发展状况有了初步的了解。 总体来说,我国经济发展东强西弱的结果没有改变。我国东部沿海各省份的经济发展明显强于中西部地区而位于我国西部偏远地区的青海、西藏等省份,在我国经济发展格局中明显处于不利地位。 当然,我们也应该欣喜地看到,国家西部大开发战略的实施必然会对西部地区经济的发展起着巨大的促进作用。 总之,采用聚类和判别分析分析地区经济发展状况所得的模型符合我国当前实际情况,其结果具有统计学和现实意义,因此有比较实际的应用和研究价值。 [1] 孙海燕, 周梦, 李卫国, 冯伟, 应用数理统计, 北京航空航天大学, 2004.9 [2] 周复恭, 黄运成, 应用线性回归分析, 中国人民大学出版社, 1989.8 [3] 中华人民共和国国家统计局, 中国统计年鉴-2008 [4] 中华人民共和国国家统计局, 中国统计年鉴-2007 [5] 倪青山, 刘小丹, SPSS 应用?实验教程, 湖南大学出版社, 2007 regulations are strictly implemented, work style and work style of cadres to further change, the party do The group further close relation, further establish the safety supervision cadres for the people, pragmat

文档评论(0)

iwh682 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档