SY1307231张立强A22班第二次大作业.docVIP

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
我国各省市农村居民消费水平的聚类分析和判别分析 摘要 为了研究中国各地区农民消费水平的差距,本文选取中国26个省(直辖市、自治区)的农村居民家庭平均每人生活消费支出作为研究对象,针对食品、衣着、居住、家庭设备、交通和通讯、文教娱乐用品和医疗保健六个方面的人均消费支出的具体数据,本文利用SPSS软件进行了聚类分析和判别分析。 使用快速聚类分析得到的结果是:选取的26各地区农民消费水平可以分为3类,高水平区(一共3个)、中等水平区(一共3个)和低水平区(一共20个)。对比2012年中国各省市人均GDP排名的情况,分类结果在直观上看具有可信性。 对聚类分析的结果,利用逐步判别分析进行判别。原始数据观测案例的25/26=96.2%进行了正确分类。未知类别的5个地区,1个被分为第2类(中等水平),4个被分为第3类(低水平)。由此可知,本文选取的判别方法具有理想的历史回报率和良好的处理预测能力。 关键字:农村消费支出 快速聚类分析 逐步判别分析 回报率 引言 研究背景和意义 改革开放以来,我国农村经济的快速发展给农民带来了真正的实惠,居民的收入水平有了较大幅度的提高,随之而来的是农村居民消费水平的不断提高。但是,由于地区间经济发展的不平衡,自然条件以及消费观念等因素的影响,各地区农村居民的消费水平存在较大的差异。注重效率、兼顾公平的时代,我们不得不关注这种差异和不平衡,认识问题是解决问题的第一步,所以对中国各地区农村居民消费水平进行合理分类、科学分析,具有很大的理论意义和现实意义。 内容、方法与结论 根据《中国统计年鉴2013》中的数据,本文选取中国26个省市的农村居民家庭平均每人生活消费支出(食品、衣着、居住、家庭设备、交通和通讯、文教娱乐用品和医疗保健)作为研究对象,利用SPSS软件进行了聚类分析和判别分析。 聚类选择的是k-均值快速聚类分析法,判别使用的是逐步判别分析方法。 选取的26个地区农民消费水平可以分为3类,高水平区、中等水平区和低水平区。对比2009年中国各省市人均GDP排名的情况,分类结果在直观上具有可信性。逐步判别分析得到结果—原始数据观测案例的96.2%进行了正确分类;未知类别的5个地区,1个被分为第2类(中等水平),4个被分为第3类(低水平)。由此可知,本文选取的判别方法具有理想的历史回报率和良好的处理预测能力。解决问题的方法和计算结果 数据说明 根据《中国统计年鉴2013》中的数据,选取全国31个省、市、自治区(26个作为初始案例,另外5个作为未知案例)2012年的农村居民消费支出的6个指标的数据资料,进行聚类分析、判别分析,确定各地区农村居民消费的类型。这6个指标依次为食品、衣着、居住、家庭设备、交通和通讯、文教娱乐用品和医疗保健。数据分析之前进行标准化,目的是消除各变量间由于量纲不同或数量级单位不同导致距离或相似系数的计算结果有较大的偏差,难以进行客观分析。 聚类分析 2.21快速聚类分析简介快速聚类是一类聚类方法的统称,其特点是:在在确定类别数量基础上,想给定一个粗糙的初始分类,然后按照某种原则进行反复修改。直至分类较为合理。在选定类中心作为凝聚点的基础上进行分类和修正的方法有很多,本文使用的是K-均值 算法 K-均值 算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。 ? -均值 算法的工作过程说明如下:首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数. k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。 导入数据之后,选择“分析→分类→K-均值聚类”,执行K均值快速聚类过程,主界面如图所示,在此指定分析变量、模型方法、初始类中心等参数。本文一共选取了食品、衣着、居住、家庭设备、交通和通讯、文教娱乐用品和医疗保健六个方面的人均消费支出(单位:元)作为聚类变量。聚类数设为3。 2.22运行结果 (1)、初始聚类中心 初始聚类中心 聚类 1 2 3 食品 4847.59 3658.66 1592.00 衣着 704.43 319.46 372.62 居住 1834.07 1196.10 251.62 家庭设备 646.13 378.53 173.31 交通和通讯 1704.83 760.07 363.

文档评论(0)

kabudou + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档