多元统计分析应用
多元统计分析应用
班级:11级统计二班
学号:201106010215
姓名:聂廷侦
时间:2014年6月28日
关于城镇各个行业
就业人数平均工资的多元统计分析
摘要
20世纪90年代以来,随着市场经济体制进程的加快和经济结构的调整,我国的经济出现了快速的发展。就业人员的工资也随之而增长。由于我国就业人员整体素质普遍低下,我国的分配制度并不是很完善等原因,导致就业人员工资在各行业和各部门的差距较大。随着经济的发展,这个差距越来越大。?
由于我国人口众多,素质较低,而且就业观念较落后,导致我国劳动力普遍廉价,就业职工工资普遍低下。刚毕业的大学生人数众多,城市发展速度与农村发展速度不平衡,各省市自治区的就业条件和国家政策,就业环境不同,导致职工工资存在行业间的工资水平存在着巨大的差异,从另一个方面反映出了中国贫富差距的不断扩大。对我国就业人员职工工资的研究,对我国的社会保障政策和就业政策,教育政策等具有重要的决策意义。也为对我国经济社会的研究提供了一个因素。我国就业职工工资水平的行业间的差异已经日益成为我国政府重视的一个问题。
[关键词] 不同行业 就业 平均工资
引言
当前我国处于经济发展快速时期,由于我国人口总数较大,就业人员众多。因此,就业问题成为了我国社会的一个焦点问题。研究好行业间就业问题以及就业职工工资问题,能够有效的把握好社会状况,能够帮助大学生更准确的定位自己,找到自己满意的工作。制定正确的就业政策和社会保障,社会福利政策,来促进大学生的就业问题以及我国国民经济的发展。
本文选取2013年我国各行业城镇单位就业人员平均工资的数据,主要利用以下几种统计方法进行分析:因子分析法、聚类分析法。将全国各省按照不同行业就业人数进行分类和排序,并与人们实际观察到的情况进行比较分析。
因子分析是指研究从变量群中提取共性因子的统计技术。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。
聚类分析是一组将研究对象分为 相对同质的群组的统计分析技术,依据研究对象(样品或指标)的特征,对其进行分类的方法,减少研究对象的数目。
数据
下表是我国按行业分城镇单位就业人员平均工资的原始数据,数据来源于《2013中国统计年鉴》,X1~X19分别代表农林牧渔业、采矿业、制造业、电力热力燃气及水生产和供应业、建筑业、批发零售业、交通运输仓储和邮政业、住宿和餐饮业、信息传输软件和信息技术服务业、金融业、房地产业、租赁和商务服务业、科学研究和技术服务业、水利环境和公共设施业、居民服务修理和其他服务业、教育、社会卫生和工作、文化体育和娱乐业、公共管理社会保障和社会组织。
分析
(一)因子分析
1、因子分析的适用性判定
如图所示,从KMO测度来看,KMO值等于0.705大于0.5,可以做因子分析,从巴特莱特球体检验来看,其零假设是相关矩阵为单位矩阵,P值等于0,说明拒绝原假设,原始数据适合进行因子分析。
上图说明因子解释原始变量方差的情况,提取了三个主成分因子,第一主成分的特征值为14.527,第二主成分的特征值为1.101,第三主成分的特征值为0.860,这三个主成分特征值的累计概率达到了86%,说明解释了原始数据86%的信息。
上图为各个变量的共同度,大多数变量的共同度都达到了0.9以上,说明提取的信息较多。
图为旋转前的因子载荷矩阵,旋转前各变量在各个载荷区别并不是很明显。根据X=aF+…+aF+ε可以算出各公共因子的线性组合。
图为旋转后的因子载荷矩阵,可以看出,电力热力、批发零售业、交通运输 住宿和餐饮业、信息传输、金融业、房地产服务业、租赁、公共设施服务业、教育社会工作、卫生、体育社会保障、公共管理和社会组织对第一主成分的贡献较大,称为社会工作因子;农林牧业、采矿业、制造气燃气、建筑业对第二主成分的贡献较大,称为工农建筑业因子;居民服务、服务业对第三主成分的贡献较大,称为居民服务因子。
图为主成分的得分系数矩阵,根据F=βX+βX+…+βX算出各主成分的得分如下表所示。
上图为各个省份的主成分得分和综合得分情况。
图为主成分得分和综合得分的排名。从第一主成分来看,东部地区和东南部发达地区的得分比较高,说明这
原创力文档

文档评论(0)