基于各地区各行业就业人数的聚类分析与主成分分析22汇编.doc

基于各地区各行业就业人数的聚类分析与主成分分析22汇编.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于各地区各行业就业人数的聚类分析与主成分分析22汇编

基于各地区各行业就业人数的聚类分析与主成分分析 河南农业大学 信息与管理科学学院 金融数学系 闫云舒 (1310110007) 摘 要:高校毕业生就业一直是社会关注的热点话题,本文根据统计年鉴中13年的各地区各行业私营企业和个体就业人数的数据和多元统计中的SPSS19.0软件,主要采用了聚类分析与主成分分析,结合因子分析的方法,旨在分析当下社会各地区就业情况并预测未来就业职位空缺。 关键词:就业 多元统计 聚类分析 主成分分析 引 言:当今社会,就业一直是人们关注的热点话题。分析各地区各行业的私营企业和个体就业情况需进行全面 、动态 、定量 、定期的测定 。我认为 ,针对私营企业和个体就业状况需观察不同区域 、不同行业的状况和调查其数据 。(本文数据来自统计年鉴)对于如此多维,复杂的数据,仅用单一的某种统计方法已经无法实现科学统计与分析,更不能预测各地区各行业未来空缺人数。只有综合运用多种统计方法 ,即采取聚类分析与主成分分析,才能相对确保数学分析的全面性与正确性 。基于多元统计分析的各地区各行业就业情况是综合运用几种统计分析方法 ,对各地区各行业就业情况的预测。 多元统计分析方法是定量分析事物间复杂关系的一种综合统计分析,它具体涉及主成分分析、聚类分析、相关分析、因子分析等多种分析方法。主成分分 析 法 是 利 用 降 维 的 思 想 ,通 过 适 当 的 数 学 变 换 ,把 多 指 标 问 题 转 化 为 较 少 的 综 合 指 标 (即 主 成 分 )问 题 。 综 合 指标是原来多个指标的线性组合 ,通过线性转换的手法将 一组可能具有相关性 的变量观测转化之后得 到一组相互无关的变量值,且尽可能地反映原来 指标信息(85 以上) 。聚类分析是直接比较各类之间的性质,将性质相近的归为一类,将性质差别较大的归入不同类的一种方法。因子分析是用少数几个因子描述许多变量之间的关系。被描述的变量是可以观测的随机变量 ,即显在变量。因子分析是通过变量的相关矩 阵,找出能够控制所有变量的少数几个随机变量去描述多个变量之间的相关关系。 一:主成分分析 根据每个地区各行业的就业人数对各省市进行综合评价与排序。 主成分分析可以将多变量简化为较少综合变量 ,对数据进行降维 ,降维后的变量是原来变量的线性组合 ,反映原变量的绝大多数信息,使信息的损失较小。也就是说主成分分析可以把原来多个指标减少到一个或几个综合指标 ,并且这些少量 的综合指标能够反映原来多个指标所反映的绝大部分信息。指标的减少有利于进行下一步的计算、分析和评价 。 表1:解释的总方差 成份 初始特征值 提取平方和载入 合计 方差的 % 累积 % 合计 方差的 % 累积 % 1 6.038 75.470 75.470 6.038 75.470 75.470 2 .868 10.855 86.325 3 .466 5.820 92.145 4 .393 4.914 97.058 5 .143 1.792 98.850 6 .069 .865 99.715 7 .022 .270 99.986 8 .001 .014 100.000 1代表制造业,2代表建筑业,3代表批发业和零售业,4代表交通运输业,5代表住宿和餐饮业,6代表租赁和商务服务业,7代表居民服务业。由上表看“初始特征值”这一项下面的“合计”的数值,有几个数据1就表明提取了几个公因子,下表数据表明有一个数据.1,只可以提取一个公因子。然后看表中“提取平方和载入”中的“累积,这里是75.260,这表明表中数据可以很好的解释自变量。” 由表二可以看出因为只抽取了一个主成分,所以无法进行旋转。现用KMO 和 Bartlett 的检验进行效度检验。检验结果如表3所示,第一行的数据0.768表明效度较高。Sig为0.00,这俩个数据显示这份数据完全可以做因子分析。但是做出来的结果无法进行旋转。 二:聚类分析 快速聚类 表3:KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。 .768 Bartlett 的球形度检验 近似卡方 234.530 df 21 Sig. .000 考虑到传统的将各省市区按东 、中、西部划分会使得不同地区之间就业差异不明显 ,以及同一地区不同行业差异较大的问题 ,本文采用系统默认的组间联接法对综合因子得分进行层次聚类,使就业水平接近 的地 区分归为一类 ,以便于对各地区各行业就业的类别内和类别间差异及

文档评论(0)

2232文档 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档