- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于k―means和关联度分析网络招聘信息数据挖掘
基于k―means和关联度分析网络招聘信息数据挖掘
摘 要:本文基于K-means算法对网络招聘数据进行聚类分析,并运用关联规则对大数据和IT行业进行关联预测。从分析结果可知,学历和经验直接影响薪资水平,且金融银行职业类型的平均薪资水平在所得分类中最高,同时也得到大数据和IT行业对学历要求较高,其占总体职业类型比例有增加趋势。
关键词:网络招聘;数据挖掘;聚类算法;关联度分析
中图分类号:TP311 文献标识码:A
3.4 聚类分析
在完成文本信息向量化处理后,使用统计分析软件SAS中IML模块进行矩阵化运算[5],通过对K-means聚类算法的研究和应用[6,7],得到关于职业类型的聚类结果,我们对经过聚类分析的数据进行挖掘,便可以得到网络招聘信息中关于职业类型、薪资、地域、学历和工作经验的知识模式。
4 结果分析和预测(Interpretation of result and
prediction)
4.1 对整体数据进行分析和挖掘
(1)通过北上广职业分布和大长福职业分布词云图(图1和图2)对比可以得出:
相同点:销售行业在两类城市占比最高,依此可以推断出在全国范围内,销售行业仍然占据主流招聘人群。
不同点:一线城市中除销售相关职业外,“PHP”“.NET”
“JAVA”“UI设计师”“iOS”“C++”等词出现频数较大,直接说明了大数据和IT相关职业在一线城市的兴起和热门,而二线城市各个行业需求较销售都比较小,借此推断高端技术的需求量和城市类型有一定关系。
(2)对比两类城市的学历、经验分别与平均薪资的分布图(图3和图4)可以看出,无论是哪类城市,随着学历的提高,薪资水平提高明显;随着工作经验的丰富,薪资水平同样提高明显。
所以我们有理由得出:工作经验和学历都与薪资水平呈正相关系,即随着学历的提高和经验的丰富,薪资水平提高明显。
(3)通过聚类结果,得到关于职业类型和对应的平均薪资待遇的表格(表1)。
通过对上述平均薪资状况的对比得知:金融银行业相应职位平均薪资最高,其次是要求专业技术较高的互联网通讯行业平均薪资条件优秀,其余产业薪资水平接近,但是鉴于职位供应地区是一二线城市。所以数据显示薪资水平与实际相比较为合理。
4.2 大数据和IT行业的预测
鉴于近年来大数据和IT行业的崛起,高精尖产业和职业的兴起已经成为了当今社会的主流走向,所以对这类行业进行分析更有价值。
(1)通过对这类专业招聘信息和总体招聘信息对比,得出大数据相关职业所占百分比条形图(图5)。通过对图表信息的解读,我们可以得到三点结论:
大数据相关职业招聘比例在2016年9月开始快速增长,到2017年2月开始放缓增长速度,但是仍然以一种放缓的趋势增长。
根据上图所示,大数据相关职业招聘比例最大的三个月份是2016年8月、2017年3月和2017年4月,结合实际分析,可以得出每年的这两个季度是大学生毕业求职的高峰期,也是传统意义上的秋招和春招,侧面说明了大数据行业对于学历要求和能力要求较高。所以集中大学生毕业求职期间发布招聘信息。
对比2016年8月和2017年4月数据可以得出,大数据行业正在逐渐增长所占比重。因此可以认为短期内,大数据相关行业所占比重在未来短期内会持续上升。
(2)我们针对从整体数据中筛选出的大数据和IT行业的招聘信息数据的分析,得到关于大数据和IT行业的学历与经验要求柱形图(图6和图7),从图像中我们可以得到如下结论:
根据图6得出,大数据和IT行业需求学历更高,半数以上的最低学历要求是本科,专科及以上学历占据绝大部分比例。说明这个行业对人才的要求更高,所以相对应聘者来说除专业适合以外,学历要求门槛也较高。
根据图像可以看出,经验要求大部分集中于经验三年以下和不限经验。参考社会大背景下,大数据和IT行业较传统工商业起步晚,说明现有供给量已经无法满足日益增长的需求量,基于此原因出现了经验要求低的现状。
结合以上两点,我们大胆预测市场急需关于大数据和IT行业的人才,正处于求大于供的阶段,而且学历越高、经验越多的人才薪资待遇越好。
(3)通过对编码后各指标之间的关联规则进行挖掘,结果显示图如图8所示。
其中编码对应文本信息为:
c1=北京;c2=上海;c3=广州;c4=大连;c5=长沙;c6=福州。
s1=0-5k;s2=5-10k;s3=10-15k;s4=15-20k;s5=20-25k;s6=25-30k;s7=30k以上。
e1=高中以下;e2=大专以下;e3=大专;e4=本科;e5=硕士;e6=不限;e7=其他。
w1=一年以下;w2=1-3
原创力文档


文档评论(0)