基于关联规则毕业生就业现状与在校表现分析.docVIP

基于关联规则毕业生就业现状与在校表现分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关联规则毕业生就业现状与在校表现分析

基于关联规则毕业生就业现状与在校表现分析   摘 要:基于对某独立学院毕业生的调查问卷,通过Apriori算法进行关联规则分析并实现数据可视化,挖掘毕业生平均学分绩点,毕业半年后月收入和现状满意度之间的潜在关系,从而给学校相关部门以及在校生提供参考。   通过关联分析,我们得出以下结论:平均学分绩点在[3,4)的毕业生普遍对现状感到不满意;毕业生的平均学分绩点越低,则毕业生半年后的月收入就呈较低的趋势。对此,我们给出相应建议:在对毕业生进行就业指导时,可按绩点进行分批培训给不同层次的学生进行对应的辅导,适当对平均学分绩点在[1,2)和[3,4)范围内的学生加强辅导、劝导以及指导,增强对现状的满意度,使其更好的应对严峻的就业形势。   关键词:关联规则;Apriori算法;数据可视化   中图分类号:G420文献标志码:A文章编号:2095-9214(2016)07-0235-02   一、引言   近年来,我国大学生就业难问题愈发严重。本文在这一背景下以某独立学院2010级毕业生为例,对其在校表现与就业现状进行关联性分析。旨在找出两者间的关系,给学校相关部门和在校生提出一些切实可行的建议。   二、基于Apriori算法的静态关联规则基本原理   Apriori算法是一种先验概率算法,它利用了频集特性的先验知识,采取层次顺序搜索的循环方法来完成频繁项集的挖掘工作[1]。本文利用R语言中arules包及其相关包对我校毕业生半年后月收入,在校各类满意度和平均学分绩点进行关联规则挖掘和数据可视化展现。   关联规则的一般表示形式为: X=Y (规则支持度,规则置信度,规则提升度),其中X为规则前项,Y为规则后项,规则支持度,规则置信度及规则提升度是规则的评价指标。   规则支持度是该项集出现的次数除以总的记录数。其意义在于度量项集在整个事务集中出现的频次。我们在发现有价值的规则时,会更多的关注频次高的项集。   ConfidenceX=Y=SupportX∪YSupportX   规则提升度反映X的出现对Y出现的影响程度,一般大于1才有意义,表示X的出现对Y的出现有促进作用,故规则提升度越大越好,其表达式如下:   LiftX=Y=SupportX∪YSupportX*SupportY   三、关联规则的应用   置信度和支持度阀值的设定直接影响到关联规则结果输出的数量。若置信度和支持度的阀值设置得越小,生成的关联规则越多,而关联规则所体现的项集之间的关联更倾向于偶然;若置信度和支持度的阀值设置得太大,就可能无法得到关联规则,因此需要合理地设置阀值。若计算出的规则的置信度大于或等于预先给定的最小置信度阈值,且支持度大于或等于预先给定的最小支持度阈值,那么这条规则就被保留下来,否则删除。   得出符合条件的全部关联规则中可能存在冗余的规则,即规则1实际上包含了规则2,且规则2与规则1的提升度相等,或低于规则1的提升度,由此认定规则2是冗余的。因此我们通过生成关联规则子矩阵并删除其每列元素和大于等于1的列将冗余的规则删除,得到最终的关联规则并根据提升度降序排序。   由于提升度大于1的才有意义,因此,本文提取提升度大于1的三条关联规则进行分析讨论。   本文做了两个关联分析,第一个关联分析选取大学生对现状满意度为后项,以大学生平均学分绩点为前项;第二个关联分析是以大学生毕业后半年月收入为后项,以大学生平均学分绩点为前项。   1.现状满意度跟平均绩点的关联规则   首先进行第一个关联分析,选取最小置信度阈值为30%,且最小支持度阈值为0.4%,冗余处理后剩下3条关联规则如表1。   图1 现状满意度与平均绩点的关联规则泡泡图   图1中圈的大小表示支持度的值,支持度代表两种事物同时出现的概率。颜色的深浅代表了提升度的大小。由图可知,绩点[1,2)和[3,4)范围内的毕业生与对现状不满意关联程度较高,绩点[2,3)范围内的毕业生与对现状满意关联程度较高。   从表1看到,三条关联规则的提升度均大于1,说明这三个规则中,一个学生出现该平均学分绩点时,他相对于其他绩点的学生对自己的现状出现该满意度的可能性较大,而且提升度越大,代表这条关联规则越有价值。   第一个关联规则:平均学分绩点=[3,4) =对自己的现状是否满意=不满意的支持度为0.1633,这说明2014届毕业生当中有16.33%的毕业生平均绩点在[3,4)范围内时,同时会对自己的现状感到不满意;它的置信度是0.3668,说明平均绩点在[3,4)范围内的毕业生中有36.68%的毕业生确实对自己现状感到不满意。   第二个关联规则:平均学分绩点=[2,3) =对自己的现状是否满意=满意的支持度为0.2933,这说明2014届毕业生当

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档