基于深度学习的简历推荐算法研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

摘要

近年来,解决就业问题迫在眉睫,企业在招聘人才时必须花费大量时间和精

力来应对庞大的简历数据库,以期找到符合要求的候选人。对于多样的岗位需求,

招聘人员不仅要判断应聘者的基本信息等是否满足招聘条件,还需深入分析其

工作经历和职业技能是否与职位的要求相契合,这一筛选过程耗时且任务量较

大,研究简历推荐算法有助于加快招聘人员的简历筛选效率。传统的基于规则和

关键词匹配的方法已经难以满足日益多样化的招聘需求。深度学习作为一种强

大的机器学习方法,为处理大规模、高维度的简历数据提供了新的可能性。所以,

本篇文章分别针对只有简历文本数据与岗位标签场景的数据集、又有简历文本

数据又有岗位描述文本数据与两者之间的匹配标签场景的数据集,设计了不同

的简历推荐算法,这样做的目的是为了减少招聘筛选的复杂性并提高整体筛选

效率。

本文通过简历自身,以及简历文本与岗位信息之间的关系,研究不同场景下

简历与岗位之间的匹配,分别实现了适用于简历数据集的单向文本的简历推荐

算法和适用于岗位-简历数据集的双向文本的简历推荐算法,本文的具体研究工

作如下:

第一,本文根据已有数据构建了两个不同招聘场景下的数据集。首先,我们

使用了云南省某大型国有企业的真实招聘数据,构建了一个反映国有企业招聘

场景的数据集,其中包含了详实的简历数据以及相应的岗位名称标签,并将该数

据集转化为可用于后续实验的结构化数据。接着,我们构建了另一个数据集,代

表新兴网络招聘中常见的招聘场景,为了生成这个数据集,我们从专业招聘网站

上对12个岗位类别分别抓取了400条岗位的文本描述,并运用文本摘要技术生

成可供使用的岗位文本描述数据集。通过将岗位描述数据集与已有的简历集合

进行笛卡尔乘积操作,生成了一个包含了简历-岗位对及其对应匹配标签的数据

集,同样生成为结构化数据集进行储存。

第二,提出了适用于简历数据集的单向文本的简历推荐方法。我们使用云南

省某大型国有企业的线下真实招聘数据作为实证数据,使用构建的简历及对应

的岗位标签数据集,对深度学习算法BERT在此数据上的简历推荐进行了研究。

首先,从结构化简历中汇总出本文所需的文本特征。再依据机器学习与深度学习

I

摘要

所需的数据输入格式,分别对所提取的文本特征进行了特征工程和构建词向量

处理。然后利用经过处理的数据来分别对BERT模型以及其余用于对比的算法

模型进行训练。在简历推荐的对比算法方面,分别试验了机器学习算法中的随机

森林、xgboost模型、GBDT模型、LightGBM等四种机器学习模型,以及深度学

习中的卷积神经网络模型。本部分的BERT模型以及其余对比模型结果中,BERT

模型在简历推荐过程中的表现最佳,推荐准确率可达88.12%,F1得分为87.47%。

第三,提出了适用于岗位-简历数据集双向文本的简历推荐方法。对孪生

BiLSTM模型在构建的岗位-简历数据集上的简历推荐方法进行了研究。首先从

各类简历中提取出实体簇,并分别拼接到各类岗位描述文本中,可认为在模型的

共享层中嵌入额外信息。接着利用现有的结构化岗位-简历数据集进行词向量字

典的生成,根据生成的词字典构建两个文本输入的词向量,用以嵌入深度学习模

型。再对两个输入文本经过BiLSTM模型的训练结果作差,判断两个文本的相

似情况,最后通过激活函数得出匹配与否的结果,使用该模型的推荐准确率可达

93.50%。另外,我们还选取了孪生CNN、孪生LSTM、孪生RNN等算法,与孪

生BiLSTM模型的推荐结果进行了对比分析。其中,孪生BiLSTM模型在简历

推荐过程中的表现最佳,推荐准确率可达94.17%,F1得分为94.04%。

综上,本文将深度学习技术应用到简历推荐研究中,针对不同场景下的招聘

数据构建合适的简历推荐方法,以提高简历推荐准确率,降低招聘筛选的难度,

提升整体筛选效率。

关键词:简历推荐;数据构建;文本摘要;BERT;孪生BiLSTM

II

Abstract

文档评论(0)

营销资料库 + 关注
实名认证
文档贡献者

本账号发布文档部分来源于互联网,仅用于技术分享交流用,版权为原作者所有。 2,文档内容部分来自网络意见,与本账号立场无关。

1亿VIP精品文档

相关文档