- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
摘要
摘要
近年来,解决就业问题迫在眉睫,企业在招聘人才时必须花费大量时间和精
力来应对庞大的简历数据库,以期找到符合要求的候选人。对于多样的岗位需求,
招聘人员不仅要判断应聘者的基本信息等是否满足招聘条件,还需深入分析其
工作经历和职业技能是否与职位的要求相契合,这一筛选过程耗时且任务量较
大,研究简历推荐算法有助于加快招聘人员的简历筛选效率。传统的基于规则和
关键词匹配的方法已经难以满足日益多样化的招聘需求。深度学习作为一种强
大的机器学习方法,为处理大规模、高维度的简历数据提供了新的可能性。所以,
本篇文章分别针对只有简历文本数据与岗位标签场景的数据集、又有简历文本
数据又有岗位描述文本数据与两者之间的匹配标签场景的数据集,设计了不同
的简历推荐算法,这样做的目的是为了减少招聘筛选的复杂性并提高整体筛选
效率。
本文通过简历自身,以及简历文本与岗位信息之间的关系,研究不同场景下
简历与岗位之间的匹配,分别实现了适用于简历数据集的单向文本的简历推荐
算法和适用于岗位-简历数据集的双向文本的简历推荐算法,本文的具体研究工
作如下:
第一,本文根据已有数据构建了两个不同招聘场景下的数据集。首先,我们
使用了云南省某大型国有企业的真实招聘数据,构建了一个反映国有企业招聘
场景的数据集,其中包含了详实的简历数据以及相应的岗位名称标签,并将该数
据集转化为可用于后续实验的结构化数据。接着,我们构建了另一个数据集,代
表新兴网络招聘中常见的招聘场景,为了生成这个数据集,我们从专业招聘网站
上对12个岗位类别分别抓取了400条岗位的文本描述,并运用文本摘要技术生
成可供使用的岗位文本描述数据集。通过将岗位描述数据集与已有的简历集合
进行笛卡尔乘积操作,生成了一个包含了简历-岗位对及其对应匹配标签的数据
集,同样生成为结构化数据集进行储存。
第二,提出了适用于简历数据集的单向文本的简历推荐方法。我们使用云南
省某大型国有企业的线下真实招聘数据作为实证数据,使用构建的简历及对应
的岗位标签数据集,对深度学习算法BERT在此数据上的简历推荐进行了研究。
首先,从结构化简历中汇总出本文所需的文本特征。再依据机器学习与深度学习
I
摘要
所需的数据输入格式,分别对所提取的文本特征进行了特征工程和构建词向量
处理。然后利用经过处理的数据来分别对BERT模型以及其余用于对比的算法
模型进行训练。在简历推荐的对比算法方面,分别试验了机器学习算法中的随机
森林、xgboost模型、GBDT模型、LightGBM等四种机器学习模型,以及深度学
习中的卷积神经网络模型。本部分的BERT模型以及其余对比模型结果中,BERT
模型在简历推荐过程中的表现最佳,推荐准确率可达88.12%,F1得分为87.47%。
第三,提出了适用于岗位-简历数据集双向文本的简历推荐方法。对孪生
BiLSTM模型在构建的岗位-简历数据集上的简历推荐方法进行了研究。首先从
各类简历中提取出实体簇,并分别拼接到各类岗位描述文本中,可认为在模型的
共享层中嵌入额外信息。接着利用现有的结构化岗位-简历数据集进行词向量字
典的生成,根据生成的词字典构建两个文本输入的词向量,用以嵌入深度学习模
型。再对两个输入文本经过BiLSTM模型的训练结果作差,判断两个文本的相
似情况,最后通过激活函数得出匹配与否的结果,使用该模型的推荐准确率可达
93.50%。另外,我们还选取了孪生CNN、孪生LSTM、孪生RNN等算法,与孪
生BiLSTM模型的推荐结果进行了对比分析。其中,孪生BiLSTM模型在简历
推荐过程中的表现最佳,推荐准确率可达94.17%,F1得分为94.04%。
综上,本文将深度学习技术应用到简历推荐研究中,针对不同场景下的招聘
数据构建合适的简历推荐方法,以提高简历推荐准确率,降低招聘筛选的难度,
提升整体筛选效率。
关键词:简历推荐;数据构建;文本摘要;BERT;孪生BiLSTM
II
Abstract
您可能关注的文档
- 后刚兑时代国有企业债券违约连锁反应分析--以永煤控股集团为例.pdf
- 呼和浩特市老年健康服务供需问题研究.pdf
- 互联网平台封禁行为的反垄断法规制研究.pdf
- 互联网企业数据资产会计确认与计量研究--以哔哩哔哩为例.pdf
- 互联网使用对老年人劳动参与决策的影响研究.pdf
- 互殴案件中正当防卫的司法认定.pdf
- 环境保护税、政府补助与制造业企业的技术创新研究.pdf
- 环境保护税对西部地区企业绿色技术创新的影响研究.pdf
- 环境动态性、TMT警觉性与组织主导逻辑变革.pdf
- 环境规制和技术创新对建筑业碳排放效率的影响研究.pdf
- 8 黄山奇石(第二课时)课件(共22张PPT).pptx
- 22《纸船和风筝》教学课件(共31张PPT).pptx
- 17 松鼠 课件(共23张PPT).pptx
- 23《海底世界》课件(共28张PPT).pptx
- 21《大自然的声音》课件(共18张PPT).pptx
- 第12课《词四首——江城子 密州出猎》课件 2025—2026学年统编版语文九年级下册.pptx
- 第2课《济南的冬天》课件(共42张PPT) 2024—2025学年统编版语文七年级上册.pptx
- 17 跳水 第二课时 课件(共18张PPT).pptx
- 第六单元课外古诗词诵读《过松源晨炊漆公、约客》课件 统编版语文七年级下册.pptx
- 统编版六年级语文上册 22《文言文二则》课件(共27张PPT).pptx
最近下载
- TCACM 009-2016元胡止痛片优质产品质量标准.pdf VIP
- 声乐正谱伴奏 黑雾 降E.pdf VIP
- 三年(2023-2025)高考地理真题分类汇编:专题12 交通(全国通用)(原卷版).docx VIP
- 2025至2030智能道路检测车行业发展趋势分析与未来投资战略咨询研究报告.docx
- 内科三基试题(含参考答案).docx VIP
- 中国建设工程鲁班奖(国家优质工程)复查工作准则(试行).pdf VIP
- 手术室感染暴发应急预案与处置流程查房.pptx VIP
- 凝结水混床树脂和普通混床树脂性能指标.doc VIP
- 军事理论全部题库及答案.doc
- 2025年宠物鲜食配行业发展趋势分析报告.docx VIP
原创力文档


文档评论(0)