- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于内容过滤网络招聘双向推荐系统研究
基于内容过滤网络招聘双向推荐系统研究
摘要:个性化推荐在网络中应用越来越广泛,在电子商务中表现尤其突出,然而个性化推荐技术在网络招聘推荐领域的应用却不是很成熟。设计了基于内容过滤的网络招聘双向推荐系统,利用简历的特性获取用户需求信息并提取特征项,建立需求向量,通过计算向量相似度进行推荐,依据统计用户历史信息调整权重值的大小,进而增强系统的可靠性。实验表明:本系统一定程度上可以提高用户的满意度,提高推荐的成功率,增加用户对系统的信任程度。
关键词:网络招聘;个性化推荐;推荐系统;向量空间模型
中图分类号:TP302 文献标识码:A 文章编号:1672-7800(2014)003-0028-03
作者简介:刘利伟(1987-),男,五邑大学计算机学院硕士研究生,研究方向为计算机网络。
0 引言
近年来,网络招聘得以快速发展,迅速成为招聘行业的新宠。面对网络招聘平台丰富的信息,用户通常会感到迷茫,不能快速准确地找到适合自己的人才(岗位)。推荐系统[1]能够提高网络招聘平台的服务能力,增加用户对招聘系统的信任。推荐虽然是一个发展了很多年并在很多网站(亚马逊、Netflix、当当、豆瓣)都得到充分应用的技术,但在国内的网络招聘领域,除了智联招聘外,还没有看到哪家公司应用得较为成熟。现在招聘网站主要是采用统计的方法,也就是通过记录每一个岗位被查阅的频率,从而获取岗位的热度,这样就可以把热度较高的岗位呈现在用户面前,虽然这种推荐方法具有一定的优越性,但也存在一定的缺点:①每一个用户所看到的被推荐的岗位都是类似的,无法体现个性化;②许多热度很低却适合用户需求的冷门职位无法被推荐到。
如何获取用户的兴趣特征、使用什么样的模型建模以及采用何种方法计算相似度,是本文实现基于内容过滤[2]的网络招聘双向推荐系统主要解决的问题。
1 用户需求特征
1.1 用户需求
在获取用户的需求信息后,根据获取的信息来描述用户的需求特征,并以此建立模型是实现个性化推荐技术[3]的前提条件。通常用户需求模型体现了用户的需求信息,本文使用基于向量空间模型的表??方法。
1.2 向量空间模型
向量空间模型[4](Vector Space Mode)作为向量的标识符,是一个用来表示文本内容的数学模型,并成功地应用于著名的SMART文本检索系统,其原理就是把对文本内容的处理简化为向量空间中的向量运算,文本内容中的字词出现的位置和次数互不影响。可以使用一个m维的向量来表示用户需求特征的模型,也即W=((t1,wl),(t2,w2),…,(tm,wm)),tm代表文本内容中的关键词,而m表示在所有被检索文本内容中出现的关键词个数,wm则代表关键词tm在此文本内容中所占的比重。然而利用空间向量来表达文本内容的含义会遇到一些困难:首先,词语间不同的排列组合会呈现不同的意义,而所有被搜索的文章又都是由大量的词语组合而成,因此利用词语表示文章所表达的意思存在一定的困难。当前,评估词语对于文档意义的重要性[5],主要是通过词语在所有被搜索文本内容中所出现的次数来决定的。其次,由于被搜索的文本内容会不断地得到丰富,因此m的增长尤其突出,进而使得向量的分量会不停地增加,参与计算的数据量急剧增大,从而导致降维成为信息检索领域近年来的一个热点研究方向。
目前网络招聘平台中简历填写都很规范,因此可以利用其自身的特性[6]来避开上述问题。
1.3 特征项提取
特征项就是那些最能反映用户主要信息的关键词[7]。目前人才招聘网站填写求职者简历和招聘者招聘信息的表项大多是选择性填写,因此从简历信息表和招聘信息表中获取特征项还是较为简单的,即使有少数不确定的表项,例如工作经验,也可将其简化为“无、一年、两年等”关键字的表达方式。
2 系统总体结构
系统主要以B/S架构为基本框架,采用MVC的开发模式,充分利用Struts2、Spring、Hibernate等前沿框架技术的优势来实现每一个模块的具体功能。
系统的推荐功能主要由两部分实现,分别是用户信息处理部分和结果自动推荐部分,对于用户来说,这两个部分都是无法看到的。
3 系统推荐算法
3.1 推荐算法思想
双向推荐算法的基本思想是:充分利用求职用户注册的简历和企业发布的招聘信息,将二者进行比较,判断它们之间的相似程度。这就好比是在招聘会现场,在向某个企业递交简历之前都会先了解该企业发布的职位信息是否与自己的需求符合,若符合则提交简历前去应聘,否则就转向下一个企业继续寻找符合自己需求的职位。要充分利用简历和招聘信息,就要从中提取特征项。
首先,将招聘单位的招聘信息和求职用户简历信息进行分指标量化,可以考虑利用数学模型来表示单位的
文档评论(0)