面向毕业生求职帮助信息主题搜索引擎的研究.docVIP

面向毕业生求职帮助信息主题搜索引擎的研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向毕业生求职帮助信息主题搜索引擎的研究.doc

面向毕业生求职帮助信息主题搜索引擎的研究   摘 要:随着互联网信息化的快速发展,网络求职人数不断增多,主题搜索引擎正成为新一代的主流搜索引擎。本文就面向毕业生求职帮助信息为主题的搜索引擎进行了研究,通过提出主题搜索引擎的关键技术,提出了求职帮助信息的搜索引擎的设计方案。   关键词:求职信息;主题搜索;信息查找   中图分类号:G647.38   近年来,各大高校都以前所未有的速度扩大招生规模,大学生的总数在不断增加,导致大学生毕业人数急剧增长,就业率不断下降,大学毕业生很难寻觅到自己满意的工作,毕业生的就业问题面临着十分严峻的挑战。2013年全国大学毕业生达到699万人,较2012年增加了19万人,被人们称为“史上最难就业季”,2014年全国普通高校毕业生预计将达到727万人,再加上全国的待业人员,求职的激烈程度可见一斑。这就要求大学生积极收集就业信息,学习了解笔面试经验,搜集面试技巧,才有可能在千军万马中找到适合自己的岗位。   根据2013年6月底中国互联网信息中心发布的《第32届中国互联网络发展状况统计报告》,中国互联网普及率为44.1%,互联网普及率在稳步上升。互联网对大学生就业产生了巨大的推动作用,我国就业信息方面的网站已经发展到成百上千家,在传播就业政策和提供就业信息方面发挥了显著的作用。随着网络信息数量的迅猛增长,“信息过载”、“信息超载”已经成为日益严重的问题。笔者负责学生就业工作将近两年,其中担任过《大学生就业指导》任课教师。《大学生就业指导》作为一门公共任选课,没有被得到高度地重视。然而更多学生的目的只是获取学分甚至在大学四年重来没有选过,致使大部分毕业生缺乏笔面试经验以及面试技巧。本文旨在研究建立一个面向求职帮助信息主题搜索引擎的平台,对广大的求职者给予更大的帮助。   1 主题搜索引擎介绍   1.1 主题搜索引擎的概念。随着互联网信息的“爆炸式”增长和人们对搜索引擎要求的提高,通用搜索引擎也面临着挑战。为了得到更高的查全率和查准率,主题搜索引擎成为新一代搜索引擎的新趋势。所谓主题搜索引擎是专门采集某一行业、某一专题、某一学科、某一主题范围内的信息资源,建立本地资源数据库,对搜集到的资源做索引。用户进行搜索是通过界面接口对信息检索,以得到用户所需的专业信息。   所谓主题,是指用户所要搜集的信息的特征。主题通常由用户指定若干相关网页(称为样本网页)来确定。通过用户选定的样本网页来确定所搜集的主题,在此基础上进行特征提取,分析样本网页,提取特征信息,然后根据获取的特征信息进行搜集,对每一个搜集的网页,都赋予一定的相关度,相关度越高,就说明与主题越相似。   1.2 主题搜索引擎的优势。通用搜索引擎主要是针对全互联网各类网站信息进行搜集和检索的工具。主要目标是信息量全,覆盖各个领域和各个行业。而主题搜索引擎是针对某一主题、某一行业的专业搜索引擎,是通用搜索引擎的细分和延伸。主要优势表现在:(1)主题搜索引擎只为某一领域或行业的用户提供服务,所以信息资料减少,可以精确无误的对请求做出反馈。(2)主题搜索引擎只关注某一主题、某一领域的信息,所以信息提取量、数据量的变小对于计算机硬件的要求也相对较低,并且索引数据库的规模变小有利于缩短查询响应时间。(3)主题搜索引擎只涉及某一主题、某一领域的信息,所以使用专业词表进行规范和控制,大大提高了信息资源检索的查全率和查准率。   2 关键技术研究   基于面向求职帮助信息主题的搜索引擎具有自身的特性,下面列出实现面向求职帮助信息主题搜索引擎的关键技术。   2.1 网页信息抓取技术。网络信息采集是通过网络蜘蛛程序来实现的。在实际应用中,主题搜索的网页采集技术能够按照需控制采集范围和目标、需支持深度采集以及需支持复杂的动态网页来采集。也就是说,网页采集技术能够达到更加具有针对性、实时性。   2.2 网页内容分析技术。通过网络蜘蛛搜集来的网页信息一般要先进行分析,以便于后面建立索引。分析技术一般包括分词、过滤、转换等工作。经过分词、过滤、转换,将有价值的信息提取出来,才能进一步提供更有价值的服务。   2.3 信息索引技术。为了提高用户的查询精度、空间的利用率以及系统运行的效率,需要对这些信息建立索引。索引模块是信息采集模块和信息检索模块的“桥梁”,其工作主要是建立索引数据库。网页建立完索引才能被后续流程使用。设计良好的索引可以加快搜索速度,能够更加准确地进行网页定位,从而减少计算开销。在这里,针对求职帮助信息的主题搜索,我们将使用Lucene系统的索引技术。Lucene是一个开放源代码的全文检索引擎的工具包,提供了完整的查询和索引引擎,可以减少经费开支。   2.4 信息检索技术。信息检索功能是搜索引擎体现自己最终价值的重要环节

文档评论(0)

you-you + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档