- 1、本文档共42页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 1 章 绪 论
第 1 章 绪 论
本章阐述了本课题的研究背景、研究目的、内容以及意义,介绍了垂直搜索引擎的
基本概念和国内外发展现状,最后介绍了本论文的内容框架。
课题研究背景
互联网至今已经过了几十年的高速发展,从最初只能实现简单的网络通信和资源共
享功能到如今丰富多彩的各种应用,网络已经具备了海量信息,它们来源广泛,种类繁
多,很多信息关联性很强。网络用户如今已经陷入信息的汪洋,如何从如此众多的信息
当中有针对性地择取需要的内容已成为网民的首要问题。
以 Google、百度为代表的搜索引擎很好地解决了上述问题[1]。它们利用先进的技术,
对网络上的海量信息进行分类整合,建立便于检索的索引文件,并对其进行定期的修改
和维护,在用户检索的时候,快速地通过索引找目标信息并使用一定的算法将查询的结
果集显示在用户面前。有关数据表示,目前网络用户获取信息的 80%左右是通过搜索引
擎实现的。
目前,随着我国信息化步伐的加快和人民生活水平的提高,有更多形式各样的信息
涌入网络,这就使得网络用户需要在更多更复杂的结果集里面寻找自己需要的信息,浪
费时间和精力。
在教育领域也存在同样的问题。随着高校扩招规模逐年加大,毕业生数目也随之水
涨船高。近年来,各大城市招聘市场的火爆场面更是让众多的毕业生望而生畏。为了在
毕业生和招工企业之间建立一条畅通的、不受时空约束的通道,本文在通用的搜索引擎
的基础之上,针对大学毕业生以及高职毕业生就业的主要企业群体,采用垂直搜索的技
术来实现一个大学生就业平台,更好地促进学生就业。
研究目的及意义
随着我国高等教育事业的迅猛发展,越来越多的适龄青年进入各类高校深造。经过
3 至 4 年的大学教育,高校为社会各行各业培养和输送了大量的毕业生。但是制造业和
服务业相对落后的形势下并没有响应数量的就业岗位。所以,大学生毕业找工作就面临
很多困难。其中,招聘信息渠道不畅通是最大的问题。招聘会、报纸、电视等传统的方
1
河北大学工程硕士学位论文
式根本无法承载每年近千万数之巨的毕业生的就业问题。而网络就因为它无与伦比的普
及性而有了用武之地。大量的毕业生通过网络求职,通过发求职帖子,搜索相关行业的
相应职位等方法求职,简单方便快捷。
然而,目前的综合搜索引擎如 Google,百度等搜索引擎的相关搜索结果中充斥着各
种无用信息[2]。除了广告和其他的各种垃圾信息之外,搜索结果门类不清、针对性不强,
形形色色的数据更是加大了学生在其中找到有用信息的难度。
综上所述,本研究立足高校,针对大学生求职研发专业化的搜索引擎,丰富工种,
细化岗位,实现招聘信息的精确搜索,以大力促进大学生就业。
国内外研究现状
垂直搜索的专业针对性很强[3],它只对网络中的某一类信息进行分析和处理,然后
以某种形式进行展现。垂直搜索服务于某一特定的用户群体,具有定位准确,搜索具体
而深入的特点,因此可以吸引特定行业的用户,形成长期而稳定的合作关系。在国外很
早就出现了对基于内容垂直的搜索引擎的研究工作。而第四代网络检索引擎也在 2000
年以后投入研究。同时也出现了垂直搜索结合人工加工数据的一些网站,专门面向一个
特定的领域,这就是垂直搜索的雏形。
垂直搜索引擎正在成为当前网络技术发展的一个重要方向[4],在最近几年中发展尤
其迅猛。很多行业都有了自己的垂直搜索引擎服务。加利福尼亚大学研发的法律信息搜
索系统,针对法律专业人士的特定要求实现搜索,极大地提高了检索效率。还有只返回
URL 的美国国家图书馆检索系统,它搜索的对象只涵盖科学、工程技术和数学领域,检
索主题的准确度极高。检索结果数量有限,但是相关度和准确度都很高。
国内在垂直搜索领域的研究和国外比较起步晚,但是随着国家经济的发展也在迅速
发展[5]。如用户加入奇虎论坛后发布的帖子会被论坛收集和整理,其中好的帖子将被论
坛代为宣传并加入相关的检索范围。如此以来,随着用户数量和精华帖的增多,该论坛
的访问量也相应地提高。还有其他很多针对性很强的搜索引擎。有的是针对房产的,有
的是针对找工作的,而有的是针对生活交友的等等。它们可以自动地检索网络中同类的
网页,通过一定的算法选择相关度高的网页,自动更新到自己的数据库中,当用户需要
的时候再以某种形式展现出来。目前很多的基于垂直搜索的网站正在蓬勃发展中,它们
在集中服务方面和内容的垂直化方面都做了有益的探索,但是在当前的网络普及大潮中
2
第 1 章 绪 论
还有更多的机遇和挑战。
目前,随着各大行业的兴起和发展,基于垂直检索的搜索引擎已经越来越多地介入
到人们生活的各个方面[6]。而作为传统搜索巨头的 Google 和百度,因为其宽泛、针对性
不强的特点在某些领域已经逐渐被蚕食市场,所占市场份额正在逐年缓慢下降。未来,
是一个集行业化
文档评论(0)