智能搜索引擎在数字图书馆中应用.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
智能搜索引擎在数字图书馆中应用

智能搜索引擎在数字图书馆中应用   关键词:智能搜索引擎;数字图书馆;个性化服务   摘 要:随着互联网络的发展以及现代科学技术的不断创新,传统搜索引擎已经不能适应时代的需要,如何有效地利用智能搜索引擎,特别是将它应用于数字图书馆中是我们面临的重要问题。   中图分类号:G258.6文献标识码:A 文章编号:1003-1588(2009)04-0095-03   Intelligent Search Engine in Digital Library   Lv Jingqiao   (Library of Xinxiang Medical University,Xinxiang 453003,China)   Key words: Intelligent Search Engine; Digital Library; Personalized service   Abstract: With the development of the Internet, as well as modern scientific and technological innovation, search engines already can not meet the traditional needs of the times, how to effectively use intelligent search engine, in particular, it applies to digital libraries is an important issue we face.      随着互联网的出现和发展,搜索引擎也由传统的搜索引擎发展到了智能搜索引擎。作为新一代的信息检索工具,智能搜索引擎凭着自身的优点,被越来越多地应用到各个领域。调查显示网站75%的访问量都来自于搜索引擎的推荐。如何有效地将智能搜索引擎应用于数字图书馆,打造具有本馆特色的数字图书馆,是我们面临的一个问题。      1 搜索引擎      1.1 搜索引擎的概念   搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行理解、提取、组织和处理后,为用户提供检索服务的系统。   1.2 搜索引擎的组成   搜索引擎一般由搜索器、索引器、检索器和用户接口四个部分组成:搜索器的功能是在互联网中漫游、发现和搜集信息;索引器的功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表;检索器的功能是根据用户的查询在索引库中快速检索文档,进行相关度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息;用户接口的作用是接纳用户查询、显示查询结果、提供个性化查询项。   1.3 搜索引擎的分类   1.3.1 全文搜索引擎   全文搜索引擎是名副其实的搜索引擎,具有代表性的有国外的Google和国内的百度。它们都是从互联网提取以网页文字为主的各个网站的信息,建立起自己的数据库,并能检索与用户查询条件相匹配或相近的记录,按一定的排列顺序返回结果。根据搜索结果来源的不同,全文搜索引擎可分为两类:一类拥有自己的检索程序,俗称“蜘蛛”程序或“机器人”程序,它能自建网页数据库,搜索结果直接从自身的数据库中调用,Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。   1.3.2 目录索引   目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,它的信息收集与索引主要依靠人工来完成,搜索引擎的标引主要依靠手工来搜寻不断出现的新网站,给每个网站一个标题和大概的描述,将其放入相应的类目体系中。用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以不依靠关键词而按照分类目录找到所需要的信息。目录索引中最具代表性的有新浪分类目录搜索。   1.3.3 元搜索引擎   元搜索引擎本身并没有存放网页信息的数据库,它的工作原理是将用户提交的搜索请求转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的查询结果集中起来进行处理后,再返回给用户。元搜索引擎设计简单,但由于网络负载太大且搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。中文元搜索引擎中具代表性的是搜星。      2 传统搜索引擎存在的不足      搜索引擎是伴随着互联网的发展而发展起来的,它的出现为人们查询资料带来了极大的方便。然而,随着人们对信息需求的不断增加,现有搜索引擎的工作方式使得其搜索

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档