第三章 因特网信息资源的检索.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 因特网信息资源的检索

第三章 因特网信息资源的检索 第三章 因特网信息资源的检索   随着因特网的发展,网上信息资源的数量、种类不断激增,如何才能在这浩瀚、动荡的信息海洋中快捷、准确地找出所需信息已成为一个突出的问题,于是网络搜索引擎应运而生。像图书馆目录能指引读者迅速找到所需图书一样,搜索引擎可以为人们在茫茫的网络信息海洋中拾贝、导航。 3.1 搜索引擎概况   搜索引擎(Search Engine)是Internet上具有查询功能的网页的统称,是开启网络知识殿堂的钥匙,获取知识信息的工具。随着网络技术的飞速发展,搜索技术的日臻完善,中外搜索引擎已广为人们熟知和使用。任何搜索引擎的设计,均有其特定的数据库索引范围、独特的功能和使用方法,以及预期的用户群指向。它是一些网络服务商为网络用户提供的检索站点,它收集了网上的各种资源,然后根据一种固定的规律进行分类,提供给用户进行检索。 3.1.1 搜索引擎的工作原理   搜索引擎是互联网上三大最流行的服务(电子邮件、搜索引擎、WWW浏览)之一,使用频率仅次于电子邮件,一般说来,搜索引擎由搜索软件、索引软件和检索软件三部分组成。   搜索引擎工作时,要按照一定的规律和方式运行特定的网络信息搜索软件,定期或不定期地搜索Internet各个站点,并将收集到的网络信息资源送回搜索引擎的临时数据库;接下来利用索引软件对这些收集到的信息进行自动标引形成规范的索引,加入集中管理的索引数据库;在Web的客户端,提供特定的检索界面,供用户以一定的方式输入检索提问式并提交给系统,系统通过特定的检索软件检索其索引数据库,并将从中获得的与用户检索提问相匹配的查询结果再返回客户端供用户浏览。   这一过程可简单描述为: 搜索软件用来在网络上收集信息,执行的是数据采集机制; 索引软件对收集到的网络信息进行自动标引处理并建立索引数据库,执行的是数据组织机制; 检索软件通过索引数据库为用户提供网络检索服务,执行的是搜索引擎的用户检索机制。 3.1.2 搜索引擎功能简介   简单搜索(Simple Search):指输入一个单词(关键词),提交搜索引擎查询,这是最基本的搜索方式。   词组搜索(Phrase Search):指输入两个单词以上的词组(短语),提交搜索引擎查询,也叫短语搜索,现有搜索引擎一般都约定把词组或短语放在引号内表示。   语句搜索(Sentence Search):指输入一个多词的任意语句,提交搜索引擎查询,这种方式也叫任意查询。不同搜索引擎对语句中词与词之间的关系的处理方式不同。   目录搜索(Catalog Search):指按搜索引擎提供的分类目录逐级查询,用户一般不需要输入查询词,而是按照查询系统所给的几种分类项目,选择类别进行搜索,也叫分类搜索(Classified Search)。   高级搜索(Advanced Search):指用布尔逻辑组配方式查询。   使用逻辑运算为and(和)、or(或)、not(非),能够进行要领组合,扩大或缩小检索范围,提高检索效率。对A、B两词而言。   A and B是指取A和B的公共部分(交集),检索结果必须含有所有用and连接起来的提问词;   A or B是指取A和B的全部(并集),检索结果必须至少含有一个用or连接起来的提问词;   A not B是指取A中排除B的部分,检索结果只含有not前面的提问词,而不能含有not后面的提问词。 A、 B本身为多词时,可以用括号()分别括起来作为一个逻辑单位。   上述前三种搜索方式可以合称为语词搜索(Word Search),与高级搜索和目录搜索一道构成三类常见搜索方式。   在所有搜索方式中,还可使用通配符,就象DOS文件系统用*作为通配符一样,通配符用于指代一串字符,不过每个搜索引擎所用的通配符不完全相同,大多用*或?,少数用$。不少搜索引擎还支持加(+)、减(-)词操作。 3.1.3 搜索引擎的类型   搜索引擎的种类很多,各种搜索引擎的概念界定尚不清晰,大多可互称、通用。事实上,各种搜索引擎既有共同特点,又有明显差异。按照信息搜索方法和服务提供的方式的不同,主要可分为:   一、检索式搜索引擎   该类搜索引擎由检索器根据用户的查询输入,按照关键词检索索引数据库。这种方式其实是大多数搜索引擎最主要的功能。在主页上有一个检索框,在检索框中输入要查询的关键词,单击检索(或搜索、search、go等)按钮,搜索引擎就会在自己的信息库中搜索含有输入的关键词的信息条目。用户可以通过分析选择所需的网页链接,直接访问要找的网页。此类搜索引擎主要有如下。   AltaVsita--。AltaVista有英文版和其他几种西文版。提供全文检索功能,并有较细致的分类目录。网页收录极其丰富,有英、中、日等25种文字的网页。搜

文档评论(0)

80219pm + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档