第六章 多元搜索引擎.pptVIP

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 多元搜索引擎 作者:张海燕 第五章所介绍的网络检索工具,如 天网、搜狐等,每个 URL都只代表一个搜索引擎或Web目录,检索只在本引擎的数据库内进行,都是单一的搜索工具。由于不同的网络检索工具数据库所覆盖的领域、资源类型、规模等均不同,检索方式也各具特色,对同一个检索提问,不同的网络检索工具会产生不同的检索结果。为了获得最全面的检索结果,用户不得不将同一个检索课题在多个搜索引擎上一次次地进行检索,因此要面对不同的检索界面,一次次地重复输入提问式,还要对反馈的检索结果进行筛选、去掉重复等,非常繁琐。 多元搜索引擎产生的原因 网络上还有许多专门针对某种类型的网络资源查找(如:FTP资源、Telnet资源、用户组资源等)和专为某种类型问题检索(如:查找人名、地名、统计数据等)而设计的专门工具,这些检索工具并不都为用户所了解或熟悉。为了克服用户面对品牌繁多、五花八门的网络检索工具而产生的无所适从 ,多元搜索引擎应运而生 6.1 多元搜索引擎 多元搜索引擎又称为集合式搜索引擎。它是将多个搜索引擎集成在一起,并提供一个统一的检索界面。可分为两种类型:搜索引擎目录和多元搜索引擎。 搜索引擎目录 搜索引擎目录也即检索工具的检索工具,它将主要的搜索引擎集中起来,并按类型或按检索问题等编排组织成目录,帮助、导引用户根据检索需求来选择适用的搜索引擎;检索的还是某一搜索引擎的数据库,与普通单一搜索引擎的检索是一样的。 搜索引擎目录 只不过是设立了又一层门户,通过其组织、检索界面,为用户选择适用的检索工具提供积极的帮助,以克服用户面对众多的检索工具的无所适从。 如:酷站大全 / 多元搜索引擎 多元搜索引擎,是将多个搜索引擎集成在一起,提供一个统一的检索界面;且将一个检索提问同时发送给多个搜索引擎,同时检索多个数据库,再经过聚合、去重之后输出检索结果。 又被称为 simultaneous unified search index(SUSI),可译为“并行统一检索索引”,即在用户输入检索词后,该引擎自动地利用多种检索工具同时进行检索。它是一种集中检索的方式,其最大优点就是:省时。不用就同一提问一次次地访问所选定的搜索引擎,每次均要输入检索词等。且检索的是多个数据库,检索的综合性、全面性也有所提高。 6.2 多元搜索引擎的检索特性 每个多元搜索引擎均有其自身的特性,如:使用哪些引擎检索、如何处理检索提问、如何编辑和显示结果。有些是顺序检索,有些是同时检索;有些将提问转化为目标引擎的语法,其他的则以“相当于”来发送检索请求。正是因为多元搜索引擎的这些特性,所以无法进行单个的特点比较。不过,通过对10余个多元搜索引擎的研究,可以找出一些共同的选项和特性。 多元搜索引擎的检索特性 (1)可检索引擎的数量和名称 即一个多元搜索引擎可检索哪些和检索多少搜索引擎。这在有些多元搜索引擎的检索界面上可以一目了然,但有些多元搜索引擎则未加详细说明,将检索引擎的数量和名称隐藏在帮助信息或FAQ中。 (2)检索提问 搜索引擎目录只是将主要的搜索引擎集中罗列,并导引用户按检索资源类型或检索问题等选择相应的检索工具。它并未将各个搜索引擎的检索功能加以合并,检索时使用的还是某一搜索引擎的数据库,与普通单一搜索引擎的检索是一样的。因此其检索界面上可见一系列的检索提问框,每个列出的搜索引擎对应一个检索框,使用该搜索引擎的检索句法输入检索词或提问式,单击递交(submit)或检索 (search)后分别检索每个搜索引擎。如:ALL-In-One。 而并行式的多元搜索引擎的检索界面则非常简单,大多只有一个提问框。与大多数流行搜索引擎的作法类似,均支持布尔检索选择,允许检索者按某种检索句法(syntax)形成自己的提问式。在用户输入检索提问式后,该引擎自动地利用多种检索工具同时进行检索。这里要特别注意的是由于不同的搜索引擎的检索机制、算法及对提问式的解读均不同,没有一个共同规范,某些搜索引擎可能不支持用户所使用的检索句法。因此有的多元搜索引擎在发出提问式时,即将提问转换为每个引擎的检索句法,或者是以“相当于”(as is)直接传送给目标引擎。 (3)其他检索选项 ①等候时间 使用并行检索式的多元搜索引擎进行检索时,由于同时检索多个数据库,所需检索时间较长,可事先设定等候时间为10秒、15 秒或30秒等。 ②检索作业方式 使用搜索引擎目录按照列表检索时,对多个引擎是顺序检索还是同时检索,这个差别将使得处理时间、结果返回方式等有差异。 ③其他检索参数 该多元搜索引擎是否支持布尔算符、自然语言和词组等检索策略?可供选择的其他检索参数等。 (4)检索结果选项 大多数多元搜索引擎的检索结果按相关的搜索引擎排序,即将各搜索引擎的查找结果合并,并

您可能关注的文档

文档评论(0)

赵五菱王 + 关注
实名认证
文档贡献者

资料收集自互联网,若有侵权请联系删除,谢谢~

版权声明书
用户编号:8036120077000004

1亿VIP精品文档

相关文档