元搜索基础知识.doc

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
元搜索 元搜索引擎又称多搜索引擎,通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。(搜索引擎分类:全文搜索引擎、目录索引、元搜索引擎) 元搜索引擎的另外一个定义:元搜索引擎(Metasearch Engine),是一种调用其它独立搜索引擎的引擎,亦称“搜索引擎之母(The mother of searce engines)”。在这里,“元”(Meta)为“总的”、“超越”之意,元搜索引擎就是对多个独立搜索引擎的整合、调用、控制和优化利用。相对元搜索引擎,可被利用的独立搜索引擎称为“源搜索引擎”(source Engine),或“搜索资源”(searcing resources),整合、调用、控制和优化利用源搜索引擎的技术,称为“元搜索技术”(Meta-searching technique),元搜索技术是元搜索引擎的核心。世界上最早的元搜索是metacrawler,它是infospaceinc.的一部分,初始网上运行时间为 1995年,是由华盛顿大学的学生erik和教授oren etzin共同开发研制的。它是万维网搜索引擎metacrawler的姐妹引擎,是一个并行式的元搜索引擎。具有同时调用Google、Yahoo、Ask Jeeves About、LookSmart、TeomaOverture、FindWhat等搜索引擎的功能,然后按相关度给出精确,详细的结果。它可以对网页、图像、音频、多媒体、新闻、购物等进行选择检索,还提供了如下高级检索功能: 提高你检索的品质(Qualify Your Search):你可以创建一个特定的检索,查询一个精确的字段,或者排除包含特定词的页面。 使用布尔逻辑符检索(Use Boolean Terms):在关键词中使用and,or和not布尔逻辑检索符,使得检索结果更精确。 最后更新页面(Last Page Update):使用After来查询特定日期后更新的结果,使用Before来查询在特定日期千更新的结果。同时选择After和Before,将检索出两个日期之间的结果。 域名过滤(Domain Filter):可以排除以.com、.gov、.edu结尾的域名,你也可以包括一个特殊的包含.com的域名。 成人过滤(Adult Filter):可以包含或者过滤掉Web检索结果中的成人内容。 语言选择(Language Selection):可以选择返回结果所用的语言。 结果展示(Results Display):可以选择检索结果排序的方式,按与检索词的相关性排序或者按搜索引擎展示结果的顺序排序。 一个真正的元搜索引擎由三部分组成,即:检索请求提交机制、检索接口代理机制、检索结果显示机制。请求提交负责实现用户个性化的检索设置要求,包括调用哪些搜索引擎、检索时间限制、结果数量限制等。接口代理负责将用户的检索请求翻译成满足不同搜索引擎本地化要求的格式。结果显示负责所有源搜索引擎检索结果的去重、合并、输出处理等元搜索引擎的出现,对于那些需要连续地使用不同的搜索引擎重复相同的检索的人来说,是一个福音。使用元搜索引擎同时对几个搜索引擎进行检索,获得分级编排的检索结果。 我们可将元搜索引擎看成具有双层客户机/服务器结构的系统。用户向元搜索引擎发出检索请求,元搜索引擎再根据该请求向多个搜索引擎发出实际检索请求,搜索引擎执行元搜索引擎检索请求后将检索结果以应答形式传送给元搜索引擎,元搜索引擎将从多个搜索引擎获得的检索结果经过整理再以应答形式传送给实际用户。当然,某些元搜索引擎具有略微不同的机制。简单搜索(Simple Search)指输入一个单词(关键词),提交搜索引擎查询,这是最基本的搜索方式。 词组搜索(Phrase Search)指输入两个单词以上的词组(短语),提交搜索引擎查询,也叫短语搜索。现有的搜索引擎一般都约定把词组或短语放在引号“”内表示。 语句搜索(Sentence Search)指输入一个多词的任意语句,提交搜索引擎查询,这种方式也叫任意查询。不同搜索引擎对语句中词与词之间的关系的处理方式不同。 目录搜索(Catalog Search)指按搜索引擎提供的分类目录逐级查询,用户一般不需要输入查询词,而是按照查询系统所给的几种分类项目,选择类别进行搜索,也叫分类搜索(Classified SearCh)。 高级搜索(Advance Search)指用布尔逻辑组配方式查询,也叫定制搜索。常用的逻辑运算为AND(和)、 OR(或)和NOT(非)。 上述前3种搜索方式可以合称为词语搜索(Word Search),与高级搜索和目录搜索一起构成3类常见搜索方式。 在所有搜索方式中,还可使用通配符,就像

文档评论(0)

bbnnmm885599 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档