《信息存储与检索》第十章元搜索引擎及搜索引擎的质量评价.ppt

《信息存储与检索》第十章元搜索引擎及搜索引擎的质量评价.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
通用型搜索引擎的质量评价 搜索引擎评价研究内容分析 搜索引擎评价研究角度分析 1.以系统为中心的研究 2.以任务为中心的研究 3. 以用户为中心的研究 基于用户的搜索引擎质量评价体系 1搜索引擎检索功能指标 2. 搜索引擎检索效率指标 3. 搜索引擎检索结果显示指标 4. 搜索引擎数据库性能指标 5.搜索引擎亲和度指标 6.搜索引擎提供个性化服务指标 第三节 搜索引擎伦理问题 对知识入口的控制 检索结果排序 个人信息保护(英语文献) 第十章 元搜索引擎与搜索引擎的评价 第一节 元搜索引擎 1.元搜索引擎的含义 2、元搜索引擎的基本构成 3、元搜索引擎的基本特征和优点 4、元搜索引擎的类型 5、元搜索引擎的发展的问题和趋势 根据专家的测评,目前主要搜索引擎返回的相关结果的比率不足45%,而且由于所采用机制、算法与适用范围等的不同,导致同一个检索请求在不同的搜索引擎中的查询结果的重复率不足34%。 因此要获得一个比较全面的准确的计算结果,就必须反复调用多个搜索引擎。元搜索引擎的出现,在一定程度上解决了这些问题。 一、元搜索引擎的含义 元搜索引擎(Metasearch Engine)是在前述 搜索引擎基础上建立的可以同时查询多个搜索引擎的WWW站点,其英文原意是搜索引擎之后或之上的搜索引擎,因而也可以叫做后搜索引擎、多元搜索引擎、集合式搜索引擎 元搜索引擎集成了不同性能和不同风格的搜索引擎并发展了一些新的查询功能,其检索的综合性和完整性较好。 元搜索引擎技术现在成为检索工具的发展方向。著名的Excite和HotBot都增添了元搜索引擎的功能。 二、元搜索引擎的基本构成 主要由请求提交代理、检索接口代 理和结果显示代理三部分构成。 图: 元搜索引擎的基本构成 用户 请求提交代理 ------ 搜索引擎 检索接口代理 ------ 搜索引擎 元搜索引擎 结果显示代理 ------ 搜索引擎 1. 请求提交代理 负责实现用户的“个性化”的检索设置要求,包括选择哪些搜索引擎、检索结果限制、结果数量限制等 一般的元搜索引擎设定了它所调用的独立搜索引擎;有些元搜索引擎让用户自己选择所用的搜索引擎;有的通过分析用户的兴趣和网络的实际情况来选择搜索引擎,这有利于提高查准率和对用户的响应速度。 2.检索接口代理 负责将用户的请求“翻译”成搜索引擎独立搜索引擎要求的格式。 元搜索引擎需要将用户通过同一界面以同一形式输入的检索指令转换成为各个成员搜索引擎的具体指令 3.结果显示代理 负责成员搜索引擎检索结果的合并、去重、输出处理等 从各独立搜索引擎返回的检索结果具有自己的数据格式,元搜索引擎需要按照用户要求将各个局部格式转换为全局格式,并将同一整体呈现给用户。 全局格式转换要在记录数量、内容、标题、长度、位置等方面准确表达所有局部格式的共同特点和要求,又要能根据全局格式的要求对记录进行处理,同时需要协调不同的局部格式可能存在的差异。 元搜索引擎的结构一般由网页标题、内容摘要、索指网页的URL、相关度、信息返回时间、所采用的引擎标志等组成。元搜索引擎的检索结果常用的排序方式有:相关度排序、时间排序、域名分类排序、搜索引擎排序等。 三、元搜索引擎的基本特征和优点 元搜索引擎与独立搜索引擎相比更多的是提供同一界面,形成一个由多个分布的具有独立功能的检索工具构成的虚拟逻辑整体。 元搜索引擎的核心问题是要解决如何调用其它搜索引擎的索引数据库、如何获取检索提问在其它搜索引擎中的查询结果以及如何评价、排序、呈现结果等 元搜索引擎需要采用的技术有用户提问转换、分布式数据库调用、检索机制设计与优化、检索结果输出等。 1.基本特征 统一检索界面,用户界面友好 检索指令转换 统一结果集的组织和显示 2.主要优点 与普通搜索引擎比较 信息的覆盖面 检索结果的权威性和可靠性 易维护性 四、元搜索引擎的类型 按照搜索机制划分,元搜索引擎包括并行式和串行式两类 并行式元搜索引擎运行时是将查询请求同时发向各个独立搜索引擎,然后将检索的结果按特定的顺序呈现给用户 串行式元搜索引擎运行时是将查询请求先发向某个独立搜索引擎,待其返回结果后再将请求发往另一个独立搜索引擎。 按照请求提交代理、检索接口代理和结果显示代理的复杂程度,可分为简单元搜索引擎和复杂元搜索引擎

文档评论(0)

autohhh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档