- 1
- 0
- 约4.84千字
- 约 28页
- 2016-11-23 发布于贵州
- 举报
第六章 元搜索引擎 6.1 概念 1、也称为集合式的搜索引擎,将多个搜索引擎集合在一起,提供一个一致的界面,也可分为关键词检索和目录检索。 当用户发出检索请求后,该引擎自动利用多种其它的搜索引擎同时进行检索。 开发元搜索引擎,主要的理由是: 1)元搜索能够分散处理负载,增加检索的范围。 Web 数据量太大,而且增长迅猛,单个引擎的容量,处理能力难以扩展到很大的规模,所以每个引擎只能包含一部分 Web 文档。 2)元搜索具有较好的扩展性,可以加入多个成员引擎。它使得各个成员引擎规模变小,性能更好,这样成员引擎的检索响应时间短,还可以使得检索的内容保持最新。 3)有些 web 站点的内容不能用数据采集器抓取,只有用该站点提供的 API 访问。 4)检索更有效,用户为了找到满意的检索结果可能访问多个搜索引擎,直到找到结果位置,而元搜索引擎可以帮助用户自动完成这个任务。 3)查询分发:把来自检索界面的查询串翻译成特定的引擎的串。 4)结果合并: 如果成员引擎的相关函数不同,没有可比性,则逐个取返回结果队列的头部,如果成员引擎的相关函数相同,返回结果的权值具有可比性,可以按查询与引擎的相关系数加权各个返回队列,用多路最优归并算法合并结果形成全局有序队列。 结果合并过程中还要除去重复的文档,方法是取每个文档的索引纪录中摘要部分的前
您可能关注的文档
- 稻田中学庆祝国三八妇女节100周年暨颁奖仪式.ppt
- 第01讲_第1绪论_习题1 116页.ppt
- 第01讲_第1绪论_习题1 116页-1.ppt
- 第01章、现状发展v1.1.ppt
- 第01章:Orcle简介_SQLPLUS客户端.ppt
- 第1讲 绪论-008.ppt
- 第1章 SQ Server 2005概述.ppt
- 第1章 可编程oC设计导论.ppt
- 第1章 数字控.ppt
- 第1章 物流成管理.ppt
- 邢台市清河县2025-2026学年第二学期三年级语文第六单元测试卷(部编版含答案).docx
- 烟台市龙口市2025-2026学年第二学期六年级语文第六单元测试卷(部编版含答案).docx
- 延安市洛川县2025-2026学年第二学期六年级语文第六单元测试卷(部编版含答案).docx
- 赤峰市松山区2025-2026学年第二学期三年级语文第六单元测试卷(部编版含答案).docx
- 宣城市泾县2025-2026学年第二学期六年级语文第六单元测试卷(部编版含答案).docx
- 荆门市东宝区2025-2026学年第二学期四年级语文第六单元测试卷(部编版含答案).docx
- 铜仁地区石阡县2025-2026学年第二学期二年级语文第六单元测试卷(部编版含答案).docx
- 临夏回族自治州康乐县2025-2026学年第二学期六年级语文第六单元测试卷(部编版含答案).docx
- 荆州市江陵县2025-2026学年第二学期六年级语文第六单元测试卷(部编版含答案).docx
- 贺州市富川瑶族自治县2025-2026学年第二学期四年级语文第六单元测试卷(部编版含答案).docx
原创力文档

文档评论(0)