种适合于专题式元搜索引擎的信息检索策略.PDFVIP

种适合于专题式元搜索引擎的信息检索策略.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
种适合于专题式元搜索引擎的信息检索策略.PDF

2004年 7月 重庆 大学 学报 Ju1.2004 第27卷第7期 Journal of Chongqing Universit)r Vo1.27 No.7 文章编号:1000—582X(2004)07—0090一o4 一 种适合于专题式元搜索引擎的信息检索策略 吕传 宇 ,李 华 ,耿 虎 (1.重庆大学计算机学院,重庆 400030;2.省泰兴市黄桥电视台,Lr-苏泰兴 225400) 摘 要:现有的元搜索引擎技术是基于关键词的信息检索,在查找某一专业知识时,简单的关键词 组合不能真实地反映用户的检索意图,导致在检索中大量无关的信息被返回,专题式的元搜索引擎较好 地解决了这一问题。本文通过对现有的元搜索引擎技术、领域知识库等研究,提出了一种适合于专题式 元搜索引擎的信息检索策略,提高了检索的效率与精度。本文着重介绍了该检索策略的核心思想及其 关键技术。 关键词:专题式;元搜索引擎;搜索引擎;检索策略 中图分类号:TP393 文献标识码:A 随着信息技术和互联网技术的发展,Internet已经 1 元搜索引擎的定义及运作机制 成为拥有400万站点和3亿页面的分布式信息空间, 为了从纷繁芜杂的信息海洋中挖掘出有用的信息,出 1.1 元搜索引擎的定义 现了一批具有典型代表的搜索引擎,如Yahoo、C,oo~e 搜索引擎是Internet上进行信息检索的工具,它 等。由于各个搜索引擎实现技术不同,各自存在着检 向用户提供一个信息检索的接口,根据用户的检索请 索性能、效率、质量上的优缺点,为了达到全面、准确的 求,返回用户需要的信息,一般所说的搜索引擎是指的 检索效果,元搜索引擎技术应运而生。元搜索引擎的 独立搜索引擎。而元搜索引擎是一种基于搜索引擎的 搜索引擎,它由多个独立搜索引擎构成,在本文中将元 特点是通过调用多个搜索引擎,并对检索结果进行分 搜索引擎内部的独立搜索引擎称为成员搜索引擎。 析处理得到期望的结果。但是,由于元搜索引擎检索 1.2 元搜索引擎的结构及运行机制 的涵盖范围比独立的搜索引擎更广,用户只通过几个 元搜索引擎主要由用户提问处理、搜索引擎调度 关键字布尔组合在巨大信息空间中进行查找,因此在 及指令转化、检索结果排序处理及结果统一定制4个 对专题性、领域性目标进行检索时,就很难达到预期的 部分组成 -3 J,如图1所示。结合图1,分析元搜索引 效果,太多无关的信息被返回给用户 J。 擎的运行机制如下: 通过分析可以发现,现有元搜索引擎技术缺乏知 元搜索引擎 识处理能力和理解能力,其核心采用的是“以词对网” 圆 圈 一 噻塑 匮匿豳囹蓼 的检索策略,即在拥有巨大信息量的互联网中,以关键 ③ 词作为网络信息查询的人口进行检索。解决问题的根 用户 一 匾 一圆 · —— 匾圃匠圈 本和关键是构建专题式的元搜索引擎,即在现有的元 搜索引擎技术基础上,通过引入领域知识库,把信息检 图1 元搜索引擎结构图 索从目前的基于关键词的点提高到基于领域知识关联

文档评论(0)

tangtianxu1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档