信息检索和信息过滤的比较.pdfVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索和信息过滤的比较

第 24 卷  第 3 期 临 沂 师 范 学 院 学 报 2002 年 6 月 Vol . 24 No . 3 Journal of Linyi Teachers’College Jun . 2002 信息检索和信息过滤的比较 赵铭建 ( 临沂师范学院 计算机与信息科学系 ,山东 临沂 276005) 摘  要 :分析了信息检索和信息过滤的搜索过程 ,前者是在静态信息源中搜索用户短期的特定信息需求 的过程 ;后者是在动态信息源中搜索用户长期的特定信息需求的过程. 通过对信息需求与信息源关系图的分 析 ,可以采用整合信息检索技术和信息过滤技术的方法 ,也可以在信息检索技术和信息过滤技术的基础上 ,研 究新的信息搜索技术 ,来实现在动态信息源中搜索用户短期的特定信息需求. 关键词 :信息检索 ; 信息过滤 ; 信息搜索过程 ( ) 中图分类号 :TP391    文献标识码 :A       文章编号 :1009 - 6051 2002 03 - 115 - 03 随着信息技术的高速发展 ,尤其是因特网的不断普及 ,各种在线的电子文档如潮水般地涌来 ,面对 信息的“汪洋大海”,如何查找和利用所需的各类信息 ,往往使用户感到十分的茫然. 出现所谓的“信息过 载”和“信息迷向”的现象 ,即信息浩如瀚海 ,却又很难发现 自己感兴趣的信息 , 即使找到一些有用的信 息 ,也经常混有很多的“噪音”. 因此 ,为了能够根据用户个人的兴趣 ,提供给用户真正感兴趣的信息 ,尽 量屏蔽那些不为用户喜欢的信息 , 目前 ,出现了两种信息搜索方法 ,即信息检索法和信息过滤法. 信息过 滤与信息检索有着极为密切的联系 ,过滤实质上是建立在检索的基础之上的 ,因为它借鉴了许多检索的 表示方法和技术. 但两者又有着各自不同的特点 ,认清这一点对于我们更好地利用成熟的搜索技术 、研 究新的搜索技术及消除它们存在的局限性都是十分必要的. 1  信息检索和信息过滤的搜索过程 由于网上资源 日新月异 ,呈爆炸性增长. 面对浩如烟海的数字化 、多媒体 、非规范 、跨时空、跨行业 、 跨语种的信息资源 ,用户迫切需要高效的搜索技术和搜索工具来搜索用户真正感兴趣的信息 ,而尽量屏 蔽那些不为用户喜欢的信息. 信息搜索过程一般说来应分为 3 步 , 即收集信息源 ,选择用户感兴趣的信 息源 ,显示用户所需要的信息源. 如图 1 所示. 无论信息检索过程还是信息过滤过程都是对用户所需要 ( 的某一特定信息进行搜索 ,它们的搜索过程也是经过这 3 步 ,最终将用户真正感兴趣的信息 用户需求 ) 的信息 显示给用户. 似乎它们是相同的 ,但是从应用角度来看 ,它们具有各自不同的特点. 收集信息源 选择信息源 显示信息源 图 1  信息搜索过程 在 Internet 上信息检索的方法大致分为 2 种类型[ 1] :主题 目录 、搜索引擎. 主题 目录又被称为主题指 南 ,或列表查询引擎 ,它实际上是人工建立的、结构化的 Internet 网址主题类 目和子类 目,按照字母 、时 间、地点、主题等顺序进行排列 ,使用户通过浏览网络站点列表 ,检索有关信息. 较为典型有 Yahoo !、 LookSmart 、InfoMine 等. 搜索引擎也称为关键词检索工具或独立搜索引擎 ,其实就是定期搜索 Internet 并 收集新网页信息的计算机程序. 每个搜索引擎都有自己独有的搜索系统和一个包容因特网资源站点的 独有数据库. 其数据库由自动检索程序建立 ,不需人工干预. 这是它与主题 目录的最大区别. 自动检索程 序自动在网上漫游 ,不断收集各种新网址和网页 ,形成数千万甚至亿万条记录的数据库. 搜索引擎提供 对关键词 、主题词或

文档评论(0)

wnqwwy20 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7014141164000003

1亿VIP精品文档

相关文档