网站大量收购闲置独家精品文档,联系QQ:2885784924

第二讲信息检索技术精要.ppt

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机信息检索的基本概念 二、基本信息检索技术 三、进阶检索技术 四、检索效果评价 五、信息检索策略的制定和实施 一、计算机信息检索的基本概念 1、计算机信息检索的定义 2、计算机信息检索的原理 3、计算机信息检索类型 4、计算机信息检索的发展 5、计算机检索系统构成 6、计算机信息检索对象 计算机信息检索简称机检 狭义:指使用特定(或非特定的)指令形成的检索策略在计算机检索系统中检索出需要的信息,并在检索端上显示(或打印)的过程 广义:包括计算机信息存储和计算机信息检索2个方面 信息检索经历了从手工检索到机械检索再到计算机化检索的发展过程。 信息检索的定义 根据特定的需求、按照一定的方法查找所需信息的过程。 广义:包括信息存贮、信息检索 狭义:信息的查找过程 2、信息检索的原理 就是将特定的用户信息需求与检索系统中的文献线索进行有无、异同及大小的比较和匹配,选取两者相符或部分相符的文献予以输出。 无论手工检索还是计算机检索,其基本原理都是一样的。 计算机信息检索的原理 同信息检索原理 就是将特定的用户信息需求与检索系统中的文献线索进行有无、异同及大小的比较与匹配,选取两者相符或部分相符的文献予以输出 3、信息检索类型 文献检索(Literature Retrieval ):以文献为检索对象的信息检索 数据信息检索(Data Retrieval):电话号码、观测数据、统计数据、参数、市场行情、图表、化学分子式等 事实信息检索(Fact Retrieval):事物(事件)的性质、定义、原理以及发生的时间、地点、过程等。 3.1文献信息检索 凡是利用目录、文摘或索引等二次信息查找某一课题、某一著者、某一地域、某一机构、某一事物的有关信息以及这些信息的出处和收藏单位,都属于文献信息检索范畴,其检索的结果就是文献信息。 例如,“设计人行天桥的参考文献有哪些?” 3.2数据信息检索 凡是利用参考工具书、数据库等检索工具检索包含在文献中的某一数据、参数、公式或化学分子式等,统称为数据信息检索。 例如,“某一新型载货汽车的载重量是多少,百公里油耗是多少?” “今日人民币对美元汇率” 3.3事实信息检索 凡是利用百科全书等检索工具从存储事实的信息系统中查找出某一事实的具体答案的过程称为事实信息检索,其检索结果是基本事实。 例如,“世界上最长的斜拉桥是哪座,该桥位于什么地方,何时建成?” 4、信息检索的发展: 手工信息检索:印刷型检索工具 机械信息检索:是手工检索向计算机信息检索的过渡阶段 计算机信息检索 :目前,计算机信息检索已成为用户获取信息的主要方式,我们所说的现代信息检索一般指计算机信息系检索。 计算机信息检索可划分为脱机检索、联机检索、光盘检索和网络检索4个阶段。 5.计算机检索系统的构成 联机检索中心:中央计算机处理器、数据库、外设 通信网络:桥梁 检索终端:电传终端、数传终端、微机终端 6.计算机检索的对象——数据库 顺排文档与倒排文档 文献型数据库(书目数据库、全文数据库)和非文献型数据库 基本索引字段和辅助索引字段 AU=:作者字段 CS=:作者所在单位字段 SO=:文献出处字段,包含期刊名称、卷、期、页等,也包含会议事项。 CO=:期刊代码字段 LA=:语种字段,表示原文语种 DT=:文献类型字段 CC=:分类代码字段 /AB:文摘字段 /TI:篇名字段 /DE:叙词字段,都是选自叙词表、主题词表 中的词 /ID:自由标引词字段,非系统词表中的词。 二、 基本检索技术 1、布尔逻辑 2、检域限制 1、布尔逻辑 在进行信息检索时,检索项之间概念有相交关系、同义关系或相关关系,这时采用布尔逻辑进行检索项之间的逻辑组配。即用“与”(AND)、“或”(OR)、“非”(NOT)来表达。 (1)逻辑“与” 在计算机信息检索时, “与” (and或*)是表达概念交叉和限定关系的一种组配,具有缩小检索范围和提高专指性的功能。 实际操作中,表达式为: A and B 或 A* B 例: ?S computer and library ?S computer*library (2)逻辑“或” 逻辑“或”算符,表示主题概念之间的同义、近义、相关或多个并列的检索概念。具有扩大检索范围,减少漏检的功能。 A or B 或 A + B 例:aerocraft OR aircraft aerocraft+aircraft (3)逻辑“非” 逻辑“非”算符,是具有概念包含关系的一种组配,可以从原检索范围中排除某一内容

文档评论(0)

宝贝计划 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档