信息检索的略.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 2.5信息检索的策略 检索策略就是在检索过程中如何高效率实施检索的途径、方法和步骤。 2.5.1信息检索的途径 2.5.2信息检索方法 2.5.3信息检索技术 2.5.4信息检索步骤 2.5.1信息检索途径(示意图) 2.5.2 信息检索方法(示意图) 2.5.3 计算机信息检索的技术 信息检索技术是指信息检索过程的原理、方法、策略、设备条件和检索手段等因素的总称。 主要介绍电子信息检索的技术。 电子信息检索过程中,为保证检索结果准确全面、经济高效,各种检索系统均为用户提供了多种不同的检索功能,其中使用比较普遍的有以下几种。 2.5.3 计算机信息检索的技术 1.布尔逻辑检索 利用布尔逻辑算符对检索词或代码进行逻辑组配,是信息检索系统中最基本、最常用的一种检索技术。 常用的布尔逻辑算符有:逻辑“或”、逻辑“与”和逻辑“非”。 2.5.3 计算机信息检索的技术 1.布尔逻辑检索 (1)逻辑“或”(用“OR”或“+”表示) 逻辑“或”是用来组配具有同义或同族关系的词,如同义词、相关词等。其含义是,检出的记录中,至少含有两个检索词当中的一个。(如:“汽车”和“车辆”是相关词) “OR” 算符的基本作用是扩大检索范围, 增加命中文献量,防止漏检, 提高检索结果的查全率。 2.5.3 计算机信息检索的技术 1.布尔逻辑检索 (2)逻辑“与”(用“AND”或“*”表示) 逻辑“与”是一种用于交叉和限定关系的组配。 其含义是检出的记录必须同时含有所有的检索词。 其基本作用是缩小检索范围,减少命中的文献量,有利于提高查准率。 逻辑“与”一般用于组配不同概念的检索词。 (如查找我校某教师发表的文章,解决同名问题,用“AND”组配可提高查准率,如“刘红光”/作者字段 AND“江苏大学”/机构字段AND“汽车”/关键词字段; 如 “刘红光” 、“江苏大学”就是不同概念的检索词。 2.5.3 计算机信息检索的技术 1.布尔逻辑检索 (3)逻辑“非”(用“NOT”或“-”表示) 逻辑“非”是一种排斥关系的组配,用于在某一记录集合中排除含有某一概念的记录。 逻辑“非”的基本作用是缩小检索范围,起到减少输出文献量的作用。 例如:在含有概念A的集合中排除含有概念 B的记录,可表示为“A NOT B”或“A-B”。 如:如“刘红光”/作者字段 AND“江苏大学”/机构字段NOT“汽车”/关键词字段; 如:“激光加工” NOT “激光切割” 2.5.3 计算机信息检索的技术 布尔逻辑检索图示 1、布尔逻辑检索 2.5.3计算机信息检索的技术 2.截词检索 截词检索是预防漏检、提高查全率的一种常用检索技术。 根据词的截断位置划分为后方截词、前方截词、中间截词三种类型。 根据截断的字符数量划分为有限截断和无限截断两种类型。 主要用于英文数据库的检索。 2.5.3计算机信息检索的技术 (1)后方截词 也称前方一致检索。将截词符放在一串字符的后面,用以表示以相同字符串开头,而结尾不同的所有词。 例1:comput* 可检出computer,computing,computers,computation等。 例2:acid?? 可检出acid acidic acids,但不能检出下列词汇:acidicity acidify等。 2.5.3计算机信息检索的技术 (1)后方截词 使用后方截词,归纳起来,主要使用在如下4个方面: ①词的单复数,如book?,wom?n ②年代,如199?(90年代) ③作者,如用Eric* 可检出所有姓Eric的作者。 ④同根词,如用technic* 可检出technical,technicality,technician等。 2.5.3计算机信息检索的技术 (2)前方截词 也称后方一致检索。它是将截词符放在某一词干的前方,用以表示词头不同但词尾相同的所有词。 例如:??press 可能检出depress express impress等。 前截断和后截断可以结合使用。例如:*chemi* 可以检出:chemical, chemistry,chemist, electro chemistry等。 2.5.3计算机信息检索的技术 (3)中间截词 又称中间屏蔽,它把截断符号放置在一个检索词的中间,屏蔽词中不同的字符。一般地,中间截词只允许有限截断。 例如:wom?n可表示woman women等。 2.5.3计算机信息检索的技术 3.位置检索 用于规定检索词相互之间的邻近关系,包括在记录中的顺序和相对位置。 位置检索是一种增强的逻辑与(AND)检索,一般用于全文数据库查询系统。 具体的说,位置检索可划分为以下4种不同形式:邻接检索、同句检索、同字段检索、同记录检索。 2.5.3计算机信息检索的技

文档评论(0)

dmdt5055 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档