网站大量收购闲置独家精品文档,联系QQ:2885784924

3.2计算机信息检索基本原理和检索技术.ppt

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3.2计算机信息检索基本原理和检索技术

第三章 计算机信息检索 第二节 计算机信息检索基本原理及 检索技术 一、 计算机信息检索原理 计算机将输入机检系统的用户提问标识(检索词)与已存储在系统中数据库内的文献特征标识(标引词)进行机械性匹配比较,凡符合给定的比较原则和逻辑运算条件即为命中信息。 检索提问字符串匹配数据库中特征标识字符串。 二、 计算机信息检索技术 计算机检索时采用的相关技术,主要有布尔检索、词位检索、截词检索、限制检索。 布尔检索 利用布尔逻辑算符对检索词或检索代码进行组配形成检索式,以此检索式作为匹配依据,进行检索。 布尔检索逻辑算符及其运算含义: 逻辑或(OR,+) 逻辑与(AND,*) 逻辑非(NOT,-) 逻辑或(OR,+) 表示它所连接的两个检索词只有其中任何一个出现在结果中就满足检索条件,即对于检索式“A OR B”来说,数据库中的文献凡含有检索词A、或含有检索词B、或同时含有检索词A和B的均为命中文献。 如COMPUTER AND LAW 逻辑与(AND,*) 表示它所连接的两个检索词必须同时出现在结果中才满足检索条件,即对于检索式“A AND B”来说,数据库中同时含有检索词A和检索词B的文献才算命中文献。 【例】CAR OR TRUCK 逻辑非(NOT,-) 表示它所连接的两个检索词应该包含的一个检索词而不包含第二个检索词才满足检索条件,即即对于检索式“A NOT B”来说,数据库中凡含有检索词A而不含有检索词B的文献才算命中文献。 【例】图书馆 NOT 公共图书馆 逻辑或——检索范围扩大,提高检索结果数量,保证有较高的查全率。 逻辑与——检索结果范围缩小,增强检索的专指性,保证有较高的查准率。 逻辑非——与逻辑与的作用类似,有缩小检索范围,提高检索准确性的作用。 截词检索 截词是指检索者将检索词汇在他认为合适的地方截断。截词检索是使用被截断的词汇进行检索匹配,并认为凡满足这个词局部中所有字符(串)要求的记录,都为命中文献。因此,检索词的不变部分加上由截词符号(一般用*表示)所代表的任何变化形式所构成的词汇都是合法检索词。 截词检索基于:西方语言构词灵活,在词干上加上不同的前后缀,可派生出许多新词汇。词干相同,派生出的词在基本含义上通常是一致的,形态的差别多半只是语法上的意义。 正是这个原因,检索者如果不在检索式中列举出一个词的所有派生形式,检索时容易出现漏检。截词检索是防止这种类型漏检的有力手段,作为一种后控制措施,目前,大 多数检索系统都提供截词检索能力。 按截断的字符数量分: 有限截断——指要具体说明截去的字符数量 无限截断——指不具体说明截去多少个字符 按截断位置分:后(右)截断、前(左)截断、中截断 后截断检索 将截词符号置放在一个字符串右方,以表示其右边的有限或无限个字符不影响该字符串的检索匹配。从检索匹配性质上讲,后截断检索属于“前方一致”检索。 【例】检索式“Comput*”无限后截断检索,可检出词汇有: Computing Computer Computerized ……………… 前截词检索 将截词符号置放在一个字符串左方,以表示其左边的有限个或无限个字符不影响该字符串的检索。从检索性质上讲,前截词检索是“后方一致检索”。 【例】对于检索式“*magnetic”来说,能够检索出含有 magnetic electromagnetic(电磁的) paramagnetic(顺磁的) thermomagnetic(热磁的) 中截词检索 将截词符号置放在一个检索词的中间,而不是左右两侧。仅允许有限截词,主要用于英、美拼写不同的词和单复数拼写不同的词。 【例】organi?ation可检索出含有organisation和 organization的记录。Wom*n可检索出Woman、Women 截词检索具有隐含的“逻辑或(O

您可能关注的文档

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档