计算机检索基础重点.ppt

(3)截词算符 检索 是指在检索词的合适位置进行截断,保留相同的部分,用相应的截词算符代替可变化部分进行检索 。常用的截词算符(又称通配符)有“?”和“*”两种,也有采用其他符号表示的。 作用: 主要是解决一个检索词的单复数、词性的词尾变化,词干相同而词尾不同以及英美词汇拼写差异的问题等。 按截断的字符数量可分为有限截断和无限截断两种: 无限截断是指检索词与被检索词实现部分一致,被截断部分的字符不限。常用“*”表示(*=0-n个字母)。 有限截断是指检索词与被检索词只能在指定的位置可以不一致。常用“?”表示(?=0-1个字母)。例如,输入leukemi?可同时检出leukemia、leukemic、leukemid等词的记录;输入Wom?n,可同时检出Woman和women这两个词的记录。 按照截词的位置: 无限截断可分为左截断(后方一致)、右截断(前方一致)、左右截断(中间一致)、中间截断(前后一致)等四种方式。不同的检索系统有不同的截词方式,但以右截断和中间截断比较常见。 右截断是指检索词与被检索词的词干相同而后缀不同。例如,输入 compute*,可同时检索出compute、computer、computerized、computerization等词的记录。 中间截断是指检索词与被检索词的

文档评论(0)

1亿VIP精品文档

相关文档