[2013信息检索课件第2章.pptVIP

  • 7
  • 0
  • 约1.27万字
  • 约 44页
  • 2017-01-05 发布于北京
  • 举报
[2013信息检索课件第2章

目录 2.1信息资源检索技术 2.2信息资源检索的方法、途径和步骤 2.3信息资源检索效果的评价 2.1信息资源检索技术 2.1.1 传统的信息资源检索技术 2.1.2 新型的网络资源检索技术 2.1.1 传统的信息资源检索技术 1 检索技术  检索技术是指应用于信息检索过程的原理、技术、方法、策略的总称,是检索系统为了提高检索效率,从概念相关性、位置相关性等方面对检索提问进行组配、加权、扩展、截词、邻近、限定的比较和运算处理技术。 2.1.1 传统的信息资源检索技术 2传统检索技术 (1)布尔检索 布尔检索(boolean retrieval)是用布尔逻辑算符将检索词、短语或代码进行逻辑组配的一种技术,也是目前最常用的一种检索技术。 2.1.1 传统的信息资源检索技术 逻辑“与” 2.1.1 传统的信息资源检索技术 逻辑“或” 2.1.1 传统的信息资源检索技术 逻辑“非” 2.1.1 传统的信息资源检索技术 布尔逻辑运算符优先级 布尔运算符优先级比较 有括号时:括号内的先执行; 无括号时:NOT AND OR 例:检索“唐宋诗歌”的有关信息。 关键词:唐、宋、诗歌; 检索表达式: (唐 OR 宋)AND 诗歌; 唐 AND 诗歌 OR 宋 AND 诗歌 2.1.1 传统的信息资源检索技术 (2)截词检索 截词检索(truncation retrieval)是指在检索词的适当位置截断,用截断的词的一个局部进行的检索。由于检索词与数据库所存储信息字符是部分一致性匹配,所以又称部分一致检索。 由于西文的构词特性:单复数形式不一致、英美拼写不一致 、词干+前缀、词干+后缀。 检索时,计算机会将所有含有相同部分标识的记录全部检索出来。在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。 2.1.1 传统的信息资源检索技术 2.1.1 传统的信息资源检索技术 (3)位置检索 位置检索,也称临近检索,主要是通过位置运算符来规定和限制检索词之间的相对位置或者检索词在记录中的特定位置来实施检索的技术。位置检索主要有以下几个级别。 2.1.1 传统的信息资源检索技术 (3)位置检索 (1)词位置检索 词位置检索主要是利用位置逻辑算符限定检索词之间的位置,来反映要检索的信息概念。常用的词位置算符有(W)与(nW)、(N)与(nN)以及(X)与(nX)3类。 ① (W)算符与(nW)算符 例如, “VISUAL(W)FOXPRO”可以检出“VISUALFOXPRO”或“VISUAL FOXPRO”; “control(1W)system”可以检出含有“control system”、“control of system”和“control in system”文献。 2.1.1 传统的信息资源检索技术 (3)位置检索 (1)词位置检索 ② (N)算符与(nN)算符 例如,“control(1N)system”不仅可以检出含有“control system”、“control of system”和“control in system”的文献,还可以检出含有“system of control”、“system without control”等的文献。 ③ (X)算符与(nX)算符 例如,“side(1X)side”可以检索到含有“side by side”的文献。 2.1.1 传统的信息资源检索技术 (3) 位置检索 (2)同句检索 同句检索要求参加检索运算的2个词必须在同一自然句或者全文数据库的一个段落中出现,检索词的先后顺序和插入词的个数不受限制。同句检索中用到的位置算符主要是(S),是“Sentence”或“subfield”的缩写。 例如,“electronic(S)optical”,可以检索到题名为“Cutting and Polishing Optical and Electronic Materials”的文献。 2.1.1 传统的信息资源检索技术 (3) 位置检索 (3)同字段检索 同字段检索是对同句检索条件的进一步放宽,表示在此运算符两侧的检索词必须同时出现在文献记录的同一字段内,其运算符有两种。 ① (F)算符 例如,“information(F)retrieval/DE,TI”表示“information”和“retrieval”两个词必须同时出现在叙词字段或篇名字段内。 ② (L)算符

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档