信息检索基本方法教案.pdfVIP

  • 1
  • 0
  • 约5.8千字
  • 约 6页
  • 2026-03-04 发布于山东
  • 举报

第五章信息检索的基本方法

5.1布尔逻辑检索Booleanlogic

由GEORGEBOOLE1815-1864提出,目前大多数搜索引擎都采用

与AND,*,

或OR,+,︱

非NOT,—,!

逻辑“与”:用关系词AND表示(可写作“*”或“”)。逻辑“与”表示AND

所连接的两个检索词必须同时在结果中出现才满足检索条件。

逻辑“或”:用关系词OR表示(可写作“+”或“︱”),逻辑“或”表示OR所

连接的两个检索词只要有一个能出现在结果中就算满足了检索条件。

逻辑“非”:用关系词NOT表示(可写作“andnot”“—”或“!”),逻辑

“非”表示NOT后面的那个检索词一定不能在检索结果中出现。

例如:校庆AND武汉大学

高等教育*中国

湖南OR湖北

移动学习+泛在学习

大学NOT武汉大学

玉米–甜玉米

例如,用GFsoso检索,电子AND读书笔记

电子读书笔记OR读书笔记软件

5.2位置限制检索

临近检索(ProximitySearch)

以Dialog为例,收900多个数据库

(1)PRE/0,P/0表示前后词序不能颠倒,中间不能插入其他词,但可以插

入符号。

With,(W)

例如:WuhanP/0University

(2)PRE/#,P/#表示前后词序不能颠倒,中间可插入一定数量的单词,即

插入#个单词。

例如:WuhanP/1University

检索结果:WuhanMedicalUniversity;

WuhanAgricultureUniversity;

WuhanTechnologyUniversity;

(3)NEAR/0,N/0表示前后词序可以颠倒,但中间不能插入单词。

例如:WuhanN/0University

检索结果:WuhanUniversity;Wuhan–University;Wuhan,University

University,Wuhan;University-Wuhan;UniversityWuhan

(4)NEAR/#,N/#表示前后词序可以颠倒,中间可以插入#个单词。

例如:WuhanN/1University

检索结果:WuhanMedicalUniversity;

WuhanAgricultureUniversity;

WuhanTechnologyUniversity;

UniversityofWuhan;

UniversityinWuhan;

UniversityatWuhan

(5)(s)是sentence的缩写,A(s)B表示A和B必须同时出现在记录的

同一个句子或短语中,但次序可以随意改变,A与B之间可以有若干个其他的

词。

如:resin(s)ester(酯化树脂)

【练习】1、查找computer和game的间隔不大于100个单词的网页

2、检索“杂交玉米”的外文文献,要求两词间隔1个词,前后次序固定。

hybrid、corn

答案:1、computernear/100game

2、hybridp/1corn

hybridw/1corn

5.3短语检索(精确检索)(PhraseSearchExactSearch)

一般用“”表示。常见类型:

(1)机构名称检索:“WuhanUniversity”

文档评论(0)

1亿VIP精品文档

相关文档