《第四章检索式编制.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《第四章检索式编制

第四章 检索式编制 【知识框架】 什么是检索式? 指搜索引擎理解和运算的查词串,由关键词、逻辑运算符、搜索指令(搜索语法)等构成。 主要逻辑算符 布尔逻辑算符:与或非 优先算符 邻接算符 字段算符 截词算符 加权算符 词组或短语 如何构建合理的检索式? 常用检索方法与策略【补充教材2.4-4章】 【主要内容】 1、检索式和运算符 检索式:用运算符将检索词连接起来构成的能让计算机识别的式子。 运算符:又称逻辑算符,是表达检索词之间逻辑关系和限制关系的运算符号,它是复合检索式中必不可缺的构件。 2、布尔逻辑算符 1)逻辑“与” 逻辑“与”可用“AND”或“*”表示,检索词用“AND”或“*”相连,含义是检出的记录中同时含有所有检索词。逻辑“与”运算符的基本作用是对检索词加以限定,逐步缩小检索范围,减少命中文献量,提高检索结果的查准率,适用于不同概念组面之间以及同一组面内不同含义的词之间的组配。 2)逻辑“或” 逻辑“或”可用“OR”或“+”表示,检索词用“OR”或“+”相连,含义是检出的记录中,至少含有检索词中的一个。 逻辑“或”算符的基本作用是扩大检索范围,增加命中文献量,防止漏检,提高检索结果的查全率。适用于同义词或同族概念的组配,如同义词、近义词等。 3)逻辑“非” 逻辑“非” 可用“NOT”或“-”表示,检索词用“NOT”或“-”相连,表示排除“NOT”或“-”算符后的词语,检出含有算符前检索词的所有记录。 逻辑“非”算符的基本作用是缩小检索范围,减少文献输出量的作用,但不一定能提高文献命中的准确率。同时应注意在有两个以上运算符的复杂逻辑式中,“NOT”出现次数不能太多,否则检出结果极少,影响检出效果。 使用布尔检索需要注意问题: (1)布尔检索执行顺序: 布尔检索运算执行顺序通常是NOT、AND、OR。有括号时,先执行括号内的逻辑运算。有多层括号时,先执行最内层括号中的运算。 (2)绝大部分网络信息检索工具都支持布尔检索功能,但不同的检索工具之间有差别。 第一,不同的检索工具表示布尔逻辑关系时使用的符号不同,有的用“&”、“︳”和“!”分别表示布尔关系的AND、OR和NOT,有的用+、- 分别表示布尔关系的AND、OR,有的则用表格、文字、空格或菜单来体现不同的布尔关系。使用的时候要注意使用帮助系统了解代表某种逻辑关系的符号。 第二,有的检索工具检索词之间默认关系为AND,有的检索工具检索词之间默认关系为OR。 第三,支持布尔逻辑的程度不同,有的完全支持三种运算,如 Infoseek;有的仅在高级检索中完全支持,而简单检索中则部分支持,如 Lycos;而Yahoo则不支持布尔关系NOT。 3、优先处理算符 优先处理算符用“()”表示,含义是优先对()内的算符进行逻辑运算,在实际检索中,有时要调整逻辑运算符的运算顺序,使某些算符优先进行逻辑匹配,或者是简化逻辑算式,在这些情况下,将使用算符“()”。 4、邻接算符 邻接算符又称词位置逻辑检索符、全文查找逻辑算符,相邻度检索算符,原文检索符。 在检索中,会遇到如下一些情况: 某个概念需用词组形式表达; 两个或两个以上的词要紧密相邻; 在这些情况下,需要用邻接算符限定检索词之间的间隔距离或是词语出现的顺序。 1)(W) W的含义是“With”,其用法为A(W)B,表示(W)前后所连接的A、B两个检索词在检出结果中必须紧密相邻,且词序不能颠倒。 2)(nW) W的含义是“Word”,n代表单词个数,用法为A(nW)B,表示A、B两词之间允许插入最多为n个的其他词语,插入词可以是实词或系统禁用词,同时A、B两词的前后顺序保持不变。 (N) N的含义是“Near”,用法为A(N)B,表示在检出结果中A、B两词必须紧密相邻,并允许词序发生颠倒。 4)(nN) N的含义仍是“Near”,用法为A(nN)B,表示A、B两词之间允许插入最多为n个的其他词语,插入词可以是实词或系统禁用词,两词的前后顺序可以颠倒。 5、(X),这是无间隔有序检索符。检索式为A(X )B,表示这个算符两边的检索词必须完全一致,并以指定的顺序相邻,中间不允许插入任何单词或字母。 6、(nX),这是有间隔有序检索符。检索式为A(nX)B,表示两个检索词之间最多可以插入n个单元词,两边的检索词必须完全一致。 5、字段限制 在联机数据库或光盘数据库检索系统中,都提供字段限制的检索功能,其作用是检索范围限定在某一字段内如题目、作者等。以DIALOG检索系统,基本字段限制为四个:题目(TI)、叙词(DE)、标引词(ID)、文摘(AB)。 例8:检索式COMPUTER/TI 表示在题目中查找含有COMPUTER一词的文献。 除了基本字段以外,检索系统中的其它字段都可称为辅助字段,其表

您可能关注的文档

文档评论(0)

haha85864 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档