网站大量收购独家精品文档,联系QQ:2885784924

信息技术 第一册(五年制高职)教案 2.6.4 常用的信息检索技术-文档.docx

信息技术 第一册(五年制高职)教案 2.6.4 常用的信息检索技术-文档.docx

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE2

2.6.4常用的信息检索技术

要想快速、准确地从信息集合中找到所需信息,需要掌握一些基本的检索技巧和方法,不同的检索系统会略有差别,应以检索系统说明为准。

布尔逻辑检索

布尔逻辑检索是信息检索使用频率最高的基本技术,是指用布尔逻辑运算符连接各个检索词,然后由计算机进行相应的逻辑运算,以找出所需信息的方法。常用的逻辑运算符有三种:逻辑与、逻辑或、逻辑非。

逻辑与

逻辑与是用来表示其所连接的两个检索项的交叉部分,即交集部分。用“AND”(AND不区分大小写)或“*”表示。如果用AND连接检索词A和检索词B,则检索表达式为:AANDB(或者A*B),表示让系统检索同时包含检索词A和检索词B的信息集合C。例如,查找“培养大学生的价值观”的检索式为:大学生and价值观。该方式可缩小检索范围,提高检准率。

逻辑或

逻辑或是用于连接并列关系的检索词。用“OR”(OR不区分大小写)或“+”表示。如果用OR连接检索词A和检索词B,则检索表达式为:AORB(或者A+B),表示让系统查找含有检索词A、B之一,或同时包括检索词A和检索词B的信息。例如,素质OR素养,表示检索含有“素养”和“素质”其中之一或者同时含有这两个检索词的信息。该方式放大检索范围,提高检全率。

逻辑非

逻辑非是用于连接排除关系的检索词,即排除不需要的和影响检索结果的概念。用“NOT”(NOT不区分大小写)或“-”表示。用NOT连接检索词A和检索词B,检索表达式为:ANOTB(或者A-B),表示检索含有检索词A而不含检索词B的信息,即将包含检索词B的信息集合排除掉。例如,动物-宠物,表示检索包含“动物”但不包含“宠物”的文献。该方式在检出的文献集合中排除无用的文献,缩小检索范围。

为了检索更精确,在一个检索式中,可以同时使用多个逻辑运算符,构成一个复合逻辑检索式。比如,(AorB)andC,先运算(AorB),再运算andC。布尔逻辑运算符的优先级一般为:notandor,()中的部分优先运算。

截词检索

截词检索是预防漏检、提高检全率的一种常用检索方法,是指在检索词中保留相同的部分,用截词符代替可变化的部分。截词检索有时也称为通配符检索。截词符主要有两种:“*”和“?”。*代替任意一个或多个字符,?代表一个字符。截词检索截断的形式主要有以下几种:

(1)前截断

前截断是将截词符号放在一个字符串左方,是后方一致检索。例如,检索词“*啤酒”可检索出包含青岛啤酒、崂山啤酒、百威啤酒等的信息。

后截断

前截断是将截词符号放在一个字符串右方,是前方一致检索。例如,检索词“信息*”可检索出包含信息技术、信息素养等的信息。

中间截断

中间截断是将截词符号放在两个字符串中间,在外文检索中使用较多。例如,检索词“wom?n”可检索出包含woman和women的信息;检索词“中国?山”可检索出包含中国泰山、中国黄山的信息。

位置检索

位置检索是用一些特定的运算符(位置算符)来表达检索词与检索词之间的位置关系。检索系统不同,规定的位置算符也不尽相同。

(1)“(W)”算符

“W”即为“With”,表示该运算符两侧的检索词相邻,两检索词之间,除空格和标点符号外,不得插入其他词或字母,词序不可以颠倒。“(W)”算符还可以使用其简略形式“()”。例如,检索式为“communication(W)satellite”时,系统只检索含有“communicationsatellite”词组的记录。

(2)“(nW)”算符

“(nW)”即为“nWords”,表示该算符两侧的检索词之间最多间隔n个其他词,且检索词的词序不可颠倒。例如,laser(1W)printer可检索出包含“laserprinter”、“lasercolorprinter”和“laserandprinter”的记录。

(3)“(N)”算符

“(N)”即“Near”,表示该算符两侧的检索词必须紧密相连,除空格和标点符号外,不得插入其他词或字母,两词的词序可以颠倒。例如,“computer(n)network”可以检索出含有“computernetwork、networkcomputer”的记录。

(4)“(nN)”算符

“(nN)”即“nNear”,表示该算符两侧的检索词之间允许插入最多n个其他词,且两词的词序可以颠倒。

限制检索

限制检索是通过限制检索范围,达到优化检索结果的方法。限制检索的方式有多种,有进行字段检索、使用限制符、采用限制检索命令等。

您可能关注的文档

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档