- 1、本文档共43页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
模块4
信息检索技术
模块知识导读文献信息检索经历了手工检索、半机械化检索和计算机网络检索等几个阶段。信息化社会,通过网络来获取信息已经是人们查找信息最主要的途径。这一模块我们来了解和学习网络检索的相关技术。本模块主要学习内容:从最基础和最常用的布尔逻辑检索出发,依次介绍截词检索、邻近检索、限制检索、全文检索和构造检索式。采用理论联系实际的方法,每一种检索技术都配有实际案例。最后小结常用检索方法与策略。通过本模块的学习,达到以下目标:熟练掌握布尔逻辑检索技术明确截词检索的使用范围和理解截词符意义了解全文检索掌握构造检索式
4.1布尔逻辑检索
4.1布尔逻辑检索布尔逻辑得名于GeorgeBoole,他是考克大学(现爱尔兰国立考克大学)的英国数学家,他在19世纪中叶首次定义了逻辑的代数系统。现在,布尔逻辑在电子学、计算机硬件和软件中有很多应用。在1937年,ClaudeShannon展示了布尔逻辑如何在电子学中使用。那么,什么是布尔逻辑呢?布尔逻辑检索就是指运用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种技术。常用的布尔逻辑算符有三种,分别是逻辑或“or”、逻辑与“and”、逻辑非“not”。
4.1.1布尔逻辑的要素利用布尔逻辑进行检索词或代码的逻辑组配来编制检索提问式,是计算机文献检索中最常使用的一种方法,也是复合性检索的要求。严格意义上的布尔逻辑检索是指利用布尔运算符连接各个检索词,然后由计算机进行相应逻辑运算,以找出所需信息的方法。它在计算机信息检索中,使用面最广、使用频率最在具体检索时,是通过逻辑“与”(and),逻辑“或”(or)和逻辑“非”(not)这三个布尔运算符来实现其功能的。多数计算机检索系统中,“and”“or”“not”算符可分别用“*”“+”“-”代替。如图4-1所示。
4.1.1布尔逻辑的要素用符号“and”或“*”表示,其逻辑表达式为:AandB或A*B。其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。如图4-2所示的阴影部分。用途及检索功能:用于缩小检索范围,提高查准率。1.逻辑与
4.1.1布尔逻辑的要素例如,检索“植物保护但不包括害虫”方面的文献,采用检索式:植物保护-害虫。如在维普数据库中输入检索词(图4-7),结果如图4-8所示。
4.1.1布尔逻辑的要素用符号“or”或“+”表示,其逻辑表达式为:AorB或A+B。其意义为检索记录中凡含有检索词A或检索词B,或同时含有检索词A和B的,均为命中文献。如图4-5所示区域。用途及检索功能:用于扩大检索范围,提高查全率。2.逻辑或
4.1.1布尔逻辑的要素用符号“not”或“-”表示,其逻辑表达式为:AnotB或A-B。其意义为检索记录中含有检索词A,但不能含有检索词B的文献,才算命中文献。如图4-6所示区域。用途及检索功能:用于缩小检索范围,提高查准率。3.逻辑非
4.1.1布尔逻辑的要素例如,查找“鲜切花病虫害”方面的有关资料,用检索式表示为:鲜切花*病虫害在维普数据库中,如果你只用检索词“鲜切花”检索(图4-3),结果如图4-4所示。
4.1.1布尔逻辑的要素如果采用检索式:“植物保护not害虫”这样的“逻辑非”进行逻辑组配,如图4-9,图4-10。
4.1.2布尔逻辑注意技巧0102把出现频率低的检索词放在逻辑“与”(and)的左边,可缩短计算机处理时间。把出现频率高的检索词放在逻辑“或”(or)的左边,有利于提高检索速度。0304同时使用逻辑“与”(and)和逻辑“或”(or)检索时,应把“或”运算放在“与”运算的左边。布尔运算符优先级比较:有括号时括号内的先执行;无括号时notandor。
4.2截词检索
4.2.1截词检索的提出截词检索是预防漏检、提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能。截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。截词检索一般是指右截词,部分支持中间截词。截词检索能够帮助提高检索的查全率。特殊符号检索如使用双引号进行精确查找,使用加减号限定查找。
4.2.1截词检索的提出如果按所截断的字符数目来分,有无限截词和有限截词两种。按截断的位置来分,截词可有后截断、前截断、中截断三种类型。不同的系统所用的截词符也不同,常用的有?、$、*等。分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。下面以无限截词举例说明:(1)后截断,前方一致。如:comput?表示computer,
文档评论(0)