第二讲 网信息检索基本方法.ppt

  1. 1、本文档共73页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二讲 网信息检索基本方法

第二讲 网络信息检索基本方法 【目的与要求】 掌握布尔逻辑检索等网络信息检索的基本技术。 熟悉网络信息检索的途径和步骤。 【重点】 布尔逻辑语言、邻近检索、截词检索 【难点】 邻近检索 影响信息检索质量的因素 信息资源本身的质量对信息检索的影响(鱼龙混杂,参差不齐) 检索软件对信息检索的影响(不同的搜索引擎,数据库系统) 用户水平对信息检索的影响 信息检索过程的实质: 一、网络信息检索的基本技术 1.布尔逻辑检索(boolean logic) 逻辑检索是一种比较成熟、较为流行的检索技术,现代的情报检索系统大多都采用这种技术。 逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符(boolean logic operator), 它的作用主要是利用布尔逻辑算符将一些具有简单的、表达某一主题概念的检索单元(或检索 标识)组配成一个具有复杂概念的检索式,以满足课题检索的要求。 主要运算符有 “和(and,*)”、“或(or,+)”、“非(not,-)”。 运算优先级顺序为NOT、AND、OR,可以用括号“( )”改变它们的运算顺序。 如A and (B or C),检索顺序为先B或C,然后再与A 实例: 【实例】在搜索引擎中输入“电视台-中央电视台”,查询结果不包含“中央电视台”。 逻辑算符举例 ①查找关于“动物保护”的文献: “动物 AND 保护” ②查找有关冬虫夏草的文献: “冬虫夏草 or 冬虫草 or 虫草” ③查找关于能源方面的文章,但关于“核能”的不要: “energy not nuclear”(energy - nuclear) ④检索西红柿种植技术的相关文章: (西红柿+番茄)*(种植+栽培+培育) Exercise1: 查找电子图书的标准 (Digital book OR electronic book OR e-book OR online book) AND standard Goolge的默认运算符就是逻辑“与”,用空格、“AND”和“+”都表示,而逻辑“非”只能用“-”而不能用“NOT”表示,逻辑“或”用“OR”表示。 百度的默认运算符是逻辑“与”,空格均表示逻辑“与”。 在ISI Web of Knowledge平台上,逻辑算符“AND”、“NOT”、“OR”不区分大小写,但不支持以“*”、“-”、“+”代替。 在Science Direct中,逻辑“非”是用“AND NOT”表示,而不是我们常用的“NOT”。 2.词组检索(phrase search) 通常在所检索词上加“”对所检索词视为词组处理,表示检索与“”内形式完全相同的短语,以提高检索的精度和准确度,因而也有人称之为“精确检索”(exact search)。 例如:“动物保护”,表示动物保护是个词组,检索结果动物和保护不能分开。若不加“”,检索结果可以是动物保护、动物多样性保护、动物栖息地保护、动物资源保护等形式。 Science Direct用双引号“”表示宽松短语检索,标点符号、连字符、停用字等会被自动忽略,如检索式为“heart attack”会检出包含“heart attack”和“heart-attack”的检索结果。 在该数据库中,精确检索是用“{}”表示。 邻近检索有时又被称为位置算符检索。 因此,我们要利用位置逻辑算符来限定检索词与检索词之间的位置关系,从而使检索出的文献更确切地符合用户要求,提高查准率。 在不同的检索系统中,所采用的位置算符是不同的,功能也有差异。下面以全球最大的联机检索系统Dialog为例来说明位置算符的用法,OCLC也是如此。 3. 邻近检索(proximity search) ①(W)—WITH算符 表示两个检索词前后次序固定,二者之间只能间隔连字符、空格或者是逗号。 【实例】在OCLC中输入communication w satellite; ②wN (with N)算符 表示两个检索词之间插有n个词,但顺序不能颠倒。 表达式: A WN B AB两词靠近,次序为A先B后,中间最多可加n个词。 【实例】在EBSCO中输入communication w3 satellite; ③N(Near)算符 N( Near)表示两个检索词可以互换顺,二者之间只能间隔连字符、空格或者是逗号。 表达式:A N B :AB两词靠近,次序可变。 【实例】在OCLC中输入communication n satellite; ④nN ( Near N)算符 表示两个检索词之间可以插入 n 个词并且词序可以颠倒 表达式:A(nN)B:AB两词靠近,次序可变,中间最多可加n个词。 【实

文档评论(0)

woai118doc + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档