信息检索技术简介.ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索技术简介

T=污水 AND 处理(10968条) T=废水 AND 污水 AND 处理(57条) 逻辑非 1、逻辑非是一种具有概念排除关系的组配。 2、算符: - 或 not 3、特点:提高查准率,影响查全率。 4、举例: 通信技术 not 微波,表示检索出的记录中排除含有“微波通信 ”的记录。 举例: “通信技术” NOT “微波”,表示检索出的记录中排除含有“微波通信 ”的记录。 通信技术 not 微波 微波 通信技术 2. 限制检索 (1)字段限制:为了确定检索词在数据库记录中出现的位置,可采用字段(亦叫检索项、检索入口)来限制查找的范围。其作用是提高检全率或检准率。常用的字段代码有题名(T)、关键词(K)、摘要(AB)、作者(AU)、地址(AD)等。  (2)时间限制:限制课题的检索年代范围。 篇名 作者 单位 摘要 关键词 英文摘要 正文 参考文献 3. 词位检索 词位检索具有限定检索词的词与词之间位置关系的功能,可弥补布尔逻辑算符只是定性规定检索词的范围,以提高检准率。常用的词位检索有:邻位检索和字段检索。 邻位检索 一、(W)与(nW) 特点:词序不能颠倒。  gas (w) chromatograph 结果是   gas chromatograph  laser(1w)printer   结果是 (1)laser printer (2)laser colour printer (3)laser and printer 二、(N)与(nN) 特点:词序可以颠倒。 air (N) pollution 结果是 (1)air pollution (2)pollution air (W)最准 (nN)最全 字段检索 同句检索:A S B , 表示A、B两词必须同时出现在非标题字段中的一个句子(或两个标点符号之间)中,不限制词距。见 CNKI 期刊库、SCIE 数据库、EI光盘。 同段检索: A F B , 表示A、B两词必须同时出现在同一个文摘字段中,不限制词序,也不限制词距。见 CNKI 期刊库、EI光盘。 查全率: A and B > A F B > A S B 4. 截词检索 截词检索是防止漏检,提高查全率的一种检索技术,用于外文数据库。算符为 * 或 ?。其功能相当于布尔逻辑或。 截词实际是截字母。在检索词的适当位置进行截断,防止漏检、节省输入的字符。网络数据库主要用的是无限后截词。 截词方式和类型 一、自动截词:由数据库自动取词或截词(见EI网络版、SFS数据库)setup、 install、installer、installation 二、人工截词:  1、按截词位置分  (1)前截词:*install ( install 、uninstall ) (SCIE不适用)  (2)中截词:sul*ate (sulfate、 sulphate )  (3)后截词:treat*(treat、treated、treating、treatment)  2、按截词数量分(用于光盘数据库,如EI光盘库)  (1)有限截词:book? ? (book、books)          acid?? (acid、acids、acidic) (2)无限截词:treat? (treat、treated、treating、treatment) 人工截词与自动截词的区别 后截词 后截词是一种满足前方一致的检索。用于名词的单、复数和动词词尾变化。 例如:book* 可检出book和 books两个词。 treat*可检出treat、treatment、treating、 treated四个词。其作用相当于布尔逻辑或。 EI:人工截词和自动截词的区别 截词方式 检索结果(篇) 有人工截词、无自动截词 3474 无人工截词、有自动截词 554 有人工截词、有自动截词 3619 无人工截词、无自动截词 41 信息检索技术介绍 主讲人:胡静 1. 布尔检索 2. 限制检索 3. 词位检索 4. 截词检索 1.布尔检索   逻辑与 逻辑或 逻辑非 逻辑与 (1)概念:逻辑与是一种具有概念交叉或概念限定关系的组配。 (2)算符: and 或 * (3)特点:增强了专指度,提高了查准率。 (4)举例:低碳 and 经济,表示两个概念应同时包含在一条记录中。 “低碳” AND “经济”,表示两个概念应

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档