三章精准获取信息的方法编写检索式.pptVIP

三章精准获取信息的方法编写检索式.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
三章精准获取信息的方法编写检索式

三、 截词检索技术 含义:用截断的词(词的片段)的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。 检索者将检索词在合适的地方截断,然后截出的片断进行检索。 ? 原因: 由于西文的构词特性,在检索中经常会遇到名词的单复数形式不一致;同一个意思的词,英美拼法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等等。 为了保证查全,就得在检索式中加上这些具有各种变化形式的相关意义的检索词,这样就会出现检索式过于冗长,输入检索词的时间太久,同时也占太多机时。 截词方式 ?截词的方式 (1)按截断的字符数量来分:有限截断和无限截断 有限截断:有具体截去的字符数。 无限截断:不指明具体截去的字符数。 (2)按截断的位置区分:后截断、前截断以及中间截断。 (3)截断常使用截断符号,各检索系统所使用的截断符号有所不同,常用的符号有 “?”,“$”,“#”以及“ *” 。以下举例中用“?”来表示有限截断,用“*”表示无限截断。 注意:不同的数据库所用的截词符不一样,使用应先查 一下各数据库的帮助加以确认。 1 后方截词(前方一致或右截断) 含义:将截词符放在一串字符的后面,用以表示以相同字符串开头,而结尾不同的所有词。 (1)词尾的截断 相同字符串后可能变化一个字符时,则在其后使用一个“?”、空格、再加一个“?”,常用来表示检索词的单复数变化。 例如:用system??可以查出sytem 和systems 的文献。 相同字符串后可能变化两个以上字符时,则在其后连续使用若干个“?”代替可能变化的字符。 例如:??表示两个字符,???表示三个字符,以此类推。 (2)后截词主要使用在如下4个方面 词的单复数,如book?,potato??; 年代,如198?(80年代),19??(20世纪); 作者,如用Lancaster*可检出所有姓Lancaster的作者; 同根词,如用biolog*,可检出biological、biologist、biology等同根词。 注意问题 ?注意 (1)有限截断比较精确,只检索出用户需要的词汇; (2)使用时无限截断必须注意:词干不要太短,否则会检出许多无关的文献; (3)应尽量选用不会引起误检的截断词。 中间截词 2 中间截词(中间屏蔽) 将提问字符串中间的字符用符号代替,主要用于英式美式不同拼法的英文单词,或单复数不同的单词。 截词符具有“OR”运算符的功能,能够扩大检索范围,而且减少了输入检索词的时间,节约了机时。 例如:“ woman ” 和“ women ” , 可用“ wom?n” 代替; “ defence ” 和“ defense ” 可用“defen?e”代替。 ? 检索时为防止漏检可用中间屏蔽的检索方法: m?n wom?n organi?ation defen?e 当然使用中间屏蔽的方法也要注意是否可能误检其它词汇的文献。 前截词 3 前截断(后方一致或左截断) 前截断检索常用于复合词。 例如:?computer表示minicomputer,microcomputers等。 前截断与后截断也可以组合起来使用。 例如: *chemi* 可以检出下列词汇 chemical、chemistry、chemist、 eletrochemical、electrochemistry、 physicochemistry、thermochemistry等。 四、字段限定检索 四、字段限定检索 含义:限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。(规定的字段范围内出现的信息方为命中信息的一种检索方法。) 适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索结果的查准率。由于字段限制采用前缀和后缀的形式,又可称为前缀限制和后缀限制。 限制检索主要有两种方式 限制检索主要有两种方式: 字段检索——利用字段进行限制,如题名、摘要、全文等 通常的字段限制范围的大小顺序是: 题名关键词摘要全文 二次检索——在前一次检索的结果中进行另一概念的检索 主题字段和非主题字段 通常数据库中可供检索的字段分为主题字段和非主题字段。 主题字段:题名(Title)、叙词(Descriptor)、标识词(Identifier)、文摘(Abstract)等; 非主题字段:作者(

文档评论(0)

liudao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档