第1章节 数字文献检索基础.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第1章节 数字文献检索基础.ppt

《数字文献检索》 2. 截词检索技术 主要应用于西文数字文献的检索 定义:是指在检索式中用截词符号表示检索词的某一部分允许有一定的词形变化。 原因:在西方语言如英语的语境中,动词、名词常有会词形的变化(动词的词态、名词的单复数),出现词干相同、词义相近的检索词或有英、美不同拼写法的词。 作用:检索时不遗漏相关词,扩大检索范围,提高查全率。 截词符一般用“?”、“*”、“$ ”和“!”等,不同的系统,不同的数据库,其代表的含义可能有所不同。 截词方式根据截词的位置不同,分为前截断、后截断、前后截断和中截断。 截词位置 前截断(左截断、后方一致):允许检索词前有若干变化。如*physics就可检索到physics、astrophysics、biophysics、chemophysics、geophysics等词的结果。 后截断(右截断、前方一致):允许检索词尾有若干变化。如comput*将检索出computer 、computing、computerised、computerized、computerization等结果。 前后截断(中间一致):词干的前后各有一个截词符,允许检索词的前端和尾部各有若干变化形式。如*computer*可检索computer、computers、computerize、computerized、computerization、minicomputer、minicomputers、microcomputer、microcomputers等结果。 中间截断(前后一致):允许检索词中间有若干变化。例如wom*n可检索出woman、women。英美的不同拼法,defen*e可检索出defence、和defense的结果。 请 注 意 在不同的数据库和联机检索系统中,所使用的截词符号没有统一的标准,有的用“?”,有的用“*”,有的用“#”,用的用“$”等。 即便常用的“?”和“*”在不同的数据库中其用法也是不一定相同的。 在允许截词的检索工具中,一般是指后截断,部分支持中间截断,左截断比较少见。 大多数数据库在模糊匹配方式下,默认前方一致检索,词尾可省略截词符。如精确匹配,则不能省略截词符。 我们将要使用的一些数据库,一般用“?”代表一个字符,用“*”代表任意一个字符串。 3. 邻近检索技术 邻近检索又称位置检索,主要是通过位置符号来规定多个检索词在结果中的相对位置。 例如检索生物防治的文献,若用检索式:“biological and control”检索,则会将“抑制生物”(control biological)的文献也查出来,这显然不是所需文献。 主要位置算符:(W)、(nW)、(N),(nN) (1)(W) 算符 (W)算符:表示此算符两侧的检索词必须按此前后顺序相邻排列,词序不可变,且两词之间不许有其他的词或字母,但允许有一空格或标点符号。 如:biological (W) control 相当于检索:biological control CD (W) ROM 相当于检索 CD ROM或CD-ROM。 (2) (nW) 算符 (nW) 算符:(nW)是n words的缩写,表示此算符两侧的检索词之间允许插入最多n个词,且词序不可变。 如wear (1W) material*相当于检索wear materials、wear of materials等词。 注意与”wear material*”、“wear and material*”等检索式的区别 (3) (N)和(nN)算符 (N)是near的缩写,表示此算符两侧的检索词必须紧密相连,词序可变,词间不允许插入其他词或字母,但允许有一空格或标点符号。 (nN)表示两词间可插入最多n个词,词序可变。 如检索式:environment (2N) protect* 就可检索出包含“environment protection”、“environment of the protection ”、“environment of water protection”、“protection of forest environment”等内容的结果 如检索式:Information (1N)retrieval 可检索出:information retrieval retriveal of information 注 意 邻近检索对提高检索的查全率和查准率有重要作用。 不同的检索系统或数据库,截词符号虽然含义相同,但形式可能有所不同: ①有的可能有括号,有的可能没有。 ②小写n有时在大写的W、N前面,有时在大写的W、N后面。 常见的形式有:

文档评论(0)

yuzongxu123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档