第一章信息检索基础(研)..pptVIP

  1. 1、本文档共86页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章信息检索基础(研).

(2)后截词:也称右截词,前方一致,截词符位于词干的后边。如: computer? 可检索computer、computers、computerize等词 Physic? 可检出physic、physical、physican、physicalism (3)中间截词:截词作为通用字符位于检索词的中间,而词的前后一致,凡前后方一致的词都能检出,通常用在英美对某些词的不同拼写法。 如:wom?n可检出woman、women等。 fib?board 可检出 fiberboard、fibreboard两词。 为了提高检索的查准率,缩小检索的范围 ,将检索词限定在特定的字段中进行检索。? 如检索式: (1)AU=Gordon? AND PY=199? (2) chemical reaction/DE,TI (3)(minicomputer/DE, TI) OR (personal computer/ID, TI)AND (PY=2008) AND (LA=English ) 1.2.3 字段限定检索 常见的检索字段: 题名Title TI 文摘Abstract AB 作者Author AU 作者单位Corporate Source CS 刊名Journal Name JN 叙词Descriptor DE 语种Language LA 文献类型Document Type DT 表示两个检索词间的位置临近关系,又叫邻接检索,使用的检索算符称为位置算符。 布尔逻辑运算符表示两个概念之间的逻辑关系,位置算符表示的是两个概念在信息中的实际物理位置关系。 1.2.4 位置限定检索 例如: 检索“CD-ROM”,则可用CD(W)ROM; 检索式econom??(2N)recovery,可以检出:economic recovery recovery of the economy recovery from economic troubles 位置算符常用的有: (W)与(nW)算符 W是with的缩写。(W)或用( )表示其连接的两个检索词必须按序出现,中间不允许插词,只能有一空格或标点、符号。   如:high(W)class   命中的记录中出现的匹配词可能有:   high class 或high-class。   (nW)与(W)类似,只是它允许插词,插词量小于或等于n个。   如:silicon(1W)sensor   命中的记录中出现的匹配词除silicon sensor外,还可能有:   silicon integrated sensor, silicon image sensor, silicon-based sensor等。   如:silicon(2W)sensor   命中的记录中出现的匹配词除上例的外,还可能会有:silicon angular rate sensor, silicon-based chemical sensor等等。   N是near的缩写。(N)表示其连接的两个检索词的顺序可以互易,但两词间不允许插词。(nN)中的n表示允许插词量少于或等于n个。   如:internet(N)accessing   命中记录中出现的匹配词可能有:   internet accessing, accessing internet。   如:internet(1N)accessing   命中记录中除上例的外,还会可能有:   accessing internet, accessing the internet, internet /intranet accessing等。 (N)与(nN)算符 位置算符在数据库中的实际应用 1)EI NEAR Bridge NEAR Piling* 表示这两个词要彼此接近,前后顺序不限。 W/n Pig* W/2 pine*表示两个词的距离不能超过n个单词 Adj Channel adj tunnel表示含有这两个词,两个词相 邻,位置一定 2)SCI 用同句算符(SAME):如Channel same tunnel,表示channel 和tunnel 出现在同一句子中才符合检索条件。 位置算符举例:Elsevier tongue

文档评论(0)

kakaxi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档