第3章计算机信息检索3.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一节 概述 第二节 计算机检索系统 第三节 机检技术 电子图书(electronic books) 指供在电脑上阅读的一种新型的数字化书籍, 是多媒体技术和超文本技术发展的产物。一般有专用电子图书阅读器。如:超星数字图书馆,中国数字图书馆有限公司的网上图书馆,书生之家“中华图书网”,方正Apabi电子图书 电子报纸(electronic newspaper) 将电子技术应用到涉及报刊出版、发行、利用的全过程 纽约时报(Http://) 华盛顿邮报( 泰晤士报(Http://www.thetimes.co.uk) 人民日报(Http://) 光明日报(Http://) 中国日报(Http://) 计算机检索式(逻辑表达式) 检索词+有关算符 布尔逻辑算符 截词检索算符 位置检索算符 加权与限制检索算符 【实例分析】 下面以“计算机”和“文献检索” 两个词来解释三种逻辑算符的含义。 “计算机”AND“文献检索”,表示查找文献内容中既含有“计算机”又含有“文献检索”词的文献。 “计算机”OR“文献检索”,表示查找文献内容中含有“计算机”或含有“文献检索”以及两词都包含的文献。? “计算机”NOT“文献检索”,表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。 优先级运算 ()NOTANDOR 词位置检索(positional operator) — 位置运算符 利用布尔逻辑算符对检索词进行逻辑组配时,未限定检索词之间的位置关系,会影响某些课题的查准率并容易造成误检。为了弥补其不足,一般检索系统都提供文中自由词检索功能,也称全文检索功能 (Full text searching)。 所谓全文检索是利用文献记录中任何有实义的关键词、词组或字符串作为检索词,词与词之间的位置关系可以用位置运算符来表达。位置运算符的使用,进一步强化了对概念的限制,比布尔逻辑运算符更能表达复杂的概念,并避免AND逻辑组配产生的词义含糊或误检。 为了提高检索的广度和准确度,常常需要对检索词之间的位置关系加以限定。 **全文检索的运算方式,不同的检索系统有不同的规定,主要差别有两点: 规定的位置算符不同; 位置算符的职能和使用范围不同。 下面介绍几种数据库经常使用的位置运算符: 1.W - With W 算符是With的缩写,表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。所连接的词之间除可以有一个空格、标点或连接号外不得夹有任何其他单词或字母。 例: electric (W) vehicles Wn( 或nW) 表示在此算符两侧的检索词必须按输入时的前后顺序排列,不能颠倒。但允许在连接的两个词之间最多插入n个单元词。 例: electric ( w1) vehicles electric vehicles 和 electric rail vehicles. 2. N – Near N算符是Near的缩写,表示此算符两侧的检索词必须紧密相连,所连接的词之间不允许插入任何其他单词或字母。但词序可以颠倒。 例: intelligent (NEAR) robot* ( Ei CPX Web) Nn (或nN)表示在两个检索词之间最多可插入n个单词,且两词的词序任意。 例: intelligent ( N1) robot* (OCLC FirstSearch ) 3. Adj - adjacency 邻接算符,表示在此算符两侧的检索词必须按所列词序排列,不能颠倒,两词之间不允许有其他的词或字母。相当于短语检索。 例: intelligent adj robot* (Elsevier Science SDOS) 4. F - Field 同字段邻接 例: environment (F) protection 5. P - Paragraph 同自然段邻接 例: environment (P) protection 6. S - Sentence 同句邻接词序可以颠倒,两词必须出现在同一句子(子字段)中 例: environment(S) protection 查找计算机情报检索自动化方面的文献资料,用加权法列提问式如下:   W=计算机(1)情报检索(4)自动化(2)   A代表计算机,B代表自动化,C代表情报检索 聚类检索 聚类检索是在对文献进行自动标引的基础上,构造文献的形式化表示即文献向量,然后通过一定的聚类方法,计算出文献与文献之

文档评论(0)

ranfand + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档