第2章 计算机信刘息检索技术.ppt

  1. 1、本文档共96页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章 计算机信息检索技术;第1节 计算机检索概述 第2节 计算机信息检索系统组成 第3节 计算机信息检索的分类 第4节 计算机信息检索技术 第5节 信息检索的方法* 第6节 信息检索的策略*;1.1 国内外计算机信息检索发展阶段;国外计算机信息检索发展阶段(P5);1.2 计算机信息检索的定义;1.3 计算机信息检索特点;1.4 计算机信息检索的原理(P8-11);信息存储过程;信息的著录;信息的标引;信息检索过程;2 计算机信息检索系统组成;2.2 数据库的构成;文档(File);;由若干字段组成的文献单元,是数据库中的基本文献单元,每条记录描述了原始信息的外部和内部特征。数据库中的一条记录通常代表一篇文献。 例如:在书目型数据库中,一条记录相当于一条题录或文摘;在全文型数据库中,一条记录相当于一篇完整的文献;在其它类型数据库中,一条记录则代表一个信息单元。记录越多,数据库的容量就越大。 ;2020/11/27;字段(Field);2.3 数据库的类型*(P3-4);参考(文献书目型)数据库; 事实数据库;数值数据库;全文数据库;3 计算机信息检索的分类;3.1 按信息资源的存储形式分* (P7-8);(2)二次文献检索*;(3)多媒体检索;(4)超文本检索;3.2 按信息访问模式分(P5);(1) 脱机信息检索;(2) 联机信息检索;(3)国际联机检索*;国际联机检索的缺点;世界上最著名的国际联机检索系统;;DIALOG WEB系统检索平台;世界上最著名的国际联机检索系统;世界上最著名的国际联机检索系统;(4) 光盘数据库检索;光盘检索的定义和特点;光盘检索的系统组成;(5)镜像数据库检索*;通过计算机网络系统可以连接世界上各种公用数据库和商用数据库,可以帮助用户获取希望得到的信息。 网络化信息检索系统的特点是:一般基于客户机/服务器, 客户与服务器是同等关系,只要遵循共同协议(TCP/IP协议是目前最成功的网络体系结构和协议规范),一个服务器可被多个客户访问,一个客户可访问多个服务器。网络的用户数量不受到限制,它是一个开放系统而不是封闭式系统 网络化信息检索将在全球范围内实现信息资源共享,全球网络是信息存贮与检索进一步发展的方向。 常见检索有:GOOGLE、百度、多媒体、咨询行及所有的外文数据库;4 计算机信息检索技术*(P11);4.1 布尔逻辑检索*(P11);逻辑与;逻辑或(OR);逻辑非(NOT);布尔逻辑算符的运算次序;4.2 截词检索;截词的作用:采用截词检索表达式,既能防止漏检,又能节省时间,能有效提高检索效率。 截词符的使用:利用截词检索时,注意截词的部位,一定不能截的太深,否则误检率会很大。;截词方法 无限截断:即该词根后可跟任何字符,且字符数不限; 如:child*,可查到child, children,childish, childhood等所有以child开头的单词。 如:coumput?,可检出Compute,Computer,Computing, computable 有限截断:即该词根后至多可跟n个字符,如需要n个有限词符截词,请输入n个?即可; 如,输入stud???表示截3个字母,可检出带有study、 studies、studing等的文献。 中间截断:又称前后方一致,允许检索词中间有若干变化。 如, wom?n 可以检索出: woman, women ;4.3 位置运算检索;(S)算符—Subfield的缩写。表示其连接的两个检索词必须出现在同一子字段中。子字段是指字段中的一部分,如一句句子,一个词组、短语。字段不限,词序不限。 ?如:silicon(S)sensor 命中记录出现的匹配情况如: A vacuum magnetic sensor(VMS) using a silicon field emitter tip was fabricated and demonstrated. (F)算符—Field 的缩写。表示其连接的两个检索词必须出现在同一字段中,字段不限,词序不限。; 4.4 字段限制;5 信息检索的方法;5.1.直查法;5.2.追溯法;5.3.工具法;顺查法;倒查法;抽查法;4.综合法;(1)交替检索。在检索某个课题的文献时,同时交互使用不同的检索方法。 例如,某人在接受了某个课题后,首先利用直查法在核心期刊中查到两篇文章,再根据其后所附参考文献利用追溯法检索出一批文章,而后发现一位著者的文章被多次引用,他又利用工具法从某专业性检索工具的累积著者索引中,检索出这位著者关于该课题的数篇有价值文章。;(2)分段检索。即在检索某个课题的文献时,不同阶段使用不同的检索方法。 例如,

文档评论(0)

173****1616 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档