第2章计算机信息检索技术1.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 计算机信息检索技术 郑州大学信息检索教研室 2017-5-31 1 2 2017-5-31 第1节 计算机检索概述 第2节 计算机信息检索系统组成 第3节 计算机信息检索的分类 第4节 计算机信息检索技术 第5节 信息检索的方法* 第6节 信息检索的策略* 1 计算机检索概述 1.1 国内外计算机信息检索发展阶段 1975年,从国外引进数据库开展机检服务; 1980年,建立国际联机终端开展检索服务; 20世纪80年代中后期,自建数据库; 90年代初,发展光盘检索; 90年代中期,Internet网络化检索阶段。 3 2017-5-31 国外计算机信息检索发展阶段(P5) 脱机检索阶段(20世纪50-60年代) 联机检索阶段(20世纪60-80年代) 光盘检索阶段(20世纪80年代中-90年代) 网络信息检索阶段(1995-) 4 2017-5-31 1.2 计算机信息检索的原理 计算机信息检索的实质就是由计算机将输入的检索策略与系统中存储的文献特征标识及其逻辑组配关系进行类比、匹配的过程,主要包括2个部分: 信息存储是将文献、数值、事实等信息按一定的格式输入到计算机中,构成可供检索的数据库。主要包括信息的采集、著录、标引、整序等过程。 信息检索是将检索提问式按一定的要求输入计算机中,经计算机系统与已存贮在计算机中的数据库进行匹配运算,然后将符合检索提问的数据按要求的格式输出。 5 2017-5-31 计算机信息检索的原理(P8-11) 6 2017-5-31 信息存储 原始信息 信息主题 数据库记录及 信息特征标识 信息检索 信息需求 检索主题 检索提问式及 提问标识 计算机 检索结果 主题 分析 著录 标引 类比 输出 主题 分析 选定 编制 检索语言(主题词表) 信息存储过程 信息存储就是按照一定标准,将收集到的原始文献进行主题概念分析,用系统规定的语言(主题词、分类号)进行标引,形成信息的特征标识,进行整理与排序,构成可供检索的数据库,主要包括:信息的采集、著录、标引和整序等过程。 7 2017-5-31 信息检索过程 用户对检索课题加以分析,明确检索范围,弄清主题概念,然后用系统检索语言来表示主题概念,形成检索标识及检索策略,输入到计算机进行检索。计算机按照用户的要求将检索策略转换成一系列提问,在专用程序的控制下进行逻辑运算,选出符合要求的信息输出。 计算机检索的过程实际上是一个比较、匹配的过程,检索提问只要与数据库中的信息的特征标识及其逻辑组配关系相一致,则属“命中”,即找到了符合要求的信息。 8 2017-5-31 1.3 计算机信息检索特点 检索速度快,效益高; 检索功能强,数量大; 检索途径多,手段灵活; 检索范围广; 服务方式多。 2 计算机信息检索系统组成 2.1 系统设备 硬件:运算器、控制器、存储器、输入输出装置等 软件:系统操作程序、数据库管理程序、联机控制程序、应用程序等。 通讯线路:电话通讯网、数据通讯网、卫星通讯网等。 检索终端:信息用户与检索系统主机进行人机对话,实现联机检索的设备。包括上网设备、调制解调器等。 数据库:是计算机检索的对象。是由一个或数个文档构成,并能够满足某一特定目的或某一特定数据处理系统需要的一种数据集合。 2.2 数据库的构成 构成数据库的三大要素: 文档——记录——字段 11 2017-5-31 一定专业范围内的信息记录及其索引的集合体,是计算机信息检索系统的重要组成部分,是信息资源,是检索对象。 一定专业范围内的信息记录及其索引的集合体,是计算机信息检索系统的重要组成部分,是信息资源,是检索对象。 文档(File) 数据库中一部分记录的集合,文档由若干记录构成。 数据库是由一个顺排文档和若干个倒排文档所构成 顺排文档是数据库的主体,又称主文档,按每条记 录的顺序号大小排列,检索结果都来自于顺排文档。 倒排文档是从顺排档中抽取有检索意义的检索标识,如主题词、著者姓名、化学物质名、刊名等,并按索引词的字顺排列,同时在检索标识后注明入藏顺序号,这就是常见的数据库中的主题词索引、著者索引、刊名索引。 12 2017-5-31 13 2017-5-31 由若干字段组成的文献单元,是数据库中的基本文献单元,每条记录描述了原始信息的外部和内部特征。数据库中的一条记录通常代表一篇文献。 例如:在书目型数据库中,一条记录相当于一条题录或文摘;在全文型数据库中,一条记录相当于一篇完整的文献;在其它类型数据库中,一条记录则代表一个信息单元。记录越多,数据库的容量就越大。 14 2017-5-31

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档