- 1、本文档共30页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[管理学]第三章计算机信息检索
第三章 计算机信息检索 3.1计算机信息检索的发展 3.2计算机信息检索原理 3.3数据库与信息存储 3.4计算机信息检索系统 3.1计算机信息检索的发展 计算机检索主要经历了以下四个阶段 (1)脱机检索阶段(1954-1964年)。 脱机检索(Offline Retrieval),即批处理检索,1946年世界上第一台电子计算机问世后,20世纪50年代初就有人开始研究其在信息检索领域的应用。1954年,美国海军武器实验站图书馆在一台电子管计算机上建立了世界上第一个计算机检索系统。 (2)联机检索阶段(20世纪60年代-80年代) 进入20世纪60年代,计算机检索进入了实用和全面发展阶段。20世纪60年代末,数据通讯网络出现,大容量计算机分时系统和强功能检索软件研制成功,使脱机检索发展到联机检索并迅速得到了推广。20世纪70-80年代,联机检索得到迅速发展,一些联机检索系统开始向公众提供商业性服务,如DIALOG、ESA、ORBIT、BRS等许多世界著名的联机检索系统相继投入商业性运营。 (3)光盘检索阶段 1983年,出现了一种新的存储器,CD-ROM光盘。光盘检索具有储量极大而体积微小,要求设备简单,可随地安装,使用方便、易于操作,检索费用低(不需要昂贵的联机检索通讯费用),具有可随时修改检索策略而具有很高的查全率和查准率等优点,因而至今仍被世界各地广泛应用。 (4)网络化检索阶段 进入20世纪90年代,随着卫星通讯、公共数据通讯、光缆通讯技术以及信息高速公路事业在全世界的迅猛发展,计算机情报检索走向了全球大联网。网上资源具有信息的时效性、内容的广泛性、访问的快速性、搜索的网络性和资源的动态性五大特点,那么要及时、准确、有效地获取与自身需求相关的实用信息,对所有网络用户都非常具有挑战性。 3.2计算机信息检索原理 计算机信息检索是指人们在计算机检索网络或终端上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需要的信息,然后再由终端设备显示和打印的过程。为实现这种信息检索,必须事先将大量的原始信息加工处理、存贮在各种信息载体上待用,所以计算机信息检索广义上讲包括信息的存贮和检索两个方面。 信息检索 信息检索则是查询的过程。用户对检索课题加以分析,明确检索范围,弄清主题概念,然后用系统语言来表示主题概念,形成检索标识及检索策略,输入到计算机进行查找。这一查找的过程实际上是计算机自动比较匹配的过程,当检索标识、检索策略与数据库中的信息的特征标志及其逻辑组配关系相一致时,则属“检索命中”,即找到了符合要求的信息。检索结果可以联机或脱机打印输出。 信息存贮 信息存贮的过程就是将所选中的一次文献进行主题分析、标引和著录,按一定格式输入计算机,构成可供机读数据库记录及文献特征标识,这相当于编制手工检索用的文摘索引等检索工具。 3.3 数 据 库(Database) 数据库是计算机技术和文献信息检索技术相结合的产物,同时它又反作用于信息检索。它是文献信息检索系统必不可少的组成部分,是计算机信息检索系统的信息源和核心,也是现代信息资源管理的重要工具。所谓数据库,是计算机信息检索的重要组成部分。它是以二进制代码形式在计算机存贮设备上(如磁带、磁盘和光盘等)合理存放的相关数据的信息集合,通常由存贮信息记录及其索引的若干文档组成。 根据数据库所含信息内容来分,可将数据库分为以下四种类型的数据库: 文献型数据库 数值型数据库 词典型数据库 全文型数据库 文献型数据库 文献型数据库又叫书目型数据库,记录文档中主要存入的是原始文献的书目。包括原始文献的篇名、作者、文献出处、文摘、关键词,以及主要用于查询各种文献资料的书目性线索、文摘等。 该数据库主要以文献或书目形式记录在存储介质上,其记录实体有期刊论文、图书、博士论文、技术报告及其他出版物。包括机读版的文摘、索引、目录等,它的作用是指引用户查找一次文献,文献出处是不可缺少的内容。用户可从大量文献记录中筛选出有参考价值的文献源,以获取一次文献。目前这类数据库占有很大的比例,其代表性的数据库有《Ei Compendex Plus》(工程索引)、《INSPEC》(科学文摘)和《中文期刊数据库》等 数值型数据库 数值型数据库的记录包括各种调查数据或统计数据。它是一种以自然数值形式表示、计算机可读的数据集合,这些数据是从文献中分析、概括、提取出来,或以调研、观测及统计工作中直接获得的数据。 数值型数据库主要用于查询各种有关的数字、参数、公式等。 如:气象数据、地质资料、化学或物理化合物特性的文献数据、人口统计资料、市场调研数据等。 词典型数据库 这类数据库的文献记录主要介绍一些有关公司、团体或名人的情况,供用户查询某一事物发生的时
文档评论(0)