二、计算机信息检索.pptVIP

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
二、计算机信息检索

科技信息检索之二 计算机信息检索 计算机信息检索的发展 计算机信息检索原理 数据库 世界著名的国际联机检索系统 计算机信息检索的策略与方法 计算机信息检索的发展 计算机检索主要经历了以下四个阶段 (1)脱机检索阶段(1954-1964年)。 脱机检索(Offline Retrieval),即批处理检索,1946年世界上第一台电子计算机问世后,20世纪50年代初就有人开始研究其在信息检索领域的应用。1954年,美国海军武器实验站图书馆在一台电子管计算机上建立了世界上第一个计算机检索系统。 (2)联机检索阶段(20世纪60年代-80年代) 进入20世纪60年代,计算机检索进入了实用和全面发展阶段。20世纪60年代末,数据通讯网络出现,大容量计算机分时系统和强功能检索软件研制成功,使脱机检索发展到联机检索并迅速得到了推广。20世纪70-80年代,联机检索得到迅速发展,一些联机检索系统开始向公众提供商业性服务,如DIALOG、ESA、ORBIT、BRS等许多世界著名的联机检索系统相继投入商业性运营。 (3)光盘检索阶段 1983年,出现了一种新的存储器,CD-ROM光盘。光盘检索具有储量极大而体积微小,要求设备简单,可随地安装,使用方便、易于操作,检索费用低(不需要昂贵的联机检索通讯费用),具有可随时修改检索策略而具有很高的查全率和查准率等优点,因而至今仍被世界各地广泛应用。 (4)网络化检索阶段 进入20世纪90年代,随着卫星通讯、公共数据通讯、光缆通讯技术以及信息高速公路事业在全世界的迅猛发展,计算机情报检索走向了全球大联网。网上资源具有信息的时效性、内容的广泛性、访问的快速性、搜索的网络性和资源的动态性五大特点,那么要及时、准确、有效地获取与自身需求相关的实用信息,对所有网络用户都非常具有挑战性。 目前,信息检索技术正向两个方向发展: 一是传统信息检索向全文文本、多媒体、多载体、多原理等新型信息检索发展,在深度上提高信息检索和信息组织能力,如探索自动抽词、自动索引、自动检索、自动文摘、自动翻译等; 二是信息资源的网络化和分布化,面向Internet 中浩瀚无垠的资源,在广度上提高管理和组织信息的能力。 计算机信息检索原理 计算机信息检索是指人们在计算机检索网络或终端上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需要的信息,然后再由终端设备显示和打印的过程。为实现这种信息检索,必须事先将大量的原始信息加工处理、存贮在各种信息载体上待用,所以计算机信息检索广义上讲包括信息的存贮和检索两个方面。 信息存贮 信息存贮的过程就是将所选中的一次文献进行主题分析、标引和著录,按一定格式输入计算机,构成可供机读数据库记录及文献特征标识,这相当于编制手工检索用的文摘索引等检索工具。 信息检索 信息检索则是查询的过程。用户对检索课题加以分析,明确检索范围,弄清主题概念,然后用系统语言来表示主题概念,形成检索标识及检索策略,输入到计算机进行查找。这一查找的过程实际上是计算机自动比较匹配的过程,当检索标识、检索策略与数据库中的信息的特征标志及其逻辑组配关系相一致时,则属“检索命中”,即找到了符合要求的信息。检索结果可以联机或脱机打印输出。 数 据 库 数据库是计算机信息检索的重要组成部分。它是以二进制代码形式在计算机存贮设备上(如磁带、磁盘和光盘等)合理存放的相关数据的信息集合,通常由存贮信息记录及其索引的若干文档组成。 目前,大多数计算机信息检索系统都存有四种类型的数据库: 文献型数据库 数值型数据库 词典型数据库 全文型数据库 文献型数据库 文献型数据库又叫书目型数据库,记录文档中主要存入的是原始文献的书目。包括原始文献的篇名、作者、文献出处、文摘、关键词,以及主要用于查询各种文献资料的书目性线索、文摘等。 数值型数据库 数值型数据库的记录包括各种调查数据或统计数据。它是一种以自然数值形式表示、计算机可读的数据集合,这些数据是从文献中分析、概括、提取出来,或以调研、观测及统计工作中直接获得的数据。 数值型数据库主要用于查询各种有关的数字、参数、公式等。 词典型数据库 这类数据库的文献记录主要介绍一些有关公司、团体或名人的情况,供用户查询某一事物发生的时间、地点、过程或简要情况,或诸如化学物质名称、结构、俗称和化学物质登记号之类指南性信息,故又称之为指南型数据库。 全文型数据库 这类数据库的文献记录存入了原始信息的正文。通过它可以直接检索出原始信息的全文,从而大大方便了用户,也提高了信息的有效利用。 目前大多数的全文型数据库的记录都是图像扫描格式,阅读时需要专门的软件,大多可以通过软件转换成文本格式。 信息存储 信息技术的核心是信息的处理与存储,无论信息

您可能关注的文档

文档评论(0)

cgtk187 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档