- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(PPT)-计算机信息检索概述
计算机信息检索概述
1 计算机信息检索理论基础
2 计算机信息检索的发展历史
3 计算机检索技术与实现
4 计算机检索策略与实施技巧
1 计算机信息检索理论基础
使用计算机检索信息,是专业人员在开展科学研究中不可或缺的一项基本技能。一个具有这方面能力并善于从电子信息源中获取所需信息者,将在今后的信息社会中获取更多的成功机会 。
1 计算机信息检索理论基础
计算机信息检索的定义
计算机检索系统的构成
数据库的概念
计算机信息检索的定义
所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。
计算机检索系统的构成
硬件
软件
数据库
硬件
系统中采用的各种硬件设备的总称,包括具有一定性能的计算机主机、外围设备以及怀数据处理或数据传输有关的其他设备。主机,是计算机检索系统的中枢。外围设备包括外部存储器,输入输出设备如键盘、光笔、鼠标、光学字符识别装置,显示终端、打印机等。
软件
系统中有关的程序和各种文件资料的总称,包括系统软件(如操作系统,输入输出控制程序)和应用软件。
数据库
“一组文件的集合”,就是以一定的组织方式存贮在一起的相关数据的集合。
数据库的概念
数据库的定义
数据库的类型
数据库的定义
数据库是至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。通俗地说,数据库是在计算机存储设备上按一定方式存储,并提供给确定范围内的各类用户共享的相互关联的数据集合。数据库是计算机技术与信息检索技术相结合的产物。它既是现代人们从事信息资源管理的工具,同时也是计算机信息检索的基础。
数据库的类型
参考数据库
源数据库
混合数据库
参考数据库
指用户从中获取信息线索后,还需进一步查找原文或其他资料的一类数据库。它包括书目数据库和指南数据库。
(1)书目数据库。它是存储某个学科领域的二次文献的数据库,有时又称作为二次文献库。它依照二次文献的不同类型又可分为题录文摘数据库、索引数据库和图书馆书目数据库。
(2)指南数据库。它是存储有关某些机构、人物、出版物、项目、程序、活动等简要描述性信息的一类数据库,亦称指示性数据库。例如,机构名称数据库、人物传记数据库、产品数据库等都属于这一类数据库。
源数据库
又称为数据银行。它是能够直接为用户提供原始资料或具体数据的一类数据库。 源数据库又分为:
数值型数据库
文本—数值型数据库
术语数据库
图像数据库
全文数据库
超文本数据库
数值型数据库
是指专门提供以数值方式表示的调查数据和统计数据的一类数据库。
文本-数值型数据库
是指能够同时提供文本信息和数值数据的一类数据库。
术语数据库
是指专门存储和检索名词术语、词语信息等的一种源数据库。
图像数据库
是指用来存储和检索各种图像或图形信息及有关文字说明资料的一种源数据库。
全文数据库
是指存储和检索文献全文或其中主要部分的一种源数据库。
超文本数据库
这种数据库存储时将存储内容分割为若干独立利用的结点,使用链路连接结点等方式进行存取,从而构成一个不拘泥于形式逻辑推理,不遵循某种正规模式的一种网络框架结构,因而具备了类似于数据库又优于一般数据库的特点。
混合数据库
这类数据库兼有源数据库和参考数据库的特点,按载体形式它又可分为以下四种类型:
磁媒体数据库
光盘数据库
多媒体数据库:是一种能够对文字、数值、声音和图像等不同性质的媒体进行一体化处理和管理的新型数据库
超媒体数据库。通过外部树形的链接将多种类型的媒体连成一个集合,该集合称为超媒体数据库。
2 计算机信息检索的发展历史
脱机批处理检索
联机情报检索
国际联机检索
光盘检索
网络信息检索
脱机批处理检索
1954一64。定期由专职检索人员把许多用户课题汇总,批量处理提问要求,并把结果提供给用户。直接在计算机旁检索,不需要远程终端设备及通信网络。用户在计算机处理成批检索课题之后才知道检索结果,不能直接、及时修改检索策略,查全率和查准率受到一定限制。
联机情报检索
20世纪70年代投入商业运营。用户在计算机检索系统的终端上,通过通信网络,使用特定的指令和算符,以人机对话方式,查询远程计算机检索系统核心的数据库,从中获取所需信息的计算机检索系统。
联机系统的诞生,使许多相互独立的终端实现了“对话”方式的信息检索。所谓对话方式,就是用户利用系统提供的、为数不多且简单易记的检索命令,每次输入一条命令或由命令组成的表达式查看结果。系统方面则每次显示出可能的信息,帮助用户选择下次该用的命令或表达式,用户通过与系统双向对话,可不断改变或完善检索策略,直至获得满意的检索结果为止。
联机检索系统由三个部分组成:
主机系统
通讯系统
终端设
原创力文档


文档评论(0)