- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章计算机检索 第一节 基本涵义与发展简史 第二节 计算机信息检索的原理 第三节 计算机信息检索系统的构成 第四节 计算机检索技术和策略 第五节 计算机检索步骤 第一节 基本涵义与发展简史 一、计算机信息检索的基本涵义 定义:简称机检,指人们根据特定的信息需求,利用计算机信息检索系统从专指或相关的机读数据库中查找并获取所需信息的过程,是计算机将检索用户的提问标识与数据库中的信息特征标识进行比较匹配的过程。 计算机技术+高密度存储技术+现代通讯技术 广义上包括存储和检索两个过程 狭义仅指检索过程 计算机检索系统的构成 计算机检索系统由硬件、软件和数据库组成。就检索而言,检索系统是指数据库。其数字检索机制主要包括四个部分: 1、检索界面模块:接受用户检索要求,有一般检索界面和高级检索界面。 2、检索策略模块:将用户输入的检索要求编制成计算机可执行的规范化检索式。 3、检索执行模块:利用检索式检索索引数据库,并保证检索的速度和准确性。 4、检索结果模块:对检中记录的整理组织。 计算机检索发展简史 1.脱机检索(50年代末~60年代中期 ) 这时是计算机检索的原始时期,计算机由电子管组成,主要存储介质是磁带、磁鼓,只能进行简单的检索。(第一台计算机诞生于1946年,美国的宾夕法尼亚州) 专业检索人员定期批量处理用户的情报要求 用户不能立刻获得检索结果 检索结果为题名,作者,文摘等。 在脱机检索阶段,计算机主要进行文献目录、索引、文摘等前处理工作。 2.联机检索(60年代末~70年代初) 1963年-1964年间,美国洛克希德导弹与宇航公司的情报实验室建立了”人-机“对话的联机情报检索系统(DIALOG的前身),此后在60年代末到70年代初联机检索系统得以快速发展。国际著名的DIALOG系统、ORBIT系统、MEDLINE系统都是从这个时期发展起来的。 多个检索终端,通过通讯线路与联机检索系统中央计算机(主机)联接 利用分时技术,使多个用户可同时与主机以“对话”方式进行检索 用户可随时浏览检索结果 由于这个阶段的计算机网络主要是通过电话线联接,因而联机检索受到地区的限制 3.国际联机检索(70年代中期-) 卫星通讯技术的出现,使得联机检索系统打破了地域限制。 而数据库生产的迅速发展及微机大量的涌现,更使得国际联机检索蓬勃发展。 用户利用终端设备,通过国际卫星通讯网与世界各地的大型计算机情报检索系统中央计算机直接进行“ 人-机对话”,查找世界各国的情报文献资料。 联机检索系统进入发展的黄金时期。 国际联机检索的贡献 方便和加速了世界情报资源的交流与利用 过去千里迢迢不能找到看到的情报资料,现在利用国际联机情报检索终端,只用几分钟就可以从几年到几十年几万种期刊中查到 实现了人类情报资源的共享。 优点:信息量大、快速、方便、数据库内容更新快 4.光盘网络检索(90年代-) 以太网技术的出现推动了网络版光盘数据库的出现。 光盘网络是一种计算机网络,如图书馆局域网 实现多用户光盘资源共享 例如:美国“化学文摘”(CA)从1987-1991年的五年累积索引(含文摘)光盘数据库共6张,价值40.5万元。 5. Web信息资源检索(90年代末-) 进入90年代后,随着网络技术的发展,尤其是互联网的迅猛发展,使计算机检索进入一个崭新的时期。 检索方法更简单,检索结果更全面 经过40多年的发展,从早期的书目信息到后来的全文本信息,到今天的网络与多媒体信息,网络信息资源已成为现代社会不可缺少的资源财富。其处理技术从简单的字段与关键词检索到全文检索,再到今天成为网络主流的超文本与多媒体处理。 处理技术的演进与发展,一方面使网络信息资源的内容从单一的书目到图文并茂的多媒体,更富有吸引力和使用价值;另一方面,超文本的广泛利用改变传统的信息组织的线性方法,使电子资源的组织更接近于“自然”,大大方便了用户的使用,使电资源的利用变得非常容易,用户不需要太多的检索知识与技术。 第二节 计算机信息检索的原理 信息存储(建立数据库过程) 信息存储就是利用检索语言对文献信息进行标引,形成文献标识并输入检索系统,为检索者提供有规律的检索途径。 信息检索(利用数据库过程) 通过一定的方法,从任一信息集合中查出特定信息的过程。 第三节 计算机信息检索系统的构成 逻辑构成: 信息源选择和采集子系统 标引子系统 建库子系统 词表管理子系统 用户接口子系统 提问处理子系统 物理构成: 数据库(Database) 数据库的概念: 是指一定专业范围内的信息记录及其索引的集合体。 数据库的类型 书目数据库与全文
文档评论(0)