- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
试论数字图书馆跨库检索的现状和发展
摘要:数字图书馆的跨库检索是一种近些年才兴起的服务方式,但已经成为数字图书馆领域的研究热点,无论是在功能还是在技术上都发展迅速。文章探讨目前数字图书馆跨库检索的相关技术及其发展,以及对国内外跨库检索系统进行比较和总结。
关键词:跨库检索;数字图书馆;中间件
ABSTRACT:Digital library of cross-database retrieval is a kind of emerged in recent years service way, but has become the research focus in the field of digital library, whether in function or to be technically developing rapidly. The article probes into digital library cross -search the relevant technology and development at home and abroad, and cross -search system to compare and summarized.
KEY WORDS:Cross –search;Digital library ;middleware
一、引言
本世纪以来,人类创生的信息量高速增长,据估计,70年代以来全世界每年出版图书50万种以上、期刊10万种以上、专利约50万件、科技报告约90万件、会议文献10多万篇、产品样本50多万种,每年发表的科技论文总数近500万篇,并呈指数式增长,真可谓信息浩如烟海。随着互联网的快速发展,通过网络提供服务的以缩微品、声像带、磁盘、光盘等形式记录的非纸信息急剧上升,电子资源日益增多,数据库种类越来越丰富。如何从这浩如烟海的信息中找出所需信息,就成为信息检索的重任。信息化的多样性、数据库种类的形式不一、平台的差异性这些都对文献检索带来了许多困难。随着国家教育部要求在部分高校开设“文献检索与利用”课程,各高校图书馆数字化建设的大力投入、情报单位信息化建设的研究深入,这方面的工作也取得了一定的成绩。但存在的问题也不少,几乎所有的数据库都有自己独特的检索系统,用户每使用一种数据库,都必须重新进入和使用一种不同的检索系统,使人感到不胜其烦。往往又找不到所要的信息。这样用户的使用成本大大增加,降低了用户的积极性。因此,不少用户提出能不能开发一个兼容各种数据库的无所不包的检索和阅读的统一平台。跨库检索也称联邦检索(Federated Search),数据库检索(Multi-Database Search)或集成检索(Integrated Access),是以多个分布式异构数据源为对象的检索系统,这种系统向用户提供统一的检索接口,将用户的检索要求转化为不同数据源的检索表达式并发地检索本地的和广域网上多个分布式异构数据源,并对检索结果进行整合,在经过去重和排序等操作后,以统一结果呈现给用户。跨库检索的发展不仅方便了用户的信息获取,而且还在一定程度上提高了数据库的利用率,促进了资源共目前,国内外已经有不少跨库统一检索系统,美国在这个领域处于领先地位,他们早先在跨库统一检索领域的研究成果之一就是提出了三个数字图书馆系统模型。第一个是伊利诺依大学的Interspace系统,第二个是斯坦福大学的Infobus系统,第三个是密执根大学的UMDL系统。另外还有后来的美国新墨西哥州莫斯阿拉莫斯国家实验室研究图书馆研究开发的FlashPoint系统,加利福尼亚大学的SearchLight系统等。我国的数字图书馆研究起步较晚,但是也研究开发出了多个数字图书馆跨库检索系统,主要有清华大学的同方异构统一检索平台(USP)、中国科学院文献情报中心开发的集成检索系统(CSDL)、中国高等教育文献保障系统(CALIS)统一检索系统、CNKI知网技术有限公司开发的CNKI跨库检索系统等等跨库检索的相关技术 跨数据库检索需要用到数据的整合技术,目前对异构数据源的数据整合方式主要有以下两种:一种是将各种异构数据库的部分数据导入一个数据库系统中,为了整合不同类型的数据,必须将一些非传统的数据类型转化成新的数据类型。这种方法的优点是检索反应速度快,不会因个别数据库访问失败而影响整体检索效率。缺点是收录的数据库数量不能太多,只能实现对有限数据库的集中和检索。第二种方法是利用中间件技术进行异构数据库数据整合,这种方法不需要改变原始数据的存储和管理方式。采用中间件技术,对来自用户的查询请求,分解成对不同原始数据库的独立访问请求,通过标准或非标准的数据访问接口对原始数据库进行实时访问并将结果整合后通过发布系统(或直接)返回给
文档评论(0)