浅谈数字图书馆跨库检索现状和发展.docVIP

浅谈数字图书馆跨库检索现状和发展.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅谈数字图书馆跨库检索现状和发展

浅谈数字图书馆跨库检索现状和发展   【摘要】:数字图书馆的跨库检索是一种近几年才兴起的服务方式,但也已成为数字图书馆领域的研究热点,无论是在功能还是技术上都发展迅速。文章探讨目前数字图书馆跨库检索的相关技术及其发展。   【关键词】:跨库检索; 异构数据库; XML; 中间件   中图分类号:TP393; 文献标识码:A 文章编号:1002-6908(2008)0410062-02      1. 跨库检索简介       跨库检索也称联邦检索(Federated Search),数据库检索(Multi-Database Search)或集成检索(Integrated Access),是以多个分布式异构数据源为对象的检索系统,这种系统向用户提供统一的检索接口,将用户的检索要求转化为不同数据源的检索表达式并发地检索本地的和广域网上多个分布式异构数据源,并对检索结果进行整合,在经过去重和排序等操作后,以统一结果呈现给用户。跨库检索的发展不仅方便了用户的信息获取,而且还在一定程度上提高了数据库的利用率,促进了资源共享。    目前,国内外已经有不少跨库统一检索系统,美国在这个领域处于领先地位,他们早先在跨库统一检索领域的研究成果之一就是提出了三个数字图书馆系统模型。第一个是伊利诺依大学的Interspace系统,第二个是斯坦福大学的Infobus系统,第三个是密执根大学的UMDL系统。另外还有后来的美国新墨西哥州莫斯阿拉莫斯国家实验室研究图书馆研究开发的FlashPoint系统,加利福尼亚大学的SearchLight系统等。    我国的数字图书馆研究起步较晚,但是也研究开发出了多个数字图书馆跨库检索系统,主要有清华大学的同方异构统一检索平台(USP)、中国科学院文献情报中心开发的集成检索系统(CSDL)、中国高等教育文献保障系统(CALIS)统一检索系统、CNKI知网技术有限公司开发的CNKI跨库检索系统等等。      2. 跨库检索的相关技术       跨数据库检索需要用到数据的整合技术,目前对异构数据源的数据整合方式主要有以下两种:    一种是将各种异构数据库的部分数据导入一个数据库系统中,为了整合不同类型的数据,必须将一些非传统的数据类型转化成新的数据类型。这种方法的优点是检索反应速度快,不会因个别数据库访问失败而影响整体检索效率。缺点是收录的数据库数量不能太多,只能实现对有限数据库的集中和检索。    第二种方法是利用中间件技术进行异构数据库数据整合,这种方法不需要改变原始数据的存储和管理方式。采用中间件技术,对来自用户的查询请求,分解成对不同原始数据库的独立访问请求,通过标准或非标准的数据访问接口对原始数据库进行实时访问并将结果整合后通过发布系统(或直接)返回给用户。这种方式的特点是实时性好,任何原始数据的更改都可以在用户查询时及时得到反映;原文获取可以直接通过中间件获得从而省去原文数据库的原文发布服务;但应用局限于原始数据库必须提供访问接口,而且由于各数据库的速度问题而影响到用户得到结果的时间。目前用于异构数据库数据集成的数据库中间件技术使用较为广泛的有:       2.1 公共网关接口技术CGI    利用CGI可实现Web与数据库的连接,CGI(Common Gateway Interface)是最早的Web程序设计方式,它提供一个外部应用程序与Web服务器交互的标准接口,遵循CGI标准编写的Web服务器端的可执行程序称为CGI程序。CGI最大的用处之一是其与浏览Web站点的用户之间的交互能力,使信息网关、反馈机制、访问数据库、查询等一系列灵活复杂的操作得以实现。利用CGI实现与数据库的连接,最大的优点在于其通用性。目前几乎所有的HTTP服务器都支持CGI。       2.2 开放式数据库互连技术ODBC    ODBC(Open Database Connector)是由Microsoft推出的基于C语言的开放数据库互连技术,主要针对客户端/服务器结构的数据库。它包含访问不同数据库所要求的ODBC驱动程序及驱动程序所支持的函数,应用程序通过调用不同的驱动程序所支持的函数来操纵不同的数据库。若想使应用程序操作不同类型的数据库,就要动态地链接到不同的驱动程序上。       2.3 JAVA 数据库互连技术JDBC    JDBC(Java Database Connector)是JavaSoft公司设计的Java语言的数据库API(应用编程接口),主要针对浏览器/服务器结构的WEB数据库。JDBC的出现是Java编程中最重大的突破之一,它使得Java程序与数据库服务器的连接更加方便。与其他的数据库存取技术相比,JDBC继承了Java语言的所有特点,不仅具

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档