- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
互操作联邦数字图书自馆研究
互操作联邦数字图书馆研究
【 内容 提要】未来的图书馆将是联邦数字图书馆,其目标是向用户提供一个将异构、分布信息源无缝集成的视图,实现对数字图书馆资源的透明访问。文中首先介绍了 研究 数字图书馆互操作的必要性,在此基础上重点 分析 讨论了联邦数字图书馆的实现 方法 ,并对当前具有代表性的互操作联邦数字图书馆的研究进行了综述讨论,最后简单讨论了 目前 建立互操作联邦数字图书馆所面临的挑战及进一步研究和解决的 问题 。
1 研究数字图书馆互操作的必要性
随着在线数字图书馆(DLs)的日益增多,人们发现必须访问许多DLs才能找到所需要的资料。由于大多数DLs是基于数据库驱动的,现有流行的搜索引擎不能对其内容建立索引。因此,对于那些需要跨越多个DLs查找资料的用户来说,搜索引擎不能满足这种需求。如何将广泛分布的、异构的DLs联合起来向用户提供统一的服务,即实现DLs之间的互操作,成为DLs研究与开发所关注的中心问题。
所谓数字图书馆的互操作是指交换和共享DLs的文档、查询和服务的能力[1]。它要求来自技术(协议和格式等)、内容(元数据及其语义等)和组织(DLs的基本访问原则、支付方式和认证等)三方面的合作。DLs的互操作可以出现在不同的抽象层次上,我们可以将其概括为两类视图[1]:纵向视图(verticalview)和横向视图(horizontalview)。前者涉及 法律 、 社会 、文化和知识产权等方面的问题,后者涉及DLs的硬件和软件即体系结构方面的问题。
为什么要研究DLs的互操作?道理很简单:目前很少有DLs既提供丰富的馆藏资源,又提供有效的服务。尽管目前一些DLs拥有大量的馆藏资源,而另外一些DLs却提供许多的服务,但在这两种情况下,用户都不太容易找到其所需要的信息资源。只有在这些DLs之间实现互操作,才能共享DLs的资源和服务。因此,研究DLs的互操作是十分必要的。
2 联邦数字图书馆的实现方法
为了解决用户使用DLs查找资料时同一查询条件的重复提交问题,人们提出了联邦数字图书馆的概念。所谓联邦数字图书馆是指正式或非正式合作操纵DLs的一些组织,它们同意支持一组共同的服务和标准,以便在联盟成员之间共享DLs的资源,实现互操作。联邦数字图书馆允许跨越不同的DLs执行搜索,并将每个DLs的查询结果合并后返回给用户,使用户感到如同使用单个数字图书馆一样。从联邦的耦合度考虑,实现联邦数字图书馆的方法可分为以下三种:NCSTRL方法、Harvesting方法和搜集(Gathering)方法。
2.1 NCSTRL方法
网上 计算 机 科学 技术报告图书馆(NCSTRL)是一个拥有100多个机构加盟的联邦数字图书馆[2],它利用Dienst作为DLs的协议和体系结构。凡是要求加入NCSTRL的机构需要在本地安装Dienst服务器,并按照统一规定的数据格式建立其馆藏资源。NCSTRL借助于分布式搜索技术在联盟DLs之间实现资源共享,它将用户的查询送往参与联邦的所有DLs上分别执行,收集返回的结果,综合整理后返回给用户(图1)。
附图
图1 NCSTRL方法
NCSTRL方法要求所有参与联邦的DLs使用相同的协议或软件系统,因此能够提供全面的互操作。但紧密的联邦必将加重联盟成员的负担,它们不得不就技术标准和策略(如知识产权准则、安全和隐私等)达成一致。从 网络 和搜索系统方面的限制考虑,NCSTRL是昂贵的运行模式,因为要求每个联盟成员的DLs必须支持复杂的查询语言和对查询的快速实时响应。另外,从查询的频率、元数据的质量以及网络资源的可用性等方面综合考虑,这种实现联邦的方法对联盟成员加负较重。因此,只有那些需求强烈的DLs会采用这种代价较高的模式。
2.2 Harvesting方法
一台计算机能够自动地从其他计算机中收集并提取元数据的方法通常称作Harvesting[3]。利用Harvesting方法建立联邦数字图书馆的基本思想是:从每个DLs收集并提取元数据,经过处理、合并后集中保存在一个中心DL中,然后对保存在中心DL本地的元数据执行搜索(图2)。显然,这种方法需要在中心DL维护一个所有DLs馆藏元数据索引信息的副本,以便提供基于馆藏元数据内容的查询路由服务。
附图
图2 Harvesting方法
Harvest系统[4]是这种方法的代表,它包括一组从各个DLs馆藏中搜集信息并建立基于主题内容索引的集成工具。Harvest体系结构主要包括两部分:搜集者(gatherers)和代理(brokers)。每个搜集者从DLs馆藏中搜集并提取索引信息。代理程序从一个或多个搜集者或其他代理检索索引信息,并按增量方式对其进行更新。代理程序能够为多个馆藏建
文档评论(0)