上海数字图书馆元数据方案.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
上海数字图书馆元数据方案

上图数字图书馆元数据方案 An Approach of Metadata in Shanghai Digital Library Initiative 上海图书馆系统网络中心 刘炜 赵亮 ABSTRACT 目前的上海数字图书馆是一个综合了七个资源库的网上图书馆,拥有数据近200GB,主要是扫描的影像数据。系统采用IBM Digital Library version 2.4作为主要开发工具应用平台,系统的元数据方案以Dublin Core作为核心集,多种元数据方法并存,并以基于XML的以RDF为基础的资源描述体系将它们封装在一起,保证了原始素材内容管理中元数据的完整性与互操作能力。本文从设计理念,具体实施框架,在实施中的问题探讨以及未来的实施构架设想等几方面对上图的元数据方案及其实施作了介绍。 ---------------------------------------------------------------------------------------------------------------- 上海图书馆以她的一千多万册藏书和三千余万件其它资料服务着上海市1300万人口。这是个世界上最大的城市图书馆,借助于近二十年中国的高速发展,上海在许多方面领先于全国,与世界同步。建设国际一流的图书馆,是上海图书馆新馆1996年建成开放后努力追求的目标。 1997年上海图书馆启动了第一个数字化项目,善本古籍的数字化,此后又陆续开始了六个数字化项目,分别是上海图典、上海文典、中国报刊、民国图书、点曲台和科技百花园,集中将极具特色的馆藏和地方文献按计划开发出来,到1999年底,总容量已经达到200GB。 在上海图书馆的数字图书馆项目实施中,元数据方案的选择是其中的一个关键所在。本文将就上海图书馆数字图书馆实践中所采用的元数据方案作一个简单的介绍,以供国内同行指正参考。 元数据方案与设计理念 在上图的数字图书馆方案中,我们所采用的元数据方案是以Dublin Core为核心元数据集,多种对应于不同资源类型的元数据方法并存,并以RDF为基础的资源描述体系将它们封装在一起。图一简要描述了上海图书馆数字图书馆建设的元数据方案及其在数字图书馆系统中实现的框架。 图一:上图数字图书馆元数据方案及其实施框架 好的元数据方案应具有互操作性(interoperability)、扩展性(extensibility)的特点,同时它是实现各种灵活查询功能(资源内容挖掘)的基础,是数字图书馆技术方案的核心。由于我们的数字化图书馆项目涉及的资源项目类型较多,也具有不同的特点,有书、刊、古籍、照片、乐曲及视频资料,这其中有的对象已有完整的CNMARC记录,有的则采用特有的元数据描述(如古籍),而有的则没有现成的元数据描述。对于一些原由CNMARC标引的图书来说,CNMARC记录对资源对象已提供了很好的内容与格式描述,而对于一些重新加工组织与整理的资源来说(如上海图典与乐典),使用MARC作为描述资源内容的元数据方法就不是那么合适了,这不仅仅是因为这些对象本身并没有已有的MARC描述记录,而且重新对这些大量的信息资源对象进行MARC标引成本很高,MARC本身注重形式的特点也并不适合对这些资源的内容描述。实际上这种情况下,Dublin Core就有了它的用武之地。所以从保护现有资源的基础出发,再充分挖掘与数字化特色资源的角度来看,上图的数字图书馆不适合采用一个唯一的、统一的元数据描述方法。采用多种元数据标准并存的方法是我们不二的选择。 在图一所示的元数据方案及其实现中,重点就是基于XML结构的RDF描述体系将多种元数据封装在一起。这样既保证了针对不同资源类型描述的元数据要求,也充分利用了图书馆原有的元数据资源(主要为CNMARC记录),同时以基于XML为基础的RDF描述体系也实现了开放、标准、统一的内容管理,使数字图书馆的资源建设能在相当长的时间内得到保护,也为未来向新的体系与标准迁移提供了便利。 在现实的数字图书馆实施方案中,基于多种元数据方法并存的体系十分有必要定义一个核心元数据集,以提供不同元数据集之间因应用的需要而产生的互操作的需求,基于核心元数据集的元数据之间的转换与整合将更为容易实现。在我们的系统中,我们选用Dublin Core作为我们的核心元数据集。选用Dublin Core的理由大致上有以下几条: 它的可用性与扩展能力 简洁清晰的元素语义定义使它的使用成本很低,所需的人员培训费用少 句法独立性,使它能很容易地嵌入各种描述体系中 Dublin Core经过这几年的发展,已成为类文档类对象(DLO)元数据事实上的一个使用相当广泛的一个标准,在国际上也已得以广泛的应用。而且Dublin Core不仅在国际上得以广

文档评论(0)

dlmus + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档