基于元数据重庆地区电子文献资源整合探究.docVIP

  • 2
  • 0
  • 约4.87千字
  • 约 10页
  • 2017-11-07 发布于福建
  • 举报

基于元数据重庆地区电子文献资源整合探究.doc

基于元数据重庆地区电子文献资源整合探究

基于元数据重庆地区电子文献资源整合探究   〔摘要〕通过调查重庆地区高校、公共图书馆、医院电子文献资源,发现各单位在资源种类、总量、平均拥有量,特别是外文资源,差距更大,整合与共享势在必行,通过对各单位元数据的抽取,构建本地区电子资源元数据仓储,使读者通过对元数据仓储的“一站式”检索,实现对资源的统一访问,从而达到整合目的。 〔关键词〕元数据;电子文献资源;整合;高校图书馆;公共图书馆;医院 DOI:10.3969/j.issn.1008-0821.2013.05.011 〔中图分类号〕G25076〔文献标识码〕A〔文章编号〕1008-0821(2013)05-0047-04 21本地镜像的商业数据库资源 由于知识产权的原因,数据厂商一般情况下是不愿意提供资源的元数据的,不过可以通过与数据厂商协商,获取一些数据库的元数据资源。对于可以获取元数据的商业数据库,可以实施基于数据层的资源整合。对于不能获取元数据的数据资源,数据厂商可以提供该资源所遵循的协议和访问许可方式,实现应用层的整合。 22本馆自建特色资源 由于这类资源由本馆自建,本馆拥有该资源的元数据和对象数据,通过元数据收割获取各馆自建资源的元数据。 23随书光盘资源 各馆自建的随书光盘数据库,各馆拥有元数据及对象数据,可以实施元数据整合。 总之,对于较容易获取元数据的电子文献资源都可以通过元数据实现数据整合。 3元数据整合模型分析 基于元数据的区域电子文献资源整合的中心思想是:通过建立区域内统一的元数据中心,系统通过OAI(Open Archive Initiative for Protocol Meta-data Harvesting)技术,将各校各类型资源收割到临时的元数据仓储中,然后通过对临时元数据仓储中的数据进行清洗、转换,将这些数据追加到中心元数据仓储中。用户只需要对中心元数据仓储进行检索,即可实现对区域内电子文献资源的统一检索。 在所调查的高校图书馆、公共图书馆、医院分别属于3个不同的系统,所以在模型图中我们分别设立高校图书馆DC元数据中心、公共图书馆DC元数据中心、医院DC元数据中心,通过OAI收割各个区域的元数据资源。所谓DC元数据中心,即采用DC元数据标准的元数据中心。3个分中心,分别对各系统内各单位的各类电子文献资源实施元数据收割,建立系统的元数据中心。 31分布集中系统思想 通过上面的分析,针对重庆地区种类多样的电子文献资源,本文提出了基于元数据的集中与分布相结合的区域电子文献资源整合与共享模型,所谓集中与分布相结合,即元数据的集中存储,对象数据的集中与分布存储相结合。在资源整合过程中,数据有两部分组成,即元数据和对象数据。元数据是描述对象数据的数据,本模型中资源整合与共享的实现主要依靠元数据,通过元数据揭示资源,为读者提供检索浏览的线索,最终定位对象数据。对象数据是知识的载体,如PDF格式的电子图书、光盘镜象文件、音视频文件等,是我们整合的最终对象。在本模型中,对于元数据采取集中的存储模式,不同类型数字资源的元数据经过规范化处理,被分别存储在相应的元数据仓储数据库中。而针对对象数据的存储,本模型采取分布与集中相结合的方式,即系统在整合资源时,对象数据仍保留在各院校的系统中,不会被抽取到中心。当某些院校没有能力存储某资源时,可以将这些资源存储到某资源中心,实现相对集中的存储[1]。 32整合流程 在模型中,整合系统被分为了3层,第一层:重庆地区DC元数据中心。第二层:高校图书馆DC元数据中心、公共图书馆DC元数据中心、医院DC元数据中心。第三层:每一个分中心下面的高校。所以系统运行的流程是: (1)高校DC元数据中心、公共图书馆DC元数据中心、医院DC元数据中心分别将所属的图书馆的元数据收割到分中心,形成分中心的元数据仓储。 3个分中心分别构建自己的DC元数据仓储(电子图书DC元数据仓储、电子期刊DC元数据仓储、自建资源DC元数据仓储等),然后对所属的高校的元数据进行收割,将收割的元数据存储到临时元数据仓储中。 (2)元数据ETL(Extract-Transform-Load) ETL,即数据抽取(Extraction)、数据转换(Transfonnation)、数据装载(Loading)。ETL是数据仓库体系结构当中的一个重要过程,也是数据仓库建设过程中最复杂、费时的环节,ETL开发通常会占整个数据仓库项目时间的60%~80%,ETL是实现异构资源集成的关键环节。 数据抽取:数据抽取是从异构数据源中采集原始数据,这些数据可以是元数据据,也可以是对象数据。在本模型中只采集元数据资源,对象数据仍保留在各系统中。

文档评论(0)

1亿VIP精品文档

相关文档