- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于元数据重庆地区电子文献资源整合研究
基于元数据重庆地区电子文献资源整合研究
〔摘要〕通过调查重庆地区高校、公共图书馆、医院电子文献资源,发现各单位在资源种类、总量、平均拥有量,特别是外文资源,差距更大,整合与共享势在必行,通过对各单位元数据的抽取,构建本地区电子资源元数据仓储,使读者通过对元数据仓储的“一站式”检索,实现对资源的统一访问,从而达到整合目的。
〔关键词〕元数据;电子文献资源;整合;高校图书馆;公共图书馆;医院
DOI:10.3969/j.issn.1008-0821.2013.05.011
〔中图分类号〕G25076〔文献标识码〕A〔文章编号〕1008-0821(2013)05-0047-04
21本地镜像的商业数据库资源
由于知识产权的原因,数据厂商一般情况下是不愿意提供资源的元数据的,不过可以通过与数据厂商协商,获取一些数据库的元数据资源。对于可以获取元数据的商业数据库,可以实施基于数据层的资源整合。对于不能获取元数据的数据资源,数据厂商可以提供该资源所遵循的协议和访问许可方式,实现应用层的整合。
22本馆自建特色资源
由于这类资源由本馆自建,本馆拥有该资源的元数据和对象数据,通过元数据收割获取各馆自建资源的元数据。
23随书光盘资源
各馆自建的随书光盘数据库,各馆拥有元数据及对象数据,可以实施元数据整合。
总之,对于较容易获取元数据的电子文献资源都可以通过元数据实现数据整合。
3元数据整合模型分析
基于元数据的区域电子文献资源整合的中心思想是:通过建立区域内统一的元数据中心,系统通过OAI(Open Archive Initiative for Protocol Meta-data Harvesting)技术,将各校各类型资源收割到临时的元数据仓储中,然后通过对临时元数据仓储中的数据进行清洗、转换,将这些数据追加到中心元数据仓储中。用户只需要对中心元数据仓储进行检索,即可实现对区域内电子文献资源的统一检索。
在所调查的高校图书馆、公共图书馆、医院分别属于3个不同的系统,所以在模型图中我们分别设立高校图书馆DC元数据中心、公共图书馆DC元数据中心、医院DC元数据中心,通过OAI收割各个区域的元数据资源。所谓DC元数据中心,即采用DC元数据标准的元数据中心。3个分中心,分别对各系统内各单位的各类电子文献资源实施元数据收割,建立系统的元数据中心。
31分布集中系统思想
通过上面的分析,针对重庆地区种类多样的电子文献资源,本文提出了基于元数据的集中与分布相结合的区域电子文献资源整合与共享模型,所谓集中与分布相结合,即元数据的集中存储,对象数据的集中与分布存储相结合。在资源整合过程中,数据有两部分组成,即元数据和对象数据。元数据是描述对象数据的数据,本模型中资源整合与共享的实现主要依靠元数据,通过元数据揭示资源,为读者提供检索浏览的线索,最终定位对象数据。对象数据是知识的载体,如PDF格式的电子图书、光盘镜象文件、音视频文件等,是我们整合的最终对象。在本模型中,对于元数据采取集中的存储模式,不同类型数字资源的元数据经过规范化处理,被分别存储在相应的元数据仓储数据库中。而针对对象数据的存储,本模型采取分布与集中相结合的方式,即系统在整合资源时,对象数据仍保留在各院校的系统中,不会被抽取到中心。当某些院校没有能力存储某资源时,可以将这些资源存储到某资源中心,实现相对集中的存储[1]。
32整合流程
在模型中,整合系统被分为了3层,第一层:重庆地区DC元数据中心。第二层:高校图书馆DC元数据中心、公共图书馆DC元数据中心、医院DC元数据中心。第三层:每一个分中心下面的高校。所以系统运行的流程是:
(1)高校DC元数据中心、公共图书馆DC元数据中心、医院DC元数据中心分别将所属的图书馆的元数据收割到分中心,形成分中心的元数据仓储。
3个分中心分别构建自己的DC元数据仓储(电子图书DC元数据仓储、电子期刊DC元数据仓储、自建资源DC元数据仓储等),然后对所属的高校的元数据进行收割,将收割的元数据存储到临时元数据仓储中。
(2)元数据ETL(Extract-Transform-Load)
ETL,即数据抽取(Extraction)、数据转换(Transfonnation)、数据装载(Loading)。ETL是数据仓库体系结构当中的一个重要过程,也是数据仓库建设过程中最复杂、费时的环节,ETL开发通常会占整个数据仓库项目时间的60%~80%,ETL是实现异构资源集成的关键环节。
数据抽取:数据抽取是从异构数据源中采集原始数据,这些数据可以是元数据据,也可以是对象数据。在本模型中只采集元数据资源,对象数据仍保留在各系统中。
您可能关注的文档
最近下载
- (2024秋新改)人教版七年级数学上册全册教案.doc
- 青岛版四年级下册《观察物体》.ppt VIP
- 钢结构高空安全施工专项方案.docx
- 单位档案管理员题库.pdf VIP
- 部编版小学道德与法治六年级上册教案(全册).docx VIP
- (优质!)GB 45673-2025《危险化学品企业安全生产标准化通用规范》之“5.14绩效评估与持续改进”审核检查单(2025A0)(可编辑!).docx VIP
- 001-10.绿色施工安全防护措施费用实施登记表GDAQ20110.xls VIP
- 文正路自评报告.doc VIP
- (优质!)GB 45673- 2025《危险化学品企业安全生产标准化通用规范》之“5.9 相关方”审核检查单(2025A0).docx VIP
- 2024浙江丽水缙云县招聘专职社区工作者13人笔试备考试题及答案解析.docx VIP
原创力文档


文档评论(0)