基于元数据与重庆地区电子文献资源整合研究.docVIP

基于元数据与重庆地区电子文献资源整合研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于元数据的重庆地区电子文献资源整合研究 刘子辉 陈强 彭渝 徐敏 (重庆科技学院 图书馆,重庆401331) [摘要]通过调查重庆地区高校、公共图书馆、医院电子文献资源,发现各单位在资源种类、总量、平均拥有量,特别是外文资源,差距更大,整合与共享势在必行,通过对各单位元数据的抽取,构建本地区电子资源元数据仓储,使读者通过对元数据仓储的“一站式”检索,实现对资源的统一访问,从而达到整合目的。 [关键字]元数据 电子文献资源 整合 [中图分类号]G250.76 The Integration Research of Electronic Document Resources Based on Metadata Liu zihui Chen qiang Peng yu Xu min (Library, Chongqing University of Science and Technology, Chongqing 401331, China)[Abstract] Through the electronic resources investigation of universities library, public library, hospital in Chongqing area, university library is most in resources, gross, average possession. so the integration and sharing of resources is imperative, Through of metadata extraction, Constructing the local metadata warehouse of electronic resource, the reader retrieves the metadata warehouse to realize the unified access to resources, so as to achieve the purpose of integration. [Keywords] Meta Data Electronic Document Resources Integration 引言: 近些年,由于电子文献资源本身所具有的优势,电子文献资源建设得到快速发展,面对海量的电子文献资源,任何图书馆的经费都显得相对渺小,都无法收集到最齐全的数据。同时,由于各数据厂商为了自己的利益,开发了不同的异构数据库,读者可能要经过多次切换数据库,才能检索到所需资源,读者不仅需要熟悉每一种数据库的使用方法,还要知道数据库中收集了哪些类型的电子文献资源,这都为读者带来不便,所以电子文献资源的整合与共享是信息化建设发展的趋势。基于元数据的资源整合是指将分散到各个异构数据库里的资源进行物理的集中,对各异构的,元数据进行抽取、清洗、使不一致的数据转换成统一的数据模型加载到数据仓储中,通过统一检索入口,可实现对异构资源的一次性检索,并依据元数据中的全文路径元素对对象数据进行定位。本文试探通过元数据实现重庆地区电子文献资源整合。 重庆地区电子文献资源整体现状 2012年8月,本文对重庆67所本科院校22所(公办15所、民办独立学院7所)、高职专科院校37所(公办22所、民办15所)、军校3所、成人高校5所xtract-Transform-Load) ETL,即数据抽取(Extraction)、数据转换((Transfonnation)、数据装载(Loading)。ETL是数据仓库体系结构当中的一个重要也是数据仓库建设过程中最复杂、费时的环节,ETL开发%一80%,hina等,面对这些差异,必需制定中心元数据标准,规定著录方式,系统依据该标准,对各个异构的元数据进行标准化。第二:数据解析,由于各系统元数据字段所概括的内容不一,某系统中其中一个元数据字段可能对应别的系统中的两个字段,数据存在不同的细节级别,称之为粒度。粒度越高,所表示的综合程度越高。在中心数据仓储中的查询涉及到不同的细节,不同的数据源对信息的描述可能具有不同的粒度,这使得对来自不同数据源的数据很难做相应的比较。所以本模块的任务就是消除各系统元数据粒度不一致的问题,对该拆分的字段进行拆分,该合并的字段进行合并。第三:数据增强,数据增强的任务是对原始数据进行补充,实现系统数据的完整性。数据中心所制定的元数据标准中,并非所有的系统都拥有标准中所拥有的元素或者修饰词,这时候就要增加字段,使被整合的系统的元数据信息更加完整。第四:重复记录归并,在中心元数据仓储中,每一条记录都对应一篇文献,不允许重复记录的存在,必须保证数据的唯一性。但从各系统抽

文档评论(0)

bhyq + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档