特色数据库建设中元数据质量控制研究.docVIP

特色数据库建设中元数据质量控制研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
特色数据库建设中元数据质量控制研究

特色数据库建设中的元数据质量控制研究   [摘要]从特色数据库建设对元数据质量的需求出发,将其中的元数据质量问题总结为元数据错误、元数据遗漏和元数据冗余三类问题,从元数据制作过程出发思考产生这三类元数据问题的原因,并从需求分析和数据库设计、元数据标注和元数据审核校验三个阶段提出元数据质量控制的具体措施。   [关键词]特色数据库 元数据 质量控制   [分类号]G250.1      元数据是用来描述数据本身内容和其他特征的数据,在数据库建设中,主要承担着描述信息、定位数据、检索资源、评估资源等重要作用,元数据质量直接关系到数据库的建设质量和服务效果。国外专门讨论元数据质量的研究大约始于2004年,美国学者Bruce和Hillman将其定义为“元数据满足需求和目标的程度”。特色数据库是根据各馆的馆藏特色或地方特色,集中搜集各种类型文献建立的数据库。作为数字图书馆建设的重要组成部分,特色数据库一直是各个图书馆建设的重点。据统计截至2007年底,CALLS在高校图书馆已建263个特色数据库,公共图书馆建了522个特色数据库,科学院系统建了32个特色数据库,这不包括非CALIS高校图书馆建设的特色数据库,如今特色数据库数量已远远高于这个统计数据。作为中小型高校图书馆,我馆已经构建或者正在建设的特色数据库就包括“黄河数据库”等近10个。由于特色数据库多由各馆负责或者参与构建,且涉及对象数据类型多样、种类繁多,再加上现有元数据规范体系的缺失等方面原因,特色数据库元数据的质量比商业数据库更值得关注。      1 特色数据库元数据质量需求      在特色数据库建设过程中,元数据承担着增加系统数据可信性、系统可用性以及资源发现能力等重要作用,是各方面功能、互操作以及参与聚合性服务等得以实现的关键。特色数据库对于元数据质量主要有如下4方面需求:   1.1 资源组织方面的需求   建立能够有效满足用户需求的高质量特色数据库,必须提取资源相关特征的元数据(题名、作者、关键词等),并科学地组织起来,便于资源的利用。特色数据库涉及的资源类型多样(图书、期刊、古籍、拓片、音视频等)、来源多样(开放获取资源、商业数据库、各馆自己数字化资源库等)、加工类型多样(目录、文摘、题录、全文等),特色数据库资源的复杂性使得其元数据质量控制具有很高的难度。因此,资源描述元数据尽可能选择合适的标准,涵盖所需的所有特征项,思考合适的资源描述粒度。同时元数据编制人员在描述资源元数据时还要保证资源在语义、语法和语义上的准确性。   1.2 资源利用方面的需求   特色数据库经过对相关资源特征抽取和标注以后最终的目的是提供给用户利用,这里的利用包括数据库查找、识别、挑选、获取和数据复用等。资源的检索、浏览和定位借助于资源组织时抽取和标注的特征元数据实现,其对于元数据质量的要求就是涵盖全面、标注准确。数据复用则要求元数据应该从多个角度对同一资源进行描述,元数据质量方面的要求是元数据的准确性、描述项目的标准化且应有一定可拓展性。   1.3 数据库管理方面的需求   建成的特色数据库除满足用户利用方面的需求外,还要满足特色数据库管理者管理方面的需求,如数据库所有权、安全控制、数据库及数据库部分内容访问统计、数据库之间互操作,这都需要借助于相关元数据实现。互操作管理元数据要求在建设过程尽可能采用相关、适用面广的标准,其他管理方面元数据则要求根据需要在数据库设计时设置好相关元数据字段。   1.4 数据库长期保存方面的需求   数字资源长期保存问题是近年来业界非常关注的内容,但从长远发展来看,像我馆这样的中小型图书馆并不需要保存诸如施普林格、维普之类的大型商业数据库(应由国内少数大型图书情报机构承担保存任务),我们需要长期保存的就是自己创建和管理维护的特色数据库。因此,特色数据库建设过程中应考虑特色数据库的长期保存问题,应该根据需要保存与数字资源长期保存相关的元数据,如:背景信息、软件硬件环境、转换历史、转换工具、采用元数据标准等。      2 特色数据库建设中元数据质量问题及其原因分析      2.1 特色数据库建设中的元数据质量问题   对于特色数据库元数据质量问题,美国国家科学数字图书馆Diane等人将其总结为数据遗漏、数据错误、数据混淆和数据残损四个方面。国内虽没有文献专门讨论,但在特色数据库调查研究中也多描述了其中涉及的质量问题。如:黄晓斌、蒲筱哥在调查中发现特色数据库“由于数据标引、分编、检索点选取没有统一标准和质量控制导致数据库兼容性和互操作性差,由于原始数据不完备、不准确、不规范、不统一,影响了数据库的利用和共享”。张毓晗在调查中则发现特色数据库“格式不规范、标引不规范(有的使用主题词标引,有的使用关键词或者任意词

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档