数据质量检查模块V2.0功能规范.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据质量检查模块V2.0功能规范

CALIS学位论文和特色库本地系统 数据质量检查模块V2.0功能规范 CALIS管理中心 2006年10月 一、概述 《CALIS OAI Record格式和发布规范》定义了“CALIS数据发布模式2”。对于该模式中的“数据质量检查模块V2.0”,本文给出了具体功能规范。 “数据质量检查模块V2.0”(简称“数据质量检查模块”)需作为学位论文或特色库本地系统的一个组成部分。该模块有两种使用方式: 方式1:该模块用于对“CALIS数据发布模式2”中的OAI记录文件(该文件遵循“CALIS OAI Record V2.0格式”,可以在同一条OAI记录中同时包含元数据和数字对象)进行校验。 方式2:本地系统在将数据送入OAI-DP之前,自动调用该模块对拟发布的元数据和数字对象进行质量检查和校验。 数据质量检查模块的使用者主要图书馆中学位论文或特色库本地系统的系统管理员或者数据管理员。 对于学位论文本地系统,需设置一个系统参数“论文必备性校验分界日期(CALIS__ETD_verify_sep_date)”,若某篇学位论文的“论文授予日期”大于等于指定该分界日期,则采用“CALIS学位论文元数据必备性规则2”进行校验,否则采用“CALIS学位论文元数据必备性规则1”进行校验。 二、界面规范 管理员首先使用本地系统的OAI文件导出模块进行OAI记录文件(遵循“CALIS OAI Record V2.0格式”)的导出。然后,管理员再使用“数据质量检查模块”对 OAI记录文件中的数据在数据格式、必备性、一致性等方面进行检查和校验。校验无误后,管理员才能将这些文件通过FTP上传,或者通过OAI-DP自动对外发布。 数据质量检查模块的界面应尽量简单易操作,提示信息明确。该界面至少应包含以下部分: oai记录文件夹(文件名)输入框,可以手工输入要检查文件存放的文件夹或文件名。 oai记录文件夹选择按钮,可以用可视对话框的方式选择要检查的文件夹或文件 oai文件检查按钮 结果提示文字框 数据质量检查模块的界面如下图所示: 图1:数据质量检查模块V2.0的界面示意 【特别注意】 对于学位论文本地系统,参数CALIS__ETD_verify_sep_date(论文必备性校验分界日期)应能由管理员统一配置。 三、功能规范 “数据质量检查模块V2.0”对于“CALIS数据发布模式2”的OAI记录文件进行校验时可能会发现一些错误,这些错误提示应遵循《CALIS学位论文和特色库本地系统的数据质量检查模块的错误代码规范》规范。 “数据质量检查模块V2.0”对OAI记录文件的校验分为以下两种情形: 用于对OAI记录文件进行校验; 与本地系统联动,用于对OAI-DP中即将发布的OAI记录数据进行校验。 3.1对OAI记录文件的校验 对“OAI记录文件”,按照“CALIS OAI Record V2.0格式”要求进行校验,该校验工作包括以下几个方面: 对OAI Record文件名称的校验 文件名称是否采用以下拼接形式生成: “完整的MetaID” + “@” + “导出时间戳” + “.oai.xml” ——这种校验的错误代码为01002A。 “完整的MetaID”部分是否采用以下拼接形式生成: “仓储标识” + “-” + “本地应用系统前缀” + “/” + “本地元数据标识” ——这种校验的错误代码为01003A。 “完整的MetaID”部分是否进行了application/x-www-form-urlencoded MIME格式转换,型如: oai%3A211011.%3Aetd-dr%2FA1002 ——这种校验的错误代码为01003B。 “导出时间戳”部分是否为型如“2005-01-01T10:02:30Z”的20位零时区时间格式 ——这种校验的错误代码为01004A。 “导出时间戳”部分是否进行了application/x-www-form-urlencoded MIME格式转换,型如: 2005-01-01T10%3A02%3A30Z ——这种校验的错误代码为01004B。 OAI Record文件名称是否型如: oai%3A211011.%3Aetd-dr%2FA1002@2005-01-01T10%3A02%3A30Z.oai.xml ——这种校验的错误代码为01002B。 对OAI Record文件的内容进行校验 用Record Schema(record.xsd)校验XML文件是否合法,schema地址为: /metadata_ns/oai/record/record.xsd ——这种校验的错误代码为01009。 取出record-header-identifier下的

文档评论(0)

busuanzi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档