面向多源异构科技信息治理的元数据标准规范体系构建.pdf

面向多源异构科技信息治理的元数据标准规范体系构建.pdf

知识组织 面向多源异构科技信息治理的元数据 标准规范体系构建* 1 1,2 1 3 3 1 1,2 罗婷婷 赵瑞雪 李娇 傅智杰 武丽丽 黄永文 鲜国建 (1. 中国农业科学院农业信息研究所,北京 100081 ;2. 农业农村部农业大数据重点实验室,北京 100081 ; 3. 中国工程院战略咨询中心,北京 100088) 摘要:为开展大数据环境下多类型、多来源、异构化科技信息的汇聚治理,实现大数据资源的规范化描述 与互联互通,提高数据资源的可发现、可利用和开放共享能力,本文基于元数据理论和知识对象建模思想,构建 了一套广泛适用的、可扩展的元数据标准规范体系,覆盖13类通用容器、24 类资源元素集描述规范及28个规范 编码表,并编制了配套的XML Schema形式化描述规范,实现对多类多源异构元数据向统一的XML格式转化、 验证和解析等自动化处理。该规范体系已在中国工程科技知识中心开展了应用验证,指导30余个分中心完成24 类数据资源超过亿级数据的转化汇交,有力支撑了工程科技“元数据海”的建设,快捷、高效地实现了近百类专业 领域特色资源元数据标准规范的定制与应用。 关键词:多源异构;科技信息;元数据;标准体系 中图分类号:G254.36 DOI :10.3772/j.issn.1673-2286.2021.04.009 引文格式:罗婷婷,赵瑞雪,李娇,等. 面向多源异构科技信息治理的元数据标准规范体系构建[J]. 数字图书 馆论坛,2021 (4):58-67. 随着大数据智能时代的到来,大数据已成为新型 计算机多种场景应用需求,研究制定了一套适用于多种 战略资源、生产要素和驱动创新发展的新引擎。大数据 类型、多源异构科技信息的元数据描述标准规范体系, 环境下,科技信息的类型多样,数量以前所未有的速度 从数据资源中抽象出相应的特征属性,组成特征元素 增长,且数据结构、存储方式存在很大差异,造成数据 集合(元数据元素),来描述特定类型的资源[3] ,初步实 集成困难、交互复杂,很大程度上影响了数据服务、知 现多源异构数据资源间关联、深层次、细粒度的规范描 识发现服务的效果,因此数据治理应运而生。数据治 述,为各领域、多类型资源的规范描述、交换复用、开 理是提升数据价值的基础[1] ,旨在通过相应的标准、规 放共享和关联互通提供指导和支撑。 范、流程和方法等,确保数据统一管理、高效运行,并 [2] 在数据使用过程中充分发挥数据价值的过程 。想要 1 国内外元数据标准规范发展现状 实现多源异构数据的汇聚融合、互联互通,数据治理是 必不可少的课题,而资源的标准化,即构建多源异构科 当前,描述数据资源的元数据标准规范日渐增 技信息元数据标准规范体系是提升数据治理效果的首 多。国外具有代表性的有:都柏林核心元数据元素集 [4] 要环节,同时也是数据治理面临的难点之一。 (DC ) 具有较强通用性;美国国家生物技术信息中 本文面向多源异构科技信息的数据治理需求,在 心(NCBI )的JATS作为美国国家标准得到了广泛应 [5] [6] 广泛参考借鉴国内外现有标准规范基础上,兼顾人和 用和认可 ;Dryad元数据标准规范 为Dryad 科学数 *本研究得到国家社会科学基金项目“科技论文全景式摘要知识图谱构建与应用研究”(编号:19BTQ061)资助。 58 年第 期(总第 期) 2021 4 203 罗婷婷,赵瑞雪,李娇,等 面向多源异构科技信息治理的元数据标准规范体系构建 据仓储

文档评论(0)

1亿VIP精品文档

相关文档