科学数据收割规范 编制说明.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

《科学数据收割规范》

(征求意见稿)

编制说明

一、工作概况

1、任务来源、承担单位和协作单位

本标准由全国科技平台标准化技术委员会(SAC/TC486)提出并归口,属于国家标准化管理委员

会下达的2022年第三批推荐性国家标准计划,项目编号为T-306,项目名称为《科学数

据收割规范》。

本标准由中国科学院计算机网络信息中心、中国标准化研究院、国家科技基础条件平台中心、

中国科学院国家空间科学中心、中国科学院空天信息创新研究院、中国科学院青藏高原研究所等单

位共同承担。

2、标准制定的背景、目的和意义

2.1背景

2018年3月,《国家科学数据管理办法》发布,明确要求科学数据集中管理,科学数据中心“承

担相关领域科学数据的整合汇交工作”,科学数据“有关目录和数据应及时接入国家数据共享交换

平台”。数据汇交与共享是国家科学数据中心的重要职责,国家科学数据中心逐渐成为科学数据资

源的汇聚、管理、服务中心。

各类科学数据平台间存在数据交换与共享的需求。科学数据往往从大科学装置、大科学计划、

观测网络中获得,而这些数据产生方式都将涉及数据的传输和交换。以国家科学数据中心为代表的

科学数据平台汇聚来自大科学装置、野外观测网络、大科学计划、基因测序等高通量计算以及科研

项目等来源的科学数据资源。面向国家重大战略,科学数据平台间往往需要按需协作,积极开展数

据联盟或数据专题建设,如黄河战略专题数据、高能-空间-天文数据联盟等,存在数据协议交换的

需求,特别是随时联合国开放科学倡议的发布,开放数据得到广泛共识,数据交换需求将更加强烈。

科学数据收割作为系统间数据获取的是科学数据交换的重要手段。国家科技资源共享服务平台

已经为各国家科学数据中心在访问统计、运行监控等方面提供了数据收割的工具和规范,在科技资

源互联互通方面做出了积极的尝试。以OAI-PMH为代表的元数据收割协议在数据采集、共享方面

已得到了广泛的应用;在以野外台站为代表的的领域分布式科研网络中,数据收割的方式也被普遍

采用;近年来,随着互联网的发展,各类数据的自动化爬取已成为数据获取的重要方式。

1

而随着科学数据利用的日趋广泛和多样,科学数据的流动已经打破了单一的层级和集中模式,

向资源网络化发展,科学数据收割的应用场景更加广泛,规范化的数据汇交与交换手段需要进一步

加强。但在科学数据管理和共享服务方面,尚未建立起主动式获取的常态化、通用性机制和规范。

随着多学科科学数据汇交与交换需求日益迫切,数据驱动科研创新对科学数据实时性、时效性的要

求也日益提高,面向异种异质异构科学数据的、统一的收割规范的建立迫在眉睫。

2.2目的和意义

《科学数据收割规范》标准旨在提出一种规范的、自动化的科学数据交换机制,有效补充原有

的汇交为主的资源汇集模式,将有效提升科学数据汇聚和流通的效率,并为科学数据“活起来”“动

起来”提供支撑。

《科学数据收割规范》标准,根据科学数据管理、汇聚、共享等需求,建立科学数据收割的框

架,明确科学数据收割的主体、收割的内容、收割的流程、收割请求以及实现要求,为科学数据中

心间数据交换、科学数据中心以外的科学数据平台的科学数据开放共享提供支撑,在提升科学数据

流通效率基础上,也是提升科学数据服务平台影响力的重要基础。当前我国正处于实施创新驱动发

展战略和推动数字中国战略的关键时期,加强和规范科学数据管理、促进科学数据共享是加强我国

科技创新能力建设的重要方式和手段。因此,在国家标准层面发布科学数据收割规范,推动科学数

据开放共享,对于服务科技创新、提升政府公共服务能力和发展共享经济等方面具有重要意义。

本项目建立的目的是对我国科研项目全生命周期内数据管理的数据汇聚过程进行指导,面向数

据获取与处置标准大类,资源获取标准小类中科学数据收割进行规范,确保以收割方式获取的科学

数据格式规范、内容完整、具有可重用性和可互操作性。

3、主要工作过程

(1)成立《科学数据收割规范》标准编制组

2023年1月,主导编制单位中国科学院计算机网络信息中心、中国标准化研究院、国家科技基

础条件平台中心、中国科学院国家空间科学中心、中国科学院空天信息创新研究院、中国科学院青

藏高原研究所成立了标准编制组,标准编制

您可能关注的文档

文档评论(0)

std360 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档