- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
ICS01.120
A00
团 体 标 准
T/CSTM00120-202219
材料基因工程数据通则
Generalruleformaterialsgenomeengineeringdata
202219-08-13发布202219-11-13实施
发布中关村材料试验技术联盟
发布
T/CSTM00120—202219
T/CSTM00120—202219
1
I
前言
本标准按照GB/T1.1—2009给出的规则起草。
本标准对T/CSTM00120-2019材料基因工程数据通则修订,
修改术语3.8的定义
修改4数据结构
修改图1
请注意本文件的某些内容有可能涉及专利。本文件的发布机构不承担识别这些专利的责任。
本标准由中国材料与试验团体标准委员会材料基因工程领域委员会(CSTM/FC97)通则委员会提出。
本标准由中国材料与试验团体标准委员会材料基因工程领域委员(CSTM/FC97)归口。
引言
材料基因工程是材料科学的新型研发理念。通过从“试错法”向以“数据+人工智能”为标志的数据驱动模式的转变,实现新材料及工艺的理性设计。在此模式下,材料研究活动围绕数据产生与数据处理展开,使掌握成分-组织-工艺-性能间关联规律的速度更快、效率更高、成本更少。它代表了材料基因工程的核心理念与发展方向。材料基因组(MaterialsGenome)这个名词的出现有感于人类基因组计划的成功,但迄今为止并无特定的科学定义,目前的共识是将材料基因工程作为设计预测型材料研发模式的代称。
材料基因工程数据库是实施数据驱动材料科学的基础条件之一,需要收录符合FAIR(Findable,Accessible,Interoperable,Reusable,可发现、可获取、可互操作、可再利用)原则的数据资源,供社会共享。其中“可发现”指数据及其元数据被赋予全球性唯一并持久的标识,数据被丰富的元数据所描述并在可检索的源中登记或建立索引,易于被第三方(人员与机器)方便地找到;“可获取”指数据及其元数据可使用标准通讯协议通过标识查询并获取;“可互操作”指数据及其元数据的表达使用正式、可获得、共享和广泛使用的语言;“可再利用”指数据及其元数据由多种准确并相关的特征所描述,与细致的出处信息相关联并符合相关领域的标准,从而被不同用户(人员与机器)方便地使用。
数据,特别是源数据(即由测量或计算获得的未经进一步分析的数据)的可再利用性是材料基因工程的重要特征。以某一合金的X射线衍射图为例,它可用于获得材料的晶体结构,也可用于分析结晶程度、晶粒大小、晶体取向等参数,还可用于分析合金的相组成。因此一组源数据在不同的使用者手中可以根据各自关切产出不同的结果。传统材料数据库一般仅收集由源数据处理而得到的分析结果(如各种材料性能参数等),而源数据本身通常分散在实验者手中,不被收录。同时,与数据相关的元数据通常也不在收录之列,难以满足FAIR原则。因此,有必要建立一种适合材料基因工程需求的数据标准,规范数据的产生过程中必须收集的信息与遵循的格式,以确保数据满足FAIR原则,从而得到充分有效的利用。
本通则应对材料科学在数据驱动模式下对数据的需求,将数据分为样品信息、源原始数据(未经处理的数据)与衍生数据(经分析处理得到的数据)三类,以操作(样品制备/表征/计算/数据处理)为条目单位,对每次操作分别赋予独立资源标识(根据国标GB/T32843或DOI)。每条数据收集与操作相关的元数据,为样品与数据重复利用提供必要条件。这里,样品可以是实验产生的实物,也可以是经计算产生的虚拟物。同理,原始数据可以来自于表征或是直接的测量,也可以通过模拟计算产生。
为了收录足够元数据与原始数据,本通则兼顾了材料数据专用性与通用性。单个数据条目拥有独立的科技资源标识,独立存在,保证专用性。在使用中,每次分析使用的数据或数据集通过规范化的标准词汇表进行检索,随时建立,保证通用性。同时,对于特定的制备、表征、计算流程也需要建立数据与元数据的格式标准,简化数据存储、分析中的资源消耗,特别是繁琐的元数据录入可以通过高通量制备、表征、计算在操作过程中由计算机自动生成,这对于收集与处理批量产生的数据是必不可少的。
T/CSTM00120—202219
T/CSTM00120—202219
PAGE4
PAGE5
材料基因工程数据通则
范围
本通则规定了材料基因工程数据库中收录的数据的内容,即数据的构成及其中必须包含的信息。
本通则适用于所有材料基因工程数据库及其中收录的数据
文档评论(0)