- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
T/CSEE
PAGE1
T/CSEE####—2021
PAGE6
团体标准发布中国电机工程学会20XX—XX—XX实施20XX—XX—XX发布能源大数据数据资源目录Energybigdataresourcesdirectory(征求意见稿)T/CSEEXXXX—
团体标准
发布
中国电机工程学会
20XX—XX—XX实施
20XX—XX—XX发布
能源大数据数据资源目录
Energybigdataresourcesdirectory
(征求意见稿)
T/CSEEXXXX—YYYY
代替T/XXXX
ICS35.240
CCSL67
T/CSEE####—2021
PAGE2
能源大数据数据资源目录
范围
本文件规定了能源大数据资源目录的定义和构成,确立了数据资源目录的构建原则,明确了数据资源目录包括的各类主题域对象,制定了数据资源目录的编码规则,规范了数据资源目录管理使用流程。
规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
DB35/T1999—2001自然资源空间数据目录体系
GB/T21063.1—2007政务信息资源目录体系第1部分:总体框架
GBT21063.2—2007政务信息资源目录体系第2部分:技术要求
GB/T21063.3—2007政务信息资源目录体系第3部分:核心元数据
GB/T20163.5—2007政务信息资源目录体系第5部分:政务信息资源标识符编码方案
GBT21063.2—2007政务信息资源目录体系第6部分:技术管理要求
术语和定义
能源大数据资源数据目录是实现能源领域数据资源共享、业务协同和数据应用的基础,可以提供能源大数据领域数据浏览、查找、共享和应用的服务,下列术语和定义适用于本文件。
编码coding
给事物或概念赋予代码的过程。
数据资源目录体系及编码规范
体系构成
能源大数据资源目录体系架构包括信息系统、库表、数据目录、目录管理、数据应用。信息系统依托终端设备、数据中台、WEB服务、公开数据作为数据来源,将能源信息数据梳理后配置在各个库表中,N个库表与数据目录形成关联关系,通过目录管理为上层数据应用提供能源信息的访问、管理、获取等服务,如图1所示。
图1能源大数据资源目录体系构成
数据分类
按照主题将能源大数据分为:能源综合、煤炭、石油、天然气、电力、太阳能、风能、水能、生物质能、核能、海洋能、氢能、热能、自来水、新兴用户、碳排放等16个能源主题以及经济社会、政务、气象、环境、其他等5个能源密切相关主题。
图2能源大数据资源目录体系构成
编码规范
数据资源目录编码共二十位,包含行政区划代码、一级主题域、二级主题域、指标名称、指标频度、指标维度。其中行政区划代码6位、一级主题域3位,二级主题域3位,指标名称4位,指标频度2位,指标维度2位,具体结构如图3所示。
图3能源大数据资源目录编码结构
各部分的说明如下:
行政区划代码:共6位,行政代码是中国国家行政机关的识别符号,第一、二位表示省(自治区、直辖市),第三、四位表示市(地区、自治州),第五、六位表示县(市辖区、县级市)。例如:河南省郑州市中原区410102、河南省洛阳市老城区410302等。
一级主题域:共3位,用于表示数据资源所属的主题域分类,例如:能源综合、煤炭、石油、天然气、电力等。具体的分类代码参考附录A。
二级主题域:共3位,各一级主题域下属的二级主题域划分,例如:煤炭主题域包括煤炭资源、煤炭生产、煤炭加工转换等二级主题域。具体的分类代码参考附录A。
指标名称:共4位,各二级主题域下属的指标划分,例如:煤炭生产二级主题域包含煤炭项目信息、煤炭产能、原煤生产量、煤炭开采量等指标。
指标频度:共2位,标识各指标采集频率,例如秒、分钟、小时、天、周、月、年等。
指标维度:共2位,标识指标的维度,用于表示指标的某种特征,例如性别、地域、时间等。
数据资源目录管理
管理流程
能源大数据资源目录体系管理流程包括规划、编目、注册、审核、发布、使用6个环节,规划包括数据准备,编目包括资源编目,注册包括目录注册/更新、数据挂接,审核包括目录审核、挂接事项审核;发布包括目录发布,使用包括目录查询、数据获取。具体如图4所示。
图4能源大数据资源目录管理流程
主要环节
能源大数据资源目录管理所涉及的主要环节如下:
规划
将业务需求范围内的数据资源进行数据清洗,检查数据质量,如:数据是否完整,是否有错,发现并纠正数据的缺失值、严重噪声值、不一致值、不完整值等问题。
基于清洗后数据资源规划数据资源目录,规划过程中应保证数据
文档评论(0)