- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Q/NFHA 01-2019
广东南方海岸科技服务有限公司企业标准
大数据采集标准
2019-08-01 发布 2019-09-01 实施
广东南方海岸科技服务有限公司 发布
Q/NFHA 01-2019
目 录
第一章 概述 1
第二章 范围 1
第三章 规范性引用文件 1
第四章 术语和定义 1
第五章 总体要求 2
第六章 大数据采集架构3
第七章 数据源要求4
第八章 大数据来源5
第九章 大数据类型6
第十章 大数据采集技术7
Q/NFHA 01-2019
大数据采集标准
第一章 概述
为进一步规范大数据采集过程,实现大数据统一采集,为后续大
数据报送、传输和分析做好准备,特制定本标准。
第二章 范围
本标准规定了大数据采集要求。
本标准适用于大数据采集过程。
第三章 规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文
件,仅所注日期的版本适用于本文件。凡是不注日期的引用文件,其
最新版本 (包括所有的修改单)适用于本文件。
ITU-TY.3600-2015 基于云计算的大数据需求与能力 (Bigdata
- Cloud Computing based requirements and capability)
第四章 术语和定义
ITU-TY.3600-2015规定的,以及下列术语和定义适用于本文件。
1. 大数据 Big Data
大数据是指在可能具有实时性要求的条件下,为实现采集、存储、
管理、分析和可视化的数据量大、类别大的数据集[ITU-T
1
Q/NFHA 01-2019
Y.3600-2015]。
2. ETL Extract Transform Load
数据从数据来源端经过抽取 (Extract)、转换 (Transform)、
加载 (Load)到目的端,然后进行处理分析的过程。
3. 大数据采集 Big Data Collection
大数据采集是指从传感器和智能设备、在线系统、离线系统、内
网平台和互联网平台等获取各种类型的结构化、半结构化及非结构化
的海量数据的过程。
4. 数据仓库 Data Warehouse
数据仓库是一个面向主题的 (Subject Oriented)、集成的
(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time
Variant)的数据集合,用于支持管理决策(DecisionMakingSupport)。
第五章 总体要求
大数据采集对大数据进行ETL操作,最终挖掘数据的潜在价值,
然后提供给用户解决方案或者决策参考。
ETL从数据源抽取出所需的数据,经过数据清洗,最终按照预先
定义好的数据模型,将数据加载到数据仓库中去,最后对数据仓库中
的数据进行数据分析和处理。
对于不同种类的数据进行数据分析,必须通过提取技术,将复杂
格式的数据进行数据提取,从数据原始格式中提取 (Extract)出需
2
Q/NFHA 01-2019
要的数据,丢弃一些不重要的字段。为提高对数据源大数据采集的准
确性,必须对提取后的数据进行数据清洗,将不正确的数据进行过滤、
剔除。
针对不同的应用场景,以及不同的数
您可能关注的文档
- Q_WHKY 019-2020混合型饲料添加剂 枯草芽孢杆菌+地衣芽孢杆菌+屎肠球菌.pdf
- Q_WFFY 021-2020复合微生物菌剂.pdf
- Q_WFFY 019-2020碳酶洛合酸50型.pdf
- Q_WFFY 018-2020聚合肽螯合钾增值肥料55.pdf
- Q_WFFY 016-2020锌硅肽藻酸螯合肥55.pdf
- Q_TZ WRH 0007-2020医用一次性防护服.pdf
- Q_TJJ 21-2020车载远程控制及定位系统.pdf
- Q_TJJ 18-2020汽车尾箱自动开启系统装置.pdf
- Q_TJJ 11-2020呼气酒精浓度自测装置.pdf
- Q_TJJ 03-2020汽车GPS导航系统.pdf
原创力文档


文档评论(0)