- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
电信网和互联网数据溯源技术规范
1范围
本文件规定了电信网和互联网数据溯源的技术要求与测试方法。
本文件适用于指导电信网和互联网开展数据溯源能力建设及管理,也适用于监管部门
第三方机构等组织对数据溯源能力进行监督和评估。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期
的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括
所有的修改单)适用于本文件。
GB/T34945—2017信息技术数据湖源描述模型
3术语和定义
GB/T34945—2017界定的以及下列术语和定义适用于本文件。
3.1
数据溯源dataprovenance
根据数据在整个生存周期内(从产生、传播到消亡)的演变信息和演变处理内容的记录
推演数据演变情况的过程。
[来源:GB/T34945—2017,定义2.1,有修改]
3.2
溯源信息proveranceinformation
推演数据演变情况所依据的演变信息和演变处理内容的记录。
4缩略语
下列缩略语适用于本文件。
IP网络互联协议lnternetProtocol
ETL抽取、转换、加载Exirct-Trinsform-Load
SQL结构化查询语言StructunelQueryLanguage
5概述
5.1数据溯源类型
按照回溯目标不同,数据溯源通常分为数据衍生关系溯源和数据流转路径溯源
5.2数据衍生关系溯源
数据衍生关系溯源是根据数据在整个生存周期内(从产生、传播到消亡)的演变信息和
演变处理内容的记录,推演数据衍生关系的过程。产生数据衍生关系的操作包括数据表的建
立、修改等,涉及到数据的收集、存储、使用、加工、提供、删除等活动
推演数据衍生关系一般可通过分析日志记录等方式开展。
5.3数据流转路径溯源
数据流转路径溯源是根据数据在不同系统间,或在同一系统的不同节点之间流转过程的
记录,推演数据演变情况的过程。产生数据流转路径的操作包括系统节点间的数据访问、系
统间的数据访问等。
推演数据流转路径一般可通过分析日志记录的方式开展,适用于组织机构内部。当数据
离开组织机构内部进行流转时,外部日志记录难以获取,则需要通过数据水印、文档指纹等
技术完成数据路径溯源。
不同场景下的数据溯源技术实现方式见附录A。
6数据衍生关系溯源
6.1溯源对象
数据衍生关系溯源的溯源对象可以为表名、字段名等元数据,不包含数据内容。
6.2溯源流程
数据衍生关系溯源在开展数据收集、数据存储、数据使用、数据加工、数据传输、数据
提供、数据公开等数据处理活动的同时,同步记录并更新溯源信息。针对待溯源的数据,按
需获取、分析相应的溯源信息,推演数据衍生关系并进行展示,具体过程示例见图1。
数招处理话动监据而生爱鼎阅源
据收基记录更新测源信息特测的数据
数据存记录更新调源信息
数面他用记录/更新测源信息
数据工记录便新调源信息分析源信息
数据传
记录/更新阅源信息
数据提供
记录便章滴源信息
数据公开数生关系
记录使新南源信息
文档评论(0)