2023数据脱敏规程数据清洗、去标识化、匿名化.pdfVIP

  • 15
  • 0
  • 约3.85万字
  • 约 46页
  • 2025-05-14 发布于河北
  • 举报

2023数据脱敏规程数据清洗、去标识化、匿名化.pdf

数据脱敏规程

数据清洗、去标识化、匿名化

2023.11

目录

一、处理目标及相互关系1

(一)数据清洗是数据可用的障1

(二)去标识化是数据脱敏的关键1

(三)匿名化是去标识化的强化2

二、数据处理原则4

(一)合法合规4

(二)安全优先4

(三)平衡效用4

(四)技管结合4

(五)有效溯源5

三、数据清洗规程5

(一)处理目的5

(二)处理流程6

(三)常见技术方法9

四、数据去标识化规程12

(一)处理目的12

(二)处理流程13

(三)常见技术方法18

五、数据匿名化规程21

(一)处理目的21

(二)处理流程21

(三)常见技术方法25

六、数据处理环境要求29

(一)管理制度要求29

(二)技术能力要求30

(三)人员能力要求30

(四)过程控制要求30

(五)事故管理要求31

附件一:常见直接标识符和准标识符示例32

附件二:常见标识符的去标识化或匿名化参考36

附件三:部分数据处理技术方法应用建议40

参考资料43

表目录

表1数据清洗、去标识化、匿名化处理的技术特点和差异3

一、处理目标及相互关系

(一)数据清洗是数据可用的障

数据清洗是运用一定方法修正识别到的数据问题,实现数据的规范

性、完整性、一致性、准确性和可溯源性,提高数据质量的过程。数据

清洗旨在满足数据的可用性要求,是数据资源预处理的第一步,也是

证后续处理结果准确、科学、有效的重要一环。数据清洗作为数据后续

开发利用的基础,是数据去标识化和匿名化处理的前置步骤。

(二)去标识化是数据脱敏的关键

数据去标识化是指数据经过处理,使其在不借助额外信息的情况下

无法识别特定自然人或相关标识符的过程。数据去标识化处理强调标识

符的“不可识别性”,即对数据内含的相关敏感信息内容进行脱敏处理,

通过去除、替换、模糊等方法,达到不借助额外信息的情况下无法识别

特定自然人或相关标识符的效果。

数据去标识化与在先的标识形成过程分属数据处理的不同阶段

及场景。标识形成是产生数据的过程,使得被标识对象据此可以被组织

进行有效管理和开发利用。数据去标识化是标识数据产生后的加工处

理过程,旨在提升标识信息的安全防护水平,确敏感的标识内容不

被未经授权的主体获取和利用。去标识化处理是强化标识数据安全性

的重要障。例如,制造业企业通过对产品、零部件、设备进行标识,

形成了可精准定位产品和设备的数据资源,在委托外部第三方技术开

发商进行相关应用系统开发时,需要对含有敏感内容或涉及商业秘密

4

的数据进行去标识化处理。

数据去标识化处理暗含了相关标识符具有“复原”的可能,去标

识化无法单独实现匿名化的法律效力。例如,对个人信息进行去标识

化处理后的数据,仍属于个人信息范畴。

三()匿名化是去标识化的强化

数据匿名化是指数据经过处理,无法识别特定自然人或相关标识符

且不能复原的过程。数据匿名化处理在强调标识符的“不可识别性”

基础上,要求标识符同时满足“难以复原性”标准,是数据去标识化的

进一步处理,即数据去标识化后应用相关技术使相关标识符难以复原的

过程。经匿名化处理后数据的初始效用将受到较大程度的改变。

5

与数据去标识化相比,经匿名化处理后的数据即便借助了额外信

也难以识别特定自然人和被处理的标识符。例如,对个人信

文档评论(0)

1亿VIP精品文档

相关文档