个人信息去标识化探讨.docVIP

  • 38
  • 0
  • 约3.52千字
  • 约 35页
  • 2020-06-08 发布于江苏
  • 举报
个人信息去标识化探讨 金涛 全国信安标委大数据安全标准特别工作组 大数据系统软件国家工程实验室 清华大学软件学院 2018年6月8日 《网络安全法》要求 第十八条 国家鼓励开发网络数 据安全保护和利用技术,促进 公共数据资源开放,推动技术 创新和经济社会发展。 第四十二条 网络运营者不得泄露、篡改、毁损其收集的 个人信息;未经被收集者同意,不得向他人提供个人信息。 但是,经过处理无法识别特定个人且不能复原的除外。 “匿名化”出现6次 “去标识化”总计出现12次 标识符概念 ? 标识符 identifier ? 微数据中的一个或多个属性,可以实现对个人信息主体的唯一识别。 ? 直接标识符 direct identifier ? 微数据中的属性,在特定环境下可以单独识别个人信息主体。例如:姓名、身份证号、护照号、 驾照号、地址、电子邮件地址、电话号码、传真号码、银行卡号码、车牌号码、车辆识别号码、 社会保险号码、健康卡号码、病历号码、设备标识符、生物识别码、互联网协议(IP)地址号和 网络通用资源定位符(URL)等。 ? 注:特定环境指个人信息使用的具体场景。比如,在一个具体的学校,通过学号可以直接识别出 一个具体的学生。 ? 准标识符 quasi-identifier ? 微数据中的属性,结合其它属性可唯一识别个人信息主体。比如:性别、出生日期或年龄、事件 日期(例如入院、手术、出院、访问)、地点(例如邮政编码、建筑名称、地区)、族裔血统、 出生国、语言、原住民身份、可见的少数民族地位、职业、婚姻状况、受教育水平、上学年限、 犯罪历史、总收入和宗教信仰等。 去标识化与脱敏的区别 ISO/IEC 20889 Information technology - Security techniques -- Privacy enhancing data de-identification techniques 去标识化 de-identification 遮蔽 删除 …… ISO/IEC 27038 Information technology — Security techniques — Specification for digital redaction 脱敏 redaction 标识信息 敏感信息 去标识化核心任务 ? 降低区分度 ? 断开和个人信息主体的关联 识别是特定人的信息 识别是同一个人的信息 个人信息主体 不能识别是同一个人的信息 常用去标识化技术和模型 统计 加密 抑制 假名 泛化 随机 合成 K匿名 差分隐私 统计技术(Statistical techniques) ? 数据抽样(Sampling) ? 因为是部分数据,无法确定主体是否被抽中 ? 数据聚合(Aggregation) ? 统计结果,无个体信息 密码技术(Cryptographic techniques) ? 确定性加密(Deterministic encryption) ? 保序加密(Order-preserving encryption) ? 保留格式加密(Format-preserving encryption) ? 同态加密(Homomorphic encryption) ? 同态秘密共享(Homomorphic secret sharing) 抑制技术(Suppression techniques) ? 屏蔽(Masking) ? 局部抑制(Local suppression) ? 记录抑制(Record suppression) 440524188*****0014 假名化技术(Pseudonymization techniques) ? 独立于标识符的假名创建 ? 基于密码技术的标识符派生假名创建 泛化技术(Generalization techniques) ? 取整(Rounding) ? 如果取整基数为10,观察值为7,应将7向上取整至10,概率为 0.7,若向下取整至0,概率为0.3。 ? 顶层与底层编码(Top and bottom coding) ? 如果一个人的薪水非常高,则可将该用户的薪水值设置为“高 于X元” 随机化技术(Randomization techniques) ? 噪声添加(Noise addition) ? 置换(Permutation) ? 微聚集(Microaggregation) 数据合成技术(Synthetic data) ? 根据需要,按照原始数据的特征生成数据 数据 输入 数据特 征分析 配置 按特 征生 成数 据 K-匿名模型(K-anonymity model) ? K-匿名模型要求发布的数据中,指定标识符(直接标识 符或准标识符)属性值相同的每一等价类至少包含K个记 录,

文档评论(0)

1亿VIP精品文档

相关文档