网站大量收购独家精品文档,联系QQ:2885784924

表格数据的隐私保护方法-崔成钢.pdf

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

ThenameoftheDepartment

BeijingForestStudio

部门名称

北京理工大学信息系统及安全对抗实验中心

表格数据的隐私保护方法

硕士研究生崔成钢

2022年05月22日

内容提要

•背景简介

•基本概念

–表格数据隐私

–K匿名

–差分隐私

–生成对抗网络

•算法原理

–TableGAN

–CorGAN

•应用总结

•参考文献

2

预期收获

•预期收获

–1.了解表格数据隐私保护的基本方法

–2.了解生成对抗网络基本原理

–3.理解生成对抗网络如何学习表格数据特征

–4.了解应用领域和发展方向等

3

背景简介

•不同类型数据隐私保护方法:

4

背景简介

•真实案例-人口普查局

–每10年,美国人口普查局(USCensusBureau)都会问每个美国家庭一系列问

题,类似于我国的“人口普查”。这些问题包括:有多少人住在这里?他们多大了?

他们的工作情况?他们彼此之间有什么关系?

–在1990年之前,调查人员删除其中不到五个个人或家庭的数据

–从1990年到2010年,使用Swapping分两步进行。首先随机选择小地理区域的家庭;

然后在生成统计数据之前,这些家庭和其他人之间交换记录。这种交换过程的细节是

保密的,让人们更难设计攻击

5

背景简介

•真实案例-人口普查局

–对2010年的数据进行攻击,以更好地了解隐私风险。他们意识到这次攻击比预期要成

功得多。做更多次Swapping,同时他们并发现数据的效用将会受到灾难性的损失。

–为2020年人口普查发布的统计数据将被差分隐私(DifferentialPrivacy)进行保

护。在统计数据中添加噪音,在不泄露个人信息的情况下对统计数据进行发布。

6

基本概念

•表格数据隐私

–定义:单个用户的某些属性(不愿为他人公开或知道的)➔可以看到数据,但不能定

位到具体的人。

–方法:加密、K匿名、差分隐私

–加密:数据加密、传输加密、压缩加密

7

基本概念

•K匿名

–定义:发布数据存在K个在准标识符(在标识符和非敏感信息间)上不可区分的记录

•标识符:tId、name

•非敏感信息:disease、party

•准标识符:province、age、sex、zip

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档