- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据管理前沿技术报告
- 7 -
- 8 -
大数据隐私问题与挑战
—2016 (首届)中国隐私保护学术会议
1. 引言
2016 年11 月7 日,由中国保密协会隐私保护专业委员会主办,中国人民大学承办的
“2016 (首届)中国隐私保护学术会议”,在中国人民大学艺术学院音乐厅成功召开。本次
会议是国内隐私保护领域的一次最重要的盛会,会议由中国人民大学孟小峰教授、信息工程
研究所信息安全国家重点实验室林东岱主任担任大会主席,来自国内外的两百余人参加本次
会议。
会议共邀请到佐治亚理工大学Ling Liu 教授,中国人民大学孟小峰教授,阿里巴巴集团
安全部技术杜跃进副总裁,中国信息通信研究院技术与标准研究所何宝宏副所长,中国科学
院软件研究所丁丽萍研究员,西安交通大学桂小林教授,复旦大学周水庚教授,中国电科三
十所安红章高级工程师,贵州大学彭长根教授和东南大学倪巍伟教授十位专家学者参加会
议,并就大数据下的新的隐私问题、隐私模型、隐私保护技术、隐私问题的挑战等几个议题
展开讨论。
2. 隐私问题与挑战
大数据研究的前提是数据开放与共享。然而在现实情况中,大量数据处于闲置、孤岛状
态,因为数据的开放和共享可能会导致隐私的泄露,很多数据拥有者或者管理者不敢或不愿
开放、共享数据,导致工业界有数据、缺技术,而学术界有技术、缺数据。在这样的背景下,
隐私保护被提出,其是大数据应用成功的关键。通过隐私保护技术,寻求一些使用数据的方
法,既不妨碍第三方从带有敏感信息的数据集中获取信息,同时又避免隐私资料的泄露。
下面分别从各个专家学者的角度,介绍大数据下的隐私问题和挑战。
数据隐私的演化:概念和方法 (Ling Liu,美国佐治亚理工)
大数据时代给隐私保护技术带来极大的挑战,Ling Liu 教授就大数据下的数据开放和隐
私保护问题做了详细的报告。现如今,各式各样的网络媒体为数据的收集提供了便捷,然而
这些数据中却蕴含了大量的个人信息,如购物模式、家庭住址、医疗信息和社交信息等。直
接对这些蕴含敏感信息的数据进行分析无可避免会产生社会歧视等问题。
针对隐私保护问题,已经提出了诸如加密、访问控制、匿名化、变换和差分隐私等方法。
去标识符的方法已被广泛使用,然而简单去标识符却依旧无法抵御像链接攻击这样具有背景
知识的攻击,抑制和泛化等方法同样不可用。基于此提出的k 匿名、l 多样性和t 贴近性模
型由于良好的泛化性能而克服了这一点,此外还有基于敏感属性的数据变换、数据扰动等,
此类保护技术都是基于匿名化的思想,而最新提出的差分隐私保护技术则是基于背景知识
的,即使攻击者掌握了除欲攻击元组以外的所有背景知识,其仍无法推理该元组,因而得到
广泛的关注和研究。
大数据带来更加便捷的服务,然而其与数据隐私却存在着矛盾的关系。随着技术的发展,
- 9 -
为了获取个性化的服务,或是为了发展创新,常常以牺牲隐私为代价。那么,对于其中的矛
盾关系真的如此不可调和吗?Ling Liu 教授提出,在大数据的背景下,我们应该着眼于探索
以可用性为导向的隐私保护方法。此外,数据隐私应该包括个人和组织对数据收集、使用和
分析,甚至是交易的控制权。
大数据治理中的隐私保护 (孟小峰·中国人民大学)
在大数据驱动的管理与决策应用背景下,孟小峰教授对大数据隐私保护问题进行重新定
位与思考,提出了大数据隐私保护框架,并试图从数据管理的角度探讨主动隐私管理技术,
为大数据隐私技术提供新思路和理论依据。主要讨论了以下四个方面:
隐私问题:大数据时代数据的共享使得信息获取成本降低,原来以企业为主的信息构成,
变成了以人为主,也导致了隐私的问题急剧增加。数据治理是当下的热点问题,所谓数据治
理,就是要规范数据的使用和交易,对隐私进行有效保护。新的社会浪潮带来的隐私风险主
要来自于三个方面:多元异构数据的融合、大数据的深度分析、廉价的信息获取手段。这三
个方面使得隐私的问题更为迫切,也更具挑战。
隐私模型:将隐私重新分类为显式隐私 (用户自身公开的匿名的敏感信息)和隐式隐私
(由第三方所搜集的用户自身并不了解的敏感信息)
原创力文档


文档评论(0)