- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据下的隐私保护
陈克非
kfchen@sjtu.edu.cn
2014.11.12
西安、贵阳行
网上订机票引出的事
无处不在的大数据
网络应用,移动终端,穿戴设备,。。。
个人数据可以随处采集
例: Google预测流感趋势
2009.2.19,Nature上刊登了一篇关于Google预测flu trends的文章。
流行病学家发现,Facebook、Twitter这类社交网站和谷歌等网络搜索引擎,对于流感传播情况的了解,比世界卫生组织(WHO)或美国疾病控制与防御中心(CDC)等官方机构的报告来得还快。
通过Twitter上的数据,可提前八天预报。
大数据时代的安全
2019-12-25
5
典型的安全事件
系统类事件
2010.9, 发现Google员工利用职权查看了多个用户的隐私数据
2011.3, Google邮箱再爆大规模用户数据泄漏,涉及15万用户
2011.4, Amazon的EC2云计算服务被黑客租用,对Sony PlayStation网站进行了攻击,造成了大规模用户数据的泄露
2012.8,苹果公司的iCloud云服务受到黑客攻击,黑客暴力破解用户密码后,删除了部分用户资料,而云平台并未备份用户数据导致了用户数据的丢失,并致使用户Gmail和Twitter账号被盗
2014.8,美版“艳照门”iCloud数据外泄
2014.10,摩根800万客户资料泄露
斯诺登事件
貌似有信誉的商家如政府不靠谱,用户的安全需要自己把握
人肉搜索事件
对隐私造成巨大威胁且防不胜防
隐私是什么?
隐私一般是指仅与特定人的利益或者人身发生联系且权利人不愿为他人所知晓的私人信息、私人事务和私人领域。
隐私泄露的关键是某些数据、信息与个人发生关联,而作为个体的人则通过特定的个人标识信息信被准确锁定
个人辨识信息PII(Personal Identifiable Information):用户的姓名、手机号、身份证号、电子邮箱、住址、图片等;
个人相关信息:属于准标识符(Quasi-identifier),如年龄、性别、种族、职业、公司、遮挡的图片等,并不与任何PII直接联系在一起;
个人属性信息:是把个人准标识符进一步泛化的模糊信息,如青年人(或20-30岁)、南方人、白领、照片剪影等等。
注:1) 准标识符信息虽然不能直接指向具体的人,但是把这些条件组合在一起,还是很有机会匹配到确定的个体,从而有隐私风险。
2) 用进一步泛化的模糊用户属性解决“Quasi-identifier”的问题,也就是把能够辨识出个体的信息“虚化”,确保符合属性的个体有足够多的数量,从而无法准确与个体关联,这就所谓的k-anonymity概念。
显性隐私
隐性隐私
2019-12-25
7
需要保护的隐私
在网络环境,部分隐私就关呼个人数据的权利问题。所谓个人数据,是指用来关联个人基本情况的一组数据资料
①个人登录的身份、健康状况。在申请上网开户、免费邮箱以及申请服务商提供的其他服务时,服务商往往要求用户相关信息,服务商有义务和责任保守个人秘密,未经授权不得泄露。
②个人的信用和财产状况,包括信用卡、电子消费卡、上网卡、上网帐号和密码、交易帐号和密码等。个人在上网、网上消费、交易时,登录和使用的各种信用卡、帐号均属个人隐私,不得泄露。
③邮箱电址,不少用户不愿将之公开。掌握、搜集用户的邮箱并将之公开或提供给他人,侵犯了用户的隐私权。
④网络活动踪迹。个人在网上的活动踪迹,如IP地址、浏览踪迹、活动内容,均属个人的隐私。
⑤个人的图片和音像。通过图像识别技术,搜索引擎可以准确定位到人,并找到与之关联的其他资料
⑥其他。从部分已知信息挖掘关联出一系列个人其他资料(喜好习惯、生活规律等)。
8
例: 网上晒照片造成隐私泄露
某明星在上晒出居室照片被定位
通过分析照片
GoogleEarth
微博等各种信息
人肉搜索事件
2019-12-25
9
例:k-匿名技术
通过属性泛化实现模糊信息
2019-12-25
10
例:k-匿名技术的效用
k-匿名技术的核心,使符合相关属性的个体数目巨大,无法找到唯一解,至少增加求解的难度。
大数据时代的现状
存在“取之不尽,用之不竭”的关联数据、关联方程
搜索引擎和各种数据挖掘、数据分析、数据关联技术
云计算为代表的新型计算资源可以为大众提供廉价服务
有效保护隐私?
很难!
2019-12-25
11
保护隐私该做什么
用户自我保护意识
慎用云存储:上传重要、敏感数据尤其小心
不要随意注册:很多网站要求填写个人信息
小心玩社交网:朋友圈内的资料难保不被泄露
尽量不提供个人辨识信息,如网购送货到指定地点
服务提供商要担当
有义务保护用户数据
不得滥用用户资料
2019-12-25
12
加强隐私保护研究
研发隐私保护技术
您可能关注的文档
最近下载
- NB∕T 32037-2017 光伏发电建设项目文件归档与档案整理规范.pdf VIP
- 《我的鞋带我会系》小学一年级劳动教育PPT课件.ppt VIP
- 新发展研究生英语视听说-Unit1-Personality-Traits.ppt VIP
- 焦化厂工艺安全知识培训课件.pptx VIP
- 10-铁路运送行李、包裹.pptx VIP
- 英烈传大明山莺列传.pdf VIP
- 中国帕金森病治疗指南(第四版):精神及认知障碍的治疗.pdf VIP
- SL∕T 618-2021 水利水电工程可行性研究报告编制规程.pdf
- MSA-GRR数据自动生成工具.xls VIP
- 《“喜迎新中国成立76周年”国庆主题》课件.pptx VIP
文档评论(0)