大数据安全与隐私保护24张.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据安全与隐私保护 大数据的现状1大数据研究概述2大数据服务与信息安全53大数据带来的安全挑战64小结大数据安全与隐私保护关键技术大数据安全与隐私保护为什么我们要研究大数据?在科学界《Nature》和《Science》都推出了大数据专利对其展开探讨,意味着大数据成为云计算之后的信息技术领域的另一个信息产业增长点。一、大数据的现状当今,社会信息化和网络化的发展导致数据的爆炸式增长,据统计,平均每秒有200万的用户在使用谷歌搜索,各行业也有大量数据在不断产生。缺点:安全与隐私问题是人们公认的关键问题。大规模 人机高速性物多样性 大数据二、大数据研究概述特点来源123分析掌握个性化特征企业通过长时间、多维度的数据积累,可以分析用户行为规律,为用户提供更好的个性化产品和服务,以及更精确的广告推荐。获得知识与推测趋势由于大数据包含大量原始、真实信息,大数据分析能够有效摒弃个体差异,帮助人们透过现象把握规律。通过分析辨别真相由于网络中信息的传递更变便利,所以网络虚假信息造成的危害也更大。目前人们开始尝试利用大数据进行虚假信息的识别。大数据分析目标数据采集与预处理由于大数据的来源不一,可能存在不同模式的描述,甚至存在矛盾。因此。在数据集成过程中对数据进行清洗,以消除相似、重复或不一致的数据是非常必要的。数据分析分为三类:计算架构,查询与索引,数据分析和处理。数据解释旨在更好地支持用户对数据分析结果的使用,涉及的主要技术为可视化和人机交互。大数据技术框架三、大数据带来的安全挑战大数据中的用户隐私保护大数据带来的安全挑战大数据的可信性如何实现大数据的访问控制大数据带来的安全挑战如何实现大数据访问控制用户隐私保护大数据的可信性不仅限于个人隐私泄漏,还在于基于大数据对人们状态和行为的预测。目前用户数据的收集、管理和使用缺乏监管,主要依靠企业自律威胁之一是伪造或刻意制造数据,而错误的数据往往会导致错误的结论。威胁之二是数据在传播中的逐步失真。(1)难以预设角色,实现角色划分;(2)难以预知每个角色的实际权限。角色挖掘技术数据发布匿名保护技术51风险自适应的访问控制社交网络匿名保护技术62数据水印技术3数据溯源技术4四、大数据安全与隐私保护关键技术K匿名方案优势一定程度上保护了数据的隐私,能够很好的解决静态、一次发布的数据隐私保护问题劣势不能应对数据连续多次发布、攻击者从多渠道获得数据的问题的场景。数据发布匿名保护技术数据发布匿名保护技术是对大数据中结构化数据实现隐私保护的核心关键与基本技术手段典型例子:K匿名方案 k-匿名技术要求发布的数据中存在 一定数量(至少为k) 的在准标识符上不可区分的记录,使攻击者不能判别出隐私信息所属的具体个体,从而保护了个人隐私12基于超级节点对图结构进行分割和集聚操作不足:牺牲数据的可用性边匿名方案多基于边的增删,用随机增删交换便的方法有效地实现边匿名不足:匿名边保护不足社交网络匿名保护技术社交网络中典型的匿名保护:1、用户标识匿名与属性匿名,在数据发布时隐藏了 用户的标识与属性信息2、用户间关系匿名,在数据发布时隐藏了用户间的关系常见社交网络匿名保护数据水印技术数据水印是指将标识信息以难以察觉的方式嵌入在数据载体内部且不影响其使用方法,多见于多媒体数据版权保护,也有针对数据库和文本文件的水印方案。前提:数据中存在冗余信息或可容忍一定精度的误差案例:1、Agrawal等人基于数据库中数值型数据存在误差容忍范围,将少量水印信息嵌入到这些数据中随机选取的最不重要位上。2、Sion等人基于数据集合统计特征,将水印信息嵌入属性数据中,防止攻击者破坏水印基于文档结构微调的水印文本水印基于文本内容的水印基于自然语言的水印数据水印技术数据水印技术应用:强健水印类可用于大数据起源证明,脆弱水印类可证明数据的真实性存在的问题:当前方案多基于静态数据集,针对大数据的高速产生与更新的特性考虑不足数据溯源技术自身的安全性保护数据溯源与隐私保护之间的平衡数据溯源技术数据溯源技术目标是帮助人们确定数据仓库中各项数据的来源,也可用于文件的溯源与恢复基本方法:标记法,比如通过对数据进行标记来记录数据在数据仓库中的查询与传播历史面临的挑战①以可视化形式,通过用户权限二维图排序归并方式进行角色提取②非形式化:子集枚举以及聚类的方法提取角色③基于形式化语义分析、通过层次化挖掘来更准确提取角色角色挖掘技术角色挖掘:根据现有“用户-对象”授权情况,设计算法自动实现角色的提取与优化。典型工作:风险自适应的访问控制风险自适应的访问控制是针对在大数据场景中,安全管理员可能缺乏足够的专业知识,无法准确的为用户指定其可以访问的数据的情况。案例:基于多级别安全模型的风险自适应访问控制解决方案、基于模糊推理的解决方案等难点:在大数据环境中,风险的定义和量化都比以往更加

文档评论(0)

118books + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档