- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
LOGO 大数据安全与隐私保护 作者:冯登国 张敏 李昊 中国科学院软件研究所 第一页,共二十五页。 大数据安全与隐私保护 大数据的现状 1 大数据研究概述 2 大数据带来的安全挑战 3 大数据安全与隐私保护关键技术 4 大数据服务与信息安全 5 小结 6 第二页,共二十五页。 一、大数据的现状 为什么我们要 研究大数据? 在科学界《Nature》和《Science》都推出了大数据专利对其展开探讨,意味着大数据成为云计算之后的信息技术领域的另一个信息产业增长点。 当今,社会信息化和 网络化的发展导致数 据的爆炸式增长,据 统计,平均每秒有 200万的用户在使用 谷歌搜索,各行业 也有大量数据在不 断产生。 缺点:安全与隐私问题是人们公认的关键问题。 第三页,共二十五页。 二、大数据研究概述 大数据 大规模 高速性 多样性 人 机 物 特点 来源 第四页,共二十五页。 大数据分析目标 1 获得知识与推测趋势 由于大数据包含大量原始、真实信息,大数据分析能够有效摒弃个体差异,帮助人们透过现象把握规律。 2 分析掌握个性化特征 企业通过长时间、多维度的数据积累,可以分析用户行为规律,为用户提供更好的个性化产品和服务,以及更精确的广告推荐。 3 通过分析辨别真相 由于网络中信息的传递更变便利,所以网络虚假信息造成的危害也更大。 目前人们开始尝试利用大数据进行虚假信息的识别。 第五页,共二十五页。 大数据技术框架 数据解释 旨在更好地支持用户对数据分析结果的使用,涉及的主要技术为可视化和人机交互。 数据分析 分为三类:计算架构,查询与索引,数据分析和处理。 数据采集与预处理 由于大数据的来源不一,可能存在不同模式的描述,甚至存在矛盾。因此。在数据集成过程中对数据进行清洗,以消除相似、重复或不一致的数据是非常必要的。 第六页,共二十五页。 三、大数据带来的安全挑战 大数据中的用户隐私保护 大数据的可信性 如何实现大数据的访问控制 大数据带来的安全挑战 第七页,共二十五页。 大数据带来的安全挑战 用户隐私 保护 大数据的可信性 如何实现 大数据访 问控制 不仅限于个人隐私泄漏,还在于基于大数据对人们状态和行为的预 测。 目前用户数据的收集、管理 和使用缺乏监 管,主要依靠 企业自律 威胁之一是伪造或刻意制造数据, 而错误的数据往往会导致错误的结论。 威胁之二是数 据在传播中的 逐步失真。 (1)难以预设角色,实现角色划分; (2)难以预知每个角色的实际权限。 第八页,共二十五页。 四、大数据安全与隐私保护关键技术 数据发布匿名保护技术 1 社交网络匿名保护技术 2 数据水印技术 3 数据溯源技术 4 角色挖掘技术 5 风险自适应的访问控制 6 第九页,共二十五页。 数据发布匿名保护技术 数据发布匿名保护技术是对大数据中结构化数据实现隐私保护的核心关键与基本技术手段 典型例子:K匿名方案 k-匿名技术要求发布的数据中存在 一定数量(至少为k) 的在准标识符上不可区分的记录,使攻击者不能判别出隐私信息所属的具体个体,从而保护了个人隐私 K匿名方案 优势 一定程度上保护了数据的隐私,能够很好的解决静态、一次发布的数据隐私保护问题 劣势 不能应对数据连续多次发布、攻击者从多渠道获得数据的问题的场景。 第十页,共二十五页。 社交网络匿名保护技术 社交网络中典型的匿名保护: 1、用户标识匿名与属性匿名,在数据发布时隐藏了 用户的标识与属性信息 2、用户间关系匿名,在数据发布时隐藏了用户间的关系 常见社交网络匿名保护 1 边匿名方案多基于边的增删,用随机增删交换便的方法有效地实现边匿名 不足:匿名边保护不足 2 基于超级节点对图结构进行分割和集聚操作 不足:牺牲数据的可用性 第十一页,共二十五页。 数据水印技术 数据水印是指将标识信息以难以察觉的方式嵌入在数据载体内部且不影响其使用方法,多见于多媒体数据版权保护,也有针对数据库和文本文件的水印方案。 前提:数据中存在冗余信息或可容忍一定精度的误差 案例: 1、Agrawal等人基于数据库中数值型数据存在误差容忍范围,将少量水印信息嵌入到这些数据中随机选取的最不重要位上。 2、Sion等人基于数据集合统计特征,将水印信息嵌入属性数据中,防止攻击者破坏水印 第十二页,共二十五页。 数据水印技术应用:强健水印类可用于大数据起源证明,脆弱水印类可证明数据的真实性 存在的问题:当前方案多基于静态数据集,针对大数据的高速产生与更新的特性考虑不足 数据水印技术 基于文档结构微调的水印 基于自然语言的水印 基于文本内容的水印 文本 水印 第十三页,共二十五页。 数
您可能关注的文档
- 打造高绩效执行精英团队.ppt
- 大数据时代的车联网大数据时代的车联网.ppt
- 大众斯柯达汽车经销商商务楼外展活动执行报告.ppt
- 第章生物氧化电子传递和氧化磷酸化作用.ppt
- 地产销售培训课件.ppt
- 财务会计实务项目二.ppt
- 第二课中国古代的土地制度课件(岳麓精品).ppt
- 第二章国际企业经营战略.ppt
- 财务报表审计的结构.ppt
- 代理商如何面向未来.ppt
- 2022小学西师大五年级下册语文课内阅读理解培优补差辅导专项练习题.pdf
- 五年级部编人教版语文下册课文内容阅读理解知识点巩固练习含答案.pdf
- 2024山东全员安全生产“大学习、 大培训、 大考试”考前测试题(含答案完整版720776922.pdf
- 消化科护士习题 .pdf
- 广东深圳宝安区2023~2024学年上学期七年级数学期末考前练习卷及参考答.pdf
- 幼儿园卫生保健规章制度(精选14篇) .pdf
- 2024北京朝阳初二(上)期末道德与法治(教师版) .pdf
- 2024年云南省成考(专升本)大学语文考试真题含解析 .pdf
- 沪版牛津小学英语全部词汇 .pdf
- 最新2020年电梯安全员模拟模拟题库588题(含标准答案) .pdf
文档评论(0)