第7课 数据挖掘的高级主题.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一、隐私保护数据挖掘简介 What Why Who Goal How An Example * 感谢你的观看 2019年5月18日 什么是数据挖掘 数据挖掘是从大量数据中提取或“挖掘”知识的过程。 数据挖掘以客观、有效的数据源为物质基础。 数据挖掘得到的知识是一种数据归纳的结果,是一种统计的知识。 * 感谢你的观看 2019年5月18日 什么是隐私 针对不同的应用环境,隐私定义不同。 在信息时代,隐私指用户隐藏个人信息的权利和控制自己的信息给其他人的能力。 * 感谢你的观看 2019年5月18日 什么是隐私保护数据挖掘 “getting valid data mining results without learning the underlying data values” 噪声背景的数据挖掘 受限制的数据挖掘 * 感谢你的观看 2019年5月18日 数据挖掘可能会违反用户的隐私 数据挖掘以准确的数据为数据源,进行数据归纳分析。 个体隐私 记录级和属性级上的隐私 组织隐私 结果级上的隐私,统计分析后的结果 * 感谢你的观看 2019年5月18日 什么人需要隐私保护数据挖掘? 政府和公用事业部门 疾病控制中心 保险公司 工商业组织 跨国公司 每个国家的法律是不同的 军事情报分析 犯罪行为分析 反恐分析 * 感谢你的观看 2019年5月18日 隐私的限制不会阻止数据挖掘 数据挖掘的目标是结果的总结 关联规则 分类 聚类 结果本身不会违反隐私 不包含个人身份信息 反映的是整个数据的归纳统计结果,而不是针对每个单位 The problem is computing the results without access to the data! * 感谢你的观看 2019年5月18日 隐私保护数据挖掘的目标 PPDM encompasses the dual goal of meeting privacy requirements and providing valid data mining results. 保护隐私和满足安全性要求(安全性) 产生正确的数据挖掘归纳结果(准确性) 提供高效的数据挖掘算法(高效性) Accuracy Efficiency Privacy * 感谢你的观看 2019年5月18日 如何进行隐私保护数据挖掘 * 感谢你的观看 2019年5月18日 计算频繁项集:ABC ≥ 5%? 2 ABC=9 DBSize=200 1 ABC=18 DBSize=300 3 ABC=5 DBSize=100 ABC: R+count-freq.*DBSize R=17 ABC: 17+5-.05*100 ABC: 17 ABC: 17+9-.05*200 ABC: 12 ABC: 12+18-.05*300 ABC: 19 ABC: 19 ≥ R? ABC: YES! * 感谢你的观看 2019年5月18日 计算频繁项集:ABC ≥ 5%? 2 ABC=9 DBSize=200 1 ABC=18 DBSize=300 3 ABC=5 DBSize=100 ABC: R+count-freq.*DBSize R=17 ABC: 17+9-.05*200 ABC: 12+18-.05*300 ABC: 19 ≥ R? ABC: YES! * 感谢你的观看 2019年5月18日 二、隐私保护数据挖掘 隐私保护数据挖掘分类 保护个体用户隐私 保护组织用户隐私 研究方法 数据隐藏 安全多方计算 * 感谢你的观看 2019年5月18日 保护个体用户隐私 这是一种记录和属性级上的隐私保护。在原始数据库中,类似于标识符、姓名、地址和喜好等用户数据作为用户的隐私应该被保护。保护敏感的原始数据的隐私保护数据挖掘方法应该能够使得用户的敏感的原始数据被修改,以便数据的使用者不能对用户的原始数据进行直接存储,不能查看用户的隐私,以此保护用户的私有数据。 * 感谢你的观看 2019年5月18日 个体隐私: 保护记录 每个项都不允许泄漏 记录的一部分是可以泄漏的 个人身份信息 * 感谢你的观看 2019年5月18日 个人身份信息 删除标识符 但是我们无法保证身份不能被推断 候选码 一些个体特有的属性 Data Mining enables such tracing! * 感谢你的观看 2019年5月18日 保护组织用户隐私 这是一种结果级上的隐私保护,这里的目标不仅是保护个体用户的不被泄漏,而且一些重要的策略模式和数据挖掘之后的结果同样不能泄漏,在商业领域,这些模式被认为是能够提供有竞争力好处的知识,隐私必须被很好地保护。在数据挖掘的统计模型中,有很多挖掘出的知识也会泄漏用户的隐私。保护敏感的挖掘知识的隐私保护数据挖掘方法能够保护用户的敏感知

文档评论(0)

WUYH168 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档