基于关联规则挖掘的隐私数据保护.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信 息 技 术 SC_ENCE&TECHN0L00Y, 圜 基于关联规则挖掘的隐私数据保护 吴 方 (福建医科大学数理计算机教学部 福州 350000) 摘 要:隐私数据保护是 目前网络安全关注一个热点之一 ,随着数据挖掘技术的不断发展,恶意用户可以使用相关技术推理出正常用户 的隐私信息。在提出关联规则的前提下,提 出了一种基于关联规则挖掘的穗私数据保护方法,对数据进行规则隐藏,从而保护用户的隐 私数据。 关键词:关联规冀{ 隐私 数据挖掘 中图夯类号:TP3 文献标识码:A 文章编号:1672—3791(2008)11(b)一0021—02 任何事情都有其两面性 ,数据挖掘领 关联规则是形如A B的蕴涵式 ,其中 显然 ,当数据库中不存在未知值(例如 域也不例外,在挖掘数据产生财富的同时 , ACI,BCI,并且AnB= 。规则AjB在事 用 “? 标记的值)时,有minconf(A B) 随之产生的就是隐私泄露 的问题。随着数 务集D中成立 ,具有支持度S和置信度C,它 =maxconf(A B)成立。在数据隐私变换过 据挖掘技术的发展 ,大量的私人信 息如购 们的概率分别是P(AUB)和P(BIA)。即是 程中,当我们开始放入 “?”时,最小值和最 物 习惯 、犯罪记录、病史、信用记录等通 Support(AjB)=P(AUB) 大值将开始分离 ,并且规则的不确定度开 过应用数据挖掘技术被广泛 的收集和分 Confidence(A~B)=P(BIA) 始增加。 析。一方面 ,这些数据对于政府、商业组织 支持度表明了AjB模式发生的概率 , 2.2敏感性规则隐藏的思想方法 决策和提供社会福利如医疗研 究、减少犯 置信度表明了蕴涵的强度。同时满足最小 给定最小支持度和最小置信度 阈值 , 罪、国家安全等是很重要的l21。另一方面 , 支持度 阈值 (min—sup)和最小置信度阈值 从数据库中抽取出一组规则R,我们假定规 因为数据挖掘揭示了不容易发现 的模式或 (rain—conf)的规 0称为强规则。一般地 ,由 则集R中哪些规则是敏感的是 由领域专家 各种知识 ,如果不正确使用的话 ,它可能对 用户给定最小支持度和最小置信度阑值 , 决定。规则隐藏算法的 目的是使得敏感性 隐私和信息安全构成威胁 。公开分析大量 发现关联规则的任务就是从数据库 中发现 规则对关联规则挖掘算法不可见,同时尽 的私人数据还可能是对个人隐私的一种侵 那些支持度和置信度都大于给定阈值的强 可能少地影响留下的非敏感性规则 ,以便 犯 。在数据挖掘工具和电信与计算机网络 规则,也就是说 ,挖掘关联规 0的关键是在 尽可能高地保持数据质量 。 日益普 及的今天 ,数据挖掘要面对 的一个 大型数据库 中发现强规则。 为了隐藏规则AjB,我们可以或者把 重要 问题是隐私保护和信息安全 ,开发有 项的集合称为项集 (itemset),包含k个 项集 AB的支持度降低到最小支持度阈值 关的方法或集成技术,以便在适当的信息 项的项集称为k一项集 。项集 的出现频率 MST以下 ,或者可以把置信度降低到最小 访 问和挖掘过程 中确保隐私保护和信息安 是包含项集的事务数 ,简称为项集的频率 置信度阀值MeT以下。这可以由用 “? 取 全变得非常迫切。这样便使数据挖掘本身 或支持计数 。若项集的出现频率大干等于 代原真实值以增加支持度和置信度的不确 形成 了一个独立的新的领域”一’1。 rain— sup与D中事务总和的乘积,则项集满 定性 (支持度和置信度 区间长度)来完成。 足最小支持度min—sup,此时称为频繁项集 ①如果采用的是通过降低支持度来隐 1关联规则 (FrequentItemset),频繁k一项集的集合通 藏规则AB,那么唯一 的办法就是用 AB中 关

文档评论(0)

jingpinwedang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档