针对k-匿名隐私数据判定树和关联规则算法与研究.pdfVIP

  • 9
  • 0
  • 约5.86万字
  • 约 46页
  • 2015-10-03 发布于安徽
  • 举报

针对k-匿名隐私数据判定树和关联规则算法与研究.pdf

优秀毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!

针对k一匿名隐私数据的判定树和关联规则算法的研究 摘要 数据可用性问题是k.匿名隐私保护模型带来的一个具有挑战性问题。1998 年L.s、Ⅳeedy提出了保护用户隐私的k-匿名隐私保护模型,泛化准标识符,虽然 保护了用户的隐私但是大大降低了数据的可用性,之后为了在保护隐私的同时提 高数据的可用性,研究人员对k-匿名隐私保护模型进行了改进,但是受隐私保护 要求的制约,即使最优化的k.匿名算法,也不可能产生完全精确的数据,因此, 改进k.匿名算法只能在一定程度上提高数据的可用性,不可能彻底解决问题。 数据挖掘问题是提高k.匿名隐私保护模型下数据可用性问题之一。通过分析 发现生成k.匿名表时所利用的泛化树同利用精确表生成的判定树的部分非叶结 点的属性值的概化过程有相同之处。由此文中提出了一种基于k.匿名表的判定树 生成算法,该算法直接以k匿名表作为输入,避免了经典的判定树算法运行前的 准备工作,该算法比经典的判定树算法在时间上有明显地改善。 判定树算法是重要的分类和预测的数据挖掘算法。文中提到了四种匿名化分 类情况,分别为:(1)利用匿名化数据建立模型,来分类匿名化数据。(2)利用 匿名化数据建立数据模型,分类原始数据。(3)利用精确数据建立模型,来分类 匿名化数据。(4)利用匿名化数据分类分布式数据。改进的判定树算法是利用匿 名化数据作为输入的,即利用匿名化数据建立的模型。所以文中对前两中分类情 况做了详细的论述。 关联规则的发现是数据挖掘中重要的研究分支,是发现大量数据中项集之间 有趣的关联或相关联系。在关联规则挖掘算法中,根据规则集所涉及的抽象层可 将规则分为多层关联规则和单层关联规则。所谓多层关联规则即规则中的项为精 确表中项的泛化,且在很多应用中在底层或原始抽象级别上很难发现数据项间的 强关联规则,一般情况下都需要挖掘多层关联规则。从这层意义上来说,多层关 联规则的挖掘同k.匿名泛化过程是有共同点的。同时由于k.匿名数据是一种特 殊的不确定数据,文中对经典的Apriori算法进行改进,使其适合k.匿名隐私保 护模型。实验结果表明,文中提出的算法行之有效。 关键字:k一匿名,判定树,关联规则,数据挖掘 AND DECISIoNTIⅧE THEALGORITHMoF FoRK.ANONYMITYDATA ASSoCIATIoNRULES ABSTRACT The ofdata isa for 1998, k-锄onymit),data.In pmblem utility challeI培ingproblem misedme model,generalizedquasi-identifier.Altllough L.Sweedy k-锄onymityprivacyprotection ordert0 me itcaIl me dataof data.In protect privacy uSers,髀atlyreducing廿1eutil时of protect researcher ofuSerSandto the datainthes锄etime.The iIllproVed廿le privaCy improveutili哆of me model.Butit is constmined k一卸0nym毋

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档