K-匿名熵分类算法研究及分析.pdfVIP

  • 6
  • 0
  • 约1.36万字
  • 约 3页
  • 2017-09-01 发布于湖北
  • 举报
K-匿名熵分类算法研究及分析.pdf

第26卷第 12期 计 算 机 应 用 研 究 Vo1.26No.12 2009年 12月 ApplicationResearchofComputers Dec.2oo9 匿名熵分类算法研究及分析术 刘 坚 ,刘 晖 (东华大学 a.纺织面料技术教育部重点实验室;b.计算机科学与技术学院,上海201620) 摘 要:提 出了一种新的 匿名模型对隐私信息进行保护 ,将熵分类的方法应用于 匿名模型上 ,实验表明该 模型的有效性,利用该模型对数据进行 匿名处理后,确保共享数据具有很高的精确度,尽可能接近原始数据, 同时有效地防止隐私信息的泄露。 关键词:K-匿名;熵;数据挖掘;隐私保护 中图分类号:TP309.2 文献标志码:A 文章编号:1001—3695(2009)12—4728-02 doi:10.3969/j.issn.1001—3695.2009.12.093 Studyandanalysisofentropyclassificationalgorithm forK—anonymity LIU Jian .LIU Hui (Ⅱ.KeyLaboratoryofTextileScience&TechnologyforMinistryofEducation,b.SchoolofComputerScience&Technology,DonghuaUniversi- ty,Shanghai201620,China) Abstract:ThispaperputforthanewK-anonymitymodeltoprotecttheprivateinformation,appliedthemethodbasedonen- tropyclassificationtoit,andvalidatedthevalidityofthemodelthroughexperiment.Themodelensuredprecisionofthesha— ringdataafterK-anonymitykepttheconsistencywiththeoriginaldatautmostly,meanwhile,preventedprivateinfomrationfrom disclosureeffectively. Keywords:K-anonymity;entropy;datamining;privacyprotection 数据隐私是数据库安全特有问题 ,伴随着数据共享带给人 病等隐私信息。如某一个体是已婚女性,年龄为30岁 ,居住在 们的隐私安全问题表现得也越来越令人担忧,隐私数据的保护 401435区。如果该记录是惟一的,通过对表 1、2的链接,推得 就显得尤为重要。通过访问控制可以有效地保护隐私数据的 “小丽,朝阳路22号 ,上海,30,女 ,401435,已婚,癌症”,从而 安全 ,防止非法用户的非授权使用,但是无法避免用户利用非 具体的个体小丽得癌症的隐私信息被泄露。 匿名技术的提 敏感数据通过链接攻击 访问隐私数据,这是一种非常严重 出,能够有效地防止上述针对隐私数据的链接攻击。 的隐私泄露问题。1998年Sweeney 提出了一种用来保护隐 表 1 隐私表 (医疗系统病人信息) 私信息的 匿名模型。文献 [3]证明,获得最佳的 匿名数据 是 NP完全问题。现在有许多利用泛化和隐匿技术来实现 匿名的算法,可以分成基于泛化的层次算法和无层次泛化算法 两类。 匿名研究的对象是针对个人隐私信息的保护,即对于 对外公布共享的数据信息隐藏具体的个体的相关链接信息,防 止针对相关个体隐私数据的链接攻击。本文首先介绍了 匿 名技术的相关概念,以及 匿名的实现方法,然后提出了一个 新的应用熵分类的 匿名实现模型,并对模型的有效性和可 靠性进行了研究。 1 基本概

文档评论(0)

1亿VIP精品文档

相关文档