- 1、本文档共65页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
f嘲煳
多敏感属性微数据隐私保护匿名模型及算法研究
摘要
网络时代涌现了大量与个体相关数据,即微数据,微数据对趋势分析,疾病预
测以及经营决策具有重要的意义,因此很多组织开始收集和发布一些微数据,如医
院会发布患者的医疗数据用于帮助医疗事业的研究与发展。然后,微数据的发布会
对隐含在微数据中的个体隐私构成威胁。因此,近年来数据发布隐私保护的研究成
为数据挖掘领域的研究热点。至今,该领域已出现了很多研究成果,然而这些成果
多是面向单敏感属性的,而现实生活中存在大量多敏感属性微数据,单敏感属性的
匿名模型及算法无法直接应用于多敏感属性微数据,因而,开展对多敏感属性微数
据隐私保护模型及算法的研究具有重要意义。
在多敏感属性微数据隐私保护的研究中,需要建立适合多敏感属性数据的匿名
模型保证数据发布的安全性,同时还需要研究实现匿名模型的相应算法。本文从匿
名化模型及相应的算法两方面,对多敏感属性微数据发布中的隐私保护问题进行了
研究,具体工作有:
(1)提出抵制多敏感属性关联攻击的(,,垅).多样性模型。现有的微数据发布隐私
保护匿名模型均没有考虑敏感属性间的关联关系,不能抵制基于敏感属性间关系的
攻击。为此,论文提出抵制敏感属性关联攻击的(,,聊).多样性模型,该模型要求匿
名数据的每个等价类中,每维敏感属性上多样性至少为,,并且当某一敏感值从等
价类中删除后,该等价类剩下的敏感值仍满足(,.1,聊)一多样性。本文也提出了实现(Z,
法能很好的实现面向多敏感属性的(,,聊)一多样性模型,有效保护多敏感属性微数据
的个体隐私。
(2)提出SLOMS框架:一种面向多敏感属性的数据发布隐私保护方法。多维桶
技术是匿名化多敏感属性数据较好的方法,然而在敏感属性数据较多时该方法会造
成较大隐匿率。另外,该方法不泛化准标识属性容易受到连接攻击。为此,本文提
出一种SLOMS方法,该方法将多敏感属性划分成多个表,分别对每个敏感属性表
摘要
进行厶多样性分组,并且对准标识属性进行肛匿名泛化。本文也提出了一种基于
生的匿名数据表较泛化和多维桶技术具有较小隐匿率和较少信息损失。
(3)提出面向多敏感属性隐私保护的分桶排列技术。分解技术是实现数据匿名
的较好技术,然而分解未对准标识符处理,存在安全隐患。对此,本文提出分桶排
列技术,该技术在分解的基础上,增加对准标识符的排列处理,同时结合多维桶分
组技术应用于多敏感属性隐私保护中。本文也提出实现分桶排列技术的两种算法
刈ⅧPA和CDMBPA。实验表明:两种算法均能较好的实现对多敏感属性数据
的匿名化,产生的隐匿数据具有较好的数据可用性和较低的隐匿率,有效对多敏感
属性隐私进行保护。
关键词:多敏感属性;隐私保护;(L,,2).多样性;SLOMS;分桶排列
II
Researchon Modelsand for
Microdata
Anonymity Algorithms
with
Multi—SensitiveAttributes
PrivacyPreserving
AB
STRACT
Thereare ofdata toindividualsintheInternetcalledmicrodata.
plenty relating age
Microdatahave ontrend and
greatsignificanceanalysis,diseaseprediction
文档评论(0)