摘要
隐私保护在现如今的各种数据应用中得到了越来越广泛的关注。这一现象源于两方
面的原因:一方面,数据库和网络技术的迅猛发展,使人们能方便地发布和共享数据,
这些数据中有可能包含涉及个人隐私的敏感信息。另一方面,人们越来越重视数据的价
值,期望通过数据挖掘和分析手段从中提取出重要信息以满足特定应用。在这样的场景
下,如何在数据发布和使用过程中尊重和保护个人隐私成为一个严峻的话题。
近年来提出的大量隐私保护方法都基于数据匿名化这一有效手段。其基本思想是:
通过改变原始数据中的部分数据值,降低敏感信息与特定个体的关联度,进而降低隐私
泄露的风险。然而,已有的匿名化研究都假设数据发布者拥有的数据是完整的、未经过
修改的微数据,从而只关注敏感属性上的各种约束,却没有讨论由于个人隐私自治而带
来的非敏感属性上的约束。
本文主要研究基于个人隐私约束的数据匿名化问题,一个在数据发布隐私保护领域
的全新问题。本文的主要研究成果包括:
1、提出了基于个人隐私约束的数据匿名化思想:将数据预处理和数据使用限制等
个人隐私自治行为归一化为个人隐私约束。并给出了基于概化层次和基于概化度的两种
个人隐私约束的定义。在此基础上形式化描述了基于个人隐私约束的数据匿名化问题。
2、提出了一个新的匿名化质量度量标准:信息损失增益。并将其应用于基于个人
隐私约束的数据匿名化场合。
3、证明了基于个人隐私约束的最优匿名化问题是NP难的,针对基于概化层次和
基于概化度的个人隐私约束,分别给出了启发式算法用于解决匿名化问题。大量的在人
工数据集和真实数据集上的实验评估证明,这两个算法具有良好的性能和匿名化效果。
4、探讨了个人隐私约束的实质,并通过将基于个人隐私约束的匿名化方法扩展到
能够适用于其他数据匿名化原则,来深入阐述基于个人隐私约束的数据匿名化的意义。
关键词:隐私保护、匿名化、个人隐私约束
中图分类号:TP39
III
Abstract
,
concernina
hasbecomeamoreandmoreserious ofdata
Privacypreserving variety applications,
which tworeasons:onone advancesi九databaseandnetwork
stemsfrom hand,the technology
enables to andshare data containsensitive
peopleeasilypublish data,however,thesemay
information theother is onthevalueof
involvingpersonalprivacy.On hand,theregrowingemphasis
informationdata and tomeet
toextractusefuI mining specific
data.People using analysis
expect
such to and individuaIindata and
application.Insituations,howrespectprotect privacy publishing
bec
您可能关注的文档
最近下载
- 2025年衢州市中考语文试题卷(含答案).docx
- 成人患者医用粘胶相关性皮肤损伤的预防及护理.pptx
- 北京版小学英语1至6年级词汇表(带音标).pdf VIP
- L13S2 给水工程标准图集.pdf VIP
- 2026年春季北师大版(2024)二年级下册数学教学计划附教学进度表.docx VIP
- 第6课华灯梦敦煌(课件)-岭南美版初中美术七年级下册.pptx
- 2023年主任医师(正高)-重症医学(正高)考试历年真题集锦附答案.docx VIP
- 建设工程工程量清单计价规则CQQDGZ-2013.ppt VIP
- 生物-江苏省苏州市2024-2025学年2025届高三第一学期学业期末质量阳光指标调研卷试题和答案.docx VIP
- 演出器材租赁合同(标准版).docx VIP
原创力文档

文档评论(0)