隐私保护中K-匿名算法与匿名技术研究.pdf

摘要 数据挖掘和数据发布是当前数据库应用的两个重要领域。一方面,数据挖掘与知识发现在各 式各样的数据应用领域中都扮演着非常重要的角色。数据挖掘的目的在于从大量的数据中抽取 出潜在的、有价值的知识、模型、规则等;另一方面,数据发布是将数据库中的数据直接地展现给 用户,而在各种数据应用中,如果数据发布者不采取适当的数据保护措施,将可能造成敏感数据的 泄漏,从而给数据所有者带来危害。例如从医院的病历数据中挖掘关联规则,以进行疾病的预防 与控制。医院的病历数据就包含了特定的个人忠有某种疾病的隐私信息。所以,如何在数据的发 布和使用中保护个人隐私成为了一个越来越严峻的话题。 数据匿名化是实现隐私保护的一个有效手段,其基本思想是通过改变(概化、压缩等)原始数 据中的部分数据,使改变后的数据无法和其他信息相结合而推理出关于任何个人的隐私信息。如 何对含有隐私信息的数据进行匿名化已经吸引了大量的研究工作,得到了研究者广泛的关注。具 体地说,实施数据隐私保护主要是考虑以下两个方面:(1)如何保证数据应用过程中不泄露隐私; (2)如何更有利于数据的应用。因此,如何在保护隐私的同时获得良好的数据可用性,这是学术界 和工业界都亟需解决的一个问题。 有鉴于此,本文的主要工作集中在保证足够的隐私力

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档