- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
面向隐私保护的个性化k-匿名的研究要点
CCSEC 面向隐私保护的个性化k-匿名的研究 CCSEC 申艳光 教授 河北工程大学 概 述 本课题拟针对现有数据发布隐私保护技术在k-匿名化过程中没有考虑敏感属性的个性化敏感决策度的问题,提出一种新的k-匿名模型,以满足敏感属性个性化敏感决策度的要求。 重点尝试将粒计算理论和技术引入到新的K-匿名模型中,首先对电子商务中发布的数据进行粒度划分,建立敏感属性决策粒度空间;然后对划分后的发布数据的敏感粒空间实行不同级别的k-匿名,构造基于粒计算和个性化隐私决策度的个性化k-匿名模型,并设计出相应的定义及算法描述,旨在减少数据发布过程中所造成的隐私泄漏和过分匿名现象,提高数据发布的可靠性和精确度,为隐私保护技术在个性化服务中的应用建立必要的理论、方法和技术基础。 主要内容 4 预期成果 3 工作条件 2 研究内容、目标、方案和进度及关键问题 1 研究意义及研究现状 1 研究意义及研究现状 1.1 研究意义 1)传统的访问控制技术和加密技术核心思想是保护数据的隐秘性,保证它不被非授权的第三方访问。匿名隐私保护技术的核心是要保护隐私数据与个体之间的对应关系。 数据 访问控制技术和加密技术的核心 保护 匿名隐私保护技术的核心 保护 数据 1 研究意义及研究现状 2) K-匿名化可以有效的防止通过对已发布数据与外部数据的链接造成的标识泄露问题,并在匿名化的过程中,在保护信息隐私的同时提高数据的可用性。 3)隐私自治是隐私保护的重要原则之一,这就要求在实现k-匿名化过程中考虑到个体不同的隐私需求,制定个性化的隐私约束。 4)个性化隐私保护对实现保护隐私的数据挖掘、数据共享,推动电子政务、电子商务等领域的发展有着重要的理论意义和实用价值。 1 研究意义及研究现状 1.2 国外研究现状 美国卡基梅隆大学的Samarati和Sweeney博士首先研究用于公共数据库或数据发布的匿名隐私保护算法并在2002年命名为K-匿名算法。 K-匿名的缺陷在于没有对敏感数据做任何约束,攻击者可以利用一致性攻击和背景知识攻击,来推断出敏感数据与个体的联系,从而导致隐私泄露。为了解决这类问题,许多学者对k-匿名进行了改进。Machanavajjhala等人提出了l-diversity k-匿名模型;Wong. R. C等人提出了(a,k)-匿名模型;Li Ninghui等人提出了t-closeness k-匿名模型;Traian T.M等人提出了p-Sensitive K-匿名模型。X.Xiao等人提出了Anatomy k-匿名模型。 这些模型存在着一定的缺陷:对所有敏感属性都采用同样的约束,没有考虑到数据拥有者与数据提供者对敏感属性数据的个性化隐私保护的需求,不能满足实际需要。 1 研究意义及研究现状 1.3 国内研究现状 近年来,国内隐私保护及其k-匿名技术的研究已逐步展开。东北大学杨晓春等人提出多约束K-匿名化方法Classfly+及相应的3种算法, 继承了基于有损连接对隐私数据进行保护的思想,又提出了针对多敏感属性隐私数据发布的多维桶分组技术。中南大学的黄春梅等人提出多维泛化路径的概念及相应的 2种 K一匿名算法,提高匿名数据精度和处理效率。重庆大学王茜等人基于敏感属性分组提出了一种(p,a)-sensitive k-匿名模型,将敏感属性根据敏感度进行分组,然后给各分组设置不同的约束, 增强了数据发布的安全性。 以上这些k-匿名方法同样缺乏隐私保护的个性化决策机制。 2 研究内容、目标、方案和进度及关键问题 2.1 研究内容和目标 2.2 研究方案 2.3 研究进度 拟解决的关键问题 2.4 2.1 研究内容和目标 1)个性化隐私保护粒度空间的研究。 个体对敏感属性隐私保护程度的选择具有相同性、相异性以及不确定性。例如:对于同一个敏感属性值X,有的个体会认为X值的敏感程度很高,不应该对外发布;有的个体会认为X值的敏感程度低,可以对外发布;而有的人则会认为X值的敏感程度一般,发布与否都没有明确的选择。 2.1 研究内容和目标 本课题结合粗糙集中的上近似、下近似、边界域等划分方法首先对本模型中个性敏感度集合进行粒度化分,以产生基于敏感属性决策度粒度的数据发布粒度空间,为进一步实现个性化的隐私保护奠定基础。 数 据 敏感属性决策度 上近似域 下近似域 边界域 粒化 2.1 研究内容和目标 2)基于隐私保护粒度空间的数据发布模型的研究。 分析现有的数据发布隐私保护匿名技术个性化不足的问题,结合最新的k-匿名理论与方法,在进行个性粒度化隐私保护空间划分后,根据不同隐私保护粒度空间中敏感级别
文档评论(0)