《物联网信息安全》课件第8章.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

6.l-多样性模型

l-多样性模型保证每一个等价类的敏感属性至少有l个不同的值。l-多样性使得攻击者最多以1/l的概率确认某个体的敏感信息。7.属性值的信息损失量

给定属性A,其值域为Dom(A),则属性值v∈Dom(A)泛化为v*的信息损失量ILvalue定义为

其中,|v*|和|Dom(A)|分别表示v*和属性A的可能取值数,对于连续型属性,表示为区间的长度;对于离散型属性,则表示为值域的基数。8.元组的信息损失量

给定元组t,t.Ai(1≤i≤d)表示t在属性Ai上的取值,则t泛化为t*的信息损失量ILtuple定义为

其中,wi表示t.Ai泛化的精度损失权重。根据元组泛化前后的信息损失量,我们可以定义元组间的距离Distance(ti,tj)。9.元组间的距离

给定元组ti和tj,则两者间的距离Distance(ti,tj)定义为

其中,表示元组ti和tj在属性Ak上的距离,对于连续型属性,采用两者的区间长度之差;对于离散型属性,则采用两者值域的基数之差。10.表的信息损失量

给定数据表T,泛化为T*后的信息损失量ILtable(T)定义为8.4.2隐私保护的目的和研究方法

随着信息技术和数据库技术的快速发展,各行各业存储了海量的数据,这些数据仍然以惊人的速度不断增长,且往往包含个人的隐私信息。当需要使用这些包含个人敏感信息的数据时,隐私就成了一个重要的、必须面对的问题。数据发布者在发布数据信息前需要对数据集进行敏感信息的保护处理工作。8.4.3隐私保护的数据类型

隐私保护的数据发布通常都是针对具体问题处理的,需要处理的数据类型也是多种多样的,针对不同的数据类型,其处理方法也相应的有所不同。

根据数据样本的特征,可将样本的属性取值类型分为以下四种。

(1)连续型:

(2)离散型:

(3)关联型:

(4)混合型:8.4.4隐私泄露的攻击方式

1.链接攻击(linkingattack)

在链接攻击中,具有相同准标识符值的记录关于准标识符构成一个组(Group)。2.同质性攻击(homogeneousattack)

同质性攻击是针对k-匿名模型存在的隐私泄露风险提出的,由于k-匿名只是破坏了个体与记录之间的关联关系,而并没有破坏个体与敏感数据之间的关联关系,所以如果发布数据集等价类中的相异敏感值没有足够多样化,即等价类中的敏感值具有同质性,则攻击者仍然可以以100%的概率正确地推导出个体的隐私信息。3.背景知识攻击(backgroundknowledgeattack)

背景知识攻击也是针对k-匿名模型存在的隐私泄露风险提出的,攻击者一般会在得到匿名数据集之前就已经拥有攻击目标的个体隐私信息的一些先验知识,这些先验知识被称做背景知识。4.偏态攻击(skewnessattack)

偏态攻击是针对l-多样性模型在待发布数据集记录分布呈偏态性情形下存在隐私保护缺陷提出的,如果一个数据集中记录的整体分布是偏态的,那么发布的数据集即使满足l-多样性也不能完全防止敏感属性泄露。5.近似性攻击(similarityattack)

近似性攻击是针对l-多样性没有考虑等价类中的敏感值语义近似而存在隐私披露风险提出的,如果一个等价类中的敏感属性值可区别但是语义近似相关,攻击者仍可以获取一些重要的隐私信息。6.值等效攻击(valueequivalenceattack)

值等效攻击是针对动态数据集重发布的隐私披露风险而提出的,攻击者根据连续发布匿名表中等价类的签名集确定某一序列的记录属于同一属性集,一旦确认其中一个或几个身份,则可能引起全部序列匿名的失效。8.4.5典型的匿名模型

1.k-匿名模型

2.l-多样性模型

3.(α,k)-匿名模型

4.(k,l)-匿名模型

5.p-敏感k-匿名模型

6.t-近似模型

8.4.6匿名模型的实现技术

1.概化/隐匿

概化/隐匿是使用较多的一种隐私保护数据发布方法,它的好处是匿名化数据时不发生数据失真现象,以数据的粗粒度值代替细粒度值,即对准标识符的具体值用更加概括、抽象的值代替。概化总共有以下五种模式。

(1)全域概化模式:

(2)子树概化模式:

(3)兄弟概化模式:

(4)单元概化模式:

(5)多维概化:2.数据表分解

数据表分解与概化/隐匿解决问题的思路不同,它不修改准标识符或者敏感属性的值,仅仅使它们之间不再发生某种联系,即准标识符上的数据和敏感属性上的数据分别分割到两

文档评论(0)

酱酱 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档