基于LBS(位置服务)的隐私保护算法研究 .pdfVIP

下载本文档

0
0
约4.74千字
约 6页
2024-11-28 发布于河南
举报
版权申诉

基于LBS(位置服务)的隐私保护算法研究 .pdf

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于LBS(位置服务)的隐私保护算法研究

黄小英

【摘要】随着数据挖掘和数据发布等数据库应用的出现与发展,如何保护隐私数据

和防止敏感信息泄露成为当前面临的重大挑战.隐私保护技术需要在保护数据隐私

的同时不影响数据应用.根据采用技术的不同,出现了数据失真、数据加密、限制发

布等隐私保护技术.

【期刊名称】《制造业自动化》

【年(卷),期】2011(033)009

【总页数】3页(P96-98)

【关键词】隐私保护;随机化;安全计算

【作者】黄小英

【作者单位】广西工商职业技术学院,南宁,530003

【正文语种】中文

【中图分类】TP312

数据挖掘和数据发布是当前数据库应用的两个重要方面。一方面，数据挖掘与知识

发现在各个领域都扮演着非常重要的角色。数据挖掘的目的在于从大量的数据中抽

取出潜在的、有价值的知识（模型或规则）。传统的数据挖掘技术在发现知识的同

时，也给数据的隐私带来了威胁。另一方面，数据发布是将数据库中的数据直接地

展现给用户。而在各种数据发布应用中，如果数据发布者不采取适当的数据保护措

施，将可能造成敏感数据的泄漏，从而给数据所有者带来危害。所以，如何在各种

数据库应用中保护数据的隐私，成为近年来学术界的研究热点。

没有任何一种隐私保护技术适用于所有应用。隐私保护技术分为三类：

1）基于数据失真（Distorting）的技术：使敏感数据失真但同时保持某些数据或

数据属性不变的方法。例如，采用添加噪声（AddingNoise）、交换

（Swapping）等技术对原始数据进行扰动处理，但要求保证处理后的数据仍然可

以保持某些统计方面的性质，以便进行数据挖掘等操作。

2）基于数据加密的技术：采用加密技术在数据挖掘过程中隐藏敏感数据的方法。

多用于分布式应用环境中，如安全多方计算（SecureMultipartyComputation，

以下简称SMC）。

3）基于限制发布的技术：根据具体情况有条件地发布数据。如：不发布数据的某

些域值，数据泛化（Generalization）等。

隐私保护技术需要在保护隐私的同时，兼顾对应用的价值以及计算开销。通常从以

下三方面对隐私保护技术进行度量：

1）隐私保护度：通常通过发布数据的披露风险来反映，披露风险越小，隐私保护

度越高。

2）数据缺损：是对发布数据质量的度量，它反映通过隐私保护技术处理后数据的

信息丢失：数据缺损越高，信息丢失越多，数据利用率（Utility）越低。具体的度

量有：信息缺损（InformationLoss）、重构数据与原始数据的相似度等。

3）算法性能：一般利用时间复杂度对算法性能进行度量。例如，采用抑制

（Suppression）实现最小化的k-匿名问题已经证明是NP-hard问题；时间复杂

度为O(k)的近似k-匿名算法，显然优于复杂度为O(klogk)的近似算法。均摊代价

（AmortizedCost）是一种类似于时间复杂度的度量，它表示算法在一段时间内

平均每次操作所花费的时间代价。除此之外，在分布式环境中，通讯开销

（CommunicationCost）也常常关系到算法性能，常作为衡量分布式算法性能

的一个重要指标。

数据失真技术通过扰动（Perturbation）原始数据来实现隐私保护。它要使扰动

后的数据同时满足：

1）攻击者不能发现真实的原始数据，也就是说，攻击者通过发布的失真数据不能

重构出真实的原始数据。

2）失真后的数据仍然保持某些性质不变，即利用失真数据得出的某些信息等同于

从原始数据上得出的信息。这就保证了基于失真数据的某些应用的可行性。

数据随机化即是对原始数据加入随机噪声，然后发布扰动后数据的方法。需要注意

的是，随意对数据进行随机化并不能保证数据和隐私的安全，因为利用概率模型进

行分析常常能披露随机化过程的众多性质。随机化技术包括两类：随机扰动

（RandomPerturbation）和随机化应答（RandomizedResponse）。

随机扰动采用随机化过程来修改敏感数据，从而实现对数据隐私的保护。一个简单

的随机扰动模型如表1(a)所示。

对外界而言，只可见扰动后的数据，从而实现了对真实数据值的隐藏。但扰动后数

据仍然保留着原始数据分布X的信息，通过对扰动后的数据进行重构如表1(b)所

示，可以恢复原始数据分布X的信息。但不能重构原始数据的精确值x1,x2,…,xn。

随机扰动技术可以在不暴露原始数据的情况下进行多种数据挖掘操

您可能关注的文档

文档评论（0）

156****3713 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

基于LBS(位置服务)的隐私保护算法研究 .pdfVIP