移动数据库中基于k—匿名隐私保护模型研究.docVIP

下载本文档

3
0
约5.39千字
约 11页
2018-06-23 发布于福建
举报
版权申诉

移动数据库中基于k—匿名隐私保护模型研究.doc

1、本文档共11页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

移动数据库中基于k—匿名隐私保护模型研究

移动数据库中基于k—匿名隐私保护模型研究　　摘要：由于移动网络低安全等特性，导致移动数据库中与用户隐私相关的字段处在一种可能会被披露的状态，如何实现高效可靠地隐私保护是当前移动数据库中一个主要的研究方向。其中k-匿名技术已被证明是一种可靠地数据查询发布技术，在文中，我们在移动数据库引入k-匿名技术从而对数据库中用户的相关数据或敏感数据进行保护，以防止具有知识背景下的隐私披露。实验证明具有一定的有效性，时间复杂度也在可控的O（k）级别，比较高效。　　关键词：移动数据库；k-匿名；隐私保护　　中图分类号：TP309 　　随着便携式移动设备的普及，人们在移动设备上开始在任意时间任何地点地利用移动数据库接入某些应用系统，从中获得自己所需的信息。这种工作方式极大地方便人们的工作、学习方式，但是由于移动终端自身以及移动网络的低安全性，使得在移动网络必须对传统的技术加以改进，以让移动终端上的数据和查询结果可以实时可靠地传输。其中尤为重要的是一类特殊的数据——隐私。关于隐私的保护被国际机构公认为基本的权利，隐私也被定义为“一种与公共利益无关、群体利益无关，当事人不愿意他人知道或他人不便干涉的个人私事”的权力[1]。在数字环境中，隐私也可以被定义为个人可控制自身信息的被收集和使用。在本文中的隐私保护即是指在发布的数据中个人的隐私信息能够得到有效的保护。由于大量的Web2.0应用的产生，越来越多的社会网络数据也被公布或泄漏，攻击者根据某些方式可能获得用户的个人隐私，因此移动数据库中用户的隐私保护也愈加成为社会的关注点。　　1 网络隐私的泄露途径　　移动数据库在终端上，一般包括嵌入式数据库、同步服务器两部分；同步服务器负责与中心数据库的数据保持一致。因此，移动数据库所面对的可能构成的安全威胁，也主要来自于这两方面：第一是移动计算终端的丢失，设备丢失会使保存在终端数据库中的用户敏感信息面临泄露风险；第二是黑客利用无线信号对服务器进行攻击，可能会因此造成中心数据库中信息泄漏和恶意篡改。　　从当前在隐私保护中切入的角度来看???当前的隐私保护技术可分为面向用户的隐私保护，和面向数据的隐私保护。　　（1）面向用户的隐私保护主要从使用者的角度考虑个人隐私信息的保护，也就是从用户的角度来分析、找出并保护某些在用户看来不想被其他人所使用和读取的一类敏感信息，如数据库中的某些字段的值以及在一系列数据上的某些操作，如查询某类信息等。　　（2）面向数据的数据库隐私保护则需要考虑如何在技术层面防止利用用户的一些数据和行为信息来唯一的确定某个用户，并对应上该数据所表达的隐私信息；即需要应用一些隐私保护机制，如用户的匿名、用户泛化、行为模糊、行为不可连接来消除由数据访问所引发的隐私泄露等问题。　　移动数据库中用户隐私在不同的系统和环境中具有不同的个人需求，如医院信息管理系统，病人的身份证号、家庭住址、疾病信息、医疗服务与药品购买记录这些字段就属于用户的个人隐私；在人口管理系统中的市民家庭住址、收入状况、个人爱好、犯罪记录等就属于个人隐私；至于手机银行、掌上购物，其中客户的私有信息及其交易行为就属于用户的隐私字段。一般数据库中身份标识属性ID就记录了可以唯一识别一个人的取值，比如身份证号、电话号码、姓名等信息。除以上单字段外，还可以通过字段组合来得到用户的个人信息，我们称为准标识属性（QI），其中的属性值单独不构成隐私属性，但通过连接推理后可得到ID字段同样的效果[2]。对于这些数据我们不能简单的屏蔽了之，而是要寻找出一种可靠高效的算法来实现匿名保护。　　2 基于k-匿名的隐私保护模型　　2.1 算法思想　　数据匿名隐私保护的思想是对初始的数据进行甄别，只发布数据集中较不敏感的数据来保护隐私。数据匿名隐私保护一般采取抑制和泛化，抑制即是指不发布该数据项；泛化，即是指将某些具体的数据值用不那么具体的数据值，去替代的一种方法[3]。其中使用最广、最为经典的就是k-匿名算法。　　P.Samarati和L.Sweeney提出的k-匿名原则是基于数据匿名的隐私保护中最常见的方法，该原则要求所发布的数据表当中至少有k条记录是相同的，从而使得攻击者不能将个体从这一样的k条记录当中分辨出来。此处的不能分辨只是记录的对非敏感属性来说的，这不能互相分辨的k条记录被称作为等价类。本文也是基于对k-匿名技术的详细研究并结合时下的研究热点之一的移动数据库的背景，改进数据库中敏感字段保护当中已经提出并证明有一定作用的算法，使之达到个性化隐私保护的目的。　　2.2 相关定义　　k-匿名模型，主要的应用对象是表集数据的隐私保护，表集数据中发布的记录要求具有如下的格式：T=（ID，QI，SA，NSA）。其中ID为主键字段，该字段可用来唯一的识别