- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于隐私保护的数据相似性度量
摘要:数据对象间的相似性度量是数据挖掘中一个重要的内容。针对如何在不共享精确数据的条件下,安全计算数据对象间的相似性问题,提出了几种基于安全多方计算协议的算法。算法很好的隐藏数据,保护隐私信息,且对相似性计算的结果没有影响。
关键词:数据挖掘;隐私保护;相似性;距离
中图分类号:TP311文献标识码:A 文章编号:1009-3044(2008)12-20000-00
Privacy Preserving Data Similarity Measurement
ZHANG Guo-Rong
(Computer staff room at Guangzhou Academy of Fine Arts,Guangzhou 510260,China)
Abstract:Data similarity measurement is an important direction for data mining research. This paper is concentrated on the issue of measuring securely data similarity without sharing precise individual data records, and proposes several methods based on secure multi-party computation model. These methods efficiently hide attribute values, preserve privacy information and guarantee valid similarity measurement results.
Key words:data mining;privacy preserving;similarity;distance
1 引言
隐私保护是分布式数据挖掘中一个重要的研究方向,在双方或多方合作进行数据挖掘时,由于某种原因,参与者往往不愿意将数据与他人共享而只愿共享挖掘的结果,这就要求人们提出保持隐私性的数据挖掘方法[1]。数据对象间的相似尺度是数据挖掘中一个重要的内容,尤其对于聚类分析,相似性度量更为重要。为了在对分布式数据进行相似性度量时保持参与者隐私,本文利用安全多方计算的相关协议,对数据的相似性进行安全计算,从而达到保护参与各方私有信息的目的。
2 基于安全多方计算的协议
安全多方计算是一种为了完成某种计算任务而采用的分布式计算协议。在协议运行前,参与计算的各方各自拥有一个保密的输入;协议中, 各方保持隐私输入不为它方(包括任何的第三方)所知;协议运行后;各自获得输出,除此之外,各方不知道其他方输入的任何信息。文献[2]中引入半可信的第三方参与计算。第三方是半可信的主要要求是:(1)第三方是不可信的。因此,不能从参与的各方获得私有信息,以及从计算结果得到私有信息。(2)第三方不可以和任何一方有联系。(3)第三方严格遵守协议。现实世界中半可信的第三方要比完全可信的第三方普遍的多,所以使用半可信第三方参与计算是可行的,但是,如果半可信第三方不遵守第二点要求,与某一参与方发生共谋,后果将不堪设想。因此,本文采用的是多方协商计算的方法:假设参与各方都希望得到准确的计算结果,所以他们不会发送给虚假数据对方,同时,参与各方是好奇的,所以他们会保留所接收到的数据,并试图从这些数据中了解对方的信息。
2.1 比较协议
甲与乙各有一个私有数据,他们希望秘密比较这两个数据的大小,当两个数据不相等时,任何一方都不能够知道对方的值。文献[3]基于Φ-隐藏假设以及同态公钥加密体制的语义安全性假设,给出了一个特殊的安全双方计算协议――无信息泄漏的比较相等协议。该协议具有公平性:一方知道最后结果的等价条件为另一方也知道这个结果;安全性:除了最后结果以外,不泄露有关双方输入的任何信息;有效性:借助于茫然第三方协助完成计算任务,使协议简单有效,但这个第三方不知道最后结果及参与方的秘密,也不能与参与方串谋作弊。但是该协议在需要大规模比较数据时显得过于复杂。本文使用一种简单的比较协议,并把它应用在计算两个对象的曼哈坦距离中。
问题:P1、P2各有一些私有数据X1,X2,…,Xn和Y1,Y2, ,…,Yn,他们要共同秘密比较这些数据的大小,但任何一个用户都不愿意向其他用户泄露自己的私有信息。
协议Secure_ Compare:
(1) P1、P2双方协商两个整数a,b,其中amax(Xi,Yi), i∈[1,n]
文档评论(0)