- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于已知信息独立分量分析和局部旋转扰动的数据挖掘隐私保护研究.doc
基于已知信息独立分量分析和局部旋转扰动的数据挖掘隐私保护研究 摘 要:通过研究数据挖掘隐私保护,借助乘法扰动算法,探索提出了一种全新的算法――已知信息独立分量分析(Known Knowledge Independent Component Analysis),这种算法可以从经过旋转扰动或随机投影变换的扰动数据得到近似值或者原始数据;紧接着,得出全新的乘法扰动隐私保护算法――局部旋转扰动方法(Partial Rotation Perturbation),此法能够有效抵御KK-ICA的攻击并且安全性更高。 关键词:数据挖掘;隐私保护;已知信息 基金项目:大学生创新创业训练项目(座机电话号码5020):基于乘法扰动的数据挖掘隐私保护算法研究。 1. 引言 各种各样顾客对个人数据的隐私保护要求有所不同,也有少部分顾客可能很少在乎数据隐私问题。因此,这也给攻击者提供了收集某些个人隐私数据的大好机会,还可以依据这些已知的数据样本去获取更可信的原始数据。 已知信息独立分量分析(Known Knowledge ICA)是一种基于独立分量分析(ICA)的数据重构方法。本文分析证明当攻击者知道一小部分样本数据时,他可以使用KK-ICA准确有效的近似估计得到原始数据。因此KK-ICA对旋转扰动方法和随机投影方法的隐私安全性造成了很大威胁。 本文企图通过研究数据挖掘隐私保护,借助乘法扰动算法,探索提出了一种全新的算法――已知信息独立分量分析(Known Knowledge Independent Component Analysis),这种算法可以从经过旋转扰动或随机投影变换的扰动数据得到近似值或者原始数据;紧接着,研究全新的乘法扰动隐私保护算法--局部旋转扰动方法(Partial Rotation Perturbation),此法能够有效抵御KK-ICA的攻击并且安全性更高。 2. 已知信息独立分量分析和局部旋转扰动的数据挖掘隐私保护 2.1 假设 图2-1 已知信息独立分量分析过程 Figure3-1 Process of KK-ICA 2.2 确定J 得出全新的乘法扰动隐私保护算法――局部旋转扰动方法,能够避免KK-ICA的影响,提高隐私安全性。 2.3局部旋转扰动基本原理 旋转扰动方法指的是拥有一个特殊的性质,一旦通过旋转扰动后的数据能够非常轻松应用于基于点积或距离的各种数据挖掘模型。如图 图3-2 客户端和服务器 Figure3-2 Clients and Servers 局部旋转扰动中使用的对角块矩阵都是正交的,以上结论可以扩展到任意维度的旋转变换。给定了线性性质,本文将分别分别讨论客户端和服务器端的执行过程来说明RRP方法。如果使用两个不同的参数分别旋转扰动两个数据集得到扰动数据集,再经过一定变换,可以保留旋转扰动方法距离和内积不变的性质。 2.4 计算原理 得出:变换矩阵可以保持了原始数据向量距离、长度以及点积,因此局部旋转扰动方法的准确性有保证并且损失为零。 3 结论与讨论 通过以上原理的研究,已知信息独立分量分析(KK-ICA)方法这个全新的方法,其对旋转扰动方法(RP)以及投影扰动方法(PP)的数据隐私安全保护造成了很大的威胁。数据攻击者能够利用KK-ICA这个漏洞窃取用的需要隐私保护数据,非常严重地降低了流行隐私保护算法的数据隐私保护安全性;最后针对这种潜在可能的威胁,提出了新的乘法扰动隐私保护算法――局部旋转扰动方法(PRP),变换矩阵可以保持了原始数据向量距离、长度以及点积,因此局部旋转扰动方法的准确性有保证并且损失为零。■ 参考文献 [1] M. L. Eaton, M. D. Perlman. The non-singularity of generalized sample covariance matrices[M]. The Annals of Statistics, 1973, 1(4): 710-717. [2] A.K. Gupta, D.K. Nagar. Matrix variatedistributions[M]. Chapanand Hall/CRC, Oct. 1999. [3] S. Guo, X. Wu. Deriving private information from arbitrarily projected data[J]. Advances in Knowledge Discovery and Data Mining, 2007: 84-95. [4] 史晓丽.基于统计分布的临床行为异常检测模型[D].镇江:江苏大学,2011. [5] S.Guo. Analysis of and techniques for privacy preserving data mining[M]. A
您可能关注的文档
最近下载
- SY∕T 6540-2021 钻井液完井液损害油层室内评价方法.pdf
- 第18课 《我的白鸽》课件(共46张PPT).pptx VIP
- 2025-2030中国裹粉市场动向追踪与企业经营发展分析研究报告.docx
- 精品解析:北京市第五十七中学2024-2025学年八年级下学期期中考试物理试题(解析版).docx VIP
- 工艺评审报告、评审意见汇总表 .docx VIP
- 延安市各区县地表水系图.pdf VIP
- 初一语文语文朝花夕拾名著阅读的专项培优易错试卷练习题及答案.pdf VIP
- 四年级上册人教版第四单元 第01课时 三位数乘两位数的笔算方法(学习任务单).docx VIP
- 土地增值税清算与最新土地增值税反避税应对实务.ppt VIP
- 双能量CT临床应用指南.PDF
原创力文档


文档评论(0)