- 1、本文档共37页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
优秀硕士论文基于匿名机制的数据发布中隐私泄露控制技术
第一章 引言
1.1研究背景
数据发布环境中存在的隐私泄露问题使得邮编邮编邮编1 41 女 734562 失眠 t2 40 女 734552 心脏病 t3 41 男 734532 失眠 t4 44 男 734555 心脏病 t5 44 男 734555 失眠 t6 45 男 734532 心脏病 t7 41 男 734561 禽流感 t8 42 男 734533 禽流感 t9 43 女 734553 禽流感
表1-2选民登记表
姓名 年龄 性别 邮编k-匿名模型(k-anonymity)
定义1.1[1] k-匿名 假设T{A1,A2,…,An}为一个数据集,QIT为与之相关的准标识符。当且仅当数据集T中每个记录的准标识符属性值在数据集中至少出现k次,则该数据集满足k-匿名。
定义1.2[1] 等价类 一个等价类即数据集T{A1,A2,…,An}中一组具有相同准标识符属性值的记录。
针对数据发布中的链接攻击,文献[1,2]提出了k-匿名技术。文献[3]提出实现k-匿名的泛化和隐匿方法,泛化是指在数据集中用抽象的属性值来代替原来具体的属性值,隐匿是指隐匿是指直接删除数据集中某些属性值或记录。k-匿名通过泛化和隐匿使得等价类中每个记录具有相同的准标识符属性值,攻击者无法将个体与某个记录对应起来,从而保护个体身份的泄露。
例如,表1-3是表1-1的一个满足3-匿名模型的匿名化表,其中,匿名参数K=3,准标识符为属性组(年龄,性别,邮编邮编1 [40-41] * 7345** 失眠 t2 [40-41] * 7345** 心脏病 t7 [40-41] * 7345** 禽流感 t4 [44-45] 男 7345** 心脏病 t5 [44-45] 男 7345** 失眠 t6 [44-45] 男 7345** 心脏病 t3 [41-43] * 7345** 失眠 t8 [41-43] * 7345** 禽流感 t9 [41-43] * 7345** 禽流感 但是, k-匿名模型存在同质性攻击和背景知识攻击的问题[4]。k -匿名模型由于忽略了敏感属性值的多样性,可能造成个体敏感属性的隐私泄露,即同质性攻击。例如,假设表1-4是表1-1的另一个满足3-匿名模型的匿名化表,表1-4中生成了3个等价类{t1,t2,t3},{t4,t5,t6},{t7,t8,t9}。如果攻击者从1-2选民登记表中获知杰克的信息,与表1-4链接起来时,虽然无法确定杰克与表1-4中具体的某个记录相对应,但通过准标识符属性值可以知道杰克在表1-4的{t7,t8,t9}等价类中,由于该等价类的敏感属性值均为禽流感,攻击者容易知道杰克患有禽流感,杰克的隐私被泄露。同时,k -匿名还可能遭遇攻击者利用预先知道的背景知识来进行攻击。此外,k -匿名模型由于通过泛化准标识符属性达到匿名的目的也导致大量原始信息的损失,降低了匿名数据的可用性。
表1-4 3-匿名化表2
年龄 性别 邮编1 [40-41] * 7345** 失眠 t2 [40-41] * 7345** 心脏病 t3 [40-41] * 7345** 失眠 t4 [44-45] 男 7345** 心脏病 t5 [44-45] 男 7345** 失眠 t6 [44-45] 男 7345** 心脏病 t7 [41-43] * 7345** 禽流感 t8 [41-43] * 7345** 禽流感 t9 [41-43] * 7345** 禽流感 1.2.1.2 l-多样性模型(l-diversity)
文献[4]提出了l-多样性模型(l-diversity)以弥补k-匿名模型的不足。
定义1.3[4] l-多样性原则 一个等价类如果对于敏感属性S至少包含l个不同的敏感属性值,那么该等价类是l-多样性的。如果数据集T中的每个等价类是l-多样性的,则称该数据集满足l-多样性。
该模型除了要求满足k-匿名之外,还要求每个等价类的敏感属性值具有多样性以防止敏感属性的隐私泄露。例如,表1-5是表1-1的一个满足3-多样性模型的匿名化表,其中,l=3,QI=(年龄,性别,邮编邮编邮编1 [40-41] * 7345** 失眠 t2 [40-41] * 7345** 心脏病 t7 [40-41] * 7345* 禽流感 t4 [43-44] * 73455* 心脏病 t5 [43-44] * 73455* 失眠 t9 [43-44] * 73455* 禽流感 t3 [41-45] 男 73453* 失眠 t6 [41-45] 男 73453* 心脏病 t8 [41-45] 男 73453* 禽流感 1.2.1.3 Anatomy匿名模型
文
您可能关注的文档
- FPGA课程论文基于FPGA设计的电子密码锁.docx
- Hough算法的原理及在图像处理方面的应用机械优化设计论文.doc
- html5课程论文基于html5的贪吃蛇游戏.doc
- FDI对山东第三产业发展的对策.doc
- IIS6.0建立的网站的安全性设计以及网站被挂马的处理方案职业学院毕业论文.doc
- ios与Android操作系统的创新策略评估(英语论文.docx
- GIS技术概述及其在城市规划中的应用以某城市片区小学布局分析为例.docx
- High购系统的设计与实现本科毕业论文.doc
- javaweb课程设计基于java的个人博客系统.doc
- IT技术在金属矿山中的应用论文.docx
- 金融产品2024年投资策略报告:积极适应市场风格,行为金融+机器学习新发现.pdf
- 交运物流2024年度投资策略:转型十字路,峰回路又转(2023120317).pdf
- 建材行业2024年投资策略报告:板块持续磨底,重点关注需求侧复苏.pdf
- 宏观2024年投资策略报告:复苏之路.pdf
- 光储氢2024年投资策略报告:复苏在春季,需求的非线性增长曙光初现.pdf
- 公用环保2024年投资策略报告:电改持续推进,火电盈利稳定性有望进一步提升.pdf
- 房地产2024年投资策略报告:聚焦三大工程,静待需求修复.pdf
- 保险2024年投资策略报告:资产负债匹配穿越利率周期.pdf
- 政策研究2024年宏观政策与经济形势展望:共识与分歧.pdf
- 有色金属行业2024年投资策略报告:新旧需求共振&工业原料受限,构筑有色大海星辰.pdf
最近下载
- 结题报告高中物理小课题.PPT
- NB∕T 32037-2017 光伏发电建设项目文件归档与档案整理规范.pdf VIP
- 2024《高考志愿填报咨询服务意愿的影响因素实证研究》16000字.docx
- 无线网络优化模考试题(附答案).docx
- 中图版高中地理必修第二册课后习题 第四章 国土开发与保护 第一节 京津冀协同发展的地理背景 (2).doc VIP
- 工厂消防安全设备检查记录表.docx VIP
- 海绵城市监理实施细则.doc VIP
- 人教版小学二年级数学下册期中试卷.doc VIP
- 巴黎奥运樊振东乒乓球故事介绍【优质公开课】精品PPT课件模板.pptx
- 丽声北极星分级绘本第一级上 A Day with Monster Toon课件 .pptx VIP
文档评论(0)