THE
RESEARCHoN DATA
PUBLISHINGFoRDATA
CLASSIFICATIoNANALYSIS
ThesisSubmittedto
Normal
ZhejiangUniversity
in fulfillmentofthe
partial requirement
forthe of
degree
Masterof
Engineering
By
Wu
Jiandang
Softwareand
(Computer Theory)
Thesis
Supervisor:Jiyi
Wang
16,2014
May
万方数据
一㈣Y2㈣665
7帮76
面向分类分析的数据发布隐私保护方法研究
摘要
随着各行各业对数据共享的迫切需求,数据发布隐私保护技术取得了长足的
发展。数据挖掘分类分析工作需要大量的数据支持,如何对发布的数据成功进行
分类分析的同时保护隐私数据不被泄露成为了一个重要的问题。近年来,数据发
布隐私保护技术的研究成为数据库领域的研究热点,尼匿名模型是实现数据发布
隐私保护的重要思想,然而现有的露匿名实现技术没有考虑匿名数据的具体应用
情况,针对具体应用改进数据匿名化过程,从而得到面向该应用高质量的匿名数
据,是一项非常有意义的工作。
通过对数据挖掘分类技术和隐私模型相结合的研究,本文提出了面向数据挖
掘分类分析技术来进行匿名化数据,不再要求匿名化过程造成数据信息损失量最
小,而是要求匿名化过程对数据在挖掘分类中的影响尽可能的小,通过考虑各个
属性在分类中的作用,提出属性的权重思想,即不同的属性在数据挖掘分类中表
现的重要度可能不同,根据不同的属性在分类过程中的表现,定义不同的属性权
重,从而在匿名化过程中进行不同程度的泛化。最近,面向分类分析技术的七匿
名研究得到重视,很多的改进型七匿名算法被提出,能够实现在满足隐私要求的
同时保持匿名数据在挖掘分类中的可用性。
本文从数据可用性和安全性两个方面综合考虑,对微数据发布隐私保护技术
进行研究,具体工作点如下:
(1)通过对数据挖掘分类分析方法的研究,提出了基于属性权重的匿名化
方法。该方法考虑到不同属性在分类挖掘中所发挥的作用不同,所以在数据匿名
化过程中,对分类分析重要的属性进行较弱泛化,而对分类分析不重要的属性进
行较强泛化,并采用了信息增益比率作为度量来控制泛化程度,从而可以得到对
分类挖掘分类可用性更好的匿名化数
您可能关注的文档
- 论海德格尔对康德的想象力学说的存在论阐释.pdf
- 论肌理在工笔花鸟画中的运用和表现.pdf
- 论见危不助的成因及其法律规制.pdf
- 论罗伯特·达恩顿的图书史的研究.pdf
- 论人民调解协议司法确认制度的完善.pdf
- 论我国亲权制度的立法构建.pdf
- 硕士毕业生张瑾的学位音乐会设计和分析.pdf
- 论小学语文教材的“教育性”和“趣味性”之争.pdf
- 思维导图和高一英语词汇教学有效性研究.pdf
- 论音乐剧《赣第德》中女主角句妮宫德的人物刻画___《纸醉金迷》片段为例.pdf
- 2026及未来5年中国电磁铁行业市场发展监测及投资战略咨询报告.docx
- 2026及未来5年中国建筑工程机械行业市场发展监测及投资战略规划报告.docx
- 2026及未来5年中国硫化镍行业市场调研分析及投资战略规划报告.docx
- 2026及未来5年中国烷化剂市场运营态势及发展前景预测报告.docx
- 2026年涤纶细旦长丝项目可行性研究报告(市场数据调查、监测研究).docx
- 2026年弓型虫抗体试剂项目可行性研究报告(市场数据调查、监测研究).docx
- 2026年拖链系统用高柔性数据传输电缆项目可行性研究报告(市场数据调查、监测研究).docx
- 2025年中国水晶圆盘市场调查研究报告.docx
- 2025年中国长网双辊挤浆机市场调查研究报告.docx
- 2026年及未来5年内中国液体氩气行业投资前景及策略咨询研究报告.docx
最近下载
- 2026年长沙电力职业技术学院单招职业技能考试参考题库附答案详解.docx VIP
- 陈敏恒 化工原理 第5版 课后习题答案.docx VIP
- TCAEPI43-2022 电絮凝法污水处理技术规程.pdf VIP
- 2025年中国PE_VC基金行业CFO白皮书-.pdf VIP
- 芦笋种植方案.pptx VIP
- 预防医学导论课程教学大纲.docx VIP
- 矿物加工总论.pdf VIP
- 九年级下学期数学教学计划和培优补差.docx VIP
- 【英语】河南省天一大联考·2024-2025学年高三考前模拟考试含答案或解析.pdf VIP
- ISO IEC 27005-2022 信息安全、网络安全和隐私保护—信息安全风险管理指南(2022)(推荐下载).pdf VIP
原创力文档

文档评论(0)