EMASK算法优化和改进答题.ppt

EMASK算法的优化和改进 目录 一、研究背景 二、MASK算法介绍 三、EMASK算法的主要思想 四、改进算法的思想 五、下一步工作计划 一、研究背景 随着信息技术,特别是网络技术数据存储技术和高性能处理器技术的飞速发展,海量数据的收集管理和分析变得越来越方便,知识发现和数据挖掘更是在一些深层次的应用中发挥了积极的作用.但与此同时,也带来了隐私保护方面的诸多问题.例如,通过对医院病人的病历数据进行挖掘,可以发现各种疾病之间的关联. 所以,如何在数据挖掘过程中解决好隐私保护的问题,目前已经成为数据挖掘界的一个研究热点 。 二、MASK算法介绍 MASK(Mining Associations with Secrecy Konstraints)算法由印度学者Rizvi在2002年提出的。 假定数据集为超市购物篮数据,所挖掘的数据集可以看作由0和1组成的二维稀疏布尔矩阵,1表示购买某件商品,0表示没有购买.为了保护输入数据集的隐私性,MASK算法采用概率歪曲的方法对原始数据集进行扰乱操作.一个0-1数据库元组可以看成一个随机向量X ={Xi} , Xi =0或者1.对Xi 进行歪曲操作得到Yi = Xi XOR !ri ,其中!ri是ri 的补, ri 是满足贝努利分布的随机变量,分布律为p(ri=1)=p,p

文档评论(0)

1亿VIP精品文档

相关文档