隐私保护一站多表跨多表频繁项集挖掘.docVIP

隐私保护一站多表跨多表频繁项集挖掘.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
隐私保护一站多表跨多表频繁项集挖掘

隐私保护一站多表跨多表频繁项集挖掘   摘要:从多方合作挖掘分布存储在不同计算站点上多个数据库表而不泄露各方原始数据信息的目的出发,对于每个站点拥有多个数据表的分布式计算环境,基于三方安全协议,运用生成随机数扰乱方法,采取各站点并行挖掘频繁项集,将站点间各表数据公共连接属性作等值连接,以安全协议计算全局站间跨表频繁项集支持数的策略,提出了一站多表的3站点跨多表频繁项集挖掘隐私保护算法实验结果表明,该算法在高效地联合挖掘出跨多表频繁项集的同时保护了各站点的敏感信息 关键词:跨表挖掘; 频繁项集; 并行挖掘; 隐私保护; 多方安全协议 中图分类号:TP311.13 文献标志码:A 0 引言 数据挖掘中的隐私保护技术既能高效地挖掘出有用知识又能保护数据中的隐私信息不被泄露文献[1]较早研究了垂直划分数据格式的关联规则挖掘隐私保护问题文献[2]重点讨论了数据挖掘隐私保护技术中的安全点乘计算算法文献[3]通过计算事务序列事务组的影响权值,选取对非敏感序列模式影响最小的事务序列事务组进行清洗,以使得在确保隐藏敏感序列模式的同时,尽量减少对非敏感模式集的影响,提出一种基于数据清洗的具有更好稳定性的敏感序列模式隐藏算法文献[4]探讨分布式环境下连续模式挖掘隐私保护机制,提出了一个安全的长序列模式挖掘优化算法对于不完整的原始数据,传统的基于抑制和泛化的算法会导致大量信息丢失文献[5] 将数据表中缺失值看作正常值处理,从而大大减少正被抑制的记录数量,提出一个适用于单敏感属性的保持更多信息的线性时间复杂度的不完整原始数据分类隐私保护算法文献[6]采取无需事先预置安全度阈值,在一个合理的数据安全度区间内随机选取等距变换角度的方法,使得数据集经过等距变换后保持在空间中的距离不变,给出一种聚类数据挖掘的数据预处理算法,该算法完成数据等距变换的同时能够较好地保护敏感信息文献[7]针对数据水平分布环境,采取分拆方法,在给出基于随机站点重排策略的多方安全求和计算协议的基础上,设计了一个隐私保护分布式序列模式挖掘算法,该算法在半诚实模型下可以保护局部站点信息安全,具有防站点串谋能力文献[8]使用连接聚合查询技术完成多个私有数据表信息的连接共享,通过使用安全框架协议计算私有数据表随机和方法,实现了在私有数据表之间安全地交换其随机和信息文献[9]指出,在多方安全计算中,需要考虑参与协议的多方知识联合的获取问题,同时要确保数据的保密性没有被减弱因此,研究多方安全挖掘数据问题非常具有吸引力文献[10]给出将跨两表频繁项集挖掘方法扩展到跨3表频繁项集挖掘方法的技术,以3表频繁项集的公共属性记数集作为三方安全协议的参数,实现了跨3表频繁项集挖掘的隐私保护在云计算环境中,用户的敏感数据存储在云数据中心远程服务器中,这些数据不由拥有者本身管理与控制,研究如何存储、处理和访问不同类型的隐私数据是一个十分重要的云计算安全问题[11]在云计算中,不同可信领域的参与者不希望泄露其隐私数据集,文献[12]提出了一个云计算中适应处理多方设置、任意划分数据的BP神经网络学习隐私保护算法在用户具有有限资源或者有限专业知识的云数据存储系统中,文献[13]提出一个文件拥有者利用含有噪声数据的关键词在私钥加密的远程数据中进行容错查找的通用框架和实现隐私保护的查找模式通过使用敏感性参数化云数据库属性的父类会员已经利用加密和关系隐私保护操作修改数据库模式,文献[14]提出了一个保护云用户数据隐私的基于数据库模式再设计和云元数据动态重构的架构 目前,分布式计算环境下一站多表跨多表频繁项集挖掘隐私保护研究成果极少本文的主要工作是:对于各站点拥有多数据表的分布式计算环境,基于三方安全协议,运用生成随机数扰乱方法,采取各站点并行挖掘频繁项集,将站点间各表数据公共连接属性作等值连接,以安全协议计算全局站点间跨表频繁项集支持数的策略,提出一站多表的3站点跨多表频繁项集挖掘隐私保护算法 1 相关知识 定义1多方安全计算(Secure multiparty computation)拥有秘密输入的k方,希望用各自的秘密输入共同计算一个函数,计算要求每方都能得到正确输出,且每方只能获知他们各自的输出[15] 2隐私保护的一站多表跨多表频繁项集挖掘 一站多表的3站点跨多表频繁项集挖掘隐私保护算法的思想:从站内多个表中首先确定一个主表,其余为从表,由于同属一个站点的多个表不存在私有数据泄露的问题,所以站内跨表候选频繁项集支持数不需要安全协议参与计算,直接以站内各表的频繁项集对应的公共属性记数集作乘积操作;站间跨表频繁项集挖掘的数据传送及计算操作涉及到不同的数据拥有者(站点),将各站点间公共连接属性作等值连接,结合三方安全协议参与对站间跨表候选频繁项集的支持数计算,在能够有效

文档评论(0)

docman126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档