分布式环境下隐私保护频繁闭合项目集挖掘和研究.pdf

分布式环境下隐私保护频繁闭合项目集挖掘和研究.pdf

  1. 1、本文档共73页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
优秀毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!

万方数据 摘 要 摘 要 随着互联网技术和数据库技术的快速发展,数据的规模不断扩大,数据量级已经 发展到 TB 甚至 PB 量级。用户如何从海量的数据中快速挖掘有用的知识的同时保证 原始输入数据的安全,是数据挖掘面临的一个新的挑战。分布式环境下隐私保护关联 规则挖掘研究是一个新的研究热点。 论文研究了关联规则挖掘技术和隐私保护技术,着重研究了分布式环境下隐私保 护频繁闭合项目集挖掘方法。主要内容包括: (1)分析关联规则挖掘技术,重点对频繁项目集挖掘算法、频繁闭合项目集挖掘 算法及分布式环境下关联规则挖掘算法进行了深入的研究和分析,为算法的进一步改 进和实现奠定基础。 (2)分析隐私保护关联规则挖掘技术,从安全性、效率以及适应的环境等方面进 行了研究。详细分析了隐私保护关联规则挖掘的研究现状,重点分析了现有的典型的 隐私保护关联规则挖掘算法的设计思想、效率和安全性。 (3)研究数据垂直分布下的隐私保护频繁闭合项目集挖掘算法,针对当前数据垂 直分布下的隐私保护关联规则挖掘算法效率低和安全性不高的问题,首先提出了一种 基于多方的隐私保护频繁闭合项集挖掘算法 PPFCI 。算法利用挖掘频繁闭合项目集代 替频繁项集,结合 IT-Tree 作为搜索空间,采用隐私保护集合交集基数协议作为隐私 * 保护技术。在此算法的基础上进一步提出了改进算法 PPFCI 算法。该算法结合 Diffsets * 作为压缩结构,可进一步加快挖掘速度、减少存储空间,提高挖掘效率。PPFCI 首次 采用隐私保护的集合差集协议保护隐私数据。两种算法中的安全集合协议均是建立在 * RSA 可交换加密的基础上。理论分析和实验结果均表明,PPFCI 算法具有很好的隐 私性、准确性和高效性。 (4)研究数据水平分布下安全挖掘频繁闭合项目集算法,提出了水平分布下隐私保 护频繁闭合项目集挖掘算法 PPFP 。该算法采用基于FP-tree 的并行算法,结合 CFI-tree 结构,提高挖掘效率。算法两次利用一种新的隐私保护安全求和协议保护隐私数据, 理论分析表明算法具有较好的安全性和效率。 关键词:隐私保护 关联规则 频繁闭合项目集 安全多方计算集合协议 I 万方数据 Abstract Abstract With the rapid development of internet technology and database technology, size of data is growing rapidly. A typical dataset might involve Terabytes or even Petabytes of data. How to mine helpful and meaningful information quickly while ensure the safety of the original input data is a new challenge for data mining. Researc

文档评论(0)

ygeorcgdw + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档