网络传输数据中基于序列模式隐私保护数据挖掘.docVIP

网络传输数据中基于序列模式隐私保护数据挖掘.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络传输数据中基于序列模式隐私保护数据挖掘

网络传输数据中基于序列模式隐私保护数据挖掘摘要 随着网络传输数据总量的急剧增加,现在有一种研究实体试图通过挖掘传输数据来得到有用的信息。例如,存在一些调查,所调查研究的内容涉及到网络蠕虫病毒的侦查和通过非正常的传输模式而进行的侵入。然而,因为网络传输数据包含了用户的网络使用模式的信息,因此网络用户的私有信息可能在挖掘过程中受到威胁。因此,我们提出了一种有效而实用的方法来保护隐私,这种保护是在网络传输数据的序列模式挖掘过程中实现的。为了在不侵犯隐私的情况下发现频繁序列模式,我们在方法中使用数据仓库服务器模型,这种模型作为一个单一的挖掘服务器和保持复位技术而运行,它有可能改变问题的答案。另外,我们的方法通过保持每一点的元数据表加速了全面的挖掘过程,从而快速确定候选序列是否在站点发生过。 关键词:数据挖掘;序列模式;网络流量;隐私 Abstract With the dramatic increase in the total network traffic, there is now a research entity is trying to tap the transmission of data to get useful information. For example, there is some research and investigation and research related to the network worm detection and intrusion of non-normal transmission mode. However, because the network transmission of data contains the information of the user’s network usage patterns, the network user’s private information may be in the mining process is threatened. So, we propose an effective and practical way to protect your privacy, this protection is implemented in the network transmission data sequence pattern mining. Frequent sequential patterns found in the case of non-infringement of privacy in the method we use the data warehouse server model, this model is run as a single mining server and keep the reset, it may change the answer to the question. In addition, our method by keeping at each point data table to accelerate the overall mining process, to quickly determine whether the candidate sequences occurred at the site.省略”正好是接到来自“”的数据之后。 网络传输数据包含因特网对每一用户用法的详细信息,这些信息表明了一个用户在某一特定时间访问一个站点。在这里,关于网络传输数据的数据挖掘自身存在着危及网络用户隐私的问题。因此,在数据聚集过程中,需要先进的技术来隐藏或重整用户的私有信息。此外,这些技术不应当以牺牲挖掘结果的正确性为代价。 隐私保护数据挖掘是一个新的研究领域,可以在保护个人用户隐私的同时帮助挖掘数据信息。最近,在这个领域里已付出了许多的研究努力。然而,在先前的研究中提出的大部分方法,管理着一些站点中的数据或是处理小数量的独特类型的数据。因而,这些方法并不适合于挖掘网络传输数据,因为他们的错误和低性能。为此需要提出了一种有效的序列模式挖掘方法,它能够在解决前面方法中遇到的不正确性和低性能问题的同时保护隐私。为了发现频繁项集(例如,长度1模式)而不危及私有信息,提出的方法使用数据仓库服务器模型,这种模型作为一个单独的挖掘服务器运行。同样,它包含了在每一站点的元数据表来快速确定候选序列是否在站点发生过,从而使得整个挖掘过程具有高效性。 利用数据仓库服务器模型来寻找频繁项集的程序如下:首先,每一站点通过哈希函数将它自己的网络传输数据分割成N个

文档评论(0)

docman126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档