CTPH摘要在Chord网络中的发布和查询.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
优秀硕士毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!

摘要 摘要 基于摘要的垃圾邮件识别方法是众多垃圾邮件识别方法中十分重要的一 种。这类技术通过对比邮件摘要相似性来判定垃圾邮件。然而,现有的识别技 术大都采用集中式的摘要管理模式,该模式具有单点失效、可扩展性差等缺陷。 分布式的处理方法必然成为未来发展的趋势。 在基于摘要的分布式垃圾邮件处理系统中,如何高效、快捷的发布和查询 邮件摘要是研究的重点之一。本文在研究CTPH摘要生成算法和DHT信息发 布技术的基础上,利用iDistance方法将高维的CTPH摘要映射成一维的标识符, 法具有如下三个特点: (1)iCTPH能将相似的CTPH摘要发布到相同或相近 的节点上;(2)基于区段检索的查询算法保证仅查询网络中的少数节点即可召 回绝大部分相似摘要; (3)iCTPH具有良好的可扩展性和负载均衡性。本文 发布到不足5.6%的节点上,仅需查询4%的节点即可召回85%的相似摘要。 在基于iCTPH算法的分布式垃圾邮件过滤系统中,系统可用性也是一个至 关重要的问题,节点的加入和离开会造成网络抖动,进而会极大地影响查询准 确性。本文在详细分析各种网络抖动类型的基础上,设计了一套数据维护算法 保障系统可用性。该算法为每个节点设置两套数据库:MAINDB和AUXDB。 前者作为摘要查询和发布的主数据库,后者作为备份数据库。节点在其运行周 期内会不断将MAINDB中的数据备份到其它节点的AUXDB,并且将自身的 AUXDB同步到当前管理节点的MAINDB。文章通过仿真实验对比了没有采 用数据维护算法和采用了该算法两种情况下的系统可用性,并给出了定量分析。 实验表明,数据动态维护算法能有效地提高系统可用性,备份节点的数目为1 即可使系统可用性从10%上升到90%。 关键词:垃圾邮件CTPH摘要Chord分布式哈希表系统可用性 Abstract isoneofthemost methodsinthe Digest-basedanti·spamtechnology important field.This identifies the ofthe anti—spam technologyspambycomparingsimilarity email methods acentralized digests.However,the alwaysadopt structure existing whichhas andnot failure is sealable.Inthe to singlepoint problem future,theway musttendtobealldistributedmanner. identifyspam In distributed researchconcentrateson anti-spare digest-based technology,the how to and onthe ofCTPHand publishlookupdigestsefficiently.Baseddeepstudy DHT,we an to and CTPH inChord: proposeapproachpublishlookup digests whichthe

文档评论(0)

wpxuang12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档