基于Bloom filter的远程对称差规模估算法.docVIP

下载本文档

2
0
约4.33千字
约 5页
2016-09-30 发布于北京
举报
版权申诉

基于Bloom filter的远程对称差规模估算法.doc

1、本文档共5页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于Bloom filter的远程对称差规模估算法.doc

基于Bloom filter的远程对称差规模估算法　　摘要：在内容分发网络、闲谈协议、移动数据同步等分布式系统中，远程主机上集合对称差规模的估算准确程度，直接影响基于CPISync算法的集合调和方法的消息交换轮数以及调和时间。对称差规模的估算误差越低，则集合调和的速度越快。本文提出了基于布鲁姆过滤器的准交集查询法，该算法可显著降低对称差规模的估算误差，提高调和算法的效率。　　关键词：移动计算；布鲁姆过滤器；集合调和；数据同步　　中图分类号：TP393 文献标识码：A 　　1 引言　　随着网络基础设施的日趋完善和无线通信技术的发展，移动计算设备的计算和待机能力也在逐步提高，人们对使用PDA、智能手机、平板电脑等移动设备进行移动计算的要求越来越普及，加上对等网络（peer-to-peer， P2P）技术的研究和应用日益深入，出现了移动P2P计算（mobile peer-to-peer computing）[1-5]的研究热点。　　移动P2P计算领域中通常有两类数据同步方案：慢同步和快同步。慢同步时在同步终端之间传输所有数据，由于同步终端间的实际差异往往远小于实际数据集规模，因此该方法在带宽占用和时延方面效率较低。目前研究人员较关注的是快同步方案，即同步终端间仅传输相异数据，以达到改善带宽效率和时延效率的目的，如文献[6]提出了两种基于特征多项式插值同步算法（characteristic polynomial interpolation -based synchronization， CPISync）的快同步技术方案：确定性方案和概率性方案。确定性方案是在已知远程集合的对称差规模时使用的，但是，在移动计算领域，由于远程集合的对称差规模无法事先了解，只能使用概率性方案。文献[6]中的概率性方案不能在单轮数据交换过程中完成数据同步，必须试探性地逐轮增加插值点个数（称试探法），这样就可能造成多轮数据交换导致数据同步的时延过长。另外，文献[7]提出了一种分而治之的划分法，以降低算法的计算复杂度。其具体做法如下：将整个全集空间递归地划分为若干个子分区，直至子分区足够小，仅需调用一次CPISync算法可完成子分区的调和为止。设d为对称差规模，划分法同步只需（d）计算复杂度，但以节点之间更多的数据交换轮数为代价[7]。因此，如果能用布鲁姆过滤器（Bloom filter， BF）结构估算出对称差规模的较准确值，然后再调用CPISync算法，就能用较少的数据交换轮数（最好情况是1轮）完成数据同步，提高这类概率性方案的同步时延效率。　　本文第2节介绍现有的基于Bloom filter的远程对称差规模估算方法，并提出了准交集查询法。第3节是各估算方法的实验比较部分。第4节将各对称差规模估算方法用于P2P系统中的集合调和，测试算法在实际系统中的应用性能。第5节是本文工作的总结。　　2 基于Bloom filter的对称差规模估算方法　　2.1 计数布鲁姆过滤器法　　由图4可看出，使用准交集查询法的集合调和过程其一次插值成功率总体来说优于其它方法，性能优势较为突出。　　事实上，如果我们对算法2稍作修改：使用布鲁姆过滤器估算出对称差规模值d0后，在算法2的第2步，多计算10%（0.1d0）的特征多项式值，节点A首次即使用（1.1d0+r +1）个特征多项式值进行插值，然后确认、因式分解等，则算法能显著地提高一次插值成功率（图5），降低数据交换轮数，从而减少调和时间。这样做仅需增加少量的数据传输位数，但能显著减少数据交换轮数，这在分布式系统中是完全可行的。　　由图5可看出，对算法2按如上所述进行修改后，除内积法外，其他方法均能使集合调和的一次插值成功率达到100%或极为接近100%，以计数布鲁姆过滤器法的性能最为突出，其一次插值成功率始终为100%，而准交集查询法和布鲁姆过滤器交互查询法在对称差规模较小时稍差，为98%-99%。内积法、准交集查询法和布鲁姆过滤器交互查询法如果其一次插值成功率为100%，即仅需1次插值算法的调用，则意味着使用这些估算方法的特征多项式插值调和过程只需要1轮数据交换即可完成。但布鲁姆过滤器交互查询法由于在估算对称差规模时需要使用1轮数据交换才能完成，因此，即使其只需调用1次插值算法，它也需2轮数据交换才能完成调和。　　5 结论　　由于准交集查询法估算能得到对称差规模的较准确值，从而使用准交集查询法的集合调和过程总体来说比使用其它方法的集合调和过程要好得较多，插值次数、调和时间和一次插值成功率均有较突出的优势，综合起来其性能表现是最好的，是一种值得推荐的好方法。而内积法由于其对称差规模估算准确程度最低，从而数据调和性能也是最差的，在分布式系统中应该尽量避免使用这种方法。而