垃圾邮件Bloom Filter过滤算法浅析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
垃圾邮件Bloom Filter过滤算法浅析.doc

垃圾邮件Bloom Filter过滤算法浅析   【摘要】本课题在对电子邮件原理和垃圾邮件的过滤方法进行分析研究的基础上,设计了一种垃圾邮件过滤算法,并实现了垃圾邮件过滤系统。这个系统基于Bloom Filter的LOAF技术,通过LOAF把收到的邮件初步分为从高到低的1,2,3三个可信度等级,1级表示是自己的好友发来的邮件,2级表示是跟自己好友有联系的人发来的邮件,1、2级邮件不可能是垃圾邮件。   本文主要介绍了Bloom Filter的基本原理及其实现。Bloom Filter是一种新的高效率的数据机构,是实现LOAF的基础。   【关键词】垃圾邮件过滤; Bloom Filter;LOAF;   中图分类号:F618.1 文献标识码:A 文章编号:   系统设计思路   随着垃圾邮件的泛滥,各种垃圾邮件过滤技术不断的出现和发展。通过对部分过滤技术的研究,我们设计并实现了这个系统。接下来我们看看系统工作的整个流程。   这个系统包括两部分,邮件发送端和邮件接收端。发送端的功能包括发送邮件、读取显示通讯录、添加联系人等。接收端的功能包括接收邮件、读取显示通讯录、邮件过滤、添加功能等。   Bloom Filter 实现的主要函数   1BFMembershipQuery()函数    BFMembershipQuery()函数的功能就是判断一个元素是不是在Bloom Filter 数组中,如果是则返回1;不是则返回0。需要传递三个参数为:Bloom Filter 数组bf、带查询的元素element和元素长度length。    首先,对element产生一个SHA1哈希函数地址。其次,与bf中的对应位进行比较。函数代码如下:   int BFMembershipQuery(BloomFilter *bf, const unsigned char *element, unsigned length)   { int result = 1, i;    //产生SHA1地址 unsigned *hashAddress = (unsigned *)malloc(sizeof(unsigned) * bf-Hash_Num);    if (!GenerateHashAddress(element, length, bf-Length, bf-Hash_Num, hashAddress))    { free(hashAddress);    return 0;    }    for (i = 0; i Hash_Num; i++) //对应位比较    { if (!GetBits((unsigned *)bf-Bit_Array, hashAddress[i], 1))    {    result = 0;    break;    }    }    free(hashAddress); return result;   }   2BFInsert()函数   BFInsert()函数实现把一个元素插入Bloom Filter 数组中,同样需要传递Bloom Filter 数组bf、带查询的元素element和元素长度length三个参数。   插入过程也比较简单,首先,对element产生一个哈希地址,然后把在bf中对应位置1,这样就完成了插入的操作,函数实现代码如下:   int BFInsert(BloomFilter *bf, const unsigned char *element, unsigned length)   {    int i;    //产生SHA1地址    unsigned *hashAddress = (unsigned *)malloc(sizeof(unsigned) * bf-Hash_Num);    if (!GenerateHashAddress(element, length, bf-Length, bf-Hash_Num, hashAddress))    {    free(hashAddress);    return 0;    }    for (i = 0; i Hash_Num; i++) //对应位置1    SetBits((unsigned *)bf-Bit_Array, hashAddress[i], 1, 1);    free(hashAddress);    return 1;   }   3Main()主函数   主函数的功能就是实现Bloom Filter 的初始化、判断以及插入。   在初始化这一步骤中,我们要设定Bloom Filter数组的

文档评论(0)

sis_lxf + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档