一种基于内容的邮件过滤模型的研究和性能分析.pdfVIP

一种基于内容的邮件过滤模型的研究和性能分析.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于内容的邮件过滤模型的研究与性能分析 石艳荣孙丹宁贺永强 山东工商学院信息与电子工程学院烟台264005 圾邮件泛滥的趋势愈演愈烈,绘合法的电子邮件用户带来了多方面的惨重损失。如何有效地防范垃圾邮件, 是具有重要现实意义的课题。本文设计了一种基于内容的邮件过滤模型,综合运用了最小风险Bayes分类法、 向量空间模型、1rI∞F方法、特征提取及Ⅺ。变换,并对该模型的实现进行了研究和探讨。 关键词:邮件过滤;向量空间:文本分类最小风险;Bayes分类法 PerfOrmanceOfA Researchand Analysis System E凹aIIFi|ter.ng Shi Sun He YanrongDanningYongqiang hstitmeofBusiⅡessand Sh如dong Technology,Y柚Tai,264005 in ithas ofthe Abstract:Eman In蛔mec∞mmllnicaⅡ∞皿dbecome曲eb∞ic plays姐importaⅡtpan is dementsfor1nlemet.But eman m衄Iifold lo站for emn no、Ⅳ’spam overwhelnling柚dh鲢b10ughl grave kgal u∞rs.Sohawt0 isan realis吐ci豁u髂.ThiS a prev∞tsp砌emailimponant pap盯pmpo∞s with of asVector Model姐d modelcomb妣du删∞曲n scveral F髓魄 filt曲g keytechniqucs,蚰chSpace Ex灯ac£ion,皿Fmethod,Ⅱleleast kast础sk Bayes KeyvVords:ManF丑ce血gVSM;Te砒cat删窈矗on;The 1 引言 有关研究数据显示,我国的一个电子邮件用户平均每年收到的垃圾邮件多达350封,约占收件总数的一 半。这些垃圾邮件多是促销广告,其他还包括色情、赌博等内容。垃圾邮件不仅干扰了用户对网络的使用, 也滥用了网络带宽、计算机处理和存储资源。通过垃圾邮件散发的反动、色情、暴力等宣传材料更是严重威 胁了计算机网络和系统的安全,甚至是国家和社会安全。因此如何有效地防范垃圾邮件,是具有重要现实意 义的课题。 目前反垃圾邮件用到的主要技术就是过滤技术。电子邮件通常具有几个重要组成部分,电子邮件地址、 主题、信件内容等相关部分,这些都是过滤技术判断、分析、统计和提取的依据。目前常用的邮件过滤方法 就是寻找出邮件的特定模式(即规则)IlJlq。例如主题包含“免费”等。这种方法的优点是规则可以共享, 因此它的推广性强,目前市场上的产品多是采用这一方法。它的缺点是更新速度慢.因为规则一般都是人工 编写生成,而新规则的产生速度往往跟不上新垃圾邮件出现的速度,所以它的时效性较差,本文提出了一种

文档评论(0)

cxmckate + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档