基于内容分析的垃圾邮件过滤技术的设计与实现-软件工程专业论文.docxVIP

基于内容分析的垃圾邮件过滤技术的设计与实现-软件工程专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据 万方数据 分类号 密级 UDC 注 1 学 位 论 文 基于内容分析的垃圾邮件过滤技术的设计与实现 (题名和副题名) 方 鹏 (作者姓名) 指导教师 向艳萍 副教授 电子科技大学 成 都 张 波 高 工 福建星网锐捷有限公司 福 建 (姓名、职称、单位名称) 申请学位级别 硕士 专业学位类别 工程硕士 工程领域名称 软 件 工 程 提交论文日期 2013.9.25 论文答辩日期 2013.10.26 学位授予单位和日期 电子科技大学 2013 年 12 月 24 日 答辩委员会主席 评阅人 注 1:注明《国际十进分类法 UDC》的类号。 万方数据 万方数据 THE DESIGN AND IMPLEMENTATION OF SPAM EMAIL FILTERING TECHNOLOGY BASED ON CONTENT ANALYSIS A Master Thesis Submitted to University of Electronic Science and Technology of China Major: Master of Engineering Author: Fang Peng Advisor: Xiang Yanping School : School of Aeronautics and Astronautics 万方数据 万方数据 独 创 性 声 明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作 及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为 获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与 我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的 说明并表示谢意。 作者签名: 日期: 年 月 日 论文使用授权 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘, 允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编学位论文。 (保密的学位论文在解密后应遵守此规定) 作者签名: 导师签名: 日期: 年 月 日 摘 摘 要 AB ABSTRACT 万方数据 万方数据 万方数据 万方数据 摘 要 自电子邮件的产生以来,它给人类的交流方式带来了革命性的改变。这是一 种快速异步地实现信息传递的技术。人们可以在任何时间,任何地点接受到邮件。 然而,电子邮件带来便捷的同时也被大量地滥用。如今垃圾邮件问题已经愈演愈 烈,对互联网的正常发展造成极大的危害。因此,如何实现对这类垃圾邮件的准 确过滤成为近几年热门的研究课题。在反垃圾邮件过滤,朴素贝叶斯算法完成的 非常完美,贝叶斯文本分类技术是使用最广泛的,取得的效果最好的垃圾邮件过 滤技术。它不仅占用的系统资源少,还节省运算时间,尤其是在拉丁语系的反垃 圾邮件过滤中堪称完美。然而,在中文邮件集的处理效果还是不理想。分词是指 将连续的字符串按照不同的规范,新组合成次序列的一个过程。然而,由于语系 的不同,这种方法用到中文分词中完全行不通,本文通过对中文分词的分析,制 定出好的中文分词方法,并运用到反垃圾邮件系统中。因此,本文主要针对中文 分词与朴素贝叶斯算法在垃圾邮件过滤的应用进行研究并实现,并利用中科院提 供的中文分词器,采用朴素贝叶斯算法编写出垃圾邮件过滤器。设计一种基于内 容分析的邮件过滤系统。首先对邮件的文本内容进行分类,然后根据朴素贝叶斯 算法进行计算,当超出某一阈值是判定为垃圾邮件,否则为正常邮件。针对邮件 接收的部分,考虑到目前市场服务提供商的条件限制,本文将采用简单的接受模 式,最大的模拟出真实环境。 关键词:垃圾邮件过滤,内容分析,中文分词,朴素贝叶斯 I ABSTRACT The e-mail has brought human communication a revolutionary change. This is a fast asynchronous technology to achieve information transmission. One can at any time, any place received messages. However, e-mail brings convenience while it has also being heavily abused. Today, the spam problem has becoming harm the normal development of the I

您可能关注的文档

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档