- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
 - 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
 - 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
 - 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
 - 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
 - 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
 - 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
 
                        查看更多
                        
                    
                万方数据
万方数据
分类号	密级
UDC 注 1
学	位	论	文
基于内容分析的垃圾邮件过滤技术的设计与实现
(题名和副题名)
 	方  鹏 	
(作者姓名)
指导教师		向艳萍		副教授 电子科技大学		成	都 张		波	高		工
福建星网锐捷有限公司	福	建
(姓名、职称、单位名称) 申请学位级别	硕士	专业学位类别	工程硕士 工程领域名称		软	件	工	程
提交论文日期	2013.9.25	论文答辩日期	2013.10.26
学位授予单位和日期 电子科技大学	2013 年 12 月 24 日
答辩委员会主席 评阅人
注 1:注明《国际十进分类法 UDC》的类号。
万方数据
万方数据
THE DESIGN AND IMPLEMENTATION OF SPAM EMAIL FILTERING TECHNOLOGY BASED ON CONTENT ANALYSIS
A Master Thesis Submitted to
University of Electronic Science and Technology of China
Major:	Master of Engineering 	
Author:	Fang Peng 	
Advisor:	Xiang Yanping 	
School :	School of Aeronautics and Astronautics 	
万方数据
万方数据
独 创 性 声 明
本人声明所呈交的学位论文是本人在导师指导下进行的研究工作 及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为 获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与 我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的 说明并表示谢意。
作者签名:		日期:	年	月	日
论文使用授权
本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘, 允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编学位论文。
(保密的学位论文在解密后应遵守此规定) 作者签名:		导师签名:
日期:	年	月	日
摘 
摘 要
AB
ABSTRACT
万方数据
万方数据
万方数据
万方数据
摘 要
自电子邮件的产生以来,它给人类的交流方式带来了革命性的改变。这是一 种快速异步地实现信息传递的技术。人们可以在任何时间,任何地点接受到邮件。 然而,电子邮件带来便捷的同时也被大量地滥用。如今垃圾邮件问题已经愈演愈 烈,对互联网的正常发展造成极大的危害。因此,如何实现对这类垃圾邮件的准 确过滤成为近几年热门的研究课题。在反垃圾邮件过滤,朴素贝叶斯算法完成的 非常完美,贝叶斯文本分类技术是使用最广泛的,取得的效果最好的垃圾邮件过 滤技术。它不仅占用的系统资源少,还节省运算时间,尤其是在拉丁语系的反垃 圾邮件过滤中堪称完美。然而,在中文邮件集的处理效果还是不理想。分词是指 将连续的字符串按照不同的规范,新组合成次序列的一个过程。然而,由于语系 的不同,这种方法用到中文分词中完全行不通,本文通过对中文分词的分析,制 定出好的中文分词方法,并运用到反垃圾邮件系统中。因此,本文主要针对中文 分词与朴素贝叶斯算法在垃圾邮件过滤的应用进行研究并实现,并利用中科院提 供的中文分词器,采用朴素贝叶斯算法编写出垃圾邮件过滤器。设计一种基于内 容分析的邮件过滤系统。首先对邮件的文本内容进行分类,然后根据朴素贝叶斯 算法进行计算,当超出某一阈值是判定为垃圾邮件,否则为正常邮件。针对邮件 接收的部分,考虑到目前市场服务提供商的条件限制,本文将采用简单的接受模 式,最大的模拟出真实环境。
关键词:垃圾邮件过滤,内容分析,中文分词,朴素贝叶斯
I
ABSTRACT
The e-mail has brought human communication a revolutionary change. This is a fast asynchronous technology to achieve information transmission. One can at any time, any place received messages. However, e-mail brings convenience while it has also being heavily abused. Today, the spam problem has becoming harm the normal development of the I
                您可能关注的文档
- 基于无线传感器网络的定位算法研究-计算机应用技术专业论文.docx
 - 基于网格方法的聚类算法研究-计算机软件与理论专业论文.docx
 - 基于收益分配视角的山西煤炭企业可持续发展研究-政治经济学专业论文.docx
 - 基于数据挖掘的银行客户流失模型研究-信息管理与信息系统专业论文.docx
 - 基于随机利率的可违约债券定价研究-金融数学专业论文.docx
 - 基于通信GIS系统的光缆在线监测设计与实现-软件工程专业论文.docx
 - 基于遗传算法的高校排课系统设计与实现-软件工程专业论文.docx
 - 基于微网并网运行的微型燃气轮机系统稳定性仿真-电力系统及其自动化专业论文.docx
 - 基于网络的教育资金管理系统的研究与设计实现-软件工程专业论文.docx
 - 基于视频素材的虚拟场景生成系统-计算机应用技术专业论文.docx
 
- 基于上下位机模式的汽车零部件测控平台软件系统开发-车辆工程专业论文.docx
 - 基于网络拓扑的攻击响应系统-计算机应用技术专业论文.docx
 - 基于锁相技术的超声波电机驱动控制技术的研究-电气工程;应用电子与运动控制专业论文.docx
 - 基于遥感和数字图像处理技术的太湖蓝藻预警系统研究-计算机技术专业论文.docx
 - 基于数值代数的图像复原技术研究-计算数学专业论文.docx
 - 基于数据仓库的电信运营商数据供应链管理体系研究工商管理专业论文.docx
 - 基于时变可靠度理论的既有钢筋混凝土梁桥剩余寿命评估-桥梁与隧道工程专业论文.docx
 - 基于系统动力学模型的河南乡村旅游发展研究-旅游管理专业论文.docx
 - 基于神经网络的LDPC译码算法研究-通信与信息系统专业论文.docx
 - 基于人口结构视角的义务教育公共支出影响因素分析-西方经济学专业论文.docx
 
最近下载
- 2025年2季度5G产业和市场发展报告-TD产业联盟.pptx VIP
 - 基于plc的中央空调控制系统设计.docx VIP
 - 2017年11月浙江卷(健忘妈妈趣事)-2022年新高考英语读后续写历年真题解析(40张精品课件).pptx VIP
 - 2023年资料员资格考试题库答案下载.docx
 - 2025年中考数学总复习《二次函数的实际应用》专项测试卷(附答案).docx VIP
 - 2025年护理核心制度考核试题(附答案).docx
 - 超星尔雅学习通《中华传统文化之文学瑰宝》2021章节测试答案.docx VIP
 - RAZ-D分级阅读学前英语绘本Pillow Fort Password(可打印成册).pdf
 - 《赤壁》PPT下载一等奖新优质课比赛公开课获奖.ppt VIP
 - 论语 原文版精校 可直接打印.pdf VIP
 
原创力文档
                        

文档评论(0)