- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要
摘要
随着移动通信技术的发展,手机短信已成为人们生活中必不可少的通信方 式之一。然而日益增多的垃圾短借给人们的生活带来很多不便。垃圾短借过滤 问题已成为全球性的具有重大现实意义的课题。
本文深入研究了基于内容的垃圾短信过滤技术,改进了 Winnow 算法,并提 出一种新的基于 CAPTCHA 的垃极短信过滤方法,主要工作包括:
1) Winnow 算法是一种可以在线更新的分类算法,它通过改变权重向盘进
行更新。为了降低算法的复杂度,本文提出在每次更新权值后加入剪枝过程, 剪掉那些对分类结果几乎没有影响的特征。
2) 利用用户交互式学习思想,根据用户的反馈信息随时更新 Winnow 分类 器。本文提出的方法根据用户判定的误分类短倍的信息、找出未被判定的误分类 短信,然后纠正分类器以前产生的错误,问时更新分类器的分类规则,避免以 后的分类过程中产生问样的错误。更新分类器时采用 Adaboosting 算法提升分类 器性能,并对 Adaboosting 算法进行了两方面的改进:针对退化问题,采用在各 样本集内部调整短信样本的权重的方法:针对垃圾短信和正常短倍的不对称问 题,采用修改分类器加权因子的方法。
3) 提出多 Winnow 分类器模型,根据多个分类器的分类结果对短信分类。 利用同样的训练集选择出不同的特征集,根据各个特征集训练出不同的分类器。 本文只实现了双 Winnow 分类器。
的针对计算机程序经常发送恶意的组垃圾短倍的现状,本文提出了基于
CAPTCHA (全自动人机识别系统)的过滤方法,并提出一种新的基于图片识别 的 CAPTCHA 方法。
关键词:垃圾短信 Winnow 算法剪枝交互式学习 多分类器模型企自动 人机识别系统 图片识别
ABS丁RAC丁
ABSTRACT
With the development of mobile communication technology,SMS has become an indispensable means of communication in life. However,the number of spam messages has been increasing and SMS spam have produced a lot of inconvenience to peoples lives. 刊的fore,SMS spam filtering problem has beωme a global su均ect and has practical significance.
SMS spam filtering techniques which based on ∞ntent have been studied de叩ly,
Winnow al伊thm was improved and a new SMS filtering method bωed on CAPTCHA was proposed. Main tasks 町eωfollows:
Winnow is a classi负cation algrithm that can be updated on line by changing weight vectors. In order 协 reduce trainingωmplexity of the process of classification ,we added pruning process a班er updating weights ,which can cut off
the features that had little impact on the result of classification.
Winnow classifier can be updated based on users feedback making use of the user-interactive-learning ideas. The method proposed in 出is pap町 can find misclassification messages 由at have not been determined making use of the
misclassification messages that have been det臼mined by us町, and correct classification errors produc叫before,at 阳same time,upd创e the classifier rules and avoid the same mistakes
您可能关注的文档
- 基于WinCC的烟气脱硫工艺监控系统的设计与实现-软件工程专业论文.docx
- 基于WinCC和PLC的轴承滚道超精研自动控制系统的设计-机械制造及其自动化专业论文.docx
- 基于WinCE操作系统的GPS接收机的研究-电子与通讯工程专业论文.docx
- 基于WINCE操作系统和GPRS模块的短信功能实现-软件工程专业论文.docx
- 基于WinCE的CAN通讯网络的研究与实现-计算机应用技术专业论文.docx
- 基于WinCE的CEMS嵌入式数据库的研究-通信与信息系统专业论文.docx
- 基于WinCE的超声检测自动判读算法研究-通信与信息系统专业论文.docx
- 基于WINCE的车辆故障监测系统的设计与实现-控制理论与控制工程专业论文.docx
- 基于WINCE的触摸屏的研究与应用-计算机应用技术专业论文.docx
- 基于WinCE的短波综合模拟设备软件设计与实现-通信与信息系统专业论文.docx
- 基于WinPcap的电子邮件监测系统的设计与实现-计算机科学与技术专业论文.docx
- 基于WinPcap的局域网监控系统的设计与实现-电路与系统专业论文.docx
- 基于WinpCap的网络流量统计分析系统设计与实现-计算机技术专业论文.docx
- 基于WinPcap的网络入侵检测系统的设计与开发-软件工程专业论文.docx
- 基于Winpcap软件测试系统的研究与实现-计算机科学与技术专业论文.docx
- 基于WinSNMP的网络管理系统的设计与实现-通信与信息系统专业论文.docx
- 基于WINSOCKET技术的传真管理系统的设计-计算机科学与技术专业论文.docx
- 基于Winsock的局域网监控系统的设计与实现-软件工程专业论文.docx
- 基于Winsock的网际通讯系统的设计与实现-通信与信息系统专业论文.docx
- 基于Winsock的网络地理信息系统的研发-模式识别与智能系统专业论文.docx
文档评论(0)