协同分类器在垃圾邮件过滤中的应用.ppt
协同分类器在垃圾邮件过滤中的应用 网络中心研究生 高庆国 2008年6月18日 主要内容 1 概述 2 SVM和KNN 3 协同的原理 4 总结 概述 邮件过滤自身的特性 1 在线性 2 结构性 3 客户性 4 非均匀性 垃圾邮件过滤技术有多种,到目前为止,基于邮件内容的过滤是其中效果最好的。基于内容的过滤就是利用文本分类算法来对邮件进行过滤,可以将邮件分为两类文本:正常邮件和垃圾邮件,将邮件内容映射为向量空间中的向量,通过计算邮件间的相似度来判断是否为垃圾邮件。 基于内容的邮件过滤 1 基于规则的过滤方法 Ripper、决策树、Boosting决策树、粗糙集等方法 2 基于机器学习的方法 Bayes、KNN、SVM等方法 基于规则的方法具有“计划赶不上变化”的缺点 基于机器学习的方法具有“与时俱进”的优点 SVM 支持向量机的基本思想可概括为:首先通过非线性变换将样本空间变换到一个高维空间,然后在新空间中求取最优线性分类面,此非线性变换通过定义适当的核函数实现。 支持向量机具有以下优点: 1可以解决小样本情况下的机器学习问题 2可以提高泛化性能 3可以解决高维问题 4可以解决非线性问题 5可以避免神经网络结构选择和局部极小点问题?? SVM性能的参数: SVM的性能受到核函数形式及其参数、问题本身的复杂程度、分类面附
您可能关注的文档
- 从大学生村官中考核招聘乡镇事业单位工作人员登记表.doc
- 以下岗位工作地点内贸销售为全国各地,其余为安徽、江苏.doc
- 企业专利权质押融资评估费补贴申报书-附件.doc
- 企业溢价与市值管理.doc
- 优秀教师免费导学公益活动导学排课表.doc
- 你认为如何你怎麽想你的想法呢____doyouthink__.ppt
- 保健食品企业标准.doc
- 信息学院2016届毕业生专业相关介绍.doc
- 俪行庐山、花漾婺源3.8丽人节特惠活动.doc
- 光明新区创新型产业用房管理暂行办法.doc
- 再造烟叶生产线可行性研究报告.docx
- 安全员b证考试题库及答案建筑.doc
- 2026年配电网规划十年发展:分布式能源接入与电网稳定报告.docx
- 2026年最新传播学概念面试题及答案.doc
- 2026年农业物联网技术发展报告及市场前景分析.docx
- 《TCUPC城镇既有建筑供电安全改造技术规范》.pdf
- 莱芜市莱城区2025-2026学年第二学期二年级语文第八单元测试卷部编版含答案.docx
- 2026年共享经济行业报告及行业发展瓶颈与解决方案.docx
- 西宁市城中区2025-2026学年第二学期五年级语文第八单元测试卷(部编版含答案).docx
- 中小学班队活动 七年级下册 《第9课 会劳动——会做简单修理》教学设计.docx
原创力文档

文档评论(0)