- 4
- 0
- 约1.68千字
- 约 5页
- 2016-11-27 发布于重庆
- 举报
基于主成分分析的垃圾郵件分类
MATLAB编程课程项目
、
项目题目:基于主成分分析的垃圾邮件分类
姓名:
学号:
院系:
小组成员:
内容介绍
我在小组中主要负责邮件的测试部分,也就是接收新邮件,利用已获得的垃圾邮件特称判断新邮件是否属于垃圾邮件。
项目所用方法与已有方法的分析和比较
项目所用方法为对于一封邮件,计算该邮件中每个单词在垃圾邮件和非垃圾邮件中出现的频率乘以次数并进行求和,最后通过比较垃圾邮件和非垃圾邮件的计算结果来判断此邮件是否是垃圾邮件。
项目的意义与特点
我所负责的内容在项目中属于一个比较靠后的部分,是对前面所做的工作的一个检测,是本项目最终所要实现的功能。
项目的实施原理
核心代码分析:
1:for i = 1:numTestDocs
2: for k = 1:numclassifier
3: for j = 1:numTokens
4: result(k) = result(k) + testMatrix(i,j) * log(P_numToken(k,j));
5: end
6: result(k) = result(k) + log(P_category(k));
7: end
8: if(result(1) result(
原创力文档

文档评论(0)