朴素贝叶斯算法和SVM算法在Web文本分类中的效率分析教学教程幻灯片.pptxVIP

  • 4
  • 0
  • 约1.94千字
  • 约 17页
  • 2018-03-08 发布于天津
  • 举报

朴素贝叶斯算法和SVM算法在Web文本分类中的效率分析教学教程幻灯片.pptx

教学课件课件PPT医学培训课件教育资源教材讲义

朴素贝叶斯算法和SVM算法在Web文本分类中的效率分析主讲:周磊指导老师:孙翀论文研究内容 随着互联网上海量文本信息的增加,数据挖掘扩展到了Web数据挖掘,文本挖掘也随之扩展到了Web文本挖掘。Web文本分类计数是Web文本挖掘的只要分支之一,而文本分类算法的选择对文本分类技术至关重要。 本文主要是通过构建Web分类系统,将朴素贝叶斯算法和支持向量机SVM算法在自建的Web系统的进行效率的测试对比。朴素贝叶斯分类算法 (1)设D是训练元组和它们相关的类标号的集合。通常,每个元组用一个n维属性向量X={x1,x2,···,xn}表示,描述由n个属性A1,A2···,An对元组的n个测量。(2)假定有m个类C1,C2,···,Cm。给定元组X,分类法将预测X属于具有最高后验概率的类(在条件X下)。也就是说,朴素贝叶斯分类算法预测X属于类Ci,当且仅当 P(Ci|X)P(Cj|X) 1≤j≤m,j≠i这样,最大化P(Ci|X)。P(Ci|X)最大的类Ci称为最大后验假设。根据贝叶斯定理: P(Ci|X)=P(X|Ci)P(Ci)/P(X)(3)由于P(X)对所有类为常数,所以只需要满足P(X|Ci)P(Ci)最大即可。朴素贝叶斯分类算法 支持向量机SVM分类1.在n维空间中找到一个分类超平面,将空间上的点分类。如下2. 一般而言,一个点距离超平面的远近可以表示为分类预测的确信或准确程度

文档评论(0)

1亿VIP精品文档

相关文档