贝叶斯分类分类算法46.pptVIP

  • 3
  • 0
  • 约2.17千字
  • 约 29页
  • 2017-07-16 发布于北京
  • 举报
实验3:贝叶斯分类分类算法 实验3:贝叶斯分类分类算法 实验目的: 1.掌握贝叶斯分类算法 2.熟悉C++编程 3.数据集见下图: 背景知识 朴素贝叶斯分类 朴素贝叶斯分类的工作过程如下: (1)? 每个数据样本用一个n维特征向量X= {x1,x2,……,xn}表示,分别描述对n个属性A1,A2,……,An样本的n个度量。 (2) 假定有m个类C1,C2,…,Cm,给定一个未知的数据样本X(即没有类标号),分类器将预测X属于具有最高后验概率(条件X下)的类。也就是说,朴素贝叶斯分类将未知的样本分配给类Ci(1≤i≤m)当且仅当P(Ci|X) P(Cj|X),对任意的j=1,2,…,m,j≠i。这样,最大化P(Ci|X)。其P(Ci|X)最大的类Ci称为最大后验假定。根据贝叶斯定理 * 朴素贝叶斯分类(续) (3)?由于P(X)对于所有类为常数,只需要P(X|Ci)*P(Ci)最大即可。如果Ci类的先验概率未知,则通常假定这些类是等概率的,即P(C1)=P(C2)=…=P(Cm),因此问题就转换为对P(X|Ci)的最大化(P(X|Ci)常被称为给定Ci时数据X的似然度,而使P(X|Ci)最大的假设Ci称为最大似然假设)。 否则,需要最大化P(X|Ci)*P(Ci)。注意,类的先验概率可以用P(Ci)=si/s计算,其中si是类Ci中的训练样本数,而s是训练样本总数。 * 朴素贝叶

文档评论(0)

1亿VIP精品文档

相关文档