朴素贝叶斯分类算法的应用多元统计实验报告要点分析.pptVIP

  • 10
  • 0
  • 约2.48千字
  • 约 12页
  • 2016-06-06 发布于湖北
  • 举报

朴素贝叶斯分类算法的应用多元统计实验报告要点分析.ppt

应用多元统计实验报告 梦晴 朴素贝叶斯分类算法 算法简介 算法描述 算法优点 算法流程 算法实例 算法结果分析 算法简介 算法描述 (3)由于P(X) 对于所有类为常数,只需要P(X |Ci)P(Ci)最大即可。如果类的先验概率未知,则通常假定这些类是等概率的;即,P(C1) = P(C2) = ... = P(Cm)。并据此对P(Ci | X)最大化。否则,我们最大化P(X |Ci)P(Ci)。注意,类的先验概率可以用P(Ci) = si /s计算;其中,si是类C中的训练样本数,而s是训练样本总数。 (4)给定具有许多属性的数据集,计算P(X |Ci)的开销可能非常大。为降低P(X |Ci)计算的开销,可以做类条件独立的朴素假定。给定样本的类标号,假定属性值相互条件独立,即在属性间,不存在依赖关系。这样, 概率P(X1|Ci),P(X2|Ci),…P(Xn|Ci)可以由训练样本估值,其中 (a)如果Ak是连续值属性,则P(Xk|Ci)=Sik/Si,其中Sik是在属性Ak上具有值Xk的类Ci的样本数,而Si是Ci中的训练样本数。 (b)如果Ak是连续值属性,则通常假定该属性服从高斯分布,因而, 其中,给定类Ci的训练样本属性Ak的值, 是属性Ak的高斯密度函数,而 分别为平均值和标准差。 (5)为对未知样本X分类,对

文档评论(0)

1亿VIP精品文档

相关文档