朴素贝叶斯方法处理缺失值.pptVIP

  • 3
  • 0
  • 约3.81千字
  • 约 20页
  • 2017-05-22 发布于上海
  • 举报
朴素贝叶斯方法处理缺失值

朴素贝叶斯 结 构 贝叶斯理论 贝叶斯分类器 Ω={A1×A2×...×Am},是由所有未知类别的可能样本组成的集合; Ωc={A1×A2×...×Am×C}是由所有已知类别的样本组成的集合。D Ωc是训练样例集合。 Ω中的元素x表示为x = a1,a2 ,…,am。 Ωc中的元素x表示为x = a1,a2 ,…,am,cj。其中ai表示第i个属性的某个取值。 描述用到的符号 我们用Ai表示第i个属性,C表示决策属性;aik表示第i个属性的第k个取值,cj表示第j类;加上绝对值则表示相应的个数,如|Ai|表示第i个属性的取值个数,|cj|表示第j类样例个数。 贝叶斯定理 设x∈Ω是一个类别未知的数据样本,cj为某个类别,若数据样本x属于一个特定的类别cj,那么分类问题就是决定P(cj|x),即在获得数据样本x时,确定x的最佳分类。所谓最佳分类,一种办法是把它定义为在给定数据集D中不同类别cj先验概率的条件下最可能(most probable)分类。贝叶斯理论提供了计算这种可能性的一种直接方法 更精确地讲,贝叶斯法则基于假设的先验概率、给定假设下观察到不同数据的概率,提供了一种计算假设概率的方法 贝叶斯公式 先验概率P(cj) P( cj|x) = P(x|cj)P(cj) P(x) 联合概率P(x

文档评论(0)

1亿VIP精品文档

相关文档