北方工业大学—数据仓库挖掘7.bayes分类方法.pptVIP

  • 4
  • 0
  • 约6.53千字
  • 约 51页
  • 2017-10-02 发布于广东
  • 举报

北方工业大学—数据仓库挖掘7.bayes分类方法.ppt

北方工业大学—数据仓库挖掘7.bayes分类方法

主要内容 Bayes分类 基于实例的分类 集成方法 Bayes分类器 一个用于解决分类问题的概率框架 条件概率: Bayes定理: Bayes定理举例 给定: 50%的脑膜炎患者脖子僵硬 人得脑膜炎的概率是1/50,000 脖子僵硬的人的概率是 1/20 若某个患者脖子僵硬,则他患脑膜炎的概率是多少? Bayes分类器 将每个属性及类别标记视为随机变量 给定一个具有属性集合(A1, A2,…,An)的记录 目标是预测类别属性C 具体而言,要寻找使得P(C| A1, A2,…,An )最大的类别C Bayes分类器 方法: 利用Bayes定理计算所有类别C的后验概率P(C | A1, A2, …, An) 选择使如下概率值最大的类别C P(C | A1, A2, …, An) 等价于使如下概率值最大 P(A1, A2, …, An|C) P(C) 朴素Bayes分类器 假定给定类别的条件下属性Ai之间是独立的: P(A1, A2, …, An |C) = P(A1| C) P(A2| C)… P(An| C) 可以从Ai和C中估算出P(Ai| C) 类别为使P(Cj) ? P(Ai| Cj)最大的类Cj 如何从数据中估算概率 类: P(C) = Nc/N e.g., P(No) = 7/10, P(Yes

文档评论(0)

1亿VIP精品文档

相关文档