贝叶斯算法PPT选编.ppt

贝叶斯算法PPT选编

数据挖掘分类之;目录;1.1分类的基本概念;1.1分类的基本概念;;;;;;;动物种类;;步骤三:建立分类模型或分类器(分类)。 分类器通常可以看作一个函数,它把特征映射到类的空间上 ;;1.2 贝叶斯分类概述;; 贝叶斯公式提供了从先验概率P(A)、P(B)和P(B|A)计算后验概率P(A|B)的方法:P(A|B)=P(B|A)*P(A)/P(B) ,P(A|B)随着P(A)和P(B|A)的增长而增长,随着P(B)的增长而减少,即如果B独立于A时被观察到的可能性越大,那么B对A的支持度越小。 ;;; ; 第一阶段——准备工作阶段,这个阶段的任务是为朴素贝叶斯分类做必要的准备,主要工作是根据具体情况确定特征属性,并对每个特征属性进行适当划分,然后由人工对一部分待分类项进行分类,形成训练样本集合。这一阶段的输入是所有待分类数据,输出是特征属性和训练样本。这一阶段是整个朴素贝叶斯分类中唯一需要人工完成的阶段,其质量对整??过程将有重要影响,分类器的质量很大程度上由特征属性、特征属性划分及训练样本质量决定。; 朴素贝叶斯分类实例 检测SNS社区中不真实账号;首先设C=0表示真实账号,C=1表示不真实账号。;??2、获取训练样本 ????? 这里使用运维人员曾经人工检测过的1万个账号作为训练样本。 ?3、计算训练样本中每个类别的频率 ????? 用训练样本中真实

文档评论(0)

1亿VIP精品文档

相关文档