朴素贝叶斯分类算法讲义.pptVIP

  • 105
  • 0
  • 约2.95千字
  • 约 12页
  • 2017-01-02 发布于湖北
  • 举报
Spark实现贝叶斯算法 本章要点 一、分类算法 二、贝叶斯公式 三、朴素贝叶斯分类 四、Spark实现贝叶斯算法 分类算法 何为分类算法?简单来说,就是将具有某些特性的物体归类对应到一个已知的类别集合中的某个类别上。从数学角度来说,可以做如下定义: 已知集合: C={y 1 ,y 2 ,..,y n } 和 I={x 1 ,x 2 ,..,x m ,..} ,确定映射规则 y=f(x) ,使得任意 x i ∈I 有且仅有一个 y j ∈C 使得 y j =f(x i ) 成立。 其中,C为类别集合,I为待分类的物体,f则为分类器,分类算法的主要任务就是构造分类器f。 分类算法的构造通常需要一个已知类别的集合来进行训练,通常来说训练出来的分类算法不可能达到100%的准确率。分类器的质量往往与训练数据、验证数据、训练数据样本大小等因素相关。 分类算法 举个例子,我们日常生活中看到一个陌生人,要做的第一件事情就是判断其性别,判断性别的过程就是一个分类的过程。根据以往的生活经验,通常经过头发长短、服饰和体型这三个要素就能判断出来一个人的性别。这里的“生活经验”就是一个训练好的关于性别判断的模型,其训练数据是日常生活中遇到的形形色色的人。突然有一天,一个娘炮走到了你面前,长发飘飘,穿着紧身的衣裤,可是体型却很man,于是你就疑惑了,根据以往的经验——

文档评论(0)

1亿VIP精品文档

相关文档