- 105
- 0
- 约2.95千字
- 约 12页
- 2017-01-02 发布于湖北
- 举报
Spark实现贝叶斯算法 本章要点 一、分类算法 二、贝叶斯公式 三、朴素贝叶斯分类 四、Spark实现贝叶斯算法 分类算法 何为分类算法?简单来说,就是将具有某些特性的物体归类对应到一个已知的类别集合中的某个类别上。从数学角度来说,可以做如下定义: 已知集合: C={y 1 ,y 2 ,..,y n } 和 I={x 1 ,x 2 ,..,x m ,..} ,确定映射规则 y=f(x) ,使得任意 x i ∈I 有且仅有一个 y j ∈C 使得 y j =f(x i ) 成立。 其中,C为类别集合,I为待分类的物体,f则为分类器,分类算法的主要任务就是构造分类器f。 分类算法的构造通常需要一个已知类别的集合来进行训练,通常来说训练出来的分类算法不可能达到100%的准确率。分类器的质量往往与训练数据、验证数据、训练数据样本大小等因素相关。 分类算法 举个例子,我们日常生活中看到一个陌生人,要做的第一件事情就是判断其性别,判断性别的过程就是一个分类的过程。根据以往的生活经验,通常经过头发长短、服饰和体型这三个要素就能判断出来一个人的性别。这里的“生活经验”就是一个训练好的关于性别判断的模型,其训练数据是日常生活中遇到的形形色色的人。突然有一天,一个娘炮走到了你面前,长发飘飘,穿着紧身的衣裤,可是体型却很man,于是你就疑惑了,根据以往的经验——
您可能关注的文档
最近下载
- 大班药品安全PPT课件.pptx VIP
- 幼儿园大班音乐教案《劳动最光荣》PPT.pptx VIP
- 大班语言活动朱家故事.pptx VIP
- (正式版)D-L∕T 342-2010 额定电压66kV~220kV交联聚乙烯绝缘电力电缆接头安装规程.docx VIP
- 基于数据流分析的电控发动机故障诊断研究.doc VIP
- 隧道检查井结构施工技术要点分析.docx VIP
- 标准T14315-2008电力电缆导体用压接型铜、铝接线端子和连接管.pdf VIP
- 制造业企业质量管理能力评估规范.pdf VIP
- 通信机楼供电系统配置标准.pdf VIP
- A正谱夜莺与玫瑰里姆斯基科萨科夫声乐正谱五线谱钢琴伴奏.pdf VIP
原创力文档

文档评论(0)