第七章01课件讲解.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第七章汇报人:人工智能专业使用朴素贝叶斯算法训练分类器

朴素贝叶斯算法的分类器原理PARTONE

3在机器学习中,分类任务就是预测某个样本属于某个类别的过程,预测时需要从已有的数据集中找到相关规律,然后根据规律进行判定。朴素贝叶斯算法找规律的原理是根据数据集中的已有数据得到先验概率,然后求解待测样本属于每个类别的后验概率,哪个类别概率高就将新样本判定为哪个类别。下面根据后验概率的公式,进一步进行推理。1.朴素贝叶斯算法的原理7.2.2朴素贝叶斯算法的原理与流程

4计算得到的结果中,哪个概率大,就将新样本划分为哪个类别。假设数据集中有1个特征和两个类别标签,特征用x表示,两个类别分别用和表示。则两个类别的先验概率分别为和,样本属于类别和的后验概率分别为1.朴素贝叶斯算法的原理7.2.2朴素贝叶斯算法的原理与流程

5现在,将数据集进行扩展,如果数据集中有多个特征(用,,,表示各特征)和多个类别标签(用表示某个类别)。那么,样本属于某个类别的后验概率为对于同一个数据集来说,每个类别的后验概率的分母都是相同的。因此,只需要比较分子的大小即可。1.朴素贝叶斯算法的原理7.2.2朴素贝叶斯算法的原理与流程

6可见,朴素贝叶斯算法是基于贝叶斯算法与特征条件独立假设的分类算法,其中“朴素”的含义就是假设所有特征之间相互独立。计算分子的值时,朴素贝叶斯算法做了一个假设,即数据集中所有特征相互独立,特征之间不存在依赖关系,因此下面的等式成立。而中每一项的值都可以从数据集的样本中获得,因此,可以计算出的值。1.朴素贝叶斯算法的原理7.2.2朴素贝叶斯算法的原理与流程

7使用朴素贝叶斯算法训练分类器的流程如下。(1)设为一个待分类样本,,,,为样本的特征。(2)有类别集合。(3)分别计算每个类别的后验概率,,,,即等价于计算,,,的值。(4)如果,则。2.朴素贝叶斯算法的流程7.2.2朴素贝叶斯算法的原理与流程

使用朴素贝叶斯预测猫狗分类(1)计算先验概率P(猫)=0.6,P(狗)=0.4训练数据集(1000):猫(600),狗(400)待测样本特征:喵喵叫(2)计算不同类别中该 特征取值占比P(喵喵叫|猫)=500/600=0.9P(喵喵叫|狗)=10/400=0.025训练数据集(1000):猫(600),狗(400)喵喵叫在猫类别有540条,在狗类别中有10条7.2.2朴素贝叶斯算法的原理与流程

使用朴素贝叶斯预测猫狗分类(3)后验概率比较P(猫|喵喵叫)=P(喵喵叫|猫)P(猫)/P(喵喵叫)P(狗|喵喵叫)=P(喵喵叫|狗)P(狗)/P(喵喵叫)P(喵喵叫|猫)P(猫)?P(喵喵叫|狗)P(狗)0.9×0.6=0.540.025×0.4=0.01P(猫|喵喵叫)概率更大,结果预测为猫7.2.2朴素贝叶斯算法的原理与流程

10客户编号年龄(岁)收入是否为学生信用是否购买平板电脑130高否一般否230高否好否330~40高否一般是440中等否一般是540低是一般是640低否好否730~40低是好是830中等是一般否930低是一般是1040中等是一般是1130中等是好是1230~40中等

您可能关注的文档

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档