模式识别-朴素贝叶斯课程设计报告.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模式识别-朴素贝叶斯课程设计报告.doc

模 式 识 别 报 告 ---朴素贝叶斯分类器 一、简介及原理 贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。贝叶斯分类器是用于分类的贝叶斯网络。该网络中应包含类结点C,其中C 的取值来自于类集合( c1 , c2 , ... , cm),还包含一组结点X = ( X1 , X2 , ... , Xn),表示用于分类的特征。对于贝叶斯网络分类器,若某一待分类的样本D,其分类特征值为x = ( x1 , x2 , ... , x n) ,则样本D 属于类别ci 的概率P( C = ci | X1 = x1 , X2 = x 2 , ... , Xn = x n) ,( i = 1 ,2 , ... , m) 应满足下式:   P( C = ci | X = x) = Max{ P( C = c1 | X = x) , P( C = c2 | X = x ) , ... , P( C = cm | X = x ) }   而由贝叶斯公式: P( C = ci | X = x) = P( X = x | C = ci) * P( C = ci) / P( X = x) 假设给定了如下训练样本数据,要求根据给定的天气状况判断对PlayTennis这个请求的回答是Yes还是No。 根据样本数据集提供了14个训练样本,结合朴素贝叶斯分类器来分类下面的新实例: (Outlook = sunny,Temprature = cool,Humidity = high,Wind = strong) 对此新实例预测目标概念PlayTennis的目标值(yes或no). Temperature=cool|vj) P(Humidity=high|vj)P(wind=strong|vj) 可以得到: P(PlayTennis =yes) = 9/14 = 0.64,P(PlayTennis=no)=5/14 = 0.36 P(Wind=Stong| PlayTennis =yes)=3/9=0.33,p(Wind=Stong| PlayTennis =no)=3/5 = 0.6 其他数据类似可得,代入后得到: P(yes)P(Sunny|yes)P(Cool|yes)P(high|yes)P(Strong|yes) = 0.0053 P(no)P(Sunny|no)P(Cool|no)P(high|no)P(Strong|no)=0.0206 因此应该分类到no这一类中。 由所给的测试数据,程序运行结果如下: 有着坚实的数学基础,以及稳定的分类效率。同时,朴素贝叶斯模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上,模型与其他分类方法相比具有最小的误差率。但是对公式和模型的构造原理掌握的不是很透彻,需要经常参考公式和资料,如其中对先验概率和后验概率的计算和应用等,以后学习中应当加强注意。 参考文献 《 数据挖掘经典算法基于朴素贝叶斯的分类方法研究

文档评论(0)

gdkb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档