贝叶斯分类仿真数学统计模型决策实验.docVIP

贝叶斯分类仿真数学统计模型决策实验.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验一 贝叶斯分类仿真实验 1. 引言 贝叶斯定理用数学家Thoms Bayes命名的,他是18世纪概率论和决策论的早期研究者。贝叶斯决策理论是主观贝叶斯派归纳理论的重要组成部分。 贝叶斯决策就是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。 1.1 贝叶斯决策基本思想 贝叶斯决策理论方法是统计模型决策中的一个基本方法,其基本思想:   ★已知类条件概率密度参数表达式和先验概率;   ★利用贝叶斯公式转换成后验概率;   ★根据后验概率大小进行决策分类。 1.2 贝叶斯公式 设H1,H2,……,H为样本空间S的一个划分,如果以P(Hj)表示事件Hi发生的概率,且P(Hj)0(j=1,2,…,n)。对于任一事件X,P(X)0,则贝叶斯公式如下: P(Hj|X)=P(X|Hj)P(Hj)/ 2. 基于最小错误率贝的叶斯决策 2.1 对于贝叶斯公式的深入理解 对于引言中贝叶斯的公式,可能大家对P(H|X)与P(X|H)的区别是什么等问题存在疑问,下面我们就来深入理解该公式,X是一个元组,假设其中可以分成M类,M的先验概率是P(H),而P(X|H)则被我们看成是概率密度函数对于待归类的样品,贝叶斯可以计算出属于M类中各个类的概率大小,看X属于那个类的可能性大,就把他归属为那一类。 ★先验概率 针对M个出现的可能性而言的,不考虑任何其他的条件。例如,有统计资料表明出产产品总数为N,其中合格品为N1,不合格品为N2,P(H1)=N1/N,P(H2)=N2/N。我们可以看到,这两者都可以事先计算出来。但是如果我们只有先验概率是不够的,假设我们生产的产品是N1多于N2,那么我们得到的概率就是合格的可能性大于不合格的可能性,故我们只能把所有的产品都判断为合格,因为合格的概率大一些,但这样的结果并没有让我们把不合格的产品分离出来,这就表明我们仅从先验概率来进行分类识别是不够的,我们还需要更多的初始信息。于是我们引进了类条件概率密度。 ★类条件概率密度 类条件概率密度P(X|Hj)是指在已知的特征空间中,出现特征值的概率密度,指的是Hj类样品其属性X 是怎么样分布的。 ★后验概率 后验概率是指在呈现状态X时, 该样品属于Hj中各个类别的概率,这个概率可以用来判别Hj的归属类别依据。从而实现贝叶斯分类器。 ★关于P(Hj|X)与P(X|Hj)的区别 首先,要明确,从我们前面的理论大家可以发现P(Hj|X)是后验概率,是结论;P(X|Hj)是类条件概率密度函数,是已知的前提。类概率条件密度函数是前人总结的统计的概率分布,我们是直接拿来使用的,用它来补充先演概率的信息不足。我们还是拿前面的例子来说,P(H1|X)与P(H2|X)是指在同一条件X下,比较H1和H2的出现概率,如果P(H1|X)P(H2|X),则事件H1出现的可能性大,反之则是H2出现的可能性大。我们可以发现P(H1|X) 与P(H2|X)之和为1,因为对于产品来说,只有合格和不合格两种情况,不可能出现第三种情况。P(X|H1)与P(X|H2)都是指在各自条件下出现X的可能性,两者没有必然的联系。比较两者大小也没有实际意义,两者是在不同条件下讨论问题的,两者之和也没有等于1的结论。 2.2 基于最小错误率贝的叶斯决策详解 为了大家的理解,我们先看两类问题,对于两类问题,P(H1|X)=P(X|H1)P(H1)/P(X),P(H2|X)=P(X|H2)P(H1)/P(X),其中P(X)=P(X|H1)P(H1)+P(X|H2)P(H2),利用后验概率在作判别。那么推广到多类别问题后,P(Hj|X)=P(X|Hj)P(Hj)/P(X),由全概率公式 P(X)= P(X|Hj)P(Hj),其中M为类别个数。 在取得一个特征X之后,在特征X的条件下,看哪个概率最大,就应该把X归于概率最大的那个类。因此对于任一模式X,可以通过比较各个判别函数来确定X的类别。 P(Hi)P(X|Hi)= {P(Hj)P(X|Hj)};X∈Hi, i=1,2,3,…,M 使用什么样的原则可以做到错误概率最小呢? 前提就是要知道一样品分属于不同类别的可能性,表示成P(Hj|X),然后计算后验概率最大的类来分类,这样就是错误最小的方式。 3. 基于最小风险的贝叶斯决策 前面我们讨论了最小错误的贝叶斯决策,但是,是不是在任何情况下都使用基于最小错误的贝叶斯决策才是最佳的呢? 实际情况不是这样的,比如对于药品的检测,对于药品生产商而言,大部分的药品都是合格的,只有少数的不合格。如果我们把正常药品判断成异常药品,样会增加总的错误率,给企业带来一些损失;但如果把异常药品判断成正常药品,虽然会使错误率最小,但病人可能会被使用不合格的药品,对治疗非常不利,

文档评论(0)

baoyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档