[工学]2贝叶斯决策理论.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[工学]2贝叶斯决策理论

例1:二次曲线边界 正态分布的参数估计 例2:正态分布的参数估计 作业一 假设鱼塘只有鲈鱼w1和鲑鱼w2 ,其数量分别占2/3和1/3,鲈鱼的亮度为14的概率是0.4,鲑鱼的亮度为14的概率是0.3。正确判断的风险为1,把鲈鱼误认为鲑鱼的风险为3,把鲑鱼误认为鲈鱼的风险为4。现有一条鱼亮度为14,作出判断,使风险最小。 情况3: 判别边界是各种二次曲线。 正态模型的Bayes决策面 两类问题正态模型的决策面: 决策面方程:g1(x)=g2(x) 两类的协方差矩阵相等,决策面是超平面。 两类的协方差矩阵不等,决策面是超二次曲面。 正态分布 Bayes决策 正态模型的Bayes决策面 正态分布 Bayes决策 正态分布下的几种决策面的形式 正态分布 Bayes决策 例3:正态分布的Bayes决策 两类的识别问题:医生要根据病人血液中白细胞的浓度来判断病人是否患血液病。 根据医学知识和以往的经验,医生知道: 患病的人,白细胞的浓度服从均值2000,标准差1000的正态分布;未患病的人,白细胞的浓度服从均值7000,标准差3000的正态分布; 一般人群中,患病的人数比例为0.5%。 一个人的白细胞浓度是3100,医生应该做出怎样的判断? 正态分布 Bayes决策 数学表示: 用ω表示“类别”这一随机变量,ω1表示患病, ω2表示正常; x表示“白细胞浓度”这个随机变量。 本例医生掌握的知识非常充分,包括: 1) 类别的先验分布:P(ω1) = 0.5%,P(ω2) = 99.5% 先验分布:没有获得观测数据(病人白细胞浓度)之前,已知的关于类别的分布(某类事物出现的比例)。 正态分布的Bayes决策例解 正态分布 Bayes决策 2) 观测数据白细胞浓度分别在两种情况下的类条件分布: P(x|ω1) ~ N(2000,10002) P(x|ω2) ~ N(7000,30002) 样本观测值: x =3100 P(3100|ω1) = 2.1785e-004, P(3100|ω2) = 5.7123e-005 计算后验概率: P(ω1|3100)=1.9%, P(ω2|3100)=98.1% 医生的判断:正常 正态分布的Bayes决策例解 正态分布 Bayes决策 2.6 讨论 本章介绍基于Bayes决策的最优分类器 Bayes决策的三个前提: 类别数确定 各类的先验概率P(ωi)已知 各类的条件概率密度函数p(x|ωi)已知 问题的转换: 基于样本估计概率密度 基于样本直接确定判别函数 习题 试简述先验概率,类条件概率密度函数和后验概率等概念间的关系: 试写出利用先验概率和分布密度函数计算后验概率的公式 写出最小错误率和最小风险决策规则相应的判别函数(两类问题)。 用Matlab计算两类识别问题:根据血液中白细胞的浓度来判断病人是否患血液病。 作业二 设有两类服从二维正态分布的样本如下(前两个一类,后两个一类): 其协方差相同,可用两类样本的协方差的均值来估计。 设两类的先验概率之比为4:6。 求其判别边界,写出计算过程。 先验概率、类条件概率密度函数和后验概率 先验概率:根据大量统计确定某类事物出现的比例,如在我国大学中,一个学生是男生的先验概率为0.7,而为女生的概率是0.3,这两类概率是互相制约的,它们的总和为1。 类条件概率密度函数:同一类事物的各个属性都有一定的变化范围,在其变化范围内的分布概率用一种函数形式表示,则称为类条件概率密度函数。这种分布密度只对同一类事物而言,与其它类事物没有关系。为了强调是同一类事物内部,因此这种分布密度函数表示成条件概率的形式。例如x表示某一个学生的身高,则男生身高的概率密度表示成P(x|男生),女生身高表示成P(x|女生),这两者之间没有任何关系。 后验概率:一个具体事物属于某种类别的概率,例如一个学生用特征向量x表示,它是男性或女性的概率表示成P(男生|x)和P(女生|x),这就是后验概率。由于一个学生只可能为两个性别之一,因此有P(男生|x)+P(女生|x)=1的约束,这一点是与类分布密度函数不同的。后验概率与先验概率也不同,后验概率涉及一个具体事物,而先验概率是泛指一类事物,因此P(男生|x)和P(男生)是两个不同的概念。 * 它与人工智能关系密切,其目的是用机器完成人类智能中通过视觉、听觉、触觉等感官去识别外界环境的工作。 模式识别是一门理论与应用并重的技术科学。 * 它与人工智能关系密切,其目的是用机器完成人类智能中通过视觉、听觉、触觉等感官去识别外界环境的工作。 模式识别是一门理论与应用并重的技术科学。 * 它与人工智能关系密切,其目的是用机器完成人类智能中通过视觉、听觉、触觉等感官去识别外界环境的工作。 模式识别是一门理论与应用并重的技术科学。 * 它与人工智

文档评论(0)

hhuiws1482 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5024214302000003

1亿VIP精品文档

相关文档