中科院学习课件模式识别第四精要.ppt

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 统计判别 4.1 作为统计判别问题的模式分类 模式识别的目的就是要确定某一个给定的模式样本属于哪一类。 可以通过对被识别对象的多次观察和测量,构成特征向量,并将其作为某一个判决规则的输入,按此规则来对样本进行分类。 4.1 作为统计判别问题的模式分类 在获取模式的观测值时,有些事物具有确定的因果关系,即在一定的条件下,它必然会发生或必然不发生。 例如识别一块模板是不是直角三角形,只要凭“三条直线边闭合连线和一个直角”这个特征,测量它是否有三条直线边的闭合连线并有一个直角,就完全可以确定它是不是直角三角形。 这种现象是确定性的现象,前一章的模式判别就是基于这种现象进行的。 4.1 作为统计判别问题的模式分类 但在现实世界中,由许多客观现象的发生,就每一次观察和测量来说,即使在基本条件保持不变的情况下也具有不确定性。 只有在大量重复的观察下,其结果才能呈现出某种规律性,即对它们观察到的特征具有统计特性。 特征值不再是一个确定的向量,而是一个随机向量。 此时,只能利用模式集的统计特性来分类,以使分类器发生错误的概率最小。 4.1 作为统计判别问题的模式分类 4.1.1 贝叶斯判别原则 两类模式集的分类 目的:要确定x是属于ω1类还是ω2类,要看x是来自于ω1类的概率大还是来自ω2类的概率大。 贝叶斯判别 4.1 作为统计判别问题的模式分类 4.1.1 贝叶斯判别原则 例子 对一大批人进行癌症普查,患癌者以ω1类代表,正常人以ω2类代表。 设被试验的人中患有癌症的概率为0.005,即P(ω1)=0.005,当然P(ω2)=1-0.005=0.995 现任意抽取一人,要判断他是否患有癌症。显然,因为P(ω2) P(ω1),只能说是正常的可能性大。如要进行判断,只能通过化验来实现。 4.1 作为统计判别问题的模式分类 4.1.1 贝叶斯判别原则 例子 设有一种诊断癌症的试验,其结果为“阳性”和“阴性”两种反应。 若用这种试验来对一个病人进行诊断,提供的化验结果以模式x代表,这里x为一维特征,且只有x=“阳”和x=“阴”两种结果。 4.1 作为统计判别问题的模式分类 4.1.1 贝叶斯判别原则 例子 假设根据临床记录,发现这种方法有以下统计结果 患有癌症的人试验反应为阳性的概率=0.95,即p(x=阳| ω1)=0.95 患有癌症的人试验反应为阴性的概率=0.05,即p(x=阴| ω1)=0.05 正常人试验反应为阳性的概率=0.01,即p(x=阳| ω2)=0.01 正常人试验反应为阴性的概率=0.99,即p(x=阴| ω2)=0.99 4.1 作为统计判别问题的模式分类 4.1.1 贝叶斯判别原则 问题 若被化验的人具有阳性反应,他患癌症的概率为多少,即求P(ω1 | x=阳)=? 这里P(ω1) 是根据以往的统计资料得到的,为患癌症的先验概率。现在经过化验,要求出P(ω1 | x=阳),即经过化验后为阳性反应的人中患癌症的概率,称为后验概率。 [计算] 4.1 作为统计判别问题的模式分类 4.1.2 贝叶斯最小风险判别 当考虑到对于某一类的错误判决要比对另一类的判决更为关键时,就需要把最小错误概率的贝叶斯判别做一些修正,提出条件平均风险rj(x)。 M类分类问题的条件平均风险rj(x) 对M类问题,如果观察样本被判定属于ωj类 ,则条件平均风险为: Lij称为将本应属于ωi类的模式判别成属于ωj类的是非代价。 4.1 作为统计判别问题的模式分类 4.1.2 贝叶斯最小风险判别 意义 对于自然属性是属于ωi类的模式x来说,它来自ωi类的概率应为P(ωi |x)。 如果分类器判别x是属于ωj类,但它实际上来自ωi类,也就是说分类器失败,这时Lij为失分,对应的条件风险为后验概率进行Lij的加权运算。 由于模式x的自然属性可能来自M类中的任一类,因此可将观察样本指定为ωj类的条件平均风险用rj(x)的公式运算。 4.1 作为统计判别问题的模式分类 4.1.2 贝叶斯最小风险判别 Lij的取值 若i=j,即判别正确,得分, Lij可以取负值或零,表示不失分。 若i≠j,即判别错误,失分, Lij应取正值。 最小平均条件风险分类器 分类器对每一个模式x有M种可能的类别可供选择。 若对每一个x计算出全部类别的平均风险值r1(x), r2(x),…, rM(x),并且将x指定为是具有最小风险值的那一类,则这种分类器称为最小平均条件风险分类器。 表达式 4.1 作为统计判别问题的模式分类 4.1.2 贝叶斯最小风险判别 两类(M=2)的情况 [例子] 一般多类(M类)的情况 4.2 正态分布模式的贝叶斯分类器 出发点 当已知或者有理由设想类概率密度函数P(x|ωi )是多变量的正态分布时,上一节介绍的贝叶斯分类器可以导出一些简

您可能关注的文档

文档评论(0)

boss + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档