第二章 贝叶斯决理论.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 贝叶斯决策理论 引言 统计模式识别方法以样本特征值的统计概率为基础: 先验概率、类(条件)概率密度函数和后验概率。 Bayes公式体现这三者关系的公式。 本章讨论的内容在理论上有指导意义,代表了基于统计参数这一类的分类器设计方法,结合正态分布使分类器设计更加具体化。 模式识别算法的设计都是强调“最优”,即希望所设计的系统在性能上最优。是指对某一种设计原则讲的,这种原则称为准则。使这些准则达到最优,如最小错误率准则,基于最小风险准则等,讨论几种常用的决策规则。设计准则,并使该准则达到最优的条件是设计模式识别系统最基本的方法。 思考? 机器自动识别分类,能不能避免错分类,如汉字识别能不能做到百分之百正确?怎样才能减少错误? 错分类往往难以避免,因此就要考虑减小因错分类造成的危害损失,有没有可能对一种错分类严格控制? 贝叶斯决策理论与方法基本概念 给定一个m模式类的分类任务以及各类在这n维特征空间的统计分布, 要区分出待识别样本属于这m类样本中的哪一类问题。假设一个待识别的样本用n个属性观察值描述,称之为n个特征,从而组成一个n维的特征向量,而这n维征向量所有可能的取值范围则组成了一个n维的特征空间。特征空间的统计分布 , =1,2,…,m的先验概率: 类条件概率密度函数:(可解释为当类别已知的情况下, 样本的概率 分布密度函数) 后验概率:生成m个条件后验概率,=1,2,…,m。也就是对于一个特征 向量,每一个条件后验概率都代表未知样本属于某一特定类的概率。 第一节 基于最小错误率的贝叶斯判别方法 (一).两类情况 两类情况是多类情况的基础,多类情况往往是用多个两类情况解决的。 ① 用,=1, 2表示样本(一般用列向量表示)所属的类别。 ② 假设先验概率,已知。(这个假设是合理的,因为如果先验概率未知,可以从训练特征向量中估算出来,即如果是训练样本总数,其中有个样本分别属于,则相应的先验概率: ,) ③ 假设(类)条件概率密度函数=1,2已知,用来描述每一类中特征向量的分布情况。如果类条件概率密度函数未知,则可以从可用的训练数据中估计出来。 贝叶斯判别方法 贝叶斯分类规则描述为: 如果,则 如果,则 (2-1-1) 贝叶斯分类规则就是看的可能性大,还是的可能性大。,i=1,2解释为当样本出现时,后验概率和的大小从而判别为属于或属于类。 三种概率的关系――――贝叶斯公式: (2-1 其中,是的概率密度函数(全概率密度),它等于所有可能的类概率密度函数乘以相应的先验概率之和。 因为对于所有的类都是一样的,可视为常数因子,它并不影响结果,不考虑。故可采用下面的写法比较后验概率的大小: 则有 (2-1-4) (二)多类的情况 ① 表示样本所属的m个类别。 ② 先验概率, =1,2,…, m ③ 假设类条件概率密度函数,=1,2,…,m已知,计算后验概率后,若: > 则类。这样的决策可使分类错误率最小。因此叫做基于最小错误率的贝叶斯决策。 R1和R3的分界点是=的交点。 R2和R3的分界点是=的交点。 图2-1-1 图2 决策域、决策面,决策面方程和判决函数和分类器 决策域、决策面、决策面方程 对于m类的分类任务,按照决策规则可以把多维特征空间划分成m个决策区域,叫决策域。 两个区域,的边界叫决策面,是一维时,决策面是一个点;二维时,决策面是一条曲(直)线;三维时,决策面是一曲(平)面;n维时,决策面是一个超曲(平)面。 在数学上用解析形式可以表示为用决策面方程描述。可将决策面看作有正负的界面,对于任一样本,代入决策面方程左边的多项式,若是正的,说明;若为负,说明。 判别函数 把描述决策规则的某种函数叫判别函数,例如≡,其中是一个单调上升函数。对于最小错误率的情况,可描述为,用判决函数描述决策面方程更方便。    分类器 分类器可以看成是由软件或硬件组成的一个“分类的机器”,它的功能是先计算出m个判别函数,再从中选出判别函数最大值的类作为决策结果。 基于最小错误率的判决规则的其他形式 由,则这种判决规则,可写成 若 ,则有 (2-2-5) 这里把叫做似然函数,把叫做似然比,叫做似 然比阈值

文档评论(0)

155****8706 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档