- 1、本文档共57页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Bayes决策理论课件
引言 模式特征的不确定性 进行模式识别,首先要提取和选择模式特征,使这些特征组成的特征向量能很好地代表这个事物。但是,在实际问题中,由于技术或经济上的原因,使得提取和选择的特征不一定能准确地描述这个模式。 比如, 特征选择的不合适,特征的数量不当,特征测量的不准确,等等,使模式具有不确定性。 因此,我们应当把模式向量看成随机变量。 处理随机变量用什么方法呢? 概率论与数理统计 1.概率 频率:如果在 n次重复试验中,事件A发生了 次,则称比值 是事件A在这n次试验中发生的频率。记作 概率:在相同条件下重复进行同一试验,如果随着试验次数n的增加,事件A的频率 仅在某个数 附近有微小变化,则称 是事件A的概论, 实际上, 是不容易得到的,常用n较大时的频率作为A的概率 2. 条件概率 设A,B是试验E的两个事件,则称 为在事件B发生条件下事件A的条件概率。 3. Bayes公式 含义:假设 是某个过程的n个事件, 是各事件出现的概率,称为先验概率。如果这个过程得到一个结果B,由于B的出现,而对各事件 的概率要做出重新认识。 证明: 假设R1是 类的决策域,R2是 类的决策域,对X分类,这时有两种可能发生的分类错误: X的真实状态是 ,却分到 R1 , X的真实状态是 ,却分到 R2 , 错误率: 由Bayes公式 有: 则 在整个特征空间,有 所以, 当 时,把x分到R1,增加积分值,可以使错误率减小。 同理可得: 当 时,把x分到R2,可以使错误率减小。 条件风险为: 使 极小,即使 极大。 两种决策的结果相同 要使 极小,对于X,如果被积函数 将X分到R1,来减少 如果 , 将X分到R2,来减小 。 这样,可以写出决策规则: 如果 ,则 如果 ,则 如何求 ? 将决策规则写成: 如果 则 如果 则 可以看出, 是两种决策的边界。也就是选择R1和R2的边界,使得L极小。 正确时的条件概率 3.3 Neyman-Pearson决策 对于两类别决策,存在两种可能的分类错误: (1)把真实状态为 的模式分到 类; (2)把真实状态为 的模式分到 类。 两种错误的概率分别为: 决策应该使 都为最小。如何做? Neyman-Pearson决策所要解决的问题: 对于二类模式识别问题,保持一种错误概率为常数 ,例如 ,而使另一种错误概率 达到极小。 这个问题可以看成在 条件下求 的极小值问题。 用什么方法呢? 采用Lagrange乘数法,约束条件为 , 构造Lagrange函数: 我们的目的就是使 达到极小。即 min 对于二类问题,有 所以, 达到极小值的必要条件是: 由此得 或 这是未知数 的方程, 就是分界的阈值。 可以用其他数学方法求得。 3.6 正态分布时的Bayes决策法则 单变量正态密度函数 它的均值为: 方差为: 单变量正态密度可由两个参数,即均值 和方差 完全决定,记为
文档评论(0)