- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
贝叶斯决策 贝叶斯决策 1、简单例子引入 2、先验概率 3、后验概率 4、最小错误率决策 5、最小风险贝叶斯决策 简单的例子 正常情况下,我们可以快速的将街上的人分成男和女两类。这里街上的人就是我们观测到的样本,将每一个人分成男、女两类就是我们做决策的过程。上面的问题就是一个分类问题。 分类可以看作是一种决策,即我们根据观测对样本做出应归属哪一类的决策。 假定我手里握着一枚硬币,让你猜是多少钱的硬币,这其实就可以看作一个分类决策的问题:你需要从各种可能的硬币中做出一个决策。硬币假设面值有1角、5角、1块。 如果事先告知这枚硬币只可能是一角或者五角,那么问题就是一个两分类问题。 先验概率 最小错误率 后验概率 决策 例 假设在某个局部地区细胞识别中正常和异常两类的先验概率分别为, 正常状态 现有一待识别的细胞,其观察值为x,从类条件概率密度分布曲线上查得 试对该细胞进行分类。 解 利用贝叶斯公式,分别计算两类后验概率 最小错误率决策 根据贝叶斯决策规则,因为 P(?1 | x) = 0.818 P(?2 | x) = 0.182 所以,将 x 归类于正常状态。 最小错误率决策 假设有某个观测值 x, 若 x 使得 P(?1|x) P(?2|x),则我们自然会做出真实类别是 ?1 的判决 若 x 使 得 P(?2|x) P(?1|x),则我们更倾向于选择?2 据此规则进行一次判决的错误概率: 显然,对于某个给定的x,采用上述规则可以使错误概率最小。 问题是,这一规则能够使得平均错误概率最小吗? 最小错误率决策 平均错误概率: 如果对于每个 x 我们都能保证P(error|x)尽量小,则上述积分值也必然最小 最小错误率决策 最小风险贝叶斯决策 前面给出的是在最小错误率的原则下得到的决策规则。但是,根据情况的不同,我们关心的有可能不仅仅是错误率,而是错误所带来的损失。把五角错认成一角与一角错认成五角所带来的损失是不同的。 在癌细胞识别中,如果将正常细胞误判为癌细胞,会给病人带来精神上的负担和不必要的进一步检查,这是一种损失或风险;反之如果把癌细胞细胞误判为正常细胞,则损失更大,这可能会导致病人丧失宝贵的早期发现癌症的机会,甚至会造成影响病人生命的严重后果。 将这两种错误一视同仁来对待,在很多情况下是不恰当的。 所谓最小风险贝叶斯决策,就是考虑各种错误造成损失不同时的一种最优决策。 最小风险贝叶斯决策 基本思想 使错误率最小并不一定是一个普遍适用的最佳选择。 癌细胞分类 两种错误: 癌细胞→正常细胞 正常细胞→癌细胞 两种错误的代价(损失)不同 最小风险贝叶斯决策 基本思想 宁可扩大一些总的错误率,但也要使总的损失减少。 引进一个与损失有关联的,更为广泛的概念——风险。 在作出决策时,要考虑所承担的风险。 基于最小风险的贝叶斯决策规则正是为了体现这一点而产生的。 最小风险贝叶斯决策 最小风险贝叶斯决策 两类情况:有没有癌细胞 ω1表示正常,ω2表示异常 P(ω1|X)与P(ω2|X)分别表示了两种可能性的大小 X是癌细胞(ω2),但被判作正常(ω1),则会有损失,这种损失表示为:λ2 (1) X是正常细胞(ω1),却被判定为异常(ω2),则损失表示成: λ1 (2) 最小风险贝叶斯决策 两类情况:有没有癌细胞 为了使式子写的更方便,我们也可以定义λ1 (1)和λ2 (2) 指正确判断也可有损失 * 最 小 风 险 决 策 在上述条件的基础上,利用下面的决策表,按最小风险贝叶斯决策进行分类。 表示正常细胞, 表示癌变细胞 保守态度(延误病情损失严重) ?1 ?2 ?1 0 6 ?2 1 0 * 最 小 风 险 决 策 步骤 计算后验概率: 计算风险: 决策: , i = 1,…,a * 最 小 风 险 决 策 解: 由以上计算结果知后验概率为: P(?1 | x) = 0.818 , P(?2 | x) = 0.182 再计算条件风险: * 最 小 风 险 决 策 改变决策表, 激进态度 (误判有病损失严重) ?1 ?2 ?1 0 1 ?2 5 0 * 最 小 风 险 决 策 解: 贝叶斯决策理论的分类方法 优点:数据较少仍然有效,可以处理多类别问题。 缺点:对于输入数据的准备方式较为敏感。 应用:文档分类的常用算法。 总结
文档评论(0)