- 28
- 0
- 约6.1千字
- 约 38页
- 2019-08-04 发布于浙江
- 举报
伯努利模型 1、基本原理 在这里,m=2, p=1/2。 p( |c=YES)= p( |c=yes)(1-p( |c=yes) 伯努利模型举例 id doc 类别In c=China? 1 Chinese Beijing Chinese yes 2 Chinese Chinese Shanghai yes 3 Chinese Macao yes 4 Tokyo Japan Chinese no d={Chinese Chinese Chinese Tokyo Japan} 伯努利模型举例 id doc 类别In c=China? 1 Chinese Beijing Chinese yes 2 Chinese Chinese Shanghai yes 3 Chinese Macao yes P(Chinese|yes)=(3+1)/(3+2)=4/5 P(Beijing|yes) = P(Macao|yes) = P(Shanghai |yes) =(1+1)/(3+2)=2/5 P(Japan | yes) =P(Tokyo | yes) =(0+1)/(3+2)=1/5 伯努利模型举例 4 Tokyo Japan Chinese no P(Chinese|no)=(1+1)/(1+2)=2/3 P(Japan|no) =P(Tokyo| no) =(1+1)/(1+2)=2/3 P(Beijing|no) = P(Macao|no) = P(Shanghai|no) =(0+1)/(1+2)=1/3 伯努利模型举例 P(yes | d) =P(yes)×P(Chinese|yes) ×P(Japan|yes) ×P(Tokyo|yes)×(1-P(Beijing|yes)) ×(1-P(Shanghai|yes))×(1-P(Macao|yes)) =3/4×4/5×1/5×1/5×(1-2/5) ×(1-2/5)×(1-2/5)=81/15625≈0.005 P(no | d) = 1/4×2/3×2/3×2/3×(1-1/3)×(1-1/3)×(1-1/3) =16/729≈0.022 因此,这个文档不属于类别china。 二者的计算粒度不一样,多项式模型以单词为粒度,伯努利模型以文件为粒度,因此二者的先验概率和类条件概率的计算方法都不同。 计算后验概率时,对于一个文档d,多项式模型中,只有在d中出现过的单词,才会参与后验概率计算. 伯努利模型中,没有在d中出现,但是在全局单词表中出现的单词,也会参与计算,不过是作为“反方”参与. 模型比较 模板提供者 500,000 个可下载的 PowerPoint 模板、动态剪贴画、背景和视频 谢谢观赏 WPS Office Make Presentation much more fun @WPS官方微博 @kingsoftwps 贝叶斯算法 贝叶斯算法 贝叶斯 ,英国数学家。1702年出生于伦敦,做过神甫。1742年成为英国皇家学会会员。1763年4月7日逝世。贝叶斯在数学方面主要研究概率论。他首先将归纳推理法用于概率论基础理论,并创立了贝叶斯统计理论,对于统计决策函数、统计推断、统计的估算等做出了贡献。 一个医疗诊断问题 有两个可选的假设:病人有癌症、病人无癌症 可用数据来自化验结果:正+和负- 有先验知识:在所有人口中,患病率是0.008 对确实有病的患者的化验准确率为98%,对确实无病的患者的化验准确率为97% 总结如下 P(cancer)=0.008, P(?cancer)=0.992 P(+|cancer)=0.98, P(-|cancer)=0.02 P(+|?cancer)=0.03, P(-|?cancer)=0.97 问题:假定有一个新病人,化验结果为正,是否应将病人断定为有癌症?求后验概率P(cancer|+)和P(?cancer|+) 贝叶斯定理 解决上面的问题:已知某条件概率,如何得到两个事件交换后的概率,也就是在已知P(A|B)的情况下如何求得P(B|A)。 癌症 诊断正确 诊断正确 癌症 贝叶斯定理 这里先解释什么是条件概率 在事情B发生的条件下A发生的条件概率,其求解公式为 贝叶斯定理 贝叶斯定理的意义在于,我们在生活中经常遇到这种情况:我们可以很容易直接得出P(A|B),P(B|A)则很难直接得出,但我们更关心P(B|A),贝叶斯定理就为我们打通从P(A|B)获得P(B|A)的道路。 贝叶斯定理 下面不加证明给出贝叶斯定理公式 机器语言中的定义 表示在没有训练数据前假设A拥有的初始概率。P(A)被称为A的先验概率. P(A|B)表示假设B成立
您可能关注的文档
- 词类活用(完整版)精编版.ppt
- 诚信考试主题班会ppt精编版.ppt
- 诗经《采薇》ppt精编版.ppt
- 详解百度视频下载方法精编版.pptx
- 诚实守信主题班会ppt(共29张ppt)精编版.ppt
- 说课的ppt模板精编版.ppt
- 说话的十大技巧精编版.ppt
- 课堂学术报告蓝色扁平化论文答辩模板ppt模板精编版.pptx
- 课程设计与开发(peggy)——知音精编版.ppt
- 谁说菜鸟不会数据分析精编版.ppt
- TCECS-城市群都市圈生态生产生活空间优化评价导则.pdf
- TCSUS-城市深基坑大跨度绿色支撑技术标准.pdf
- TCAQI-聚丁二烯橡胶产品碳足迹核算指南.pdf
- TCECS-城市社区体育健身设施规划设计标准.pdf
- DB65T3576-2014 车用压缩天然气铝合金内胆纤维全缠绕气瓶定期检验与评定.pdf
- 2024咨询工程师每日一练试卷【A卷】附答案详解.pdf
- 2025年7月银行业监管处罚深度分析报告.pdf
- 2025年高校纪检监察处年工作总结(3篇).pdf
- 2025年国企招聘考试(面试)历年参考题库含答案详解(5套题).pdf
- 2025-2026年度高新技术企业研发费用加计扣除政策.pdf
最近下载
- 人教版九年级数学下册2026年春季学期教学工作计划与教学进度表 (最新教材).docx
- T_CACM 1649—2025(支气管扩张症中西医结合诊疗指南).pdf
- 第六届福建省综合气象业务职业技能竞赛【决赛】理论考试题库-上(单选题部分).docx VIP
- 标准图集-07MS101 市政给水管道工程及附属设施.pdf VIP
- 2024年国网四川省电力公司招聘考试真题.pdf VIP
- 【2026年春新教材】部编版小学二年级下册道德与法治全册教案(教学设计).pdf
- 数学思政课教学案例.docx VIP
- 2024-2025学年广东省东莞市东华高级中学、东华松山湖高级中学高一下学期学习效率检测(一)数学试卷(含答案).docx VIP
- (高清版)DB12∕T 1115-2021 泵站工程运行管理规程.pdf VIP
- DB3305_T276-2023_生态联勤警务站建设与管理规范_湖州市 .docx VIP
原创力文档

文档评论(0)