- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
伯努利模型 1、基本原理 在这里,m=2, p=1/2。 p( |c=YES)= p( |c=yes)(1-p( |c=yes) 贝叶斯算法 贝叶斯算法 贝叶斯 ,英国数学家。1702年出生于伦敦,做过神甫。1742年成为英国皇家学会会员。1763年4月7日逝世。贝叶斯在数学方面主要研究概率论。他首先将归纳推理法用于概率论基础理论,并创立了贝叶斯统计理论,对于统计决策函数、统计推断、统计的估算等做出了贡献。 一个医疗诊断问题 有两个可选的假设:病人有癌症、病人无癌症 可用数据来自化验结果:正+和负- 有先验知识:在所有人口中,患病率是0.008 对确实有病的患者的化验准确率为98%,对确实无病的患者的化验准确率为97% 总结如下 P(cancer)=0.008, P(?cancer)=0.992 P(+|cancer)=0.98, P(-|cancer)=0.02 P(+|?cancer)=0.03, P(-|?cancer)=0.97 问题:假定有一个新病人,化验结果为正,是否应将病人断定为有癌症?求后验概率P(cancer|+)和P(?cancer|+) 贝叶斯定理 解决上面的问题:已知某条件概率,如何得到两个事件交换后的概率,也就是在已知P(A|B)的情况下如何求得P(B|A)。 癌症 诊断正确 诊断正确 癌症 贝叶斯定理 这里先解释什么是条件概率 在事情B发生的条件下A发生的条件概率,其求解公式为 贝叶斯定理 贝叶斯定理的意义在于,我们在生活中经常遇到这种情况:我们可以很容易直接得出P(A|B),P(B|A)则很难直接得出,但我们更关心P(B|A),贝叶斯定理就为我们打通从P(A|B)获得P(B|A)的道路。 贝叶斯定理 下面不加证明给出贝叶斯定理公式 机器语言中的定义 表示在没有训练数据前假设A拥有的初始概率。P(A)被称为A的先验概率. P(A|B)表示假设B成立时A的概率 机器学习中我们关心的是P(B|A),即给定A时B的成立的概率,称为B的后验概率 , 贝叶斯定理的解释 P(B|A)随着P(B)和P(A|B)的增长而增长,随着P(A)的增长而减少,即如果A独立于B时被观察到的可能性越大,那么B对A的支持度越小. 评分标准 H:假设候选集 表示使P(B|A) 最大的B值 P(A)??_ P(A|B)= 朴素贝叶斯分类器 1、条件独立性 给定类标号y,朴素贝叶斯分类器在估计类条件概率时假设属性之间条件独立。条件独立假设可以形式化的表达如下: 其中每个训练样本可用一个属性向量X=(x1,x2,x3,?,xn)表示,各个属性之间条件独立。 朴素贝叶斯分类器 比如,对于一篇文章“Good good study,Day day up.” 用一个文本特征向量来表示: x=(Good, good, study, Day, day , up)。 一般各个词语之间肯定不是相互独立的,有一定的上下文联系。但在朴素贝叶斯文本分类时,我们假设个单词之间没有联系,可以用一个文本特征向量来表示这篇文章,这就是“朴素”的来历。 朴素贝叶斯如何工作 有了条件独立假设,就不必计算X和Y的每一种组合的类条件概率,只需对给定的Y,计算每个Xi的条件概率。后一种方法更实用,因为它不需要很大的训练集就能获得较好的概率估计。 估计分类属性的条件概率 P(Xi|Y=y)怎么计算呢?它一般根据类别y下包含属性Xi的实例的比例来估计。以文本分类为例,Xi表示一个单词,P(Xi|Y=y)=包含该类别下包含单词的xi的文章总数/ 该类别下的文章总数。 贝叶斯分类器举例 假设给定了如下训练样本数据,我们学习的目标是根据给定的天气状况判断你对PlayTennis这个请求的回答是Yes还是No。 Day Outlook Temperature Humidity Wind PlayTennis D1 Sunny Hot High Weak No D2 Sunny Hot High Strong No D3 Overcast Hot High Weak Yes D4 Rain Mild High Weak Yes D5 Rain Cool Normal Weak Yes D6 Rain Cool Normal Strong No D7 Overcast Cool Normal Strong Yes D8 Sunny Mild High Weak No D9 Sunny Cool Normal Weak Yes D10 Rain Mild Normal Weak Yes D11 Sunny Mild Normal S
您可能关注的文档
- xx大厦消防设备更换施工方案.doc
- XX市电梯安全状况白皮书.doc
- XX水库维修养护项目竞争性谈判响应文件.doc
- XX体检医院管理信息系统需求规格说明书.doc
- XX网络中心维护方案.doc
- YOGO健身协会评优答辩.ppt
- ZSBW数控无触点稳压器英文说明书Englishversionmanualbook.doc
- 艾滋病知识讲座(二)艾滋病基本知识.ppt
- 爱生学校全方位环境改善项目现场会.ppt
- 爱眼知识科普基础讲座.ppt
- RS-SZJCZ-6太阳能浮漂水质监测站——公园水质监测标准款.pdf
- RS-PH-N01-3 一体式PH变送器485型说明书.pdf
- DeepSeek核心技术白话解读PPT-西北工业大学·王鹏.202502s.pptx
- 茌平县信发热电有限责任公司校园招聘模拟试题附带答案详解附答案.docx
- 左右胆管分别与空肠吻合在肝门胆管癌中的应用.pptx
- 常州市盛洲铜业有限公司校园招聘85人公开引进高层次人才和急需紧缺人才笔试参考题库答案详解版推荐.docx
- 甘肃银光化学工业集团有限公司校园招聘85人公开引进高层次人才和急需紧缺人才笔试参考题库答案详解版完美.docx
- 常州市盛洲铜业有限公司校园招聘模拟试题附带答案详解最新.docx
- 常州市武进第二物资总公司校园招聘模拟试题附带答案详解附答案.docx
- 甘肃银光化学工业集团有限公司校园招聘85人公开引进高层次人才和急需紧缺人才笔试参考题库答案详解版参考.docx
文档评论(0)