- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
贝叶斯分析
贝叶斯分析是一种根据概率统计知识对数据进行分析的方法,是贝叶斯定理的应用。贝叶斯定理是指某件事发生的概率不仅取决于这件事之前发生的概率,还与最近观测到的新增信息有关。
理解层次1知道每个部分的意思2为什么它是对的3在什么时候需要用它
80%20%史蒂夫非常腼腆,少言寡语,但很乐于助人。他谦恭有礼,做事井井有条,中规中矩,关注细节。史蒂夫是图书管理员or史蒂夫是农民?
1:20(史蒂夫是图书管理员)=44+20P(图书管理员|描述)=条件概率待验事件|前提条件
P(描述|图书管理员)P(图书管理员)P(非图书管理员)P(描述|非图书管理员)+P(图书管理员|描述)=P(图书管理员)P(描述|图书管理员)P(图书管理员)P(描述|图书管理员)+P(非图书管理员)P(描述|非图书管理员)=P(描述)
P(A)P(B|A)P(B)P(A|B)=先验概率似然概率后验概率P(A):得到信息B之前,事件A成立的概率P(B|A):事件A成立的前提下,符合信息B的概率P(A|B):得到信息B之后,事件A成立的概率P(B):无论事件A是否成立,符合信息B的概率1知道每个部分的意思
BP(B)P(A|B)=P(A)P(B|A)P(B)P(A∩B)P(A)P(B|A)=P(A|B)=P(A∩B)P(B)AP(A)P(?A)?AABP(A∩B)?AP(B)=P(A∩B)+P(?A∩B)P(B)=P(A)P(B|A)+P(?A)P(B|?A)2为什么它是对的
??3在什么时候需要用它
1医学诊断2邮件分类3推荐系统4机器学习应用领域
某天早上,史蒂夫有些发烧,为了确定是普通流感还是新冠肺炎,史蒂夫去医院进行核酸检测。假设1000个人中大概有1个新冠肺炎患者,而核酸检测的准确性为99%,即新冠肺炎患者被检测出的概率为99%,而未患新冠肺炎的人被误诊的概率为1%。如果史蒂夫的检测结果呈阳性,那么他患新冠肺炎的概率有多大?P(病|阳)0.001×0.990.001×0.99+0.999×0.01==9%患病未患病真阳性假阴性真阴性假阳性P(病)P(阳|病)P(病)P(阳|病)+P(?病)P(阳|?病)=医学诊断
1/11=9%
虽然计算结果表明史蒂夫患新冠肺炎的概率只有9%,但他还是非常担心,于是做了第二次检测,不幸的是第二次检测结果也呈阳性,那么他真的患新冠肺炎的概率有多大?P(病|阳)=P(病)P(阳|病)P(阳)0.09×0.990.09×0.99+0.91×0.01==91%医学诊断
邮件分类是根据邮件中是否存在某些关键词来判断的,但实际上并不是所有包含关键词的邮件都是垃圾邮件。史蒂夫采集了10000个邮件样本,其中4000封为垃圾邮件,这4000封垃圾邮件中出现“优惠”的有1500封,出现“好评”的有1000封,出现“买单”的有800封,而在6000封正常邮件中出现“优惠”的仅有6封,出现“好评”的仅有11封,出现“买单”的有18封。某天,史蒂夫收到一封如图所示的邮件,这封邮件是垃圾邮件吗?P(垃圾|优惠)=P(垃圾)P(优惠|垃圾)P(优惠)P(正常|优惠)=P(正常)P(优惠|正常)P(优惠)Steve:邮件分类
P(垃圾|(优惠,好评,买单))=P(垃圾)P((优惠,好评,买单)|垃圾)P((优惠,好评,买单))P(优惠|垃圾)P(好评|垃圾)P(买单|垃圾)假设“优惠、好评、买单”出现的概率相互独立、互不影响P(正常|(优惠,好评,买单))=P(正常)P((优惠,好评,买单)|正常)P((优惠,好评,买单))P(优惠|正常)P(好评|正常)P(买单|正常)邮件分类
Steve:P(正常)P(优惠|正常)P(好评|正常)P(买单|正常)P(垃圾)P(优惠|垃圾)P(好评|垃圾)P(买单|垃圾)??∧史蒂夫采集了10000个邮件样本,其中4000封为垃圾邮件,这4000封垃圾邮件中出现“优惠”的有1500封,出现“好评”的有1000封,出现“买单”的有800封,而在6000封正常邮件中出现“优惠”的仅有6封,出现“好评”的仅有11封,出现“买单”的有18封。某天,史蒂夫收到一封如图所示的邮件,这封邮件是垃圾邮件吗?邮件分类
假设样本各个特征之间相互独立、互不影响。用Ai表示A被分为第i类(1≤i≤n);用B表示A的特征集,Bj表示第j个特征(1≤j≤m)P(Ai|B)=P(Ai)P(B|Ai)P(B)P(Ai)P((B1,B2,……,Bm)|Ai)P(B)=P(Ai)P(B1|Ai)P(B2|Ai)……P(Bm|Ai)P(B)=P(Ai|B)P(Bj|Ai)∝m∏j=1P(Ai)朴素贝叶斯分类器
样本邮件数据预处理训练集测试集
您可能关注的文档
- 八年级上册道德与法治统编版:认识总体国家安全观-教学设计.docx
- 八年级上册道德与法治统编版:坚持国家利益至上-教学设计.docx
- 八年级上册道德与法治统编版:国家好 大家才会好-教学设计.docx
- 八年级上册道德与法治统编版:关心国家发展-教学设计.docx
- 八年级上册道德与法治统编版:关爱他人-教学设计.docx
- 八年级上册道德与法治统编版:服务社会-教学设计.docx
- 八年级上册道德与法治统编版:诚实守信-教学设计.docx
- 八年级体育人教版:体操:足蹬地翻身上-教学设计.docx
- 八年级下美术浙美版:1-印象派的画家们-教学设计 (1).docx
- 八年级下美术浙美版:7-我设计的服装-教学设计.docx
- 8 黄山奇石(第二课时)课件(共22张PPT).pptx
- 22《纸船和风筝》教学课件(共31张PPT).pptx
- 17 松鼠 课件(共23张PPT).pptx
- 23《海底世界》课件(共28张PPT).pptx
- 21《大自然的声音》课件(共18张PPT).pptx
- 第12课《词四首——江城子 密州出猎》课件 2025—2026学年统编版语文九年级下册.pptx
- 第2课《济南的冬天》课件(共42张PPT) 2024—2025学年统编版语文七年级上册.pptx
- 17 跳水 第二课时 课件(共18张PPT).pptx
- 第六单元课外古诗词诵读《过松源晨炊漆公、约客》课件 统编版语文七年级下册.pptx
- 统编版六年级语文上册 22《文言文二则》课件(共27张PPT).pptx
原创力文档


文档评论(0)