- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
正态分布下的几种决策面的形式 正态分布Bayes决策 正态模型的Bayes决策面 两类问题正态模型的决策面: 决策面方程:g1(x)=g2(x) 两类的协方差矩阵相等,决策面是超平面。 两类的协方差矩阵不等,决策面是超二次曲面。 正态分布Bayes决策 正态分布的Bayes决策例解 两类的识别问题:医生要根据病人血液中白细胞的浓度来判断病人是否患血液病。 根据医学知识和以往的经验,医生知道: 患病的人,白细胞的浓度服从均值2000,标准差1000的正态分布;未患病的人,白细胞的浓度服从均值7000,标准差3000的正态分布; 一般人群中,患病的人数比例为0.5%。 一个人的白细胞浓度是3100,医生应该做出怎样的判断? 正态分布Bayes决策 数学表示:用ω表示“类别”这一随机变量,ω1表示患病, ω2表示正常;x表示“白细胞浓度”这个随机变量。 本例医生掌握的知识非常充分,他知道: 1) 类别的先验分布:P(ω1) = 0.5%P(ω2) = 99.5%先验分布:没有获得观测数据(病人白细胞浓度)之前类别的分布 正态分布的Bayes决策例解 正态分布Bayes决策 2) 观测数据白细胞浓度分别在两种情况下的类条件分布: P(x|ω1) ~ N(2000,10002) P(x|ω2) ~ N(7000,30002) P(3100|ω1) = 2.1785e-004P(3100|ω2) = 5.7123e-005 计算后验概率P(ω1|3100)=1.9%P(ω2|3100)=98.1% 医生的判断:正常 正态分布的Bayes决策例解 正态分布Bayes决策 2.6 讨论 基于Bayes决策的最优分类器 Bayes决策的三个前提: 类别数确定 各类的先验概率P(ωi)已知 各类的条件概率密度函数p(x|ωi)已知 问题的转换: 基于样本估计概率密度 基于样本直接确定判别函数 % Predict the class label using the Naive Bayes classifier load fisheriris % Use the default Gaussian distribution O1 = NaiveBayes.fit(meas,species); C1 = O1.predict(meas); cMat1 = confusionmat(species,C1) % the confusion matrix % Use the Gaussian distribution for feature 1 and 3 and use the % kernel density estimation for feature 2 and 4. O2 = NaiveBayes.fit(meas,species, ... dist,{normal, kernel,normal,kernel}); C2 = O2.predict(meas); cMat2 = confusionmat(species,C2) % the confusion matrix Matlab Example 习题 试简述先验概率,类条件概率密度函数和后验概率等概念间的关系: 试写出利用先验概率和分布密度函数计算后验概率的公式 写出最小错误率和最小风险决策规则相应的判别函数(两类问题)。 先验概率、类条件概率密度函数和后验概率 1. 试简述先验概率,类条件概率密度函数和后验概率等概念间的关系: 先验概率:根据大量统计确定某类事物出现的比例,如在我国大学中,一个学生是男生的先验概率为0.7,而为女生的概率是0.3,这两类概率是互相制约的,因为这两个概率之和应满足总和为1的约束。 类条件概率密度函数:同一类事物的各个属性都有一定的变化范围,在这些变化范围内的分布概率用一种函数形式表示,则称为类条件概率密度函数。这种分布密度只对同一类事物而言,与其它类事物没有关系。为了强调是同一类事物内部,因此这种分布密度函数往往表示成条件概率的形式。例如x表示某一个学生的特征向量,则,男生的概率密度表示成P(x|男生),女生的表示成P(x|女生),这两者之间没有任何关系,即一般的情况下P(x|w1)+P(x|w2)≠1,可为从[0,2]之间的任意值。 后验概率:一个具体事物属于某种类别的概率,例如一个学生用特征向量x表示,它是男性或女性的概率表示成P(男生|x)和P(女生|x),这就是后验概率。由于一个学生只可能为两个性别之一,因此有P(男生|x)+P(女生|x)=1的
原创力文档


文档评论(0)