- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
【定理】 且相应的密度函数为 ,损失为 时, 划分的贝叶斯解为 若总体G1,G2,?,Gk的先验概率为 其中 含义是:当抽取了一个未知总体的样品值x,要判别它属于哪个总体,只要先计算出k个按先验概率加权的误判平均损失 然后比较其大小,选取其中最小的,则判定样品属于该总体。 下面在k=2的情形下,计算作为例子,我们讨论。 由此可见,被积函数在D1是负数时,可使ECM最小,则有分划 Bayes判别准则为: 令 特别地,若 则 判给 。与标准Bayes判别等价 当错判概率 广义平方距离法 其中 定义样品X到总体Gi的广义平方距离为: 判别准则: * 两总体判别 简例1 :记二维正态总体N2(?(i),? )为Gi(i=1,2)(两总体协差阵相同),已知来自Gi(i=1,2)的样本数据阵为 (1) 试求两总体的样本组内离差阵A1, A2和合并样本协差阵S. (2) 今有样品x0 =(2,8)′,试问按马氏距离准则样品x0应判归哪一类. * (1)解: * 而且 * (2)解一:计算马氏距离 * (2)解二:计算线性判别函数W(X) * 简例2(简例1的续) :已知先验概率q1=0.4, q2=0.6,且L(2|1)=L(1|2)=1.对简例1中提供的资料,试用Bayes 准则对样品x0 =(2,8) ′进行判别归类. 解一:计算广义平方距离D2(X,Gi)(i=1,2) * 解二:计算线性判别函数Yi (X)(i=1,2) * * 解三:计算qifi(x0)(i=1,2)(利用定理5.2.1的推论) * * 解四:计算后验概率P(i |x0)(i=1,2) 由后验概率的计算公式: * 因 P(2| x0 ) > P(1| x0 ),故判x0 ∈G2 * 例5.2.2(胃癌的鉴别) 下表是从病例中随机抽取的部分资料.这里有三个总体:胃癌 、萎缩性胃炎和非胃炎病者.从每个总体抽5个病人,每人化验4项生化指标:血清铜蛋白(X1) 、蓝色反应(X2)、尿吲哚乙酸(X3)和中性硫化物(X4).试用广义平方距离判别方法建立判别准则并对这15个样品进行判别归类. 表5.2 胃癌鉴别数据 * 解 此例中总体个数k=3,变量个数m=4,各 组样品个数为:n1=n2=n3=5(n=15).这是多总体的判别归类问题. * data d522; input group x1-x4 @@; cards; 1 228 134 20 11 1 245 134 10 40…. 2 130 100 6 12 2 150 117 7 6….. 3 100 117 7 2 ; proc print data=d522; run; proc discrim data=d522 pool=no distance list; class group; var x1-x4; run; 选项POOL=NO表示三个总体 的协差阵不能认为相等故 而不使用合并协差阵, 此时采用广义平方距离进 行判别归类. 先验概率我们仍假定相等 * 输出两两配对的组间平方距离(即马氏距离) 比如:d2(2|1)表示X(2)到G1的平方距离.若Σ1=Σ2,则 d2(2|1)=d2(1|2);但此例中协差阵Σ1与Σ2不等,因此 d2(2|1)=22.12187,d2(1|2)=486.03104. J= J= J= i= i= i= * 输出两两配对的组间广义平方距离 用D2(2|1)表示X(2)到G1的广义平方距离.因协差阵Σ1 与Σ2不等,因此D2(2|1)=43.06467,D2(1|2)=498.26812. D2(1|1)=20.94280=Ln|S1| * 由选项LIST 要求而列出 的回判结果 * 应用多元统计分析 第五章 判 别 分 析 判别准则: 用于衡量新样品与各已知组别接近程度的思路原则。 判别函数: 基于一定的判别准则计算出的用于衡量新样品与各已知组别接近程度的描述指标。 按照判别准则来分有 距离判别、费希尔判别与贝叶斯判别。 距离判别法 判别准则:对于任给一次观测值,若它与第 类的重心距离最近,就认为它来自于第 类。 马氏距离 1、协方差相等 两总体的距离判别 先考虑两个总体的情况,设有两个协差阵?相同的p维正态总体 和 ,对给定的样本Y,判别
文档评论(0)