- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数学建模课件-多变量分析剖析
如欲对两类判别进行假设检验, 当例数n=n1+ n2较大时(通常取n50),则可用x2检验。当n不大时,则用F检验 由上可知,Fisher法则所确定的判别函数,须使两类的判别值满足以下要求:两类均数之差的平方与类内离均差平方和合计值的比值为最大。这样的做法,实质上是选择适当的投影方向,将m维空间中的点投影到低维空间中去,使同类的点尽可能地集中到一起,不同类的点尽可能地分开,这样就到达了分类目的。 第二节 Bayes判别分析 (一). Bayes准则 设有定义明确的g个总体π1,π2,…,πg, 分别为X1,X2,…,Xp的多元正态分布。对于任何一个个体, 若已知p个变量的观察值,要求判断该个体最可能属于哪一个总体。 如果我们制订了一个判别分类规则, 难免会发生错分现象。把实属第i类的个体错分到第j类的概率记为P(j|i),这种错分造成的损失记为C(j|i)。 Bayes判别准则就是平均损失最小的准则。按照这个准则去找一种判别分类的规则,就是Bayes判别。 (二). 分类函数 (g个类别,p个指标) Bayes准则下判别分析的分类函数形式如下: Y1=C01+C11X1+C21X2+……+Cp1Xp Y2=C02+C12X1+C22X2+……+Cp2Xp ………… Yg=C0g+C1gX1+C2gX2+……+CpgXp 即g个线性函数的联立方程,每个线性函数对应于某一类别。其中C0j,C1j,……,Cpj,(j=1,2,……,g)为需估计的参数。用SAS的DISCRIM过程可得到这些参数的估计值。判别函数建立后通常的判别准则为:如欲判断某样品属于上述g类中的哪一类,可将该样品的各Xi值代入式(17.1)中的各个方程,分别算出Y1,Y2,……,Yg等值。其中如Yf为最大则意味着该样品属第f类的概率最大,故判它属于第f类。 事前概率(prior probability)又称先验概率。如在所研究的总体中任取一个样品,该样品属于第f类别的概率为q(yf),则称它为类别f的事前概率。例如, 阑尾炎病人总体中卡他性占50%,蜂窝织炎占30%,坏疽性占10%,腹膜炎占10%; 则在该总体中任取一个阑尾炎病人,该病人属于以上四型的概率分别为0.5,0.3,0.1和0.1, 它们也分别是这四类的事前概率。 (三). 事前概率 考虑事前概率时,判别函数如下式: Y1=C01+C11X1+C21X2+……+Cp1Xp+ln(q(Y1)) Y2=C02+C12X1+C22X2+……+Cp2Xp+ln(q(Y2)) ………… Yg=C0g+C1gX1+C2gX2+……+CpgXp+ln(q(Yg)) 差别仅仅在于ln(q(Yj))项 考虑事前概率可适当提高判别的敏感性。事前概率可据于文献报道或以往的大样本研究。但是困难在于事前概率往往不容易知道;如果训练样本是从所研究的总体中随机抽取的,则可用训练样本中各类的发生频率Q(Yj)来估计各类别的事前概率q(Yj)。如果事前概率未知,而又不可以用Q(Yj)来估计q(Yj),就只能将事前概率取为相等值,即取q(Yj)=1/g。 (四). 事后概率 事后概率(posterior probability)又称后验概率。如果已知某样品各个指标Xi的观察值为Si,则在该条件下,样品属于Yj类别的概率P(Yj /S1,S2,…,SP)称为事后概率。事后概率和指标的值有关。 引入事后概率后,可用事后概率来描述某样品属于Yj类别的概率。这就使得判别的可靠性有一个数量的指标。 例:A1,A2,A3的事后概率为0.95,0.03和0.02 判为A1类的可靠性好。 A1,A2,A3的事后概率为0.40,0.30和0.30 判为A1类的可靠性差。 如欲判别某样品属于哪个类别时,可据样品各指标的取值S1,S2,……,SP代入判别函数,求得各类别之Y值,即Y1,Y2,……,Yg。 事后概率的计算公式为: 仅凭哪一个事后概
文档评论(0)