- 1、本文档共146页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分别对上面两式左右相加,再除以样品个数,可得 两个总体的重心: 最佳的线性判别函数应该是:两个重心的距离越大越好,两个组内的离差平方和越小越好。 取对数 求导数 称 为典型函数. (三)判别准则 如果由原始数据y求得判别函数得分为Y*, 对与一个样品代入判别函数中,若Y*Y0,则判给G1,否则判给G2。 二、多个总体的Fisher判别法 (一) 判别函数 Fisher判别法实际上是致力于寻找一个最能反映组和组之间差异的投影方向,即寻找线性判别函数 ,设有 个总体 ,分别有均值向量 , ,…, 和协方差阵 , 分别各总体中得到样品: 第i个总体的样本均值向量 综合的样本均值向量 第i个总体样本组内离差平方和 综合的组内离差平方和 组间离差平方和 如果判别分析是有效的,则所有的样品的线性组合 满足组内离差平方和小,而组间离差平方和大。则 而 所对应的特征向量即 。 Fisher样品判别函数是 然而,如果组数k太大,讨论的指标太多,则一个判别函数是不够的,这时需要寻找第二个,甚至第三个线性判别函数 其特征向量构成第二个判别函数的系数。 类推得到m(mk)个线性函数。 关于需要几个判别函数得问题,需要累计判别效率达到85%以上,即有 设 为B相对于E得特征根,则 以m个线性判别函数得到的函数值为新的变量,再进行距离判别。 判别规则: 设Yi(X)为第i个线性判别函数, , 则 例 某种产品的生产厂家有12家,其中7家的产品受消费者欢迎,属于畅销品,定义为1类;5家的产品不大受消费者欢迎,属于滞销品,定义为2类。将12家的产品的式样,包装和耐久性进行了评估后,得分资料,今有一新得厂家,得分为(6,4,5),该厂的产品是否受欢迎。 data a; input type$ x1 x2 x3@@; cards; 1 9 8 7 1 7 6 6 1 8 7 8 1 8 5 5 1 9 9 3 1 8 9 7 1 7 5 6 2 4 4 4 2 3 6 6 2 6 3 3 2 2 4 5 2 1 2 2 ; proc print; proc candisc data=a out=outcan simple distance anova; class type; var x1 x2 x3; proc print data=outcan; run; Total-Sample Standard Variable N Sum Mean Variance Deviation x1 12 72.00000 6.00000 7.81818 2.7961 x2 12 68.00000 5.66667 5.15152 2.2697 x3 12 62.00000 5.16667 3.42424 1.8505 Raw Canonical Coefficients Variable Can1 x1 0.6638029449 x2 0.0626766729 x3 0.2315780967
文档评论(0)