第4章-判别分析——part1.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * 上例中,当μ1=80,μ2 =75,σ=2时 分界点μ =(80+75)/2=77.5,故错判概率为 P(2|1)= P{X77.5|X∈G1} (X~N(80,4) ) = P{(X-80)/2(77.5-80)/2} = P{U-1.25} (U=(X-80)/2~N(0,1) ) = 1-Φ(1.25)= 0.1056 P(1|2)= P{X77.5|X∈G2} (X~N(75,4) ) = P{(X-75)/2(77.5-75)/2} = P{U1.25} (U=(X-75)/2~N(0,1) ) = 1-Φ(1.25)= 0.1056=P(2|1) 一般地,经计算可得: 由错判概率的公式及上图可见, 当两总体均值靠得很近(即| μ1 - μ2 |很小)时,则错判概率很大,这时作判别分析是没有意义的.因此只有当两总体的均值有显著性差异时,作判别分析才有意义. 即如果两个总体(类别)间的差异本来就不显著,那么就根本没有必要去作判别,即有效的判别必须以显著的差异为前提。因此,在考虑建立判别函数之前,应首先检验总体间是否存在显著的差异(在判别之前应对两总体的均值是否有显著差异进行检验)。 H0: H1: 另外,以上讨论的判别函数及规则并没有涉及到总体的具体分布类型,只要逆矩阵存在就可以。 1、两总体距离判别 4.2.2 两总体距离判别 例1 :记二维正态总体N2(?(i),? )为Gi(i=1,2)(两总体协差阵相同),已知来自Gi(i=1,2)的样本数据阵为 (1) 试求两总体的样本组内离差阵A1, A2和合并样本协差阵S. (2) 今有样品x0 =(2,8)′,试问按马氏距离准则样品x0应判归哪一类. (1)解: 而且 (2)解一:计算马氏距离 (2)解二:计算线性判别函数W(X) * * 例2 * 1、多总体距离判别 返回 4.2.1 距离判别的基本思想 4.2.2 两总体距离判别 4.2.3 多总体距离判别 4.2 距离判别 1、多总体距离判别 类似于两总体情况,计算样品 X 到每个总体的距离d2(X,Gi)(i=1,2,---k,),然后比较这些距离,如 X 距离总体Gi的距离最短,则判X属于总体Gi。 1、多总体距离判别 4.2.3 多总体距离判别 设有个总体 G1,…,Gk, 它们的均值分别是 , 协方差矩阵均是 ,则 (1)协方差矩阵相同 1、多总体距离判别 4.2.3 多总体距离判别 判别函数为: 1、多总体距离判别 4.2.3 多总体距离判别 相应的判别准则为: 当 若有某一个 ,对一切 待判, 1、多总体距离判别 4.2.3 多总体距离判别 当 未知时可用其估计量代替。 * 1、多总体距离判别 4.2.3 多总体距离判别 此时判别函数为: (2)协方差矩阵不相同 相应的判别准则为 1、多总体距离判别 4.2.3 多总体距离判别 当 未知时,可用 的估计量代替。 * 例3 人文发展指数是联合国开发计划署于1990 年5 月发表的第一份《人类发展报告》中公布的。该报告建议,目前对人文发展的衡量应当以人生的三大要素为重点,衡量人生三大要素的指示指标分别要用出生时的预期寿命、成人识字率和实际人均GDP,将以上三个指示指标的数值合成为一个复合指数,即为人文发展指数。资料来源:UNDP《人类发展报告》1995 年。 今从1995 年世界各国人文发展指数的排序中,选取高发展水平、中等发展水平的国家各五个 作为两组样品,另选四个国家作为待判样品作距离判别分析。 * * 解:本例中变量个数p=3,两类总体各有5 个样品,即n1=n2=5,有4 个待判样品,假定两总体协差阵相等。 两组线性判别的计算过程如下: (1) * * * (3)求线性判别函数W(X) * (4)对已知类别的样品判别分类 对已知类别的样品(通常称为训练样品)用线性判别函数进行判别归类,结果如下,全部判对。 * ( 5 ) 对判别效果作检验判别分析是假设两组样品取自不同总体,如果两个总体的均值向量在统计上差异不显著,作判别分析意义就不大。所谓判别效果的检验就是检验两个正态总体的均值向量是否相等,根据第二章§2.1.3(P25页) 可知检验的统计量为: * (6)对待判样品判

文档评论(0)

zcbsj + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档