应用多元统计分析 - 北京.pptVIP

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
应用多元统计分析 - 北京

北大数学学院 有时需要建立一种规则,需要你根据看到性状,来判别个体的属性或类别 比如让你根据人的某些外在特征判别人的年龄组(老中青)或民族 你可能说这很容易,你的判别依据是什么? 如果这活让计算机来完成呢? 可能很困难,即使让计算机判断人的性别也比较困难。 * * 第五章 判别分析 什么是判别分析 在气象学中,由气象资料判断明天是阴天还是晴天, 是有雨还是无雨. 在市场预测中,由调查资料判断下季度(或下个月)产品是畅销、平常或滞销. 在环境科学中,由气象条件,污染浓度等判断该地区是属严重污染,一般污染还是无污染. 在地质勘探中,由岩石标本的多种特征判断地层的地质年代,是有矿还是无矿,是富矿还是贫矿. 在体育运动中,由运动员的多项运动指标来判定游泳运动员的苗子是适合练蛙泳,仰泳还是自由泳等 样本数据 * xi1,xi2,…,xin表示个体性状 yi表示个体类别,取有限个值。 判别分析的目的 根据样本数据建立模型 y=f(x1,x2,…,xm) 根据这个模型对未来个体的类别进行判别 使得预测的准确率较高 判别的思想就是看一个样品和那个类长得比较“象”,和哪个类“象”就判别为哪一类。 但是“象”与“不象”,确是仁者见仁,智者见智。不同的人来说,结果可不完全相同。 但是还是能认同“较为合理”的结果。 * * 第五章 判别分析 目 录  §5.1 距离判别 §5.2 Bayes(贝叶斯)判别法及 广义平方距离判别法 §5.3 Fisher(费歇)判别 §5.4 判别效果的检验及 各变量判别能力的检验 §5.5 逐步判别 * 第五章 §5.1 距离判别法 距离判别的基本思想是: 样品和哪个总体距离最近,就判它属哪个总体. 距离判别也称为直观判别法. 我们在具体讨论距离判别法之前,应给出合理的距离的定义. * 第五章 §5.1 距离判别法 马氏距离 已知有两个类G1和G2,比如G1是设备A生产的产品,G2是设备B生产的同类产品.设备A的产品质量高(如考察指标为耐磨度X),其平均耐磨度μ1=80,反映设备精度的方差σ2(1)=0.25;设备B的产品质量稍差,其平均耐磨度μ2=75,反映设备精度的方差σ2(2)=4.今有一产品X0,测得耐磨度x0=78,试判断该产品是哪一台设备生产的? 直观地看, x0 与μ1(设备A)的绝对距离近些,按距离最近的原则是否应把该产品X0 判断为设备A生产的? * 第五章 §5.1 距离判别法 马氏距离 考虑一种相对于分散性的距离.记X0与G1, G2的相对平方距离为d21(x0)或d22(x0),则: d21(x0)= = = 16=42 d22(x0)= = =2.25=1.52 因为d2(x0)=1.54= d1(x0) ,按这种距离准则应判X0为设备B生产的. (x0 -μ1)2 σ2(1) (78 - 80)2 0.25 (x0 -μ2)2 σ2(2) (78 - 75)2 4 * 第五章 §5.1 距离判别法 马氏距离 设备B生产的产品质量较分散,出现x0为78的可能性仍较大; 而设备A生产的产品质量较集中,出现x0为78的可能性较小. 判X0为设备B的产品更合理. 这种相对于分散性的距离就是本节介绍的马氏距离. * 第五章 §5.1 距离判别法 马氏距离 一般地,我们假设G1的分布为N(μ(1),σ21),G2的分布为 N(μ(2),σ22),则利用相对距离的定义,可以找出分界点μ*(不妨设 μ(2)μ(1)),当μ(2)xμ(1)时,令 而按这种距离最近的判别准则为: * 第五章 §5.1 距离判别法 利用马氏距离对两个一维正态总体判别归类示意图 利用马氏距离对两个一维正态总体判别归类 令: (μ* =79为到两总体相 对距离相等的分界点) x0=78μ*=79 判x0∈G2. * 第五章 §5.1 距离判别法 两总体判别:简例1 简例1 :记二维正态总体N2(?(i),? )为Gi(i=1,2)(两总体协差阵相同),已知来自Gi(i=1,2)的样本数据阵为 (1) 试求两总体的样本组内离差阵A1, A2和

文档评论(0)

xiaolan118 + 关注
实名认证
文档贡献者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档