- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
概率论与数理统计_9
概率论与数理统计5
1
4
第五章判别分析什么是判别分析 在气象学中由气象资料判断明天是阴天还是晴天 是有雨还是无雨
在市场预测中由调查资料判断下季度或下个月产品是畅销平常或滞销
股票持有者根据某种股票近期的变化情况判断此种股票价格下一周是上升还是下跌
在环境科学中由气象条件污染浓度等判断该地区是属严重污染一般污染还是无污染
在地质勘探中由岩石标本的多种特征判断地层的地质年代是有矿还是无矿是富矿还是贫矿
在体育运动中由运动员的多项运动指标来判定游泳运动员的苗子是适合练蛙泳仰泳还是自由泳等5
第五章判别分析什么是判别分析 判别分析是应用性很强的一种多元统计方法
已渗透到各个领域但不管是哪个领域判别分析问题都可以这样描述 设有k个m维总体G1G2Gk其分布特征已知如已知分布函数分别为F1xF2xFkx或知道来自各个总体的训练样本对给定的一个新样品X我们要判断它来自哪个总体 在进行判别归类时由假设的前提判别的依据及处理的手法不同可得出不同判别方法如距离判别Bayes判别Fisher判别或典型判别逐步判别序贯判别等
本章介绍几个常用的判别方法6
§51 距离判别法
距离判别的基本思想是
样品和哪个总体距离最近就判它属哪个总体
距离判别也称为直观判别法
我们在具体讨论距离判别法之前应给出合理的距离的定义7
示例8
9
§51 距离判别法马氏距离 已知有两个类G1和G2比如G1是设备A生产的产品G2是设备B生产的同类产品设备A的产品质量高如考察指标为耐磨度X其平均耐磨度μ180反映设备精度的方差σ21025设备B的产品质量稍差其平均耐磨度μ275反映设备精度的方差σ224今有一产品X0测得耐磨度x078试判断该产品是哪一台设备生产的 直观地看x0 与μ1设备A的绝对距离近些按距离最近的原则是否应把该产品X0 判断为设备A生产的
10
§51 距离判别法马氏距离 考虑一种相对于分散性的距离记X0与G1
G2的相对平方距离为d21x0或d22x0则
d21x0 1642
d22x0
因为d2x0154 d1x0 按这种距离准则应判X0为设备B生产的
x0 -μ12
σ21
78 - 802
025
x0 -μ22
σ22
78 - 752
4
11
§51 距离判别法马氏距离 设备B生产的产品质量较分散出现x0为78的可能性仍较大 而设备A生产的产品质量较集中出现x0为78的可能性较小
判X0为设备B的产品更合理
这种相对于分散性的距离就是本节介绍的马氏距离12
§51 距离判别法马氏距离 一般地我们假设G1的分布为Nμ1σ21G2的分布为Nμ2σ22则利用相对距离的定义可以找出分界点μ不妨设μ2μ1当μ2xμ1时令而按这种距离最近的判别准则为13
§51 距离判别法利用马氏距离对两个一维正态总体判别归类示意图 利用马氏距离对两个一维正态总体判别归类令
μ 79为到两总体相对距离相等的分界点
x078μ79
判x0∈G2
14
§51 距离判别法马氏距离 com马氏距离 设总体G为m维总体考察m个指标均值向量为μμ1μ2 μm′协方差阵为∑σij则样品Xx1x2xm′与总体G的马氏距离定义为15
§51 距离判别法多总体样本特征量 设有k个总体Gii1k已知来自Gi i1k 的训练样本为
其中ni是取自Gi的样品个数则均值向量μi的估计量为16
§51 距离判别法多总体样本特征量 总体Gi的协方差阵∑i的估计Si为并称St为组内协差阵
称为组内离差阵
17
§51 距离判别法多总体样本特征量 当假定∑1∑k∑时反映分散性的协方差阵∑的估计S为并称S为合并样本协差阵
问题是对任给定的m维样品Xx1x2 xm ′要判断它来自哪个总体其中18
§51 距离判别法 两总体判别∑1∑2 时的判别方法 最直观的想法是分别计算样品X到两个总体的距离d21X和d22X 或记为d2XG1和d2XG2 并按距离最近准则判别归类即判别准则为 判X∈G1 当d2XG1 d2XG2时
待判 当d2XG1 d2XG2时
这里的距离
文档评论(0)