- 1、本文档共63页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
坚持 坚持 四、判别效果的显著性检验 在多因子判别中,要选择若干分辨能力强的变量组成判别函数,判别分析的基础是假设两组样品取自不同的总体,如果两组多元变量在统计上差异不显著,判别就没有价值,因此判别效果显著性检验就是检验判别因子在各两总体的差异是否显著。 坚持 对于判别方程中的单个因子xk的显著性,可用t检验的方法检验它在两个总体中的平均值是否显著。 遵从自由度为 的t分布。 坚持 2.对于m 个因子的共同的分辨效果,则采用马哈拉诺 比斯距离作为两总体差异的指标。 马氏距离 坚持 坚持 由 坚持 代入 坚持 坚持 遵从 坚持 例 由表所列资料,根据Fisher准则建立判别函数并检验效果。 解: 坚持 坚持 坚持 坚持 §3.2 Bayes判别准则与分析 由m个变量 组成m维空间,用 表示, 来自K个总体 已知每个总体发生的先验概率(气候概率)分别为 各总体的概率密度分别为 设有K个不同的事件,有m个变量与事件发生有关。 坚持 Bayes判别的几何意义是在m维空间中对应各总体寻找一个划分: 若样本 落在 Bayes判别准则,即在选择划分 时,应使发生 错判的概率为最小。 错判率与什么有关? 下图简单地以2维空间的两个总体为例 坚持 第三章 判别分析与聚类分析 坚持 在多元统计分析中,广泛使用一种统计应用方法,即根据表征某一事物或现象类型的随机变量的取值样本分布,将事物或现象划分为若干类型。例如,在气候分析中,需将气候划分成若干类型,干旱气候,湿润气候,半干旱气候等,究竟划分几类?选择湿度、相对湿度、降水量、蒸发量等气候要素为指标,根据样品的相近程度,划分为若干种类型,这称为聚类分析;数量统计上,即分析众多的样本 划分确认来自几个不同的总体。 坚持 另外,气候分析中,类型分类已知,介于两者之间的某站,则需根据两种类型(总体)的特征和该站要素(样本)来判断该站的属类;在天气预报中,有时需要根据前期的样本观测值来判断哪种现象(晴,阴,雨)或现象等级(火险等级1、2..5)将出现,则称为判别分析,也称为统计分辨法。 判别分析与聚类分析均属数字分类。 坚持 §3.1 费歇(Fisher)判别准则与分析 一、Fisher判别准则 坚持 判别分析是已知有两个或更多的总体(类型),并且获得每个总体中的若干样本,根据这些总体中的样本特征去建立一种判别规则,使我们能将某个新的个体归属正确的总体,而事先并不知道该个体来自哪个总体。 若需要判别的对象有两种可能的结局,则称为二级判别;有两种以上可能结局,则称为多级判别。二级判别又称简单判别。 坚持 设x为与天气状况有关的变量,而天气状况分为A与B两种状况(晴,阴雨),x的样本空间 由有利A的样本集合与有利B的样本集合组成。 越大时,判别效果越好,错判率越低。 作为判别指标, 坚持 而 取决于下列因素 坚持 1、指标x在两总体的期望值差异 越大,则 越大,判别时,错判概率越小 坚持 2、x的离散程度越小,x来自两不同总体的概率差 越大。 坚持 综上所述,离散程度小,期望值差异大,表明两总体样本重叠部分少,x出现时事件(类型)的出现概率差就大,以指标判别类型时,错判率自然小,即两总体最大分离的原则,这就是费歇判别准则: 希望用一个综合指标y,它在两总体中方差最小,而条件期望值差异最大。 坚持 影响因子是复杂的,单个气象要素指标效果不佳 ,可采用多个的要素线性组合成一个综合指标: 称为Fisher判别函数, 称为判别系数。 利用历史资料,根据Fisher准则,推断判别系数。 以 为例,说明其几何意义 坚持 坚持 1、2两总体均存在较大重叠部分,若将样本投影到直线l上,则两总体重叠部分显著减少,能相对最大分离。 坚持 坚持 在两总体的样本空间寻找一个最佳投影方向,将样本在该方向投影后,两总体能够最大分离。 坚持 二、线性Fisher判别方程的建立 设有A出现条件下,X1…xm的N1次观测值, B出现条件下, X1…xm的N2次观测值 坚持 构造判别方程 按照Fisher准则,应有: 坚持 坚持 将 代入 坚持 坚持 B与标号k无关,在方程组中是一个常数比例因子,仅起到使方程组同倍比放大或缩小的作用,不影响Ck之间的相对比例,因而不影响判别效果,故可令B=1。此时方程组为: 坚持 求解方程组,解得判别系数,即可得FIsher判别函数: 坚持 建立判别函数后,可分别计算A、B出现时,判别函数 的平均值: 以
文档评论(0)