- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
判别分析终结
判别分析
定义:
判别分析又称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。
其基本原理是按照一定的判别准则,建立一个或多个,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。据此即可确定某一样本属于何类。当得到一个新的样品数据,要确定该样品属于已知类型中哪一类,这类问题属于判别分析问题在气候分类、农业划、土地类型划分中有着广泛的应用
其中Y为判别函数判别值,为反映研究对象特征的变量,为个变量的系数即判别系数.
常用的判别法:马氏距离判别法、Bayes(贝叶斯)判别法、Fisher(费希尔)判别法,此外还包括极大似然法,Logistic判别法、逐步判别法等
1、概念:设有m个p维的总体,分别服从一定的分布。现在有一个新的样品,它可能来自于这m个总体中的某一个,依据该样品的p项指标,从而判别它最可能来自于哪个总体。
2、判别分析的一般步骤:已知分类的训练样本判别函数考核 未知样品判别归类
二、三种常用判别分析方法:
(1)距离判别法:(马氏距离判别)
两个总体判别法:印度统计学家马哈拉诺比斯提出了用
作为样品x到总体的距离。
其中和分别是总体的均值向量的协矩阵。
如此定义的距离称为x到总体的马氏距离。
取样品x到总体距离为马氏距离,并按照规则
若 则判 x
若 则判 x
若 则不判
进行的判别,这种方法称为距离判别法。
多个总体判别法:假设共有n个指标,第i个指标共测得m个数据(要求mn):
于是,我们得到阶的数据矩阵X=(),每一行是一个样本数据。阶的数据矩阵X的阶协方差矩阵记着cov(X):
求n维向量到阶的矩阵X的马氏距离定义,则n维向量到阶的矩阵X的马氏距离的公式如下:、
mahal(r,X)=
其中,表示第i个指标的算术平均值。
(2)贝叶斯判别法:
设m个总体,其概率密度分别为
根据历史数据(或经验)给出这m个总体各自出现的概率分别为,这个概率分布叫先验分布。
在观测到一个样品x的情况下,可用著名的Bayes公式计算它来自第g总体的后验概率(相对于先验概率来说,将它又称为后验概率):
并且当
时,则判X来自第h总体。
假定已量化了各种错判的损失大小,将本该属于的样品错判到所造成的损失记为
寻求样品取值的范围的一个划分,使得将一个来历不明的新样品x作出各种错判的总平均损失
达到最小。
判别规则为:若样品想x,则判x
(3)Fisher判别法
将多个数据投影到某个表面上并且与总体分开,选择判别规划,进行分类,从k个总体中抽取p个总体的指标数据,由方差构造线性判别函数
将新样品p值带入线性判别函数
符合的则满足该判别函数。(注:SPSS软件是向某个二维平面投影,然后用距离判别法判别其归属。)
判别函数的导出
假设有两个总体G1、G2,从第一个总体中抽取n1个样品,从第二个总体中抽取n2个样品,每个样品观测p个指标,列表如下:
G1总体: G2总体:
变量
样品 … 变量
样品 … … ? … … 均值 … 均值 …
假设新建立的判别式为,今将属于不同两总体的样品观测值代入判别式中去,则得:
对上边两式分别左右相加,再乘以相应的样品个数,则有:
……第一组样品的“重心”
……第二组样品的“重心”
为了使判别函数能够很好地区别来自不同总体的样品,自然希望:
1)来自不同总体的两个平均值相差愈大愈好。
ii)对于来自第一个总体的要求它们的离差平方和愈小愈好,同样也要求愈小愈好。
(2)计算判别临界值y0
由于
所以
(3)判别准则
∴判别准则为
多总体同理。
五、、实例分析
例1、.(马氏距离)现测得6只Apf和9只Af蠓虫的触长,翅长数据
Apf:(1.14,1.78), (1.18,1.96), (1.20,1.86), (1.26,2.00), (1.28,2.00),(1.30,1.96)
Af:(1.24,1.72), (1.36,1.74), (1.38,1.64), (1.38,1.82), (1.38,1.90), (1.40,1.70), (1.48,1.82),(1.54,1.82), (1.56,2.08)
若两总体协方差矩阵不等,试判别以下的三个蠓虫属于哪一类?
(1.24,1.8),(1.28,1.84),(1.4,2.04)
求解:
Apf=[1.14,1.78; 1.18,1.96; 1.20,1.86
文档评论(0)