- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
概率统计计算 p224-p266
概率统计计算p224-p266
5 判断分析
5.1 引言
在自然科学和社会科学等方面的研究中,经常遇到根据样本观测数据对其进行判别分类的问题.如在医学上,常要根据患者的不同症状和化验结果来诊断其患病类型;在经济学中,可根据各国的人均国民收入、人均消费水平等来判定一个国家经济发展程度所属的类型,等等,这些问题都可用某些统计方法进行判别分类.
判别分析是多元统计方法中较为成熟的一类判别分类法,它是根据两个或多个母体的观测样本结果,按照一定的判别准则和相应的判别函数,来判别任一待判个体归属哪一类母体.判别分析要解决的问题是在已知历史上把研究对象用某些方法已分成若干类的情况下,来确定新的观测样品应归属的类别.
在这一章,我们分别介绍距离判别,贝叶斯( Bayes)判别,费歇( Fisher)判别和逐步判别等几种判别分析方法.每种方法都给出判别准则和判别函数的推导过程以及在计算机上实现的算法步骤.关于这几种不同判别方法的特点和适用范围以及之间的联系,本章也略作介绍.
5.2 距离判别
距离判别方法直观,简单,该方法适用子连续性变量的判别分类,对变量的概率分布不要求有什么限制,尤其对不同母休的协方
差矩阵不要求相等,这是距离判别的优点之一.
5.2.1 马氏距离的概念和性质
通常我们定义的距离一般是指欧氏距离,即中两点和之间的距离是用两点的坐标差的平方和度量,
(5.2.1)
但是在多元分析或统计计算中,用欧氏距离有时不太合适,请
看下面的例子.
设有两个正态总体,~(,),~(,),现给定一个样品位于处(见图5.1),试问,A处的样品离哪一个总体较近?
从图上看出,若按欧氏距离来度量,A点离的中心要比离的中心“近一些”;但是从概率论的观点来看,A点位于右侧约处,而位于左侧约处,用标准差来度量,那么B点离要比离“近一些”。显然,后一种度量更为合理。为此,我们引入一种新的距离概念,即1936年由印度著名统计学家Mahalanobis提出的“马氏距离”。
定义5.1 设X,Y是从均值,协方差阵为V的总体A中抽取的样本,则总体A内两点X与Y之间的马氏距离为
= (5.2.2)
定义点X与总体A之间的马氏距离为.
= (5.2.2)
设X,Y,Z是来自均值为,协差阵为V的总体中的样本,则马氏距离满足下面三条基本公理.
1. , 且
事实上,
=
=
=
2.
结论显然,证明略.
3. 满足三角不等式
证明 令=
则由明考夫斯基( Minkowski)公式,
有
=
=
5.2.2距离判别的判别准则和判别函数
本节先讨论两个母体的距离判别,分协方差阵相同和不同两种情况进行讨论,然后讨论多母体情形.
I. 两个母体的距离判别
设母体和的均值向量分别为和,协方差阵为和,今给定一个个体x,要判断X来自哪一个母体。
1. , 且
要判断个体X来自哪一个母体,首先计算X到母体和的马氏距离与;然后进行比较,若≤,则判定X属于;否则,判定X来自.这就是如下的判别准则.
(5.24)
为引进判别函数表达式,考虑与之间的差,有
-=
=
=
=
=
其中是两个母体均值的平均值.
令
(5.25)
称为两个母体距离判别的判别函数.判别准则为
(5.26)
实际应用中,各母体的均值和协差阵都是由样本均值个样本协差阵代替的。设从两个母体、中抽取容量为和的样本数据,用下面的样本数据阵表示。
其中i=1,2;n为母体的特征数,即把从每个母体中抽取的样本视为n维向量,设两个母体的样本均值为
i=1,2
样本协差阵用表示,有
其中
i=1,2 (5.2.7)
, i=1,2,…,
此时二母体距离判别的判别函数为
这里为待判个体;,是母体的样本均值,为两个母体的样本协差阵。
此时的判别准则为
2. , 且
对待判个体X,用距离判别判定X来
您可能关注的文档
- 三年级神奇小磁针.ppt
- 高中数学课堂导学环节设计的理论依据.doc
- 规划实例xx.ppt
- 第四章风光好.ppt
- 幼师试用合同书110728.doc
- 高中英语加分句型.docx
- 专题 直线和圆.doc
- 化学能与电能(第3课时).ppt
- 第7章 机械工程控制的校正与设计.doc
- 高中语文必修5第3课边城》导学案(教师用).docx
- 第5课 二次函数与一元二次方程、不等式2025年新高考数学一轮全考点普查教学教学设计.docx
- 5《我们的校园》(说课教学设计)部编版道德与法治一年级上册.docx
- 前后滚动(教案) 体育二年级下册.docx
- 4.1.1水资源及其保护教学设计-2024-2025学年九年级化学人教版(2024)上册.docx
- 课时练习(12) 祝福(教学设计)轻松课堂2023-2024学年新教材高中语文必修下册(统编版).docx
- 极值点偏移问题教学设计-2023-2024学年高二下学期数学人教B版(2019)选择性必修第三二册.docx
- 3.2.1 双曲线及其标准方程教学设计-2023-2024学年高二上学期数学人教A版(2019) 选择性必修第一册.docx
- 4.2.1蛋白质教学设计2023-2024学年高二下学期化学人教版(2019)选择性必修3.docx
- Unit 5 Music Reading and thinking 课文逐句精讲教学设计 -2023-2024学年高一英语 人教版(2019)必修第二册.docx
- 12 笔芯为什么能够伸缩 (教学设计)-2023-2024学年三年级科学下册 人教版.docx
文档评论(0)