- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
距离判别法及其应用
一、什么是距离判别
〔一〕定义
距离判别分析方法是判别样品所属类别的一应用性很强的多因素决策方法,根据已掌握的、历史上每个类别的假设干样本数据信息,总结出客观事物分类的规律性,建立判别准那么,当遇到新的样本点,只需根据总结得出的判别公式和判别准那么,就能判别该样本点所属的类别。
距离判别分析的根本思想是:样本和哪个总体的距离最近,就判它属于哪个总体。
〔二〕作用
判别个体所属类型。例如在经济学中,可根据各国的人均国人民收入、人均工农业产值和人均消费水平等多种指标来判定一个国家经济开展程度的怕属类型医学上根据口才的体温、白血球数目以及其他病理指标来判断患者所患何病等。
二、距离判别分析原理
〔一〕欧氏距离
欧氏距离〔Euclideandistance〕是一个通常采用的距离定义,最多的应用是对距离的测度。大多情况下,人们谈到距离的时候,都会很自然的想到欧氏距离。从数学的角度来讲,它是在m维空间中两个点之间的真实距离。
在二维空间中其公式为:
推广到n维空间其公式为:
〔二〕马氏距离
在判别分析中,考虑到欧氏距离没有考虑总体分布的分散性信息,印度统计学家马哈诺必斯〔Mahalanobis〕于1936年提出了马氏距离的概念。
设总体为m维总体〔考察m个指标〕,样本。令μ=E()(i=1,2,?…,m),那么总体均值向量为。总体G的协方差矩阵为:
。
设X,Y是从总体G中抽取的两个样本,那么X与Y之间的平方马氏距离为:
样本X与总体G的马氏距离的平方定义为:
1.两总体距离判别。设有两总体和的均值分别为和,协方差矩阵分别为和〔,0〕,是一个新样本,判断其属于哪个总体。定义到和的距离为和,那么按如下判别规那么进行判断:
,假设
,假设﹤
(1)当=时,该判别式可进行如下简化:
-=-
=-2
=
其中,
注意到实数的转置等于实数自身,故有
=
令,那么判别规那么就成为:
,假设
,假设﹤0
在实际问题中,由于总体的均值、协方差矩阵通常是未知的,数据资料来自两个总体的训练样本,于是用样本的均值、样本的协方差矩阵代替总体的均值与协方差。
由于实际问题中只能得到两个样本的协方差矩阵,,因此当两个总体协方差矩阵相等时如何确定总体的协方差矩阵S
其中n1,n2分别为两个样本的容量。
(2)当≠时,
判别规那么为:
,假设
,假设﹤0
例.设有两个二元总体G1和G2,从中分别抽取样本计算得到
假设,试用距离判别法建立判别函数和规那么。
样品应属于哪个总体。
解:
由于所以X属于。
2.多总体的距离判别。设有g个m维总体,,…,,均值向量分别为,,…,协方差矩阵分别为,,…,,那么样本X到各组的平方马氏距离是:
,=1,2,…g
判别规那么为:,假设
三、距离判别法的应用
距离判别法可以应用于医学、建设、环境、城镇规划等多个领域的工程工程中。如距离判别法在类风湿性关节炎中医证候诊断中的应用,距离判别法相似矿区突水水源识别中的应用,在大气环境质量现状评价中的应用以及在城镇土地定级中的应用等。
在实际工程中,经常采用多总体的距离判断。设有g个m维总体,,…,,均值向量分别为,,…,协方差矩阵分别为,,…,,任意给定一个m维样本。假设==…==,那么新样本到各和的马氏距离平方差为
,
令。
利用各总体的训练样本对和〔i=1,2,…g〕进行估计。设,,…,为来自总体的训练样本〔k=1,2,…,g〕,令
〔k=1,2,…,g〕
〔k=1,2,…,g〕
利用对的联合估计为
其中,即训练样本的总数。
以和代替和,便可得到判别函数的估计为
文档评论(0)