判别分析中Fisher判别法的应用[整理].docxVIP

判别分析中Fisher判别法的应用[整理].docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
精品资源·有用参阅品 文档收拾 | 学习参阅 Summary compilation 1 绪 论 1.1课题布景 跟着社会经济不断发展,科学技术的不断进步,人们现已进入了信息时代,要在很多的信息中获得有科学价值的成果,然后核算办法越来越成为人们必不可少的东西和手法。多元核算剖析是近年来发展迅速的核算剖析办法之一,运用于自然科学和社会各个范畴,成为探究多元国际强有力的东西。? 判别剖析是核算剖析中的典型代表,判别剖析的首要意图是辨认一个个别所属类其他状况下有着广泛的运用。潜在的运用包含猜测一个公司是否成功;决议一个学生是否选取;在医疗确诊中,依据患者的多种查看目标判别此患者是否有某种疾病等等。它是在已知观测目标的分类成果和若干标明观测目标特征的变量值的状况下,树立必定的判别原则,使得运用判别原则对新的观测目标的类别进行判别时,犯错的概率很小。而Fisher判别办法是多元核算剖析中判别剖析办法的常用办法之一,能在各范畴得到运用。一般用来判别某观丈量是归于哪种类型。在办法的详细完结上,选用国内广泛运用的核算软件SPSS(Statistical?Product?and?Service?Solutions),它也是美国SPSS公司在20世纪80年代初开发的国际上最盛行的视窗核算软件包之一 1.2 Fisher判别法的概述 依据判别规范不同,能够分为间隔判别、Fisher判别、Bayes判别法等。Fisher判别法是判别剖析中的一种,其思维是投影,Fisher判其他根本思路便是投影,针对P维空间中的某点x=(x1,x2,x3,?,xp)寻觅一个能使它降为一维数值的线性函数y(x): ? 然后运用这个线性函数把P维空间中的已知类别整体以及求知类别归属的样本都改换为一维数据,再依据其间的亲疏程度把不知道归属的样本点断定其归属。这个线性函数应该能够在把P维空间中的一切点转化为一维数值之后,既能最大极限地缩小同类中各个样本点之间的差异,又能最大极限地扩展不同类别中各个样本点之间的差异,这样才或许获得较高的判别功率。在这里借用了一元方差剖析的思维,即依据组间均方差与组内均方差之比最大的原则来进行判别。 1.3 算法优缺陷剖析 长处:(1)一般关于线性可分的样本,总能找到一个投影方向,使得降维后样本依然线性可分,并且可分性更好即不同类其他样本之间的间隔尽或许远,同一类其他样本尽或许会集散布。 (2)Fisher办法可直接求解权向量; (3)Fisher的线性判别式不只适用于确认性形式分类器的练习,并且关于随机形式也是适用的,Fisher还能够进一步推行到多类问题中去 缺陷: (1)假如,,则样本线性不可分; ,未必线性可分; 不可逆,未必不可分。 (2)对线性不可分的状况,Fisher办法无法确认分类 2试验原理 2.1 线性投影与Fisher原则函数 各类在维特征空间里的样本均值向量: , (2.5-2) 经过改换映射到一维特征空间后,各类的均匀值为: , (2.5-3) 映射后,各类样本“类内离散度”界说为: , (2.5-4) 明显,咱们期望在映射之后,两类的均匀值之间的间隔越大越好,而各类的样本类内离散度越小越好。因而,界说Fisher原则函数: (2.5-5) 使最大的解便是最佳解向量,也便是Fisher的线性判别式。 2.2 求解 从的表达式可知,它并非的显函数,有必要进一步改换。 已知:,, 顺次代入(2.5-1)和(2.5-2),有: , (2.5-6) 所以: (2.5-7) 其间: (2.5-8) 是原维特征空间里的样本类内离散度矩阵,表明两类均值向量之间的离散度巨细,因而,越大越简单区别。 将(2.5-6)和(2.5-2)代入(2.5-4)式中: (2.5-9) 其间:, (2.5-10) 因而: (2.5-11) 明显: (2.5-12) 称为原维特征空间里,样本“类内离散度”矩阵。 是样本“类内总离散度”矩阵。 为了便于分类,明显越小越好,也便是越小越好。 将上述的一切推导成果代入表达式: 能够得到: 其间,是一个份额因子,不影响的方向,能够删去,然后得到最终解: (2.5-18) 就使获得最大值,可使样本由维空间向一维空间映射,其投影方向最好。是一个Fisher线性判别式。 ???这个向量指出了相关于Fisher原则函数最好的投影线方向。 2.3 Fisher算法过程 由Fisher线性判别式求解向量的过程: ① 把来自两类的练习样本集分红和两个子集和。 ② 由,,核算。 ③ 由核算各类的类内离散度矩阵,。 ④ 核算类内总离散度矩阵。 ⑤ 核算的逆矩阵。 ⑥ 由求解。 3 试验意图 运用核算办法处理形式辨认问题的困难之一是维数问题,在低维空间行得通的办法,在高维空间往往行不通。因而,下降维数就成为处理实

文档评论(0)

飞翔的燕子 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档