数学建模——判别分析.pptVIP

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数学建模——判别分析

* 判别分析 2010数学建模集训 摘要: 判别分析的目的 Fisher线性判别分析的条件 Fisher判别分析模型 判别分析的求解 一、判别分析的目的 判别分析目的:根据一些典型指标解决两个及以上类别的分类问题 1、判别分析目的 类别:G1,G2,…,Gr 指标:X1,X2,…,Xm 问题: 1、变量是否对类别具有区分能力 2、如果具有区分能力,如何进行区分? 例1:如何考察保险公司的偿付能力?即怎样对保险公司偿付能力的强弱进行分类? 类别3个: G1——偿付能力强、G2——偿付能力中、G3——偿付能力差 指标6个: X1总资产、X2股票与债券价值、X3股票与债券市值、X4损失支出、X5盈余、X6签订的保费金额 2、类别指标剖析 例2:如何对企业在两年后是否破产给以预测? 类别2个: G1——两年后破产 G2——两年后正常 指标4个: X1—— CF/TD(现金流量/总债务) X2—— NI/TA(净收入/总资产) X3——CA/CL(流动资产/流动债务) X4——CA/NS(流动资产/净销售额) 3、区分能力判断 (1)单指标对两个类别的区分能力 以例2为例,用平均值大小进行初步判断 0.5073 0.4381 X4 2.6909 1.3667 X3 0.06091 -0.814 X2 0.2209 -0.0681 X1 组2均值 组1均值 变量 初步判断X4不具有区分能力 单因素方差分析(或双样本t检验) (X1,X2)散点图 (2)两个变量的区分能力 利用平面散点图进行直观判断 (X1,X3)散点图 (X1,X4)散点图 (X2,X3)散点图 (X2,X4)散点图 (X3,X4)散点图 (X1,X2,X3)散点图 二、Fisher线性判别的条件 判别分析所研究的对象是m维随机向量,所有可能取值构成一个m维空间,记为Dm 判定x属于第i类 对于一个新个体x( Dm中的一个点),要判断它究竟应当来自哪个子总体,自然的想法就是对空间Dm进行划分 最简单的划分方式(以两个类别为例) 单变量判别 点 双变量判别 直线 三变量 平面 多变量 ? 线性划分 D2 R2 R3 R4 R5 R1 问题是:线性判别对数据有何要求 ? 以两变量两类别为例的线性划分示意图 R1 R2 x1 x2 直线划分又称为线性判别(linear discriminant) 线性判别(Fisher线性判别)的前提条件: 变量在各类别中均服从相同协方差的多元正态分布 数据是否服从多元正态分布,用散点图进行初步判断 特点:数据比较集中在其均值附近 (*) 三、Fisher线性判别模型 Fisher判别原则:以总的平均错判概率最小为原则 错判概率表 0 … P(2|r) P(1|r) Gr … … … … … P(r|2) … 0 P(1|2) G2 P(r|1) … P(2|1) 0 G1 Gr … G2 G1 真实类别 判别类别 第i类错判为其它类的概率 先验概率表 πrPr … π2P2 π1P1 先验概率 Gr … G2 G1 类别 错判概率表 Pr … P2 P1 先验概率 Gr … G2 G1 类别 平均错判概率表 πr … π2 π1 先验概率 Gr … G2 G1 类别 总的平均错判概率 结论: 假定X在各类别中均服从m元正态分布(*),且具有相同的协方差,即具有密度: 则构造线性函数 要使总错判别概率最小,必须 (1) 三、Fisher线性判别求解 1、参数估计 (1)收集已知数据 如:第i个类别的第j个个体的取值 第一下标i:第i类别 第二下标j:第j个体 第三下标k:第k变量 总数据个数 个体数 例2数据 数据总数4×32 第一类 第二类 (2)计算样本均值 第k个变量在第i类中的样本值平均 第i类中所有变量样本均值所构成的向量 所有类别所有变量样本均值构成的矩阵 以例2数据为例 (3)计算样本协方差矩阵 第i个类别中第b个变量和第c类中的样本协方差 第i个类别的样本协方差矩阵 Pooled covariance matrix 合并样本协方差矩阵 以例2数据为例 两个总体的样本协方差矩阵 *

文档评论(0)

zijingling + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档