第六讲判别分析.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
会计学; 分类学是人类认识世界的基础科学。聚类分析和判别分析是研究事物分类的基本方法,??泛地应用于自然科学、社会科学、工农业生产的各个领域。 在自然科学和社会科学的各个领域经常遇到需要对某个个体属于哪一类进行判断。如动物学家对动物如何分类的研究和某个动物属于哪一类、目、纲的判断。;判别 ; 判别分析是根据观测到的某些指标对所研究的对象进行分类的一种多元统计分析方法。在医学研究中经常遇到这类问题;例如, 临床上常需根据就诊者的各项症状、 体征、实验室检查、病理学检查及医学影像学资料等对其作出是否有某种疾病的诊断或对几种可能患有的疾病进行鉴别诊断,有时已初步诊断为某种疾病,还需进一步作出属该类疾病中哪一种或哪一型的判断。;聚类分析是根据事物本身的特性研究个体分类的方法,原则是同一类中的个体有较大的相似性,不同类中的个体差异很大。 判别分析是根据表明事物特点的变量值和它们所属的类,求出判别函数。根据判别函数对未知所属类别的事物进行分类的一种分析方法。;主要不同点就是,在聚类分析中一般人们事先并不知道或一定要明确应该分成几类,完全根据数据来确定。 而在判别分析中,至少有一个已经明确知道类别的“训练样本”,利用这个数据,就可以建立判别准则,并通过预测变量来为未知类别的观测值进行判别了。;聚类分析;聚类要注意的问题 ;判别分析;概述 距离判别法 贝叶斯判别法 费歇尔判别法 逐步判别法;11;判别分析的一般步骤;13;14;15;判别分析的假设前提;第二节 距离判别;18;19;20;21;22;;24;25;26;27;第27页/共89页;线性判别函数:;30;31;32;33;34;35;36;37; ;39;40;41;42;43;44;45;46;47;48;49;50;51;52;53;54; 下表是某金融机构客户的个人资料,这些资料对一个金融机构来说,对于客户信用度的了解至关重要,因为利用这些资料,可以挖掘出许多的信息,建立客户的信用度评价体系。所选变量为: x1: 月收入 x2:月生活费支出 x3:虚拟变量,住房的所有权,自己的为“1”,租用的“0” x4: 目前工作的年限 x5: 前一个工作的年限 x6:目前住所的年限 x7:前一个住所的年限 x8:信用程度,“5”的信用度最高,“1”的信用度最低。 ;第55页/共89页;第56页/共89页;第四节 Fisher判别法;Fisher判别法(先进行投影);第59页/共89页; 用家庭收入和草地面积来区别城市中家庭可能购买割草机和不太可能购买割草机; 从距离判别法,我们已经看到判别规则是一个线性函数,由于线性判别函数使用简便,因此我们希望能在更一般的情况下,建立一种线性判别函数。Fisher判别法是根据方差分析的思想建立起来的一种能较好区分各个总体的线性判别法,Fisher在1936年提出。该判别方法对总体的分布不做任何要求。 ;63;64;65; 为了使判别函数能够很好地区别来自不同总体的样品,自然希望: i)来自不同总体的两个平均值 相差愈大愈好。;有了判别函数之后,欲建立判别准则还要确定判别临界值(分界点)y0,在两总体先验概率相等的假设下,一般常取y0为 和 的加权平均值即 ;(3)计算步骤 i)建立判别函数;69;70;结论; 设在 维总体的情况下, 的线性组合为 其中 为 维向量。设 和 的均值向量分别为 和 ,且有公共的协方差阵 。那么线性组合 的均值为 ; 令 则有 于是Fisher判别准则为:;注意到 Fisher判别准则可写为: 这就是马氏距离最小判别准则。;75;76;77;78;记 和 分别是总体 内x的样本均值向量和样本协差阵,根据求随机变量线性组合的均值和方差的性质可知,  在上的样本均值和样本方差为;80; 定理 设 为 的 个非零特征值, , 为相应的特征向量(满足 ),则 时使得 式达到最大,称 为第一判别函数。除去 ,则 是在约束条件 之下使得 式达到最大的解,称 为第二判别函数。类推下去,除去 ,则 是在约束条件 之下使得 式达到最大,称 为第 个判别函数。;82;83;84;85;ii)加权法 考虑到每个判别函数

文档评论(0)

kuailelaifenxian + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体太仓市沙溪镇牛文库商务信息咨询服务部
IP属地上海
统一社会信用代码/组织机构代码
92320585MA1WRHUU8N

1亿VIP精品文档

相关文档