- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ch7判别分析
第七章 判别分析 Discriminant Analysis 判别与聚类 聚类分析可以对样本/指标进行分类,判别分析只对样本进行分类。 聚类分析事先 不知道事物的类别,也不知道应分几类;判别分析必须事先知道事物的类别,也知道应分几类。 聚类分析不需要分类的历史资料,能直接对样本进行分类;判别分析需要历史资料去建立判别函数,然后才能对样本进行分类。 应用 当描述研究对象的性质特征不全或不能从直接测量数据确定研究对象所属类别时,可以通过判别分析进行归类: 地质学中根据岩矿鉴定,分辨某一砂岩属于海相砂岩还是陆相;油田开发中,根据钻井的电测和化验数据,判别是否遇到油层或是水层 在经济学中,根据人均国民收入,人均工农业产值,人均消费水平等多个指标来判定一个国家的经济发展程度所属等级 在医疗诊断中,根据某人多种检验指标来判断此人是某病患者还是非患者 第一节 判别分析的基本思想 判别分析(discriminant analysis) :根据一批分类明确的样本在若干指标上的观察值,建立一个关于指标的判别函数和判别准则,然后根据这个判别函数和判别准则对新的样本进行分类,并且根据回代判别的准确率评估它的实用性。 建立判别准则: Fisher判别准则,Bayes判别准则 建立判别函数:其原则是,将所有样本按其判别函数值的大小和事先规定的判别原则分到不同的组里后,能使得分组结果与原样本归属最吻合。 回代样本:即计算出每一个样本的判别函数值,并根据判别准则将样本归类。 估计回代的错误率:即比较新的分组结果和原分组结果的差别,并以此确定判别函数的效能; 判别新的样本:如果判别函数效能较高,可用以对新样本进行归类判别。 判别分析的方法 Fisher判别分析法 采用Fisher判别准则: 使得类间点的距离最大,而类内点的距离最小。 适合于两类的判别分析。 Bayes判别分析法 采用Bayes判别准则: 使每一类中的每个样本都以最大的概率进入该类 适合于多类的判别分析。 第二节 Fisher判别分析法 建立Fisher判别函数 假设A和B为分类明确的两类煤层。在总体A中观察了p例,在总体B中观察了q例,每一例记录了k个指标,它们是 x1,x2,…,xk。令y是这 k个指标的一个线性函数,即, 以p=q=k=2 来说明Fisher判别分析法的基本原理和计算方法 根据Fisher判别分析法的基本原理,就是要选择一组适当的系数 c 1 , c 2 ,…, c k ,使得类间差异D最大且类内差异V最小,即,使得下式的值 Q 达到最大。 建立Fisher判别准则 令判别临界点是: 估计各项指标对判别函数的贡献率 第三节 Bayes判别分析法 Bayes判别法是以概率论中Bayes条件概率公式为基础导出的判别法。 根据:被判断个案应当归属于出现概率最大的总体或者归属于错判概率最小的总体的原则进行判别的。 建立Bayes判别函数 假设 x = ( x1 , x2 ,…, xk )出现在第 i 类中的事前概率是pi ,i =1,2,…, g,它可以是理论值,也可以是经验值。当样本是随机抽样得到的,事前概率可以取样本估计值,即: 使用Bayes判别分析法注意事项 每一个类中的k个指标变量均服从k元正态分布; 如果不满足正态分布条件,可用非参数判别分析方法,或者建立logistic回归模型,作为判别函数; 样本数要适当,重要指标变量不要遗漏; 要评估判别函数的判别效能,包括三个方面: 原始数据的分类要可靠准确; 指标变量对判别函数的作用要显著; 判别函数的回代错判率和事后概率错误率要小。 SPSS软件系统提供的判别方法有马氏距离判别法、贝叶斯概率判别法以及费歇判别法。 ⑴马氏(Mahalamobis)距离判别法 马氏距离判别法的思想就是建立马氏距离,当被判断的样本距离哪个总体中的马氏距离最小,该样本就隶属于这个总体。假定有A、B两个总体,则: X∈A 若d(x,A)d(x,B) X∈B 若d(x,A)d(x,B) 待判 若d(x,A)=d(x,B) SPSS操作步骤 执行菜单命令[Analyze]、[Classify]、[Discriminant] ⑴指定分组变量及其取值范围。 将分组变量从源变量窗口通过选择箭头选到分组变量窗口。并从“Define Range”按钮定义分组变量的取值范围,给定最小值Minimum和最大值Maximum。 ⑵指定判别函数中的自变量。 将自变量从源变量窗口通过选择箭头选到自变量窗口。 ⑶选择使用自变量的方法。 对于选定的自变量可以全部应用到判别函数中去,这是系统默认的使用全部自变量法“Enter independent together”。如
文档评论(0)