- 1、本文档共57页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
判别分析 判别分析 §1. 基本原理 §2. 基本操作 §3. 选项设置 §4. 实例分析 §1. 基本原理 定义:判别分析是先根据已知类别的事物的性质(自变量),建立函数式(自变量的线性组合,即判别函数),然后对未知类别的新事物进行判断以将之归入已知的类别中。 判别分析有如下的假定: ? 预测变量服从正态分布。 ? 预测变量之间没有显著的相关。 ? 预测变量的平均值和方差不相关。 ? 预测变量应是连续变量,因变量(类别或组别)是间断变量。 ? 两个预测变量之间的相关性在不同类中是一样的。 在分析的各个阶段应把握如下的原则: ? 事前组别(类)的分类标准(作为判别分析的因变量)要尽可能准确和可靠,否则会影响判别函数的准确性,从而影响判别分析的效果。 ? 所分析的自变量应是因变量的重要影响因素,应该挑选既有重要特性又有区别能力的变量,达到以最少变量而有高辨别能力的目标。 ? 初始分析的数目不能太少。 判别分析是一种有效的对个案进行分类分析的方法,组别的特征已知。 如银行为了对贷款进行管理,需要预测哪些类型的客户可能不会按时归还贷款。已知过去几年中,900个客户的贷款归还信誉度,据此可以将客户分成两组:可靠客户和不可靠客户。 再通过收集客户的一些资料,如年龄、工资收入、教育程度、存款等,将这些资料作为自变量。通过判别分析,建立判别函数。那么,如果有150个新的客户提交贷款请求,就可以利用创建好的判别函数,对新的客户进行分析,从而判断新的客户是属于可靠客户类,还是不可靠客户类。 判别分析的目的是得到体现分类的函数关系式,即判别函数。基本思想是在已知观测对象的分类和特征变量值的前提下,从中筛选出能提供较多信息的变量,并建立判别函数;目标是使得到的判别函数在对观测量进行判别其所属类别时的错判率最小。 判别函数的一般形式是: 2、继续用前面距离判别法例1的人文发展指数的数据作Bayes判别分析。 贝叶斯准则: 一种概率方法 把已知的地理数据分成几类,计算出未知地理类型或者区域归属于各已知类型的概率值,它归属于哪一类的概率值最大,就把它划归为该类。 3、利用距离判别法中例l的人文发展指数的数据作Fisher判别分析: 费歇尔准则 较优的判别函数应该能根据待判断对的n个指标最大限度地将它所属的类与其它类区分开来 一般采用线性判别函数 基本方法:首先假定判别函数(线性函数),然后根据已知信息对判别函数进行训练,得到函数关系式中的关系值,从而最终确定判别函数 §2. 基本操作 SPSS利用“Discriminate”过程进行判别分析操作,下面给出基本操作步骤。 §3. 选项设置 §3.1 Method选项 选择“Use stepwise method”方法进行判别分析时,“Method”(方法)按钮将被激活,单击“Method”按钮,打开“Discriminant Analysis:Stepwise Method”(判别分析:逐步分析方法)对话框,如图1.4所示 在“Method”选项组中选择进行逐步判别分析的方法,可供选择的判别分析方法有5种: 1.Wilks’lambda Wilks’lambda方法。默认选项,每步都是Wilk的概计量最小的进入判别函数。 2.Unexplained variance 不可解释方差方法。选择该项,表示每步都是使各类不可解释的方差和最小变量进入判别函数。 3.Mahalanobis’distance Mahalanobis距离方法。选择该项,表示每步都使靠的最近的两类间Mahalanobis距离最大的变量进入判别函数。 4.Smallest F ratio最小F值方法。选择该项,表示每步都使任何两类间的最小的F值最大变量进入判别函数。 5.Rao’s V Rao V统计量。选择该项,表示每步都使Rao V统计量产生最大增量的变量进入判别函数,可以对一个要加入到模型中的变量的V值指定一个最小增量。选择该方法时需要在该项下面的“V-to-enter”(输入V值)文本框中输入这个增量的指定值,当某变量导致的V值增量大于指定值的变量进入判别函数。 “Criteria”(准则)选项组用于选择逐步判别停止的判据,可供选择的判据包括以下几项: Use F value 默认选项。使用F值是系统默认的判据,当加入一个变量(或剔除一个变量)后,对判别分析的变量进行方差分析。当计算的F值大于指定的Entry值时,该变量保存在函数中,默认Entry
文档评论(0)