课件：SAS软应用之判别分析.ppt

下载文档 降价啦

16
0
约9.26千字
约 58页
2019-07-08 发布于广东
举报
版权申诉
保障服务

课件：SAS软应用之判别分析.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

冗余分析冗余分析是通过原始变量与典型变量间的相关性，分析引起原始变量变异的原因。以原始变量为因变量，以典型变量为自变量，建立线性回归模型，则相应的确定系数等于因变量与典型变量间的相关系数的平方，它描述了由于因变量与典型变量的线性关系引起的因变量变异在因变量的总变异中的比例。典型负荷为变量与典型变量的相关系数，可由相关系数的平方了解此典型变量解释了此变量多少比例的变异数。 CANCORR过程 SAS系统中利用CANCORR过程步进行典型相关分析。 CANCORR过程的语法格式如下： PROC CANCORR DATA= OUTSTAT= OUT= ALL ; VAR 一组变量; WITH 另一组变量; PARTIAL 变量; RUN; CANCORR过程 DATA语句指定要分析的数据集名及一些选项，它可以是原SAS数据集，也可以是corr、cov、ucorr、ucov等矩阵。 ALL选择项指令输出所有结果。 CORR选择项指令输出原始变量间的相关系数矩阵。 VP选择项用来为VAR语句中变量的典型变量命名前缀，名字不超过40个字符串长。 CANCORR过程 WP选择项用来为WITH语句中变量的典型变量命名前缀，名字不超过40个字符串长。 EDF选择项用来指定该回归分析的残差自由度。 VAR语句列出两组变量中的第一组变量。若缺省，则所有不出现在其它语句中的数值变量均将列在第一组内。 WITH语句列出两组变量中的第二组变量。该语句不能省略。 PARTIAL语句用来指定协变量。系统以此协变量来计算偏相关系数矩阵，然后进行典型相关分析。另外，freq语句、weight语句、by语句等也实用。本章小节典型相关分析的基本思想和主成分分析的基本思想相似，它将一组变量与另一组变量之间单变量的多重线性相关性研究转化为对少数几对综合变量之间的简单线性相关性的研究，并且这少数几对变量所包含的线性相关性的信息几乎覆盖了原变量组所包含的全部相应信息。典型相关分析方法的基本原理是：所有研究的两组变量为x组和y组，x 组有p个变量， y 组有q个变量，则分别对这两组变量各做线性组合后，再计算此两加权和的简单相关系数，然后以这个简单相关系数当做这两组变数之间相关性的衡量指标。本章小节有典型相关分析得到的一系列典型变量的典型相关系数所包含的有关原变量组之间相关程度的信息一个比一个少。如果少数几对典型变量就能够解释原数据的主要信息，特别是如果一对典型变量就能够反映出原数据的主要信息，那么，对两个变量组之间相关程度的分析就可以转化为对少数几对或者是一对典型变量的简单相关分析。这就是典型相关分析的主要目的。本章小节冗余分析是通过原始变量与典型变量间的相关性，分析引起原始变量变异的原因。以原始变量为因变量，以典型变量为自变量，建立线性回归模型，则相应的确定系数等于因变量与典型变量间的相关系数的平方，它描述了由于因变量与典型变量的线性关系引起的因变量变异在因变量的总变异中的比例。通过实例详细介绍了CANCORR过程步的语法及基本格式，并阐述了如何利用此SAS过程步进行典型相关分析以及进行结果解释。 THANK YOU SUCCESS * * 可编辑 BAYES判别分析法 BAYES判别法的判别准则是，将每一个点x判别到事后概率最大的类中。利用已知的数据以及求极小值的方法，可以估计出的系数，从而可以得到判别函数的系数估计值，这些估计出的系数使得每一个样本x属于某个类的事后概率达到最大。判别分析判别分析的结果对应着分析的不同步骤过程，也就包括了分类规则和分类结果两个部分。在分类规则中应该包括典型判别函数、衡量预测变量与判别函数之间关系的结构矩阵以及Fisher线性分类函数。典型判别函数是基于BAYES判别思想建立起来的，主要用途在于对参与分析的各个类别、各个预测变量、各个类别中的各个样本点及其相互关系进行考察。判别分析要将典型判别函数应用于大量的实践操作中是不现实的，因为这涉及到对被分类的样本计算各种概率，十分繁琐不利用操作。而FISHER线性分类函数则是针对每个类别分别建立起来的，可以直接应用实践操作中对新的样本进行分类。在分类结果部分则依据已经建立起来的分类规则对参与分析的各个样本点重新进行分类，并通过与原有分类进行比较来确定原有分类的判对率。判别函数中判别能力检验一个判别函数判别样本归类的功能强弱很大程度上取决与指标的选取。如果判别函数中特异性强的指标越多，则判别函数的判别功能也就越强。相反，不重要的指标越多，判别函数就越不稳定，其判别