sas判断与分析定义.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
5.2 判别分析 判别分析的方法有参数方法和非参数方法。 参数方法假定每个类的观测来自 (多 元)正态分布总体,各类的分布的均值(中心)可以不同。非参数方法不要求知 道各类所来自总体的分布, 它对每一类使用非参数方法估计该类的分布密度, 然 后据此建立判别规则。 1.DISCRIM过程的语句说明 SAS/STAT的 DISCRIM过程可以进行参数判别分析和非参数判别分析,其一般格 式如下: PROC DISCRIM DATA=输入数据集: CLASS分类变量: VAR 判别用自变量集合: RUN; 其中, PROC DISCRIM语句的选项中 输入数据集 为训练数据的数据集,包括一 个分类变量(在 CLASS语句中说明)和用来建立判别公式的自变量集合(在 VAR 语句中说明)。可以用 TESTDATA=数据集 选项指定一个检验数据集,检验数据 集必须包含与训练数据集相同的自变量集合, 用训练数据集产生判别规则后将对 检验数据集中的每一个观测给出分类值, 如果这个检验数据集中有表示真实分类 的变量可以在过程中用 TESTCLASS分类变量 语句指定, 这样可以检验判别的效 果如何。 用OUTSTAT=数据集 指定输出判别函数的数据集, 后面可以再次用 DISCRIM过程 把这样输出的判别函数作为输入数据集 (DATA=)读入并用它来判别检验数据 (TESTDATA=)。用OUT=数据集 指定存放训练样本及后验概率、交叉确认分类的 数据集。用 OUTD=数据集 指定存放训练样本及分组的密度估计的数掘集。用 TESTOUT=数据集 指定存放检验数据的后验概率及分类结果的数据集。用 TESTOUTD=数据集 输出检验数据及分组密度估计。 PROC DISCRIM语句还有一些指定判别分析方法的选项。 METHOD=NORMAL或 NPAR 选择参数方法或非参数方法。 用 POOL=NO或 TEST或 YES表示不用合并协方差阵、 通过检验决定是否使用合并协方差阵、用合并协方差阵。如果使用非参数方法, 需要指定 R=核估计半径 选项来规定核估计方法或者指定 k= 最近邻个数 来规 定最近邻估计方法。 PROC DISCRIM语句有一些规定显示结果的选项。用 LISTERR显示训练样本错判 的观测。用 CROSLISTERR显示用交叉核实方法对训练样本判别错判的观测。用 LIST 对每一观测显示结果。用 NOCLASSIFY取消对训练样本的分类检验。用 CROSSLIST显示对训练样本的交叉核实的判别结果。 用 CROSSVALIDATE要求进行 交叉核实。当有用 TESTDATA=指定的检验数据集时用 TESTLIST选项显示检验数 据集的检验结果, 当有 TESTCLASS语句时用 TESTLISTERR可以列出检验样本判错 的观测,用 POSTERR选项可以打印基于分类结果的分类准则的后验概率错误率估 计。用 NOPRINT选项可以取消结果的显示。 在 DISCRIM过程中还可以使用 PRIORS语句指定先验概率 qt 的取法。 PRIORS EQUAL指定等先验概率。 PRIORS PROPORTIONAL指定先验概率与各类个数成正 比。PRIORS概率值表 可以直接指定各组的先验概率值。 例: 用卫星遥感可以分辨作物的种类。 CROPS是训练数据集,其中包含了作物的 实际种类 (CROP)和四种遥感指标变量 (XI-X4) 。数据集中还把各

文档评论(0)

ll17770603473 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档