第五章SAS系统的多元统计分析功能.ppt

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
CLASS语句 指明归属类的变量; VAR语句 指定判别分析中使用的变量; WEIGHT语句 对已输入的资料附加加权数据; PRIORS语句 指定先验概率; TESTCLASS语句指定存储在TESTDATA中的某些变量, 以检验其观测值是否存在误判的情况; BY语句 按指定变量分类(需先排序)后,对 每一个分类进行判别分析。 PROC DISCRIM过程的常用语句 数据集SUNNY.BANKRY是为研究中小企业破产模型而收集的38个企业的相关财务数据资料,各变量含义如下: X1—总负债率(Cash Flow/Total Debt); X2—收益性指标(Net Income/Total Assets); X3—短期支付能力(Current Assets/Current Liabilities); X4—生产效益性指标(Current Assets/Net Sales); Y —类别(0=已破产企业,1=正常运营企业). 例4.9 proc stepdisc data=sunny.bankry method=stepwise; var x1-x4; class y; run; 输出结果(部分): proc discrim data=sunny.bankry pool=test slpool=0.05 listerr outstat=one; var x2 x3; class y; run; proc print data=one; run; 输出结果(部分): 可见,应拒绝两类的协方差矩阵相等的原假设,即两类的协方差矩阵不满足方差齐性的要求,应建立二次判别函数. 输出结果(部分): (后验概率的计算方法) (误报样本信息) 误判率 先验概率假设 SAS SAS系统用于多元统计分析的过程有: 多变量分析--PRINCOMP(主分量分析), FACTOR(因子分析), CANCORR(典型相关分析), MDS(多维标度过程), MULTTEST(多重检验), PRINQUAL(定性数据的主分量分析), CORRESP(对应分析); 判别分析--DISCRIM(判别分析), CANDISC(典型判别), STEPDISC(逐步判别); 聚类分析--CLUSTER(谱系聚类), FASTCLUS( K均值快速聚类), MODECLUS(非参数聚类), VARCLUS(变量聚类), TREE(画谱系聚类的结果谱系图并给出分类结果). 第五章 SAS系统多元统计分析功能 §5.1 主成分分析与PRINCOMP过程 §5.2 因子分析与FACTOR过程 §5.3 判别分析与STEPDISC、DISCRIM过程 §5.4 聚类分析与CLUSTER过程 ★ 主成分分析 (Principal Component Analysis) 为了全面系统地分析和研究某些社会经济问题,可能必须同时考虑许多存在一定内在联系和相互关联的经济指标,这些指标所反映的信息会有某种程度的重叠,但去除变量又会导致某些信息的损失; 主成分分析通过降维的方法,把相互关联的多个变量转变成少数互不相关的新变量(即主成分,也称为综合变量),各主成分由原来变量的线性关系表示,其包含信息量的多少由各自的方差测定,主成分的方差越大,所包含的信息量就越多。 PRINCOMP过程的主要功能: 完成主成分分析; 主成分的个数、名称及得分是否标准化均可由用户自己规定; 输入的数据集可以是原始数据集、相关阵或协方差阵等; 计算结果有:简单统计量、相关阵或协方差阵,从大到小排序的特征值和相应特征向量,每个主成分解释的方差比例、累计比例等; 可揭示变量间的共线关系,若某特征值特别接近于0,则说明变量线性相关。 PROC PRINCOMP DATA=数据集 OPTIONS ; VAR 变量名列; WEIGHT 变量名列; FREQ 变量名列; PARTIAL 变量名列; BY 变量名列; RUN; PRINCOMP过程的一般形式: PROC PRINCOMP过程的常用选项有: OUT=数据集 把计算的统计量存入指定的数据集; COVARIANCE(或COV) 指定以协方差矩阵为分析数据,缺省则以相关系数矩阵为分析数据; N=正整数 指定要保留的主成分个数; PREFIX=主成分名 为主成分命名,缺省则自动命名为:PRIN1,PRIN2,…; STANDARD (或STD) 对各主成分进行标准化,使各主成分的方差为1; NOINT 作协方差矩阵主成分分析或相关行列主成分分析时,各变量不对其平均

文档评论(0)

小教资源库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档