第七章 SAS多元统计分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Chapter7 SAS多元统计分析 Chapter7 SAS多元统计分析 多元统计分析是统计学的重要应用工具,SAS实现了许多常用的多元统计分析方法。SAS用于多变量分析的过程有PRINCOMP(主成分分析)、FACTOR(因子分析)、CANCORR(典型相关分析)、MDS(多维标度过程)、MULTTEST(多重检验)、PRINQUAL(定性数据的主分量分析)、CORRESP(对应分析),用于判别分析的过程有DISCRIM(判别分析)、CANDISC(典型判别)、STEPDISC(逐步判别),用于聚类分析的过程有CLUSTER(谱系聚类)、FASTCLUS(K均值快速聚类)、MODECLUS(非参数聚类)、VARCLUS(变量聚类)、TREE(画谱系聚类的结果谱系图并给出分类结果)。 Chapter7 SAS多元统计分析 一、主成分分析 二、因子分析 三、聚类分析 四、判别分析 一、主成分分析 ㈠主成分分析简介 ㈡数学模型与几何解释 ㈢PRINCOMP 过程 ㈣菜单操作方法 ㈤主成分的应用 ⒈主成分回归:解决多重共线性问题 ⒉综合评价 ㈠主成分分析简介 在实际经济工作中,我们经常碰到多变量或多指标问题,比如,企业经济效益的评价、地区经济发展情况比较等问题。这些问题的研究一般都先要设定研究的指标,也就是设定评价企业经济效益与评价地区经济发展情况的指标体系。由于变量或指标较多,分析问题具有相当的复杂性。然而,在多数情况下,这些不同的变量或指标之间,存在一定的相关性。这样,人们自然希望用较少的变量或指标来代替原来较多的变量或指标,而这些较少的变量或信息涵盖了原来变量或指标的信息。利用这种降维的思想,产生了主成分分析方法。 主成分分析,就是设法将原来变量或指标重新组合成一组新的、互不相关的几个综合变量或指标,同时根据实际需要从中选取几个较少的综合变量或指标来尽可能多地反映原变量或指标的信息。这种将多变量或多指标转化成少数几个互不相关的综合变量或综合指标的统计方法叫做主成分分析或称主分量分析。 需要注意的是,主成分分析往往不是目的,而是达到目的的一种手段。因此,它常常用在大型研究项目的某个中间环节中。例如,将它用到多重回归中,便产生了主成分回归,它可以克服回归问题中由于自变量之间的高度相关而产生的分析困难。另外,主成分分析还可以用于典型相关分析、聚类分析和因子分析中。 满足如下的条件: 如果我们将xl 轴和x2轴先平移,再同时按逆时针方向旋转?角度,得到新坐标轴Fl和F2。Fl和F2是两个新变量。 根据旋转变换的公式: 旋转变换的目的是为了使得n个样品点在Fl轴方向上的离 散程度最大,即Fl的方差最大。变量Fl代表了原始数据的绝大 部分信息,在研究某经济问题时,即使不考虑变量F2也无损大局。经过上述旋转变换原始数据的大部分信息集中到Fl轴上,对数据中包含的信息起到了浓缩作用。 Fl,F2除了可以对包含在Xl,X2中的信息起着浓缩作用之外,还具有不相关的性质,这就使得在研究复杂的问题时避免了信息重叠所带来的虚假性。二维平面上的个点的方差大部分都归结在Fl轴上,而F2轴上的方差很小。Fl和F2称为原始变量x1和x2的综合变量。F简化了系统结构,抓住了主要矛盾。 ㈢PRINCOMP 过程进行主成份分析 PRINCOMP过程的一般格式: Proc Princomp DATA=数据集 /选项列表; Var 变量列表; Partial 变量列表; Weight 变量; Freq 变量; By 变量; Run ; ⒈PROC PRINCOMP语句/选项列表 ①TYPE=COV或TYPE=CORR——指明数据集类型,例如: DATA=new TYPE=CORR:表明new为一相关系数CORR数据集。 ②OUT=输出数据集——存储原始数据和主分量得分等。 ③OUTSTAT=输出数据集——存储变量的平均数、标准差、相关系数、特征值、特征向量等。 另外,COV指定由协方差矩阵计算(一般由相关系数矩阵进行); ④N=个数——指定主分量个数。 ⑤STD——将输出标准化的主分量得分。 ⑥NOINT——不含截距。 ⑦NOPRINT——不输出分析结果。 ⒉PROC PRINCOMP过程中的主要语句 ①VAR语句——指明分析的数值变量。 ②PARTIAL语句——指明对偏相关或协方差矩阵进行分析的数值变量。 例:对我国上市公司的经济效益水平进行主成分分析,选择的主要经济效益指标共有以下几个:资金利税率,产值利税率,百元销

文档评论(0)

dreamzhangning + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档