SAS学习系列29.方差Ⅱ—ANOVA,GLM过程步讲课.docxVIP

下载本文档

25
0
约1.15万字
约 32页
2017-05-06 发布于湖北
举报
版权申诉

SAS学习系列29.方差Ⅱ—ANOVA,GLM过程步讲课.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

28. 方差分析Ⅱ—ANOVA,GLM过程步 SAS提供了ANOVA和GLM过程步进行方差分析。ANOVA过程步主要处理均衡数据（分类变量的每个水平的观察数是相等），该过程考虑到均衡设计的特殊构造，处理起来速度更快更省内存，也可以处理拉丁方设计、若干不完全的均衡区组设计数据等。若试验设计不均衡，也不是前面几种实验设计数据，则应该使用GLM过程。（一）PROC ANOVA过程步一、基本语法 PROC ANOVA data=数据集可选项 ; CLASS 分类变量列表; MODEL 因变量=效应变量列表 /可选项; MEANS 效应变量列表 /可选项 ; TEST H=效应变量列表 E=效应变量列表; 说明：（1）CLASS语句是必不可少的，必须放在MODEL语句之前，用来指定分类、区组变量（单因素方差分析只有一个变量）；（2）MODEL语句也是必不可少的，该语句用来规定因变量和自变量效应（单因素方差分析的自变量就是分类变量）。若没有规定自变量的效应，则只拟合截距，假设检验为因变量的均值是否为0. Model语句的主要形式有4种： ① 主效应模型 model y=a b c; ② 含有交叉因素的模型 model y=a b c a*b a*c b*c a*b*c; ③ 嵌套模型 model y=a b c(a b); ④ 包含嵌套、交叉和主效应的模型 model y=a b(a) c(a) b*c(a); （3）MEANS语句必须出现在MODEL语句之后，用来计算在效应变量所对应的因变量均值，但这些均值没有针对模型中的效应进行修正。若要计算修正的均值需要用GLM过程步的LSMEANS语句；（4）MEANS语句的可选项主要有两个内容，一是选择多重比较的检验方法，二是设定这些检验的参数（只能用于主效应）； bon——对所有主效应均值之差进行Bonferroni的t检验； duncan——对所有主效应均值进行Duncan的多重极差检验； smm|gt2——当样本量不等时，基于学生化最大模和Sidak不相关t不等式，等到Hochberg的GT2方法，对主效应均值进行两两对比检验； snk——对所有主效应均值进行Student-Newman-Keuls的多重极差检验； t|lsd——对所有主效应均值进行两两t检验，它相当于在单元观察数相等时Fisher的最小显著差检验； tukey——对所有主效应均值进行Tukey的学生化极差检验； waller——对所有主效应均值进行Waller-Duncan的k比率检验； …… alpha=p——设置显著水平； clm——对变量的每个水平的均值按置信区间形式输出； e=效应变量——指定在多重对比检验中所使用的误差均方。默认使用残差均方。指定的效应变量必须是在model语句中出现过的； kratio=值——给出Waller-Duncan检验的类型1/类型2的误差限制比例。Kratio的合理值为50、100（默认）、500，大约相当于两水平时alpha值为0.1、0.05、0.01. hovtest——要求输出组间方差齐性的Levene检验； …… （5）TEST语句指定效应变量（H=）和误差变量（E=）做F检验，误差变量必须要指定且只能指定1个效应变量。默认是用残差均方作为误差项对所有平方和（SS）计算F值。例1 来自四个地区少女篮球队队员身高的数据，变量包括地区、身高（C:\MyRawData\GirlHeights.dat）：读入数据，做单因素（身高）方差分析，判断她们的身高是否存在显著性地区差异。代码： data heights; infile c:\MyRawData\GirlHeights.dat; input Region $ Height @@; run; * Use ANOVA to run one-way analysis of variance; proc anova data = heights; class Region; model Height = Region; means Region / SCHEFFE; title Girls Heights from Four Regions; run; 运行结果及说明： CLASS语句中分类变量有4个不同的水平值，共64个观测值；因变量Height的方差分析表，因变量的总平方和（1030.000）、属于模型部分的平方和（196.625）、属于误差部分的平方和（833.375），自由度为（3,60,63），模型的均方MS（65.541667），误差的均方MSE（13.889583），F值=MS/MSE=4.72, P值=0.0051α=0.05, 否定原假设，即不同地区Height的均值不全相等（至少有两个