- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
28. 方差分析Ⅱ—ANOVA,GLM过程步
SAS提供了ANOVA和GLM过程步进行方差分析。ANOVA过程步主要处理均衡数据(分类变量的每个水平的观察数是相等),该过程考虑到均衡设计的特殊构造,处理起来速度更快更省内存,也可以处理拉丁方设计、若干不完全的均衡区组设计数据等。
若试验设计不均衡,也不是前面几种实验设计数据,则应该使用GLM过程。
(一)PROC ANOVA过程步
一、基本语法
PROC ANOVA data=数据集 可选项 ;
CLASS 分类变量列表;
MODEL 因变量=效应变量列表 /可选项;
MEANS 效应变量列表 /可选项 ;
TEST H=效应变量列表 E=效应变量列表;
说明:
(1)CLASS语句是必不可少的,必须放在MODEL语句之前,用来指定分类、区组变量(单因素方差分析只有一个变量);
(2)MODEL语句也是必不可少的,该语句用来规定因变量和自变量效应(单因素方差分析的自变量就是分类变量)。若没有规定自变量的效应,则只拟合截距,假设检验为因变量的均值是否为0. Model语句的主要形式有4种:
① 主效应模型
model y=a b c;
② 含有交叉因素的模型
model y=a b c a*b a*c b*c a*b*c;
③ 嵌套模型
model y=a b c(a b);
④ 包含嵌套、交叉和主效应的模型
model y=a b(a) c(a) b*c(a);
(3)MEANS语句必须出现在MODEL语句之后,用来计算在效应变量所对应的因变量均值,但这些均值没有针对模型中的效应进行修正。若要计算修正的均值需要用GLM过程步的LSMEANS语句;
(4)MEANS语句的可选项主要有两个内容,一是选择多重比较的检验方法,二是设定这些检验的参数(只能用于主效应);
bon——对所有主效应均值之差进行Bonferroni的t检验;
duncan——对所有主效应均值进行Duncan的多重极差检验;
smm|gt2——当样本量不等时,基于学生化最大模和Sidak不相关t不等式,等到Hochberg的GT2方法,对主效应均值进行两两对比检验;
snk——对所有主效应均值进行Student-Newman-Keuls的多重极差检验;
t|lsd——对所有主效应均值进行两两t检验,它相当于在单元观察数相等时Fisher的最小显著差检验;
tukey——对所有主效应均值进行Tukey的学生化极差检验;
waller——对所有主效应均值进行Waller-Duncan的k比率检验;
……
alpha=p——设置显著水平;
clm——对变量的每个水平的均值按置信区间形式输出;
e=效应变量——指定在多重对比检验中所使用的误差均方。默认使用残差均方。指定的效应变量必须是在model语句中出现过的;
kratio=值——给出Waller-Duncan检验的类型1/类型2的误差限制比例。Kratio的合理值为50、100(默认)、500,大约相当于两水平时alpha值为0.1、0.05、0.01.
hovtest——要求输出组间方差齐性的Levene检验;
……
(5)TEST语句指定效应变量(H=)和误差变量(E=)做F检验,误差变量必须要指定且只能指定1个效应变量。默认是用残差均方作为误差项对所有平方和(SS)计算F值。
例1 来自四个地区少女篮球队队员身高的数据,变量包括地区、身高(C:\MyRawData\GirlHeights.dat):
读入数据,做单因素(身高)方差分析,判断她们的身高是否存在显著性地区差异。
代码:
data heights;
infile c:\MyRawData\GirlHeights.dat;
input Region $ Height @@;
run;
* Use ANOVA to run one-way analysis of variance;
proc anova data = heights;
class Region;
model Height = Region;
means Region / SCHEFFE;
title Girls Heights from Four Regions;
run;
运行结果及说明:
CLASS语句中分类变量有4个不同的水平值,共64个观测值;
因变量Height的方差分析表,因变量的总平方和(1030.000)、属于模型部分的平方和(196.625)、属于误差部分的平方和(833.375),自由度为(3,60,63),模型的均方MS(65.541667),误差的均方MSE(13.889583),F值=MS/MSE=4.72, P值=0.0051α=0.05, 否定原假设,即不同地区Height的均值不全相等(至少有两个
您可能关注的文档
最近下载
- 参公、行政编制与事业编制的区别(修正版).docx VIP
- clvdrives科来沃X900系列通用变频器说明书-1.2.22.pdf
- 品管圈活动对降低妇科腹腔镜术后非切口疼痛发生率的应用37.docx VIP
- 四上神话单元大单元教学设计.docx VIP
- JBT 12576-2015 轮胎起重机标准规范.docx VIP
- 《保险监管法律制度》课件.ppt VIP
- 公、行政编制与事业5编制的区别(修正版).doc VIP
- 机动车驾照科目一考试题库全新的题(1000+完整版).doc
- 新版现代西班牙语第二册答案.pdf VIP
- TB_10303-2020_铁路桥涵工程施工安全技术规程.docx VIP
文档评论(0)