- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
sas学习第六天
基本描述性统计分析
Sas学习第六天
1.means 过程
SAS系统的BASE模块提供了一些计算基础统计量的过程,如:means过程、univariate过程、corr过程、freq过程等。这些过程可完成单变量或多变量的描述统计量计算。SAS系统Means过程可以用来计算数据集中指定的各变量的一些基本描述性统计量的值(如观测值个数、均值、标准差、方差、偏度、峰度等)。Means过程的一般格式为:
proc means 输入数据集名 选项列表 ;
var 变量列表 ;
class 变量列表 ;
by 变量列表 ;
freq 变量 ;
weight 变量 ;
id 变量列表 ;
output out=输出数据集名 统计量关键字=变量名列表;
run ;
语句说明:
VAR语句——指定要分析的变量名列;
BY语句——按变量名列分组统计(数据集需事先按该变量名列排序);
CLASS语句——按变量名列分组统计(数据集不需事先排序);
FREQ语句——表明该变量为分析变量的频数;
WEIGHT语句——表明分析变量在统计时要按该变量加权;
ID语句——输出时加上该变量作为索引;
OUTPUT语句——指定统计量输出的数据集及输出的内容 (OUT指定统计量的输出数据集名,统计量关键字指定统计量在输出数据集中对应的新变量名).
选项说明:
PROC MEANS语句,选项列表中常用“选项options”有:
①DATA=SAS数据集名:指明要分析的SAS数据集,缺省为最近建立的SAS数据集。
②MAXDEC=k:规定输出结果小数部分的最大位数,
③ALPHA=value:设置置信区间的置信水平α。
④统计量关键词常用的有:
统计量名称 含义 统计量名称 含义 n 未丢失的观测个数 mode 众数,出现频数最高的数 nmiss 丢失的观测个数 sumwgt 权数和 mean 算术平均 max 最大值 stderr 均值的标准误差 min 最小值 sum 加权和 range 极差,max—min std 标准偏差 median 中间值 var 方差 t 总体均值等于0的t统计量 cv 变异系数的百分数 prt t分布的双尾p值 uss 加权平方和 clm 置信度上限和下限 css 关于均值偏差的加权平方和 lclm 置信度下限 skewness 对称性的度量——偏度 uclm 置信度上限 kurtosis 对尾部陡平的度量——峰度 ⑤缺省时,该过程输出:N、MEAN、STD、MIN、MAX五个统计量。
例:针对讲义4中生成的成绩数据集updatescore(程序4.2、4.4所生成),按班级和性别分组统计语文chinese、英语english、数学math、平均分avg的均值、方差、均值标准误差、99%置信区间上下界。并将这四个变量的均值统计量值输入到数据集stat里面去。
5.1
proc means data=updatescore mean var stderr lclm uclm alpha=0.01;
class class sex;
var chinese english math avg;
output out=stat mean=mchi meng mmat mavg;
proc print data=stat;
run;
习题1.1:某车间20名工人加工某种零件,按生产数量X分组,每组工人数为W,求20名工人的平均日产量及标准差。其数据见表3.3所示。
data a ;
input x w @@;
cards;
14 2 15 4 16 8 17 5 18 1
;
run;
proc means data=a mean var stderr;
var x;
freq w;
output out=stat;
run;
习题1.2:对于讲义4中的score数据,通过means过程建立假设检验,检验30名同学的英语成绩和语文成绩有无明显差异。先建立新变量 com=Chinese – English,构建原假设H0:mean(com)=0,计算T统计量的值与检验p值。显著性水平默认为0.05.
data ttest;
set score;
com=chinese-english;
keep chinese english com;
run;
proc means mean std t prt;
var com;
run;
2.univariate过程(单变量探索分析)
功能:SAS的univariate过程主要用于对指定随机变量进行详细的描述性统计。该过程除能完成与MEAN
文档评论(0)