SAS整理.docVIP

下载本文档

15
0
约1.22万字
约 15页
2016-08-22 发布于河南
举报
版权申诉

SAS整理.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

SAS整理

一．用编程方法建立数据集 DATA 语句； /*DATA步的开始，给出数据集名*/ Input 语句；/*描述输入的数据，给出变量名及数据类型和格式等*/ （用于DATA步的其它语句） Cards； /*数据行的开始*/ [数据行] ； /*数据块的结束*/ RUN; /*提交并执行*/ 例子：data=数据集名字mylib.a; input name$ phone room height; ($符号代表该列为列名型，就是这一列是文字！！比如名字，性别，科目等等) cards; rebeccah 424 112 1.5648 （中间是数据集，中间每一行末尾不要加逗号，但是 carol 450 112 5.6235 数据集最后要加一个分号！！） louise 409 110 1.2568 gina 474 110 1.3652 mimi 410 106 1.6542 alice 411 106 1.6985 brenda 414 106 1.3698 brenda 414 105 1.8975 david 438 141 1.6547 betty 464 141 1.5647 holly 466 140 1.5624 ; proc print data=whb.phones; （这一过程步是打印出数据集，可要可不要！） run; *数据集中的框架我会用加粗来显示，大家主要记加粗的，下面的编程部分都是这样！！二．用编程方法计算统计量 1.FREQ过程 FREQ过程包括多个控制频数输出与检验的语句和选项，格式如下： PROC FREQ DATA = 数据集; [TABLES 变量1 变量2 …;] [FORMAT 变量1 输出格式1. 变量2 输出格式2. …;] RUN; 其中PROC FREQ语句调用FREQ过程，标志FREQ过程的开始； TABLES语句用于创建有关变量所构成的各种表格并进行相应的假设检验和计算，可以多次使用。例如：proc freq data = mylib.sryzc; tables R_Id Income; RUN; 这个语句提供了频数，所占百分数，累计频数，和累计百分数！ 2. MEANS过程 MEANS过程的一般格式： PROC MEANS DATA=数据集名[统计量关键字列表]； [VAR 分析变量列表；] [BY 分组变量名；] [CLASS 分组变量名；] RUN；例如：proc means data = mylib.sryzc; var Income; run; PROC MEANS语句后的选项主要用来指定所要计算的统计量，默认情况下， MEANS过程会给出频数、均数、标准差、最大值和最小值等，其余统计量的计算均需要在选项中指定。 VAR语句引导所要进行分析的所有变量的列表，SAS将对VAR语句所引导的所有变量分别进行描述性统计分析。 BY语句与CLASS语句所指定的分类变量用来进行分组统计，但输出格式不同。 3. 使用统计量关键字列表在PROC MEANS语句中使用统计量关键字列表： proc means data = mylib.sryzc n mean median p1 p5 p95 p99 q1 q3 max min; var Income; Run; 关键字所代表的含义关键字所代表的含义 n 有效数据记录数 range 极差 nmiss 缺失数据记录数 skewness 偏度 mean 均值 kurtosis 峰度 std 标准差 t 分布位置假设检验之t统计量 stderr 标准误 probt 上述t统计量对应的概率值 var 方差 q1 第一四分位数 median 中位数 q3 第三四分位数 mode 众数 qrange 四分位数间距 cv 变异系数 p1 第一百分位数 max 最大值 p5 第五百分位数 min 最小值 p10 第十百分位数 sum 总计 p90 第九十百分位数 sumwgt 加权值总计 p95 第九十五百分位数 css 校正平方和 p99 第九十九百分位数 uss 未校正平方和 2）使用CLASS语句和BY语句使用CLASS语句和BY语句可以分组计算分析变量的描述统计量值，由CLA