- 1、本文档共72页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SAS基础2
第一节 SAS过程步简介 SAS过程步的一般形式为: PROC 过程名 [ DATA=输入数据集] [选项];过程语句1 [/ 选项 ]; 过程语句2 [/ 选项 ]; …… RUN; 例如,假设我们已经把class1数据集按性别排序,则下面PRINT 过程可以把男、女生分别列出: proc print data=class1 ; by sex; run; 4.OUTPUT语句 过程步中经常用OUTPUT语句指定输出结果存放的数据集。不同过程中把输出结果存入数据集的方法各有不同,OUTPUT语句是使用频繁的语句之一。 例如: proc means data=dst.bclass; var age; output out=result02 n=n mean=meanage var=varage; run; proc print data=result02; run; 五、 PRINT过程简介 在SAS Windows版以前,PRINT过程是最常用的SAS过程之一。在生成一个数据集之后,如果数据量不是太大,我们一般都用一个PRINT过程步列出数据集的内容,以检查变量对应输入的数据值是否正确。 现在我们可能通过Viewtable表打开生成的数据集查看数据。为了输出显示一个指定的数据集,在PROC PRINT语句中使用DATA=指定数据集,语法结构如下: PROC PRINT DATA = 数据集名称; 六、 变量标签语句LABEL 实例数据 【例1】表中为两个不同地区居民家庭收入和支出情况的抽样调查(单位:元),试分别统计收入和支出情况。 将表中数据通过Excel导入到SAS数据集Mylib.sryzc中,4个变量名分别为:ID、R_ID、Income和Outgo,相应的标签名为家庭编号、地区编号、家庭总收入和家庭总支出。 2. 在INSIGHT中打开数据集 在菜单中选择“Solution(解决方案)”→“Analysis(分析)”→“Interactive Data Analysis(交互式数据分析)”,打开“SAS/INSIGHT Open”对话框,在对话框中选择数据集:Mylib.sryzc,单击“Open(打开)”按钮,即可在INSIGHT中打开数据窗口,如图所示。 3. 计算统计量 选择菜单“Analyze(分析)”→“Distribution (Y)(分布)”,打开“Distribution (Y)”对话框。在数据集sryzc的变量列表中,选择Income为分析变量,选择R_Id,为分组变量。 单击“Output(输出)”按钮,在打开的对话框中包含描述性统计量选项。 选择选项矩统计量和分位数,取消默认的选项:“Box Plot/Mosaic Plot”和“Histogram/Bar Chart”,单击“OK”按钮,即可得到变量Income按“R_Id”分组的各种矩统计量(Moments)和分位数(Quantiles),如图所示。 三、编程计算常用的描述统计量 SAS提供有不同的过程来实现统计量的计算,下面介绍用MEANS和UNIVARIATE过程来计算简单的描述统计量。MEANS和UNIVARIATE过程则对数值型变量计算均值、标准差等统计量。 (一)用univariate过程 Proc univariate data=数据集名; Var 变量名列 Run; (二)用MEANS过程 MEANS过程和UNIVARIATE过程的用法是类似,主要区别在于MEANS允许使用CLASS语句。 PROC MEANS 输入数据集名 选项列表 ; VAR 变量列表 ; CLASS 变量列表 ; BY 变量列表 ; WEIGHT 变量 ; OUTPUT OUT=输出数据集名 统计量关键字=变量名 列表 ; 1、PROC MEANS 语句中的选项列表: NOPRINT——不输出任何描述统计量,仅为了创建新的数据集 MAXDEC=数字——输出结果中小数部分的最大位数(0至8),缺省值为2。 2、OUTPUT语句中的选项 OUT=输出数据集名 ——输出数据集名 统计量关键字=变量名 列表——规定在输出数据集中要包含的统计量并规定这些统计量在新数据集中的变量名 MEANS过程对OUTPUT语句的次数没有限制,可以使用几个OUTPUT语句来创建内容不同的多个数据集 3、VAR、BY、CLASS、WEIGHT语句 VAR语句——规定要求计算简单描述性统计量的数值变量的
您可能关注的文档
最近下载
- 人教版初中生物会考试卷及答案.pdf VIP
- 2023年海南师范大学软件工程专业《数据结构与算法》科目期末试卷B(有答案).docx VIP
- 2023年四川省广元市中考地理试题卷(含答案详解).docx
- 2023年海南师范大学软件工程专业《数据结构与算法》科目期末试卷A(有答案).docx VIP
- 广西师范大学2020-2021学年《认知心理学》期末考试试卷(B卷)含参考答案.docx
- 羊常见疾病防治.ppt VIP
- 国开期末考试3987《Web开发基础》机考试题及答案(李老师第5套).pdf VIP
- 2024年怀化市靖州苗族侗族自治县六年级下学期小升初真题精选语文试卷含答案.doc VIP
- 2023年海南师范大学软件工程专业《计算机网络》科目期末试卷B(有答案).docx VIP
- 2025年社区工作者招聘考试题库及答案解析.docx VIP
文档评论(0)