- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SAS过程步操作基础 薛 富 波 2006/04/23 有关过程步程序的基本概念 过程步(proc step)的概念 过程步是指用以调用某个SAS过程(SAS procedure)的一组SAS语句所构成的相对独立的程序单元。 过程步均以SAS系统中包含的各类过程(procedure)为基础,其中所能包含的语句和语句中的选项均表现为相对固定的形式,取决于所调用的具体过程。 用户所能调用的SAS过程取决于安装SAS时所包含的模块。 不同的SAS模块包含着执行相应功能的一个或多个SAS过程。 过程步程序的一般结构 以proc语句开始、run语句结束; 过程步程序包含以下三方面的内容: (1)proc语句,其中包含proc关键字、所要使用的过程名以及所要处理的数据集等; (2)其它用于定义分析操作内容的语句,如class语句、var语句、tables语句等; (3)run语句,用于标志当前过程步程序的结束。如果此过程步后紧随其它过程步或数据步,run语句可省略。 proc语句 每一个过程步都以proc语句开始; proc语句以proc关键字开始,紧跟其后的是所调用SAS过程的名称,语句中还可包括众多的控制选项; 多数SAS过程的proc语句中均包括“data=”选项,用以指定该SAS过程所要处理的数据集; 不同的SAS过程,其proc语句中所包含的语句选项也各不相同。 BASE模块SAS过程的功能与操作 BASE模块所含过程的功能分类 报表输出过程:用以显示各种实用信息,包括数据列表、汇总报告、日历、书信、标签、表单以及各种图形报表等。 统计计算过程:用以计算各种基本统计量,包括均数、标准差等基于矩的统计量,分位数,可信区间,频数等;还可编制交叉表、进行相关分析以及针对各种分布形式的假设检验;此外还可对数据进行编秩及标准化等操作。 实用工具类过程:此类过程为用户提供各类实用工具,可实现的功能包括对数据集的创建、编辑、排序以及转置等操作,创建和恢复数据交换文件,创建用户自定义的格式,维护SAS文件等。 某些SAS过程同时兼备上述分类的两项以上功能,如means过程、freq过程等既具有统计计算功能,又具有报表输出功能。 报表输出过程 统计计算过程 实用工具类过程 BASE中若干常用的SAS过程 contents:显示SAS数据集的有关属性信息,帮助用户了解自己的数据; print:将数据集中全部或指定的部分变量、以及全部或指定的部分观测输出显示; means:针对数值型变量计算其各种描述性统计量; sort:根据一个或多个变量,对数据集的全部观测进行排序。 import过程:从外部文件读取数据并创建SAS数据集; export过程:从SAS数据集读取数据并将其写入外部文件; printto过程:指定output窗口及log窗口的输出路径。 contents过程 contents过程用于显示指定的SAS数据集的有关信息或者相应逻辑库中所包含成员的列表信息。 对于指定的SAS数据集,contents过程将列出数据集的各种属性信息,以及所包含的全部变量及其属性。 有关变量信息的列表将按照字母顺序排列,变量属性信息包括变量类型、长度、标签以及格式等。 contents过程的一般形式如下: proc contents data=SAS-data-set options; run; proc contents语句的主要选项 detials|nodetials :用于控制显示结果的详尽程度。前者将显示上述的全部内容,后者则仅显示有关变量信息的部分。默认设置:detials。 varnum :要求将变量按照其在数据集中的排列顺序而非字母顺序显示。 short :有关变量信息部分仅显示变量名称,不显示变量属性。 out= :将输入数据集中有关变量的信息存储到指定的数据集中。 noprint :禁止程序运行结果在output窗口的输出显示。 contents过程示例 print过程 print过程用于将数据集中的全部或特定内容输出显示。 可通过特定语句实现对选定列(变量)和特定行(观测)的输出显示。 print过程功能特性:自动格式化,以变量名称或标签为列标题,选择性输出,特定的by格式以及id格式。 print过程的一般形式: proc print data=SAS-data-set options; other statements; run; proc print语句的主要选项 label :使用变量标签作为列标题,否则变量名称将被用作列标题显示。 n=string :在输出结果的末尾显示观测总数,如果同时设置“=string”项,“string”将同观测总数一同显示
文档评论(0)