- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《SAS系统和数据分析PROC TRANSPOSE转置数据集》
PROC TRANSPOSE转置数据集
转置数据集的概念
在对数据库的操作中,有时需要把数据库的行和列进行交换,也可称转置。SAS系统中TRANSPOSE过程能完成对SAS数据集的转置,即把观测(行)变为变量(列),变量变为观测。该过程从读入的一个数据集中创建一个新的数据集。新数据集中包含三类变量:
一是由输入数据集中的观测转置后创建的新变量,又称转置变量,如_NAME_、COL1、COL2、COL3……
二是从输入数据集中拷贝过来的变量,使用COPY语句定义这个变量,新数据集中COPY过来的变量与输入数据集中的变量具有相同的名字和值
三是为了识别新数据集中每条观测的来源用ID语句定义的变量值作为新数据集创建的新变量
使用PROC TRANSPOSE过程转置数据集
用于TRANSPOSE过程的常用语句
Proc Transpose DATA=输入数据集 OUT=转置数据集选项列表 ; Var 变量列表 ; Id 变量 ; Copy 变量列表 ; Run ; 转置CLASS数据集
例如,在CLASS数据集中有变量NAME、TEST1、TEST2和TEST3,是按每个学生各课程成绩作为一条观测来组织的,现在我们要创建一个按每门课程各个学生的考试成绩作为一条观测的新数据集NEWCLASS。程序如下:
Proc Transpose Data=CLASS Out=NEWCLASS ; Var TEST1 TEST2 TEST3 ; Run ;
转置生成的新数据集NEWCLASS的结果如图13.1所示。
设定新数据集中的转置变量名
新数据集中的转置变量名是可以由用户自己设定的。
通过PROC TRANSPOSE语句的选项NAME=COURSE,修改了省缺的新变量名_NAME_为COURSE
还可以通过选项PREFIX=NO,修改了省缺的新变量名COL1、COL2、COL3、COL4、COL5为NO1、NO2、NO3、NO4、NO5
如果新变量名COL1、COL2、COL3、COL4、COL5想用输入数据集CLASS中NAME变量中的对应值来替代,使用ID命令定义NAME即可。这样命名新变量的优点是通过新变量名就可以很容易地识别原数据集中的观察行
修改程序如下:
Proc Transpose Data=CLASS Out=NEWCLASS Name=COURSE ; Var TEST1 TEST2 TEST3 ; Id Name ; Run ;
转置生成的新数据集NEWCLASS的结果如图13.2所示。
另外,还可以在PROC TRANSPOSE过程中使用COPY语句,在语句中指定输入数据集的某一个(或某几个)变量,将直接把输入数据集中指定变量那一列拷贝到新数据集也成为一列。当然,这样操作常会产生输出数据集的行和列数不匹配,用缺失值填满。使用FSVIEW过程编辑数据集
我们前面主要用SAS的程序方法来编辑SAS数据集。实际上,很多用户习惯使用SAS/FSP软件的FSVIEW过程来编辑SAS数据集,这是一种交互式菜单编辑方式,非常方便。例如,在PROGRAM EDITOR 窗口中输入的程序如下:
Proc fsview data=study.survey ; Run ;
程序提交后,进入FSVIEW窗口。用户仍然可以在命令框中键入命令来编辑,如键入DROP命令去掉不需要显示的变量(投影操作)、WHERE命令获得子集(选择操作)及WHERE ALSO命令获得子集的子集。FSVIEW过程与FSEDIT过程相比,FSVIEW过程更方便,是用户最常用的输入和编辑SAS数据集的过程。因为FSVIEW在每一屏显示尽可能多的观测,是一种屏编辑;而FSEDIT在每一屏只显示一条观测,是一种行编辑。我们在这里以编辑数据集STUDY.SURVEY.DATA为例,简单介绍几种最常用的编辑操作。
选择Edit/Update/Record命令编辑记录
如果选择了Edit/Update/Memer命令,则按数据集的一个个数据项进行编辑,每按一个Enter编辑光标跳到下一个数据项。如果选择了Edit/Update/Record命令,则按数据集的一条条记录进行编辑,每按一个Enter编辑光标跳到下一条记录。如图14.1所示是FSVIEW屏编辑窗口。
修改指定记录
进入按记录编辑状态后,只要单击一下所要编辑记录的行中任意位置,就会出现高反差的编辑条,移动左右光标到行中某处即可修改。要注意的是,窗口中显示的是数据集的输出格式,我们在输入或修改时,一定要按输入格式进行输入,否则可能发生错误。
删除指定记录
按上下光标或Page Up/P
文档评论(0)