实验二 SAS数据加工管理.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验二 SAS数据加工管理 【实验目的】 掌握SAS数据集抽取、变量运算、拼接、合并、排序等常用的数据加工方法 【实验内容】 项目1。 将Gpa数据集中女性的记录内容复制到一个临时数据集GPA0。 〖实验指导〗 ★有关知识★ 数据集选项where=(条件)可以将数据集中满足条件的观测筛选出,如: data test(where=(name=张三)); 可以筛选出name=张三的观测。当然用if语句、where语句也可完成对记录的筛选。 利用数据步过程的SET语句,可以从一个已存在的数据集中依次读入每一个观察值。对数据作某种处理后,写入数据集。 项目2。 将GPA数据集中的记录按照gpa的高低拆分到3个不同的数据集:gpa大于等于5的到good数据集,gpa在4和5之间的到normal数据集,gpa在4 以下的到bad 数据集。 〖实验指导〗 ★有关知识★ 在数据步中语句OUTPUT [数据集名];能将当前观测写入指定的数据集。 项目3。 根据一下数据,建立test1和test2两个数据集,并用数据步编程将数据集test1与test2按NUMBER顺序拼接成新数据集test4。 test1中数据为: 930101 王亚平 男 05/13/75 21 590.0 950207 李小丽 女 05/21/77 19 595.0 950202 吴元元 女 08/20/77 19 555.5 940203 马小平 男 12/12/76 20 576.0 test2中数据为: 940104 赵南飞 男 10/15/76 20 580.0 930105 洪燕峰 男 01/05/75 21 589.5 950106 周缅 女 01/30/78 18 566.0 〖实验指导〗 ★有关知识★ SORT过程可将数据集的观测值按一个或多个变量值进行排序,以便其它的SAS过程利用BY语句对其进行分组处理。排序后的观测值存放在一个新的SAS数据集中或替代原数据集。过程格式: PROC SORT [选项]; BY [DESCENDING] 变量1 […[DESCENDING] 变量n]; [RUN;] 利用数据步过程的的SET语句可以实现若干个数据集的拼接(纵向连接),形成新的一个大数据集。语法格式为: SET [数据集1 [(数据集选项1)] […数据集n [(数据集选项n)]; 项目4。 试对GPA数据集中的观测按变量SATV(降序)以及SEX(升序)的值排序,排序后的数据寸在数据集gtmp中。在gtmp中通过计算变量SATM的常用对数,生成新变量SATMLOG。 〖实验指导〗 ★有关知识★ 在数据步内可以通过赋值语句将已有数据经计算等处理生成出新的变量。 SAS函数log(变量)、log10(变量)可以计算变量的自然对数和常用对数。 项目5。 建立数据集old1(ID、NAME、AGE)和old2(ID、SCORE),然后通过数据步编程将old1、old2合并成数据集xsfs,要求观测能合理地匹配合并。 old1数据: 930101 王亚平 23 950207 李小丽 21 950202 吴元元 22 940203 马小平 19 940104 赵南飞 21 930105 洪燕峰 20 950106 周缅 21 old2数据: 940104 510 940203 480 930105 998 930101 890 950106 903 950202 840 〖实验指导〗 ★有关知识★ 要将数据集合并(横向连接)为一个拥有各数据集中变量的新数据集,可用DATA过程的MERGE语句来实现。MERGE语句的基本语法格式为: MERGE 数据集表; 该语句能将数据集表指定那些数据集(最多可达40个数据集)中同样观测序号的观测值合并成一个观测值,新数据集中的观测数为各原数据集中观测数最大值。若原有数据集中有同名变量,则在新数据集中仅出现一次。 该语句与BY语句配合,可以将具有共同变量且已按此变量排序过的那些数据集进行匹配合并。

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档