实验二 SAS数据加工管理.docxVIP

  • 0
  • 0
  • 约1.77千字
  • 约 2页
  • 2023-04-25 发布于上海
  • 举报
实验二 SAS 数据加工管理 【实验目的】 掌握 SAS 数据集抽取、变量运算、拼接、合并、排序等常用的数据加工方法 【实验内容】 项目 1。 将 Gpa 数据集中女性的记录内容复制到一个临时数据集GPA0。 〖实验指导〗 ★有关知识★ data test(where=(name=张三)); data test(where=(name=张三)); 可以筛选出 name=张三的观测。当然用 if 语句、where 语句也可完成对记录的筛选。利用数据步过程的 SET 语句,可以从一个已存在的数据集中依次读入每一个观察值。 对数据作某种处理后,写入数据集。 项目 2。 将 GPA 数据集中的记录按照 gpa 的高低拆分到 3 个不同的数据集:gpa 大于等于 5 的到 good 数据集,gpa 在 4 和 5 之间的到 normal 数据集,gpa 在 4 以下的到 bad 数据集。 〖实验指导〗 ★有关知识★ 在数据步中语句 OUTPUT [数据集名];能将当前观测写入指定的数据集。 项目 3。 根据一下数据,建立 test1 和 test2 两个数据集,并用数据步编程将数据集 test1 与 test2 按 NUMBER 顺序拼接成新数据集 test4。test1 中数据为: 930101 王亚平 男 05/13/75 21 590.0 950207 李小丽 女 05/21/77 19 595.0 950202 吴元元 女 08/20/77 19 555.5 940203 马小平 男 12/12/76 20 576.0 test2 中数据为: 940104 赵南飞 男 10/15/76 20 580.0 930105 洪燕峰 男 01/05/75 21 589.5 950106 周缅 女 01/30/78 18 566.0 〖实验指导〗 ★有关知识★ SORT 过程可将数据集的观测值按一个或多个变量值进行排序,以便其它的 SAS 过程利用 BY 语句对其进行分组处理。排序后的观测值存放在一个新的 SAS 数据集中或替代原数据集。过程格式: PROC SORT [选项]; BY [DESCENDING] 变量 1 […[DESCENDING] 变量 n]; [RUN;] 利用数据步过程的的 SET 语句可以实现若干个数据集的拼接(纵向连接),形成新的一 个大数据集。语法格式为: SET [数据集 1 [(数据集选项 1)] […数据集 n [(数据集选项 n)]; 项目 4。 试对 GPA 数据集中的观测按变量 SATV(降序)以及 SEX(升序)的值排序,排序后的数据寸在数据集 gtmp 中。在gtmp 中通过计算变量 SATM 的常用对数,生成新变量SATMLOG。 〖实验指导〗 ★有关知识★ 在数据步内可以通过赋值语句将已有数据经计算等处理生成出新的变量。 SAS 函数 log(变量)、log10(变量)可以计算变量的自然对数和常用对数。 项目 5。 建立数据集old1(ID、NAME、AGE)和 old2(ID、SCORE),然后通过数据步编程将 old1、old2 合并成数据集xsfs,要求观测能合理地匹配合并。 old1 数据: old2 数据: 930101 王亚平 23 940104 510 950207 李小丽 21 940203 480 950202 吴元元 22 930105 998 940203 马小平 19 930101 890 940104 赵南飞 21 950106 903 930105 洪燕峰 20 950202 840 950106 周缅 21 〖实验指导〗 ★有关知识★ 要将数据集合并(横向连接)为一个拥有各数据集中变量的新数据集,可用 DATA 过程的 MERGE 语句来实现。MERGE 语句的基本语法格式为: MERGE 数据集表; 该语句能将数据集表指定那些数据集(最多可达 40 个数据集)中同样观测序号的观测值合并成一个观测值,新数据集中的观测数为各原数据集中观测数最大值。若原有数据集中有同名变量,则在新数据集中仅出现一次。 该语句与 BY 语句配合,可以将具有共同变量且已按此变量排序过的那些数据集进行匹配合并。

文档评论(0)

1亿VIP精品文档

相关文档