各种常见随机化的SAS实现.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
各种常见随机化的SAS实现

各种常见随机化的SAS实现 在前两期的讲座中我们介绍了实验设计的三要素与四原则[1],本期将结合实例重点阐述实验设计中如何实现各种常见的随机化。随机化体现在如下三个方面[2]:①抽样随机:每一个符合条件的实验对象参加实验的机会相同,即总体中每个个体有相同的机会被抽到进入样本之中。它保证所得到的样本具有代表性,使实验结论具有普遍意义;②分组随机:每个实验对象分配到不同组(通常为对照组、不同处理组)的机会相同。它保证大量难以控制的非处理因素在对比组间尽可能均衡一致,以提高各组间的可比性;③实验顺序随机:每个受试对象先后接受处理的机会相等,它使实验顺序的影响也达到均衡。本期主要就如何用SAS实现随机抽样和随机分组进行阐述。 已知编号为1-20的20例病人的基本信息见表1。本文将以表1数据为例,阐述随机化的SAS实现。 表1 20例病人的基本信息 病人编号 1 2 3 4 5 6 7 8 9 10 性别 F F M F F F M M M M 年龄 60 64 37 57 41 31 60 64 58 16 病人编号 11 12 13 14 15 16 17 18 19 20 性别 M M F F F F F M F F 年龄 58 63 23 37 20 33 39 40 49 42 1. 随机抽样 目前在SAS/STAT模块中,有一个与调查设计有关的SURVEYSELECT过程。该过程可用来实现各种随机抽样,包括:单纯随机抽样、系统随机抽样、分层抽样、无限随机抽样(有替换)、序贯随机抽样、以及按规模大小成比例概率抽样(PPS)等。 1.1 简单随机抽样的实现 简单随机抽样,就是从总体中不加任何分组、划类、排队等,完全随机地抽取受试对象。特点是每个个体(样品)被抽中的概率相等,各样品之间完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其他各种抽样形式的基础。通常只是在总体样品之间差异程度较小和数目较少时,采用这种方法。 例1:从编号为1到20的人中用简单随机化的方法抽取10名作为受试者。 用SAS9.1.3实现简单随机抽样的程序如下: data a; input id sex$ age; cards; 1 F 60 2 F 64 … … … 20 F 42 ; run; ods html; proc surveyselect data=a method=srs n=10 out=b; run; proc print data=b; run; ods html close; 程序说明:首先,创建SAS数据集名为a。然后,调用SURVEYSELECT过程进行随机抽样,并指定一些抽样选项,其中“data=”指定输入数据集,用于指定抽样框;“method=”用于指定随机抽样的方法,srs表示单纯随机抽样;“n=”用于指定抽样大小(此处可以用“rate=”来替换,用于指定抽样率);“out=”用于指定输出数据集,它包含所有被抽到的样本(可以添加选项“rep=number”来规定重复抽样的次数,如“rep=2”命令系统同时抽取2份样本)。最后用PROC PRINT把输出数据集b在输出窗口中显示出来。命令ods html和ods html close用于把程序运行结果以网页格式保存下来。 输出结果如下: Selection Method Simple Random Sampling Input Data Set A Random Number Seed 937359000 Sample Size 10 Selection Probability 0.5 Sampling Weight 2 Output Data Set B 以上是本次单纯随机抽样的基本信息,抽样方法是简单随机抽样(Simple Random Sampling)。由于未指定SEED=选项来规定初始种子,来产生随机数字流。系统使用默认种子作为初始种子(SEED=937359000),如果将来想重新抽取与本次完全相同的样本,可以在抽样时指定同一种子。抽取的样本大小是10。抽样概率(Selection Probability)是指样本被抽中的概率,此处为0.5。对于无分层的单纯随机抽样,样本的抽样概率是一致的。抽样权重(Sampling Weight)是抽样概率的倒数,反映样本信息量的大小。 Obs id sex age 1 5 F 41 2 6 F 31 3 10 M 16 4 11 M 58 5 12 M 63 6 13 F 23 7 15 F 20 8 16 F 33 9 19 F 49 10 20 F 42 以上是PROC PRINT命令显示的输出数据集,包括所有被抽中的样本。第二列id显示了被

文档评论(0)

xjj2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档