- 1、本文档共34页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
312定量数据的统计描述
Output 语句示例 Proc univariate data=class mu0=62; Var height; Output out=t_test t=t_value probt=p_value; Run; 对变量height的均值做t检验( mu0=62 ) Output 语句示例 Proc univariate data=class; Var height weight; Output pctlpts=33.3 66.7 pctlpre=h w pctlname=p33_3 p66_6; Run; Pctlpts=百分位数 规定在过程中不能自动提供而用户又希望计算的百分位数。比如想计算33%的分位数,必须由此选项。 Pctlpre=前缀名列表 该选项规定pctlpts=要求计算的百分位数的输出变量名的前缀 Pctlname=后缀名列表 该选项规定pctlpts=要求计算的百分位数的输出变量名的后缀 Means/Summary与Univariate对比 统计描述是针对原始数据进行归纳整理、用相应的统计指标(如率、均数等)来反映研究对象最鲜明的数量特征过程。数据的统计描述可以包括以下几个方面的内容: 位置参数:包括算术平均数、中位数、众数 变异指标:包括全距,四分位数间距、方差、标准差以及变异系数 形状参数:包括偏度和峰度 频数及报表 绘图 数据的统计描述 Means过程 Summary过程 Univariate过程 定量数据统计指标计算的三种过程 Means过程格式: Proc means 数据集名noprint其它选项; Var 变量列表;(规定需要计算的数值变量及顺序) Class 变量名列表;(分组计算) Freq 变量;(该语句指定一个数值型的变量,它的值表示输入数据集中相应观测出现的频数。该变量的值应为正整数。若freq变量值1或缺失,相应的观测不参加计算统计量;若这个值不是正整数,取整数部分。) Weight 变量;(该变量的值应大于0,若0或缺失,则假定该值为0.) Id 变量名列表;(该语句对means过程产生的输出数据集增加一个或几个附加变量,目的在于识别输出数据集里德观测) By 变量名列表;(分组计算,注意一定要先排序) Output out=数据集名字输出统计量列表; Means过程 Proc means中的其它选项包括 Maxdec=n;规定输出结果中的小数部分的最大位数(0-8)。缺省时是2。 Fw=n;给出该过程用来打印每个统计量的域宽。缺省是12。 Alpha=a;设置计算置信区间的置信水平a。a在0-1之间。假如,若规定a=0.05,则得到均值的95%的置信区间 Missing要求该过程把class变量的缺失值作为有效分组值处理 Means过程 Proc means data=class; Var height; Run; 在上述用法中,没有指定输出的统计量,缺省的会对每个选定的变量计算有效记录(N)、均值(Mean)、标准差(Std)、最大值(Maximum)和最小值(Minimum)五个统计量。 Means过程最简单的用法 可以用means过程 计算的统计量分别 用关键词表示: Proc means data=class mean var clm alpha=0.01 maxdec=3 fw=8; Var height weight; Output out=mclass mean= var=vh vw lclm=lc uclm=uc; Run; Means过程示例 该程序要求输出的结果占8个字符,其中小数位为3。把运行结果输出到数据集mclass中,包括变量 height(height的均值) weight(weight的均值) vh(height的方差) vw(weight的方差) Lc(置信度为99%的置信下限) uc(置信度为99%的置信上限) 1、统计关键字=代表统计值的变量名称串 Proc means data=class; Var height weight; Class sex; Output out=test mean=m_h m_w; Run; Output的四种方式 这种界定方式自动计算出var指令所列举之所有变量的统计值。 因此,等号右边所列举的变量,必须与var指令中所列举的变量前后对应而且数目相同。 2、统计关键字(变量名称串)=代表统计值的变量名称串 Proc means data=class; Var height weight; Class sex; Output out=test mean=m_h m_w std(height)=v_h; Run; Output的四种方式 这种界定方式将产生var指令所列举之部分变量的统计值
文档评论(0)