基本统计描述过程.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基本统计(描述)过程 MEANS 过程 SUMMARY过程 UNIVARIATE过程 FREQ过程 PLOT过程(略) 一、MEANS过程 例2-1 10年间某医院因心肌梗塞死亡的病例数的数据如表2.1,试作分析。 表2.1 某医院心肌梗塞死亡的病例数 程序2-1 data ex2_1; input no x y z@@; cards; 1 545 40 50 2 490 46 39 3 515 45 44 4 505 45 47 5 492 46 32 6 485 45 25 7 499 49 17 8 480 45 20 9 566 49 36 10 539 49 27 ; proc means mean std stderr cv min max; var x y z; run; proc means后面的mean std stder cv min max称为选择项,它们分别表示要求计算和输出均数,标准差,标准误,变异系数,最小值和最大值。如proc means后面的选择项全部缺省,则输出均数,标准差,最小值和最大值。 Var x y z;表示所统计的变量是x,y和z。如var语句缺省,则统计所有的数值型变量。 二、SUMMARY过程 三、univariate过程 表2.2 100名健康女大学生血清总蛋白含量 程序2_5 data ex2_5; input x f@@; cards; 65 3 67 5 69 8 71 11 73 25 75 24 77 10 79 7 81 6 83 0 85 1 ; proc univariate data=ex2_5 normal plot; var x; freq f;/*指定f为频数变量*/ run; 程序中在input语句中读入x及f两个变量的数值,x为血清总蛋白含量的组中值,f为频数。Var x;说明分析变量为x,freq f;说明频数变量为f。例如,最前面的两个数字x=65,f=3说明有3个65。 例2_5 某地13人接种疫苗后抗体滴度(稀释度)为1:20,1:20,1:40,1:40,1:40,1:80,1:80,1:80,1:80,1:80,1:80,1:160,1:320。试求其几何均数。 几何均数的计算公式为: 程序2_6 data ex2_6; input x f@@; y=log10(x); cards; 20 2 40 3 80 6 160 1 320 1 ; proc means; freq f; var y; output out=outmean mean=logmean; proc print data=outmean; data geomean; set outmean; g=10 * * logmean; proc print data=geomean; var g; run; 首先建立数据集ex2_6。数据以频数分布表形式输入,x为变量值,f为频数。然后产生变量值x的常用对数的对数值y。用proc means求y的均数,freq f;及var y;指定了频数变量为f及求均数的变量为y。 至此我们已经可以求出y的均数。此均数必须再取反对数才能得到几何均数。由于SAS过程中没有直接求几何均数的程序,我们必须再对对数值的均数y取反对数。但如何对y取反对数却存在一个问题。因为计算反对数必须在建立数据集时进行。为此我们要另外建立一个包含均数y这个变量的数据集。 由于要取反对数,必须另外建立数据步,为此又用数据步data geomean建立数据集goemean。该数据集通过调用已有的数据集outmean来建立。为此用set语句。 Set outmean; 这时已从outmean数据集中得到数据。即可用outmean中的变量logmean求反对数来得到几何均数g,我们知道g=10**logmean,最后的结果不难得出。 四、FREQ过程 Outmean数据集 几何均数 浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 浙江大学公共卫生院流行病与卫生统计学科系 沈毅 集中趋势的描述指标 算术均数:适合单峰和基本对称的分布 中位数:适用于任意分布类型 截尾均数:数据中有极端值,用截尾均数更好 几何均数:适用于原始数据分布不对称,但经过对数转换 后呈对称分布的资料 众数(Mode):样本数据中出现频次最大的那个数字 调和均数(H):较少使用

文档评论(0)

a13355589 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档