- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
由于要取反对数,必须另外建立数据步,为此又用数据步data geomean建立数据集goemean。该数据集通过调用已有的数据集outmean来建立。为此用set语句。 Set outmean; 这时已从outmean数据集中得到数据。即可用outmean中的变量logmean求反对数来得到几何均数g,我们知道g=10**logmean,最后的结果不难得出。 浙江大学公共卫生学院流行病与卫生统计学科系 沈毅 浙江大学公共卫生院流行病与卫生统计学科系 沈毅 基本统计(描述)过程 MEANS 过程 SUMMARY过程 UNIVARIATE过程 FREQ过程 PLOT过程(略) 集中趋势的描述指标 算术均数:适合单峰和基本对称的分布 中位数:适用于任意分布类型 截尾均数:数据中有极端值,用截尾均数更好 几何均数:适用于原始数据分布不对称,但经过对数转换 后呈对称分布的资料 众数(Mode):样本数据中出现频次最大的那个数字 调和均数(H):较少使用,观察值x倒数之均数的倒数, 常用于完成的工作量相等而所用时间不 同,求平均速度的情况 全距 大体了解数据的分布范围,用于预备性检查 方差和标准差 适用于正态分布 百分位数 如中位数(P50)、四分位数(P25、P50、P75) 四分位间距 即P75-P25,适用于任意分布类型,不受极端值影响 变异系数(CV) S/ ,适用于测量尺度相差太大或数据量纲不同时, 比较两组数据离散程度的大小 离散趋势的描述指标 SAS默认的关键词(部分): 均数 方差 标准差 标准误 离均差平方和(SS) 变异系数 一、MEANS过程 对计量资料进行统计描述主要可通过MEANS过程 和SUMMARY过程实现。这两者功能大致相同, 略有差异。MEANS过程没有输出中位数、四分位 数和众数的功能,SUMMARY过程则没有输出偏度 系数和峰度系数。 格式: PROC MEANS 选择项;―――主语句 VAR 变量表;―――――――分析变量 CLASS 变量表;――――――分组变量 RUN; 选择项:1、DATA=数据集名 ----- 用于指定分析数据集, 否则,使用当前数据集 2、统计量―― 用于指定需要输出的统计量, 包括:N,MEAN,STD,STDERR,MIN,MAX,SUM,CV,t,P等18个。 说明: 1.默认状态下则不分组计算所有的变量。 3.默认状态下输出的统计量为N,MEAN,STD,MIN,MAX。 例2-110年间某医院因心肌梗塞死亡的病例数的数据如表2.1,试作分析。 表2.1 某医院心肌梗塞死亡的病例数 年 份 病例数 year x 死 亡 例 数 住院期y 急性期z ?? 1?????????? 545 40 50 2???????? 490 46 39 3?????????? 515 45 44 4???????? 505 45 47 ? 5?????????? 492 46 32 ???6???????? 485 45 25 ??7????????? 499 49 17 ? ?8?????????? 480
文档评论(0)