1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SAS第3讲

第2章 数值变量资料的统计描述 1. 频数分析与直方图 1.1 概述 1.2 用Insight作频数统计和直方图 1.3 用分析员作频数统计和直方图 1.4 用编程作频数统计 1.1 概述 统计分析 统计描述 频数表编制 集中趋势、离散趋势 统计推断 在调查或实验中出现相同观察结果的次数 称为频数。 频数分析首先就要编制频数表,将所有观察结果按一定的顺序把频数排列,从排列的顺序中,发现观察值的分布规律。 医学研究中常见的资料分布有正态分布和偏态分布两类。 根据资料分布的不同,采用的处理方法也不同,这一点是非常重要的,还可通过频数分布发现远离群体的某些可疑值。 正态分布的特征是以均数为中心,左右两侧基 本对称,靠近均数两侧的频数较多,而距均数较远的两侧,频数逐渐减少的钟形分布。 部分数据频数分布在左侧或右侧称为偏态分布。频数表绘制成直方图,可更清楚地看出资料分布的特征。 下面我们来看看用SAS系统的3种方法 是如何实现描述资料 1.2 用Insight作频数统计和直方图 对已建立好的名为JK数据集中的性别、体重、身高和胆固醇进行频数统计和作直方图,观察数据是否呈正态分布? 操作步骤如下: ⑴ 先打开JK数据集 l?? Globals 单击后弹出下拉菜单; l??? 选中 analyze 弹出级联菜单; l??? 选 Interactive data analysis 命令; l? 弹出SAS/Insight:Open 打开窗口; l 选择库名和数据集名单击Open按钮。 ⑵ 打开JK数据集观察菜单栏的变化 结果见图: ⑷ 如果想了解某变量频数详细分布情况;操作方法如下: 点击Output 按钮(选择了体重TZ变量) ⑸ Insight 还提供了一个可以随意改变 直方图分组方法 l前提条件必须打开所要分析的数据集并做出直方图; l在主菜单中选Edit → Windows → Tools;弹出工具Tools 窗口,如图所示: ⑹ 在直方图的基础上,还可画出拟合的分布曲线,以身高SG变量为例说明。 单击OK后结果如图所示: 以P61数据集为例 ⑺ 用Insight作直方图的另外一种方法 以性别和身高为例说明,具体操作如下: 显示结果如下: 结果如下: 1.3 用分析员作频数统计和直方图 在分析员的环境下,把已建好的数据集JK调出。 ⑴?性别的频数统计 ⑵? 作胆固醇变量(DGC)直方图 操作方法在主菜单中选: 1.4 用编程作频数统计 利用编程进行频数统计可使用 FREQ 过程它是最简单的用法。 ⑴ 基本格式如下:参见教材P60 ⑵ 操作步骤如下: ⑶ 分组段编程 4.7-5.2=4.7- 5.2-5.7=5.2- 5.7-6.2=5.7- 6.2-6.7=6.2- 6.7-7.2=6.7- 7.2-high=7.2-; run; proc freq data=sasuser.jk; tables dgc; format dgc wft.; run; 输出结果如图所示: 2 常用描述性统计指标 2.1 概述 对数值型变量,频数分布通过频数统计和直 方图可全面描述资料的取值特征,但是要确 定资料的分布需要许多的信息来进行判断。 描述性的指标包括两类:集中趋势指标和离 散趋势指标。各种指标根据资料的分布不同 采用的方法也不同。 为了能正确应用SAS系统得到的结果, 有必要把使用条件阐述如下: ⑴ 集中趋势指标 用于描述一组观察值的集中程度,也表示一 组性质相同的观察值的平均水平。 ●算术平均数(arithmetic mean)正态分布 ●几何均数(geometric mean)呈倍数关系 ●中位数(median)分布末尾无确定数据 ●百分位数(percentile)用于偏态分布 ⑵ 离散趋势指标 用于描述一组连续资料观察值之间参差不 齐的程度和个体之间的变异情况。 ●全距 R(range) ●方差 S2(variance) ●标准差 S(standard deviation) ●四分位数间距 QR(quartile) ●变异系数 CV(coefficient of variation) 2.2 用Insight 计算 常用描述性统计指标 在Insight 环境

文档评论(0)

gangshou + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档