- 1、本文档共43页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
卫生统计学数值变量资料的统制计描述
第三章 数值变量资料的统计描述 数值变量资料的分类 离散型资料(discrete data) 连续型资料(continuity data) 离散型资料 连续型资料 第一节 频数分布表和频数分布图 频数分布表:常用于样本量较大资料的统计描述。 频数分布图:用图示的方法描述频数分布的特点,比频数表更直观、形象。 一、离散型定量资料的频数分布 二、连续型定量资料的频数分布 求全距(range,R) ,R=129.5—101.2=28.30(cm) 划分组段 确定组数 确定组距 确定各组段的上下限 列出频数表 图3-2 某市120名6岁女孩的身高分布 频数分布两个重要特征 集中趋势 离散趋势 频数分布类型 对称分布:集中位置在中间,左右两则的频数基本对称。 偏态分布:集中位置偏向一侧,左右频数不对称。 正偏态:集中位置偏向数值小的一侧(左侧) 负偏态:集中位置偏向数值大的一侧(右侧) 第二节 集中趋势的描述 描述定量资料集中趋势常用的统计指标为平均数(average)。 算术均数 几何均数 中位数/百分位数 一、算术均数(mean) 适于描述正态分布或近似正态分布资料的集中趋势(μ, ) 方法 直接法 加权法 直接法(direct method) 加权法(weight method) 二、几何均数(geometric mean,G) 观察值呈倍数关系或其频数分布明显偏态,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描述其集中趋势。 方法 直接法 加权法 例3-4 有5人接种某种疫苗后,测定抗体滴度分别为1:8,1:16,1:32,1:64,1:128,求几何均数。 加权法 三、中位数(median,M)和百分位数(percentile,Px) 中位数 :将一组观察值按大小顺序排列后,位于中间位置的观察值称中位数。全部观察值中,大于和小于中位数的观察值个数相等。中位数可用于各种分布的资料,在实际工作中主要用于偏态分布资料、两端无确切值或分布不明确的资料。 资料为对称分布,M= 方法 直接法 频数表法 直接法 频数表法 百分位数 将观察值从小到大排列后,等分成100份,位于第x百分位置上的数值称第百分之x位数,记为Px。对于样本含量过小的资料不宜计算百分位数。 一个百分位数Px将全部数据分为两个部分,有x%的数据比Px小,有(100~X)%的数据比Px大,故百分位数是一个位置指标。 计算 例3-9 计算例3-8中表3-5的百分位数P25 、P75 、P90 的值。 (mmol/L) (mmol/L) (mmol/L) 第三节 离散趋势的描述 例3-10 三组同性别、同年龄儿童的体重(kg)资料如下: 甲组 16 18 20 22 24 乙组 14 17 20 23 26 丙组 16 19 20 21 24 描述离散趋势的常用指标有 极差 四分位数间距 方差 标准差 变异系数 一、极差(range,R) 极差亦称全距,即一组观察值中最大值与最小值之差。极差大,说明变异度大;反之,说明变异度小 极差可用于反映各种分布资料的变异程度,简单明了,但也存在缺点 只涉及最大值和最小值,不能反映组内其他数据的变异程度 样本较大时,抽样误差大,因此抽到最大值和最小值的可能性也越大,故样本例数相差较大时,不宜比较其极差 二、四分位数间距(quartile range,Q/ Qu- Ql ) P25 -P75 四分位数间距常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度,其值越大,表示观察值分布的离散程度越大,反之越小。 四分位数间距与极差相比,相对比较稳定,但它只反映了居中间的50%数据的变异情况,仍未考虑到每个观察值的变异情况,不能代表全部观察值的离散程度。 三、方差(variance) 方差是描述对称分布,特别是正态分布或近似正态分布资料离散程度的常用指标。 自由度(degree of freedom, )的意义是随机变量在一定条件下能“自由”取值的变量值个数,若变量取值受k个条件的限制,其自由度为n—k。 四、标准差(standard deviation
文档评论(0)