- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第08章-数值变量资料的统计描述第四版预防医学
回顾: 根据是否定量划分,资料被分作不同的类型: 数值资料(measurement data): 用定量的方法对观察单位进行测量得到的资料,亦称作计量资料。 分类变量资料(enumeration data): 用定性的方法得到的资料,亦称计数资料。 等级资料(ranked data): 不能精确测量,仅能根据相对大小分为几个等级。 第一节 数值变量资料频数分布 数值变量资料进行统计描述需要根据资料的分布类型选择合适的统计指标,因此首先要通过频数分布表或分布图了解资料的分布特征。 一、频数分布表及其制作 频数表的编制步骤: 二、频数分布图 三、频数表和频数分布图用途 1.描述频数分布的特征 2.描述频数分布的类型(对称分布、偏态分布) 3.便于发现一些特大或特小的可疑值 4.便于进一步做统计分析和处理(加权) (1)对称分布 : 若各组段的频数以中心位置左右两侧大体对称,就认为该资料是对称分布 (2)偏态分布 : 1)右偏态分布(正偏态分布):右侧的组段数多于左侧的组段数,频数向右侧拖尾。 2)左偏态分布(负偏态分布):左侧的组段数多于右侧的组段数,频数向左侧拖尾。 表8-3某传染病潜伏期频数分布表 3.便于发现一些特大或特小的可疑值 第二节 集中趋势指标 统计上使用平均数(average)这一指标体系来描述一组变量值的集中趋势或平均水平。 常用的平均数有: 算术均数(均数)(mean) 几何均数(geometric mean) 中位数 (median) 一、算术均数 算术均数:简称均数(mean) 定义:是一组变量值之和除以变量值个数所得的商。均数适用于资料呈对称分布或近似对称分布资料,尤其适用于正态分布或近似正态分布的资料。 总体均数:μ 样本均数: 1、计算方法 (1)直接计算法 (n50) 均数的特征 二、??中位数与百分位数 (一)中位数(median) 定义:用符号M表示,中位数是将一批数据观察值按其变量值从小至大排列,位置居中的数值(n为奇数)或位置居中的两个数值的均值(n为偶数)。反映一批观察值在位次上的平均水平。 其适用情况有: ①当资料呈明显的偏态分布; ②不封口资料; ③资料的分布情况不清楚。 按所分组段,由小到大计算累计频数和累计频率 累计频数:某个指定值以下的观测例数 累计频率=累计频数/n 找到中位数所在的组段 代入公式 表8-3某传染病潜伏期频数分布表 中位数的特征 计算时只利用了位置居中的测量值 优点:对极值不敏感,它不 受极端数值的影响,比较稳定 缺点:并非考虑到每个观测值 均数、中位数的比较 三、 几何均数(geometric mean) 定义:用G表示,是将n个观察值x的乘积再开n次方的方根(或各观察值x对数值均值的反对数)。 其适用条件是: ①等比资料; ②对数正态分布的资料。 例8.3 有7份血清的抗体效价分别为1:2, 1:4, 1:8, 1:16, 1:32, 1:64,1:128,求平均抗体效价。 (2)加权法(利用频数表n≥50) 三种平均数的特点 算术均数:通常被认为是最佳集中趋势的度量值。如果资料观察值含有少数极端数值(相对的说特大或特小值)或资料呈偏态分布,算术均数就变得不稳定而失去代表性。?正态分布 几何均数一般只适宜于等比级数资料。对于这类资料,用几何均数反映集中趋势比算术均数或中位数更合适。 中位数不受其前后其他数值(特别是极端值)的影响。但如果数据呈明显不同且差异很大,这时中位数可能不适宜作为集中趋势的度量值了。?偏态分布 第三节 离散趋势的描述 常用统计指标: 全距(range) 四分位数间距(quartile interval) 方差和标准差(variancestandard deviation) 变异系数(CV coefficient of variation) 1.极差(Range)也称作全距,即观察值中最大值和最小值之差,用符号R 表示 频数表法计算中位数及百分位数的步骤: 按所分组段,由小到大计算累计频数和累计频率 找到Px所在的组段 代入公式计算Px或P50 。 2.频数表法 公式: 表8-3某传染病潜伏期频数分布表 例8.1 试分别求例8.1频数表的第25、第75百分位数。 样本方差为什么要除以(n-1) 样本方差为什么要除以(n-1) 样本标准差:样本方差的平方根,其度量单位与均数一致,所以最常用,用 S 表示 (五)变异系数(Coefficient of Variati
文档评论(0)