定量资料统计描述和正态分布.ppt

第二讲 定量资料统计描述、正态分布 ;第一节 频数分布;;;三、频数分布表和频数分布图用途 1.描述频数分布类型: 对称分布:集中位置在中间。左右两侧频数基本对称。 偏态分布:右偏态分布和左偏态分布 2.描述频数分布的特征:集中趋势和离散趋势 3.便于发现资料中的特大或特小的离群值 4.便于进一步的分析和处理 ;第二节 集中趋势描述;一、算术均数 算术均数简称均数(mean),描述一组同质资料的平均水平。 总体均数: 样本均数: ; 2.频数表法:适用于样本量较大的计量资料。; 均数的应用: 均数适用于描述单峰对称分布,特别是正态或近似正态分布资料的集中趋势。 极端值(outlier) ;二、几何均数(geometric mean) 计算方法 1.直接法:适用于样本量较小的计量资料。 或 ;2.加权法:适用于样本量较大的计量资料,如频数表资料。 ;几何均数的应用注意事项 1)常用于等比资料或对数正态分布资料,如血清抗体滴度、细菌计数等。 2)观察值中若有0或负值,则不宜直接使用几何均数。 3)观察值一般不能同时有正值和负值。若全是负值,计算时可先将负号去掉,得出结果后再加上负号。;三、中位数与百分位数 1.中位数(median):是将一组观察值按大小顺序排列后,位次居中的观察值。 当 为奇数时 当 为偶数时 ;2.百分位数(percentage): 是指将观察值从小到大排列后处于第x百分位置上的数值,是位置指标。;中位数应用: 1.中位数可用于各种分布的资料。 2.中位数不受极端值的影响,因此,实际工作中主要用于: (1)偏态分布或不明确分布资料 (2)端点无确切值的资料 (3)有特大或特小值的资料 ; 第三节 离散趋势的描述;公式:R=Mix-Min 性质:R大(小) 变异度大(小) ;应用:适用于任何分布的计量资料 (端点无确切值者除外) 优点:简单明了,应用广泛,如用于说明传染病 、食物中毒等的最短、最长潜伏期等。 ;二、四分位数间距(quartile range) 记为Q, Q=Q3-Q1 Q 越大,说明数据的变异越大 应用:适用于任何分布的计量资料,计 算结果较稳定,尤其适用于大样本偏态分布资料。;三、方差与标准差 方差(variance):也称为均方差 (1)总体方差: (2)样本方差: 方差越大说明数据的变异越大;; 计算公式 (1)总体标准差: (2)样本标准差: 直接法: 或 ;应用:适合于正态分布或近似正态分布的资料。标准差与正态分布有明确的关系,它与均数结合能够完整地概括一个正态分布。 ;变异系数(coefficient of variation,简记为CV),又称为离散系数(coefficient of dispersion) 计算方法: ;; 第四节 正态分布;某地正常成年男子红细胞数的分布情况;;2.正态分布特点 正态分布密度函数曲线在横轴上方,以均数为中心左右对称,两端靠近X轴,但不与之相交。 正态分布曲线在横轴上方均数处最高。 正态分布有两个参数,即位置参数μ和变异参数σ 。; 当σ固定后,μ增大,曲线沿横轴向右移动。μ减小,曲线沿横轴向左移动。 当μ固定后,σ越大,曲线的形状越“矮胖”,表示数据分布越分散;σ越小,曲线的形状越“瘦高”, 表示数据分布越集中。;;;标准正态分布 简记为N(0,1);;;; 第五节 医学参考值范围 医学参考值 (reference value )也称正常值,指绝大多数正常人的人体形态、功能和代谢产物等各种生理、生化、免疫等各种指标常数。由于存在个体差异,常用正常值的波动范围来判定正常和异常。;1.正态分布法 应用:正态分布或近似正态分布 或经变量变换服从正态分布。 ;表2.5 参考值范围所对应的正态分布区间;2.百分位数法 应用:适用于任何分布,特别是偏

文档评论(0)

1亿VIP精品文档

相关文档