第二讲 定量资料统计描述、正态分布 ;第一节 频数分布;;;三、频数分布表和频数分布图用途
1.描述频数分布类型:
对称分布:集中位置在中间。左右两侧频数基本对称。
偏态分布:右偏态分布和左偏态分布
2.描述频数分布的特征:集中趋势和离散趋势
3.便于发现资料中的特大或特小的离群值
4.便于进一步的分析和处理
;第二节 集中趋势描述;一、算术均数
算术均数简称均数(mean),描述一组同质资料的平均水平。
总体均数: 样本均数:
; 2.频数表法:适用于样本量较大的计量资料。;
均数的应用:
均数适用于描述单峰对称分布,特别是正态或近似正态分布资料的集中趋势。
极端值(outlier)
;二、几何均数(geometric mean)
计算方法
1.直接法:适用于样本量较小的计量资料。
或
;2.加权法:适用于样本量较大的计量资料,如频数表资料。
;几何均数的应用注意事项
1)常用于等比资料或对数正态分布资料,如血清抗体滴度、细菌计数等。
2)观察值中若有0或负值,则不宜直接使用几何均数。
3)观察值一般不能同时有正值和负值。若全是负值,计算时可先将负号去掉,得出结果后再加上负号。;三、中位数与百分位数
1.中位数(median):是将一组观察值按大小顺序排列后,位次居中的观察值。
当 为奇数时
当 为偶数时
;2.百分位数(percentage):
是指将观察值从小到大排列后处于第x百分位置上的数值,是位置指标。;中位数应用:
1.中位数可用于各种分布的资料。
2.中位数不受极端值的影响,因此,实际工作中主要用于:
(1)偏态分布或不明确分布资料
(2)端点无确切值的资料
(3)有特大或特小值的资料 ; 第三节 离散趋势的描述;公式:R=Mix-Min
性质:R大(小) 变异度大(小)
;应用:适用于任何分布的计量资料
(端点无确切值者除外)
优点:简单明了,应用广泛,如用于说明传染病 、食物中毒等的最短、最长潜伏期等。
;二、四分位数间距(quartile range)
记为Q, Q=Q3-Q1
Q 越大,说明数据的变异越大
应用:适用于任何分布的计量资料,计 算结果较稳定,尤其适用于大样本偏态分布资料。;三、方差与标准差
方差(variance):也称为均方差
(1)总体方差:
(2)样本方差:
方差越大说明数据的变异越大;; 计算公式
(1)总体标准差:
(2)样本标准差:
直接法:
或
;应用:适合于正态分布或近似正态分布的资料。标准差与正态分布有明确的关系,它与均数结合能够完整地概括一个正态分布。
;变异系数(coefficient of variation,简记为CV),又称为离散系数(coefficient of dispersion)
计算方法:
;; 第四节 正态分布;某地正常成年男子红细胞数的分布情况;;2.正态分布特点
正态分布密度函数曲线在横轴上方,以均数为中心左右对称,两端靠近X轴,但不与之相交。
正态分布曲线在横轴上方均数处最高。
正态分布有两个参数,即位置参数μ和变异参数σ 。; 当σ固定后,μ增大,曲线沿横轴向右移动。μ减小,曲线沿横轴向左移动。
当μ固定后,σ越大,曲线的形状越“矮胖”,表示数据分布越分散;σ越小,曲线的形状越“瘦高”, 表示数据分布越集中。;;;标准正态分布 简记为N(0,1);;;; 第五节 医学参考值范围
医学参考值 (reference value )也称正常值,指绝大多数正常人的人体形态、功能和代谢产物等各种生理、生化、免疫等各种指标常数。由于存在个体差异,常用正常值的波动范围来判定正常和异常。;1.正态分布法
应用:正态分布或近似正态分布
或经变量变换服从正态分布。 ;表2.5 参考值范围所对应的正态分布区间;2.百分位数法
应用:适用于任何分布,特别是偏
原创力文档

文档评论(0)