课件:雷静《卫生统计学》第二章 定量资料的统计描述二.pptVIP

  • 3
  • 0
  • 约2.18千字
  • 约 18页
  • 2019-03-08 发布于广东
  • 举报

课件:雷静《卫生统计学》第二章 定量资料的统计描述二.ppt

课件:雷静《卫生统计学》第二章 定量资料的统计描述二.ppt

定量资料的统计描述 之二 离散趋势的描述 衡量变异程度的常用指标: 极差、四分位间距、方差、标准差和变异系数 1.极差(range),R亦称全距 R = Xmax - Xmin 优点:简单明了 缺点:1)不能反映组内其他数据的变异度; 2)样本例数越多,极差可能越大 ∴ n1与n2 相差大时,不宜比较其极差; 3)即使样本例数不变,极差的抽样误差亦较大,即不够稳定。 2.四分位间距(quartile) 用Q表示: QL下四分位数即P25 , QU上四分位数即P75 ∴Q= QU - QL 可看成是中间一半观察值的极差 Q 较极差稳定,但仍未考虑到每个观察值 的变异度。 其它百分位间距: P95-P5、P90-P10、P80-P20 3.离均差平方和、方差、标准差 1)离均差平方和:Σ(X - )2 2)方差(variance) 总体方差: 样本方差: 4.标准差(standard deviation) 为了用原单位表示变异度,把方差开方 ——标准差 标准差越大,说明个体差异越大,则平均数的代表性就越差。 总体标准差 样本标准差 公式中n-1 为自由度,其意义是当 给定时,随机变量 X 能“自由”取值的个数 任何统计量的自由度 = n - 限制条件的个数 数学上可以证明: 所以,样本标准差的计算公式可写成: 直接法: 频率表法: n 5.变异系数(coefficient of variation)CV 亦称离散系数 极差、四分位间距和标准差都是有单位的,其单位与观察值单位相同;而变异系数是相对数,没有单位,更便于资料间的分析比较。 常用于: 比较度量衡单位不同的多组资料的变异度; 比较均数相差悬殊的多组资料的变异度。 定量资料的统计描述 之二 分布形态的描述 描述分布形态的指标:偏度系数、峰度系数 偏度系数(coefficient of skewness,SKEW) 意义:理论上,总体偏度系数为0时,分布是对称的;取正值时,分布为正偏峰,取负值时,分布为负偏峰。 峰度系数(coefficient of kurtosis,KURT) 意义:理论上,正态分布的总体峰度系数为0;取负值时,其分布较正态分布的峰平阔,取正值时,分布较正态峰尖峭。 小结 计量资料离散趋势的统计描述常用指标: 四分位间距常用于偏态分布资料离散趋势的描述 标准差用于对称分布尤其是正态分布 变异系数用于比较度量衡单位不同的多组资料的变异度;比较均数相差悬殊的多组资料的变异度。 例:某地40例中年健康男子血清总胆固醇值(mmol/L)测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.39 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 1)编制频数分布表并绘制直方图 2)估计其频数分布的类型 3)计算均数 、标准差S、变异系数CV 4)计算中位数M,并与 比较。 表2 某地40例健康成年男子血清胆固醇值的频数表 组段 划记 频数 2.70~ 1 3.20~ 4 3.70~ 4 4.20~ 10 4.70~ 9 5.20~ 6 5.70~ 3 6.20~ 2 6.70~ 0 7.20~7.70 1 合计

文档评论(0)

1亿VIP精品文档

相关文档