2013医学统计学1.ppt.pptVIP

  • 20
  • 0
  • 约7.29千字
  • 约 68页
  • 2017-01-27 发布于天津
  • 举报
2013医学统计学1.ppt

2013.3.3 TYC SAS统计分析 教案 表2-2中的第(1)和第(2)栏构成频数表 。 三*、直方图(频率分布图) 频率分布图是频率分布表的直观表达,亦称直方图(histogram)。本例见图2-2。 频率密度 =频率/组距 四*、频率分布特征 频率分布有两个特征: ① 集中趋势(central tendency) ② 离散趋势(tendency of dispersion) 五*、频率分布类型 ① 对称分布 正态分布是最常用的对称分 布。医学上常见的有体温、身高、脉搏等的频数分布。 ② 偏态分布 即不对称分布。 偏态 正偏态(频数多集中在观察值较小的一侧) 负偏态(频数多集中在观察值较大的一侧) 下图为一正偏态的直方图。 六*、频率分布表(图)的用途 ① 揭示资料的分布特征和分布类型。 ② 便于发现某些特大或特小的可疑值。 第二节 描述平均水平的统计指标 平均数(average)是统计学中描述定量资料的集中趋势,反映资料的平均水平或集中位置的最常用、最重要的指标体系。常用的平均数有: 均数、几何均数和中位数。 ③ 便于进一步计算指标和统计分析。 一、算术均数 算术均数简称均数(arithmetic mean,简称mean)。总体均数用希腊字母μ表示,样本均数用 表示。适用于描述对称分布,尤其是正态分布或近似正态分布的数值变量资料的平均水平。 计算方法有: 1. 直接法 将所有观测值相加求和除以观测 值个数。公式为: 式中Σ是希腊字母,为求和符号。 公式(2-1) 例2-3 测得8只正常大鼠血清总酸性磷酸酶(TACP)含量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其算术均数。 代入公式(2-1)得: 2. 加权法 适合于频数分布表资料求均数。 公式为: 公式(2-2) 式中k是组段;fi为每组段的频数;Xi为每组段的组中值。组中值等于本组段的下限和上限相加除以2。i=1,2 … k 。 用加权法计算例2-1的均数见表2-3。 代入公式(2-2)得: 二、几何均数 几何均数(geometric mean)用G表示。适用于描述各观测值之间呈倍数关系(等比数列),或偏态分布资料的变量值经对数变换后呈正态分布(简称对数正态分布)资料的平均水平。 计算方法有: 1. 直接法 公式为: 式(2-4) 例2-5a 现有7份血清的抗体效价为:1:2、1:4、1:8、 1:32、 1:32、 1:64、 1:64 。求其平均效价。 式中lg-1表示lg 的反函数,即lg-1 =10x。 为简化计算,用抗体效价的倒数为X代入式(2-4)得: 式(2-3) 该7份血清的平均抗体效价为 1 : 16。 2. 加权法 适合于有较多观测值或频率分布 表资料。公式为: 式(2-5) 式中X是观测值或组中值。 例2-6a 某地60人的血清抗体效价,分别为:7人1:5,11人1:10,22人1:20,12人1:40,8人1:80,见表2-6a的(1)、(2)栏,求其平均抗体效价。 代入式(2-5)得: 60人的平均抗体效价为 1 : 20.706。 三、中位数与百分位数 中位数(median)用M表示。一组观测值从小到大顺序排列,位次居中的观测值即为中位数。适用于各种资料,但常用于描述①偏态分布②分布不清③有特大、特小值④端点无确定数值的资料的集中位置。 计算方法有: 1. 直接法 适合例数较少的资料。先将所有 观测值从小到大排序,当例数为奇数时,居中的 观测值即为中位数;当例数为偶数时,居中的两 个观测值相加除以2即为中位数。公式为: n为奇数时 n为偶数时 式(2-6) 式(2-7) 式中下标为排序后的观测值的位次。 例2-7a 某传染病患者9例,他们的潜伏期分别为:6、5、 4、7、 12、 4、5、7、9天 。求中位数。 首先排序:4、4、5、5、6、7、7、9、12 位次: 1 2 3 4 5 6 7 8 9 本例n=9为奇数,故M=6天。 用式(2-6), 例2-7b 若例10.5增加潜伏期为20天的一例 。求中位数。 首先排序:4、4、5、5、6、7、7、9、12、20 位次: 1 2 3

文档评论(0)

1亿VIP精品文档

相关文档