医学统计方法(二)复习要点.docxVIP

  • 7
  • 0
  • 约5.73千字
  • 约 6页
  • 2021-02-05 发布于天津
  • 举报
医学统计方法(二)复习要点 抽样研究的目的 就是通过样本的信息了解总体的情况。 个体是统计分析根据研究目的所确定的最基本的研究对象单位, 所以个体又称为观察单 位。 同质具有相同性质的观察单位称为 同质的,否则,称为异质的。 变量 就是观察指标。变量取值表示观察值 (或测量值)或对应的观察结果,亦称资料 (data)。资料分为计量资料和计数资料。 有些计数资料可以认为是分类资料: 分类资料又分 为有序分类和无序分类。 计量资料:亦称连续型资料。在测量精度无限制的情况下, 一个区间中的任意值都可以 是可能的观察值,并且通常计量资料含有测量单位。 无序分类资料:表示互不相容的类别或 属性。包括(a)二分类资料(b)多分类资料。显然X的取值仅是起指示分类的作用, 其数值大 小并无实际意义。无序分类资料的分析应先按类统计汇总, 统计每一类的观察单位数,并将 按类汇总的统计结果编制成表格形式的资料, 这种汇总后的资料又可称为 计数资料。有序分 类资料:资料不仅表示互不相容的类别而且表示各类在研究背景意义下的等级顺序, 因此具 有“半定量”意义。所以观察有序分类变量所得资料又称为等级资料。 有些观察指标,例如 白细胞计数,其取值虽然是离散的, 但不具有分类的性质, 因此通常把这类观察指标的资料 作为较为特殊的计量资料。 总体(population) 是根据研究目的确定同质个体的全体。 总体分为有限总体(finite population)禾口无限总体(infinite population) 。 样本 在一个较大范围的研究对象中随机抽出一部分个体进行观察或测量, 这些个体的 测量值构成的集合称为样本 (sample),样本中的个体总数称为样本量 (sample size)。 频率(frequency):考察某个可能的结果,若在 n次观察中,有 m次观察到这种可能的 结果,则称这种可能的结果发生的比例 f m为频率,m称为频数。显然有 0 f 1。频 n 率f是一个随机抽样观察的结果,因此频率 f呈一定的随机波动。 概率(probability) :概率刻画随机事件发生可能性大小,其取值界于 0和1之间。随 机事件发生的可能性越小,概率越接近 0;随机事件发生的可能性越大,概率越接近 1。特 别,不可能事件发生的概率等于 0,必然事件发生的概率等于 1。 概率与频率的关系:A是一个随机事件,进行了 n次随机试验,随机事件A发生了 m次, -趋向一则随机事件A发生的频率为fn ,当n 时,随机事件A发生的频率fn -趋向一 n 个常数,这个常数 就是随机事件 A发生的概率。记为 P(A)。 在统计学中,如果随机事件发生的概率小于或等于 0.05,则认为是一个 小概率事件, 表示该事件在大多数情况下不会发生,并且一般认为小概率事件在一次随机抽样中不会发 生,这就是小概率原理。小概率原理是统计推断的基础。 如果资料近似呈对称分布,则用 均数标准差 描述 如果资料呈偏态分布, 则用 中位数(P25 ―― P75)其中P25, P75为百分位数中的第 25%百 分位数和第75 %百分位数。 正态分布的两个参数 与,参数是正态总体的均数,它描述了正态分布的集中趋 越小,分布越集中,势位置。参数 是正态总体的标准差,它描述正态分布的离散程度, 越小,分布越集中, 2 越大,分布越离散。不同的 、不同的 ,对应于不同的正态分布。 通常用记号N(,) 表示均数为 ,标准差为 的正态分布。若 =0, =1的正态分布称为标准正态分布。记 为 N(0,1)。 0,标准差为 0,标准差为1。常用u或z表示标准 (2.19) N( , 2),则u就服从标准正态分布。 抽样误差(sampling error)。抽样误差是 抽样就必将导致抽样误差,即抽样误差 X u 被称为是标准化变换,因为若变量 X服从正态分布 样本均数与总体均数之间的差异被称为均数的 由个体变异和抽样引起的,因此,只要有个体变异, 是不可避免的。抽样误差有两种表现形式 ,其一是样本统计量与总体参数间的差异, 其二是 样本统计量间的差异。随着样本含量的增大,样本均数 X的频数图范围越来越窄。 样本均数的总体标准差= 资料X的总体标准差 。为了区分样本所在总体的标准差, Jn 通常称样本均数的标准差为 样本均数的标准误(简称均数标准误),记为 X。故样本均数与 个体资料所在的总体变异程度有如下规律: SX用样本标准差S估计总体标准差,利用上述公式得到均数标准误的估计式 为了叙述方便,常称 SX为标准误,称 x SX 小样本时,t统计量和U统计量的分布是有明显差别的,但在大样本时, t统计量和U 统计量的分布非常接近。t分布与正态分布的关系:自由度v较小时,t分布与标准正态分 布N(0,1)相差较大,并且

文档评论(0)

1亿VIP精品文档

相关文档