总体均数估计-sms.ppt

总体均数估计-sms

复习:总体与样本 总体(population):根据研究目的确定的同质观察单位的全体 样本(sample):从总体中随机抽取部分观察单位,其实测值的集合 为何要进行抽样研究? 对无限总体来讲是唯一可行的方法 对有限总体的也可节省人力和材料,增加研究工作的可行性 统计量 参数 读音 均数 μ mu 标准差 S σ sigma 概率 P π pi 相关系数 r ρ rho 描述总体统计特征的指标—参数(Parameter) 描述样本统计特征的指标—统计量 (Statistic) 复习:参数与统计量 复习:抽样研究的目的 医学研究实际中多数情况采用抽样研究 例:考察某种药物治疗冠心病的疗效 冠心病患者 总体 冠心病 患者 样本 随机抽样 统计推断 复习:抽样误差 (Sampling Error) 产生原因: 存在个体差异和随机测量误差 样本只是总体的部分研究对象 概念:由个体差异和抽样造成的样本统计量与总体 参数的差异 表现形式: 样本统计量与总体参数间的差异 ( - ?; p - π ) 样本统计量间的差异 ( - ; p1 -p2 ) 复习:统计推断 统计推断 参数估计 假设检验 点估计 区间估计 统计推断: 样本统计量 总体参数 参数估计 抽样分布与标准误 Z分布与t分布 总体参数的估计 抽样分布 重复地从同一总体中随机抽取n例样本m次(通常假定m为无穷大),可获得m份样本,计算获得m个样本均数,m个样本均数的分布称为样本均数( )的抽样分布(sampling distribution)。 样本均数与其总体均数之间完全相同的可能性很小,为了测量样本均数与其总体均数之间的接近程度,抽样分布起了重要的作用,抽样分布是统计学推断的基础。 抽样误差 μ 同一总体中抽样 X 1 S1 X 2 S2 X i Si X n Sn μ,σ 抽样分布 抽样分布 t 分布 F 分布 卡方分布 The sample mean has a sampling distribution Sampling batches of Scottish soldiers and taking chest measurements. Pop mean = 39.8 in, Pop sd = 2.05 in Twelve samples of size 24 Cont’d Histograms from 100,000 samples Cont’d 抽样分布 抽样分布示意图 抽样误差的分布 理论上可以证明:若从正态总体 中,反复多次随机抽取样本含量固定为n 的样本,那么这些样本均数 也服从正态分布,即 的总体均数仍为 ,样本均数的标准差为 中心极限定理: 当样本含量很大的情况下,无论原始测量变量服从什么分布, 的抽样分布均近似正态 抽样分布 抽样分布示意图 中心极限定理 (central limit theorem) ①从正态分布N(?,?2)总体中,以固定n 抽取样本,样本均数 的分布仍服从正态分布 ②即使是从偏态分布总体抽样,只要n足够大,样本均数 的分布也近似正态分布 ③样本均数 的总体均数仍为?,样本均数的标准差为: 为了与一般随机变量的标准差相区别,样本统计量(如 、p 、S)所对应的标准差习惯上称为标准误 如样本均数的标准差简称为均数的标准误(standard error of the mean,SEM) 标准误反映了抽样误差的大小,标准误大,抽样误差大;反之,抽样误差小。其大小与?成正比,与样本含量n的平方根成反比 样本均数的变异越小说明估计越精确,因此可以用标准误表示抽样误差的大小: 标准误(Standard Error) 实际中总体标准差 往往未知,可用样本标准差 S 作为?的估计值,计算标准误的估计值: 对计量资料,其计算公式为: 标准误(Standard Error) 均数的抽样误差 影响均数的抽样误差大小的两个因素: 总体内各个体间的变异程度 样本的含量n的大小 与样本量的关系:S 一定,n↑,标准误↓ 例:在某地随机抽查成年男子140人,计算得红细胞均数4.77×1012/L,标准差0.38 ×1012/L ,试计算均数的标准误? 标准误(Standard Error) 根据中心极限定理,即使样本统计量所来自的总体不服从正态分布,当样本含量n足够大时,样本均数也近似地服从正态分布。可由公式作标准正态变换 如果样本均数 的分布服从一般正态分布

文档评论(0)

1亿VIP精品文档

相关文档