总体均数估计-sms
复习:总体与样本
总体(population):根据研究目的确定的同质观察单位的全体
样本(sample):从总体中随机抽取部分观察单位,其实测值的集合
为何要进行抽样研究?
对无限总体来讲是唯一可行的方法
对有限总体的也可节省人力和材料,增加研究工作的可行性
统计量
参数
读音
均数
μ
mu
标准差
S
σ
sigma
概率
P
π
pi
相关系数
r
ρ
rho
描述总体统计特征的指标—参数(Parameter)
描述样本统计特征的指标—统计量 (Statistic)
复习:参数与统计量
复习:抽样研究的目的
医学研究实际中多数情况采用抽样研究
例:考察某种药物治疗冠心病的疗效
冠心病患者
总体
冠心病
患者
样本
随机抽样
统计推断
复习:抽样误差 (Sampling Error)
产生原因:
存在个体差异和随机测量误差
样本只是总体的部分研究对象
概念:由个体差异和抽样造成的样本统计量与总体
参数的差异
表现形式:
样本统计量与总体参数间的差异 ( - ?; p - π )
样本统计量间的差异 ( - ; p1 -p2 )
复习:统计推断
统计推断
参数估计
假设检验
点估计
区间估计
统计推断:
样本统计量
总体参数
参数估计
抽样分布与标准误
Z分布与t分布
总体参数的估计
抽样分布
重复地从同一总体中随机抽取n例样本m次(通常假定m为无穷大),可获得m份样本,计算获得m个样本均数,m个样本均数的分布称为样本均数( )的抽样分布(sampling distribution)。
样本均数与其总体均数之间完全相同的可能性很小,为了测量样本均数与其总体均数之间的接近程度,抽样分布起了重要的作用,抽样分布是统计学推断的基础。
抽样误差
μ
同一总体中抽样
X 1
S1
X 2
S2
X i
Si
X n
Sn
μ,σ
抽样分布
抽样分布
t 分布
F 分布
卡方分布
The sample mean has a sampling distribution
Sampling batches of Scottish soldiers and taking chest measurements. Pop mean = 39.8 in, Pop sd = 2.05 in
Twelve samples of size 24
Cont’d
Histograms from 100,000 samples
Cont’d
抽样分布
抽样分布示意图
抽样误差的分布
理论上可以证明:若从正态总体 中,反复多次随机抽取样本含量固定为n 的样本,那么这些样本均数 也服从正态分布,即 的总体均数仍为 ,样本均数的标准差为
中心极限定理:
当样本含量很大的情况下,无论原始测量变量服从什么分布, 的抽样分布均近似正态
抽样分布
抽样分布示意图
中心极限定理(central limit theorem)
①从正态分布N(?,?2)总体中,以固定n 抽取样本,样本均数 的分布仍服从正态分布
②即使是从偏态分布总体抽样,只要n足够大,样本均数 的分布也近似正态分布
③样本均数 的总体均数仍为?,样本均数的标准差为:
为了与一般随机变量的标准差相区别,样本统计量(如 、p 、S)所对应的标准差习惯上称为标准误
如样本均数的标准差简称为均数的标准误(standard error of the mean,SEM)
标准误反映了抽样误差的大小,标准误大,抽样误差大;反之,抽样误差小。其大小与?成正比,与样本含量n的平方根成反比
样本均数的变异越小说明估计越精确,因此可以用标准误表示抽样误差的大小:
标准误(Standard Error)
实际中总体标准差 往往未知,可用样本标准差 S 作为?的估计值,计算标准误的估计值:
对计量资料,其计算公式为:
标准误(Standard Error)
均数的抽样误差
影响均数的抽样误差大小的两个因素:
总体内各个体间的变异程度
样本的含量n的大小
与样本量的关系:S 一定,n↑,标准误↓
例:在某地随机抽查成年男子140人,计算得红细胞均数4.77×1012/L,标准差0.38 ×1012/L ,试计算均数的标准误?
标准误(Standard Error)
根据中心极限定理,即使样本统计量所来自的总体不服从正态分布,当样本含量n足够大时,样本均数也近似地服从正态分布。可由公式作标准正态变换
如果样本均数 的分布服从一般正态分布
原创力文档

文档评论(0)