4抽样误差与样分布.ppt

4抽样误差与样分布

抽样误差与抽样分布;抽样误差;例4-1 样本量为9,从N(72.5,6.32)中共随机抽取10个样本;;;表4-2 样本量为25 从N(72.5,6.32)共随机抽取10个样本;;抽样误差;抽样误差;样本均数的规律性 随机的 在概率意义下是有规律的---抽样分布 通过大量重复抽样,借助频数表描述 样本均数的变异规律(抽样分布)与个体观察值变异规律有关 即使只有一个样本资料,也可由样本资料的个体观察值的变异规律间接得到样本均数的变异规律;正态总体样本均数的分布;抽样1;抽样2;抽样3;从正态分布的总体 中随机抽取样本含量为n的样本X1,X2,…,Xn,其样本均数 服从正态分布,总体均数为 ; 样本均数的总体标准差 若 ,则其中任意一个随机样本Xn的均数;样本均数的标准差 ,称为样本均数的标准误(standard error of mean ,SE),简称均数标准误 它反映样本均数之间的离散程度,也反映样本均数抽样误差的大小。 误差大小 ,实质是要估计 的分布特征 ;由于实际 往往未知,需要用样本 来估计 ,样本均数标准误的估计式为 注意区别: 证明:;非正态总体样本均数的分布;;;;;从非正态卡方分布总体中随机抽样所得样本均数 : 在样本含量较小时呈偏态 样本含量较大时接近正态分布 均数 始终在总体均数 附近 均数 的标准差 ;中心极限定理及其应用;中心极限定理及其应用; ;二、率的抽样误差和抽样分布 ;随机抽样试验,分别在总体率?=0.25,0.5,的总体中随机抽样,其总体率?和样本含量n 每种情况分别随机抽10000个样本,每个样本计算其样本率,把同一种情况的10000个样本率视为一个新的样本资料作频率图 ;抽样1;抽样1;抽样3;抽样4;;;结果 总体率?相同时,样本含量越大,样本率的分布越趋向对称。 样本含量n相同时,?越偏离0.5,样本率的分布越偏态分布。 总体率?=0.5时,任意样本含量的样本率都呈对称分布。 样本率p的样本标准差 。;中心极限定理及其推论;对于大量重复随机抽样而言,样本率p围绕着总体率 波动 样本含量n越大,这种波动越小。当n的值充分大时,p的分布就近似于均数为 ,标准差为 的正态分布。这里样本含量n “充分大”指 、 且n40。 当总体率?=0.5时,则样本率p的分布为对称分布 当样本含量n为定值时,总体率?越接近0.5,样本率p近似正态分布的程度就越好 ;STATA命令; t分布;如在正态总体N(168.18,62)中随机抽样,样本量分别取n =5,n =100,均抽10000个样本,分别计算t值和U值并作相应t的频数图 ; t分布;结果 小样本时,t统计量和U统计量的分布有明显差别 大样本时,t统计量和U统计量的分布非常接近。 频率密度图 当样本量较大时,统计量t的频率密度图与标准正态分布曲线非常接近 样本含量较小时,t统计量的峰值比标准正态分布的峰值略小,双侧尾部的值则较标准正态分布略大 ;英国统计学家W. S. Gosset(1908)设   并给出了统计量t的分布规律,并称统计量t的分布规律为t分布,自由度为v,记为t(v)分布。 每个自由度v对应一个分布,因此t分布是一簇分布 t分布仅与总体均数有关,与总体标准差无关 ;STATA命令;三条t分布密度曲线 ;t分布的图形特征;t分布的界值 ;

文档评论(0)

1亿VIP精品文档

相关文档