均数的抽样误差与t检验.pptVIP

  • 4
  • 0
  • 约3.45千字
  • 约 31页
  • 2020-02-16 发布于未知
  • 举报
第二节 均数的抽样误差与t检验 均数的抽样误差与t检验 (一)抽样误差 由抽样引起的样本统计量与总体参数间的差异。 (二)标准误 样本均数的标准差,用来衡量抽样误差的大小。 一、抽样误差与标准误 抽样误差(sampling error) :由于抽样所造成的样本统计量与总体参数的差别。 例: 测量全部2014年华信学院的大一男生的身高,获得全校大一男生平均身高为173.5cm,而从各院系随机抽取共400名大一男生进行身高测量,获得的平均身高为175.0cm 均数的抽样误差与t检验 一、抽样误差与标准误 抽样误差的特点 1.不可避免 2.有一定的规律 产生抽样误差的根本原因: 个体差异 均数的抽样误差与t检验 一、抽样误差与标准误 标准误(standard error):衡量抽样误差的大小,即样本均数的标准差。 标准差(standard deviation): 指总体中每一个变量与均值的差的平方和(又称为离均差平方和)的均数的平方根。记为σ 公式: 均数的抽样误差与t检验 一、抽样误差与标准误 根据定义获得的标准误公式为: 均数的抽样误差与t检验 一、抽样误差与标准误 数理统计研究结果证明:标准误的大小与总体标准差成正比,而与样本含量的平方根成反比。即: 均数的抽样误差与t检验 一、抽样误差与标准误 标准误的意义 总体标准差小,样本含量多时,标准误就小,表示样本均数与总体均数比较接近,用样本均数代表总体均数的可靠性就越大。 标准误和标准差是区别的,标准差用来描述个体间的变异程度,用 可以估计95%的正常值范围;而标准误是样本均数的标准差,用来描述抽样误差的大小,用( )估计总体均数95%可信区间。 一、均数的抽样误差与标准误 t分布曲线 一、均数的抽样误差与标准误 t分布为一簇单峰分布曲线,以0为中心,左右对称; t分布与自由度有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高; 自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度趋向无穷大时,t分布趋近标准正态分布,故标准正态分布是t分布的特例。 t分布的特征: 二、参数估计 (一)点估计:以样本统计量估计对应的总体参数。 (二)区间估计 二、参数估计 按一定的概率1- 确定的包含总体参数的一个范围,这个范围称作可信度为1- 的可信区间(confidence interval, CI ),又称置信区间。这种估计方法称为区间估计。 可信区间的涵义:如果重复若干次样本含量相同的抽样,每个样本均按同一方法构建100(1-)%可信区间,则在这些可信区间中,理论上有100(1-)个包含了总体参数,还有100个未估计到总体均数。 总体均数可信区间的计算方法: 1.t分布法 2. 正态近似法 二、参数估计 二、参数估计 (1) t分布法:当未知时,按t分布原理计算可信区间。总体均数的可信度为(1- )的可信区间定义为: (2)近似正态法:当已知或未知但样本含量较大时,例如n>100,按正态分布原理估计总体均数的可信区间。当未知时,相应的总体均数1-可信区间为: ( –z , +z ) 二、参数估计 例10-9 随机抽取某地25名正常成年男子,测得该样本的脉搏均数为73.6次/分,标准差为6.5次/分,求该地正常成年男子脉搏总体均数95%的可信区间。 本例自由度=25-1=24,经查表得t0.05,24=2.064,则: 例10-10 大规模调查表明健康成年男子血红蛋白的均数为136g/L,今随 机调查某单位食堂成年男性炊事员25名,测得血红蛋白均数为 121g/L,标准差为48.8g/L,试问该单位食堂成年男性炊事员 血红蛋白的均数与健康成年男子血红蛋白的均数有无差别? 本例中已知一个总体0= 136g/L,一个样本:n=25, =121g/L,s=48.8g/L。 现有的样本均数和总体均数不同,什么是造成其差的原因? 为识别原因,我们对其做假设检验。 四、t 检验 (一)建立假设 一是检验假设(hypothesis to be tested),亦称原假设或无效假设(null hypothesis),记为H0 ; 二是与H0相对立的备择假设(alternative hypothesis),记为H1 。 两者是互斥的,非此即彼。 H1:≠ 0。H0: = 0, (1)建立假设 该单位食堂成年男性炊事员血红蛋白的均数与健康成年男子血红蛋白的均数的差别是由抽样误差引起的。 该单位食堂成年男性炊事

文档评论(0)

1亿VIP精品文档

相关文档