网站大量收购独家精品文档,联系QQ:2885784924

第四章抽样误差区间估计.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章抽样误差区间估计

3个抽样实验结果图示 抽样实验小结 中心极限定理 central limit theorem t分布的特征 ①以0为中心,左右对称的单峰分布; ②t分布曲线是一簇曲线,其形态变化与自由度的大小有关。 自由度越小,则t值越分散,曲线越低平; 自由度逐渐增大时,t分布逐渐逼近Z分布(标准正态分布);当趋于∞时,t分布即为Z分布。 t分布曲线下面积(附表2) 例4-2 第四节 方差的抽样误差与可信区间 第五节 率的抽样误差与可信区间 一、 率的抽样误差与标准误 标准误的计算 二、 总体率的可信区间 2. 查表法 * * 第四军医大学卫生统计学教研室 * 医疗等本科班《医学统计学》 Dr. 宇传华 制作 第四章 抽样误差与区间估计 第一节 均数的抽样误差与标准误 100份样本的均数和标准差 将这100份样本的均数看成新变量值,按第二章的频数分布方法,得到这100个样本均数得直方图见图4-1。 图4-1 随机抽样所得100个样本均数的分布 100个样本均数的抽样分布特点: ① ② 100个样本均数中,各样本均数间存在差异,但各样本均数在总体均数周围波动。 ③样本均数的分布曲线为中间高,两边低,左右对称,近似服从正态分布。 ④样本均数的标准差明显变小: 即样本均数的标准差,可用于衡量抽样误差的大小。 因通常σ未知,计算标准误采用下式: 标准误(standard error, SE) 通过增加样本含量n来降低抽样误差。 表4-1计算了100个样本的标准差S,由此可计算每一样本的抽样误差大小。 均数的均数围绕总体均数上下波动。 均数的标准差即标准误 与总体标准差 相差一个常数的倍数,即 样本均数的标准误(Standard Error) =样本标准差/ 从正态总体N(m,s2)中抽取样本,获得均数的分布仍近似呈正态分布N(m,s2/n) 。 ①即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。 ②随着样本量的增大, 样本均数的变异范围也逐渐变窄。 第二节 t 分布(t-distribution) 随机变量X N(m,s2) 标准正态分布 N(0,12) Z变换 均数 标准正态分布 N(0,12) Student t分布 自由度:n-1 图4-2 不同自由度下的t 分布图 t 界值表 (P406,附表2) 1.812 2.228 -2.228 t f (t) ν=10的t分布图 双侧t0.05/2,9=2.262 =单侧t0.025,9 单侧t0.05,9=1.833 双侧t0.01/2,9=3.250 =单侧t0.005,9 单侧t0.01,9=2.821 双侧t0.05/2,∞=1.96 =单侧t0.025,∞ 单侧t0.05,∞ =1.64 总体均数的点估计(point estimation)与区间估计(interval estimation) 参数的估计 点估计:由样本统计量 直接估计 总体参数 区间估计:在一定可信度(Confidence level) 下,同时考虑抽样误差 第三节 总体均数的可信区间估计 按预先给定的概率(1??), 确定一个包含未知总体参数的范围。这一范围称为参数的可信区间或置信区间(confidence interval,CI) (1??)称为可信度或置信度(confidence level),常取95%。 置信区间通常两个数值即置信限(confidence limit,CL)构成, 较小的称为置信下限(lower limit,L), 较大的称为置信上限(upper limit,U), 一、置信区间的有关概念 二、总体均数置信区间的计算 s未知,且 n较小,按t分布 s已知,或s未知但n足够大,按Z分布 单一总体均数的置信区间 两总体均数的置信区间 (一)单一总体均数的置信区间 Z0.05/2=1.96 Z0.05=1.645 Z0.05/2=1.96 Z0.05=1.645 三、可信区间估计的优劣 ??一是可信度1??(准确度),愈接近1愈好,如99%的可信度比95%的可信度要好; 二是区间的宽度(精密度),区间愈窄愈好。当样本含量为定值时,上述两者互相矛盾。 在可信度确定的情况下,增加样本含量可减小区间宽度。 四、总体均数可信区间与参考值范围的区别 卡方界值见P407附表3 一、率的抽样误差与标准误 二、总体率的可信区间 样本率(p)和总体率(π)的差异称为率的抽样误差(sampl

文档评论(0)

woai118doc + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档