- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学抽样推断第三四节11.30
第三节 抽样估计 参数估计在统计方法中的地位 统计推断的过程 概念:估计量与估计值 (estimator estimated value) 估计量:用于估计总体参数的随机变量 如样本均值,样本比例、样本方差等 例如: 样本均值就是总体均值? 的一个估计量 参数用? 表示,估计量用 表示 估计值:估计参数时计算出来的统计量的具体值 如果样本均值 ?x =80,则80就是?的估计值 (二)评价估计量的标准 1.无偏性:估计量抽样分布的数学期望等于被 估计的总体参数 2.有效性 (efficiency) 3.一致性 (consistency) 一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数 二 区间估计 (interval estimate) 在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示 置信水平 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 表示为 (1 - ???? ??为是总体参数未在区间内的比例? 常用的置信水平值有 99%, 95%, 90% 相应的 ??为0.01,0.05,0.10 置信区间 (confidence interval) 由样本统计量所构造的总体参数的估计区间称为置信区间 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值 我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个 置信区间与置信水平 影响区间宽度的因素 1. 总体数据的离散程度,用 ? 来测度 样本容量, 3. 置信水平 (1 - ?),影响 z 的大小 (一)总体均值的区间估计 (任何总体、大样本或正态总体、小样本、?2已知) 总体均值的区间估计(大样本) 1. 假定条件 总体服从正态分布,且方差(?2) 已知 如果不是正态分布,可由正态分布来近似 (n ? 30) 使用正态分布统计量Z 总体均值的区间估计(例题分析) 总体均值的区间估计 (例题分析) 总体均值的区间估计 (例题分析) (二)总体均值的区间估计 (正态总体、小样本、 ?2未知) 总体均值的区间估计 (小样本) 1. 假定条件 总体服从正态分布,且方差(?2) 未知 小样本 (n 30) 使用 t 分布统计量 t 分布 总体均值的区间估计(例题分析) 总体均值的区间估计(例题分析) (二)总体成数的区间估计 1. 假定条件 总体服从二项分布 可以由正态分布来近似 使用正态分布统计量Z 总体成数的区间估计(例题分析) 一、估计总体均值时样本容量的确定 估计总体均值时样本容量n为 样本容量n与总体方差?2、允许误差E、可靠性系数Z或t之间的关系为 与总体方差成正比 与边际误差成反比 与可靠性系数成正比 二、估计总体成数时样本容量的确定 根据比例区间估计公式可得样本容量n为 确定样本容量时注意的问题 1.前所计算的样本容量是最低的,也是最必要的 2. ?2 , P(1-P)往往未知,可用以下代替: 用历史资料的?,或P代替,注意选择? 或P(1-P)(标准差)大的; 试验抽样资料,从中选择选择? 或P(1-P)大的; 成数方差缺乏时,可用最大值0.5代替P 3.如果对同一总体,需要同时进行两个或两个以上特征值估计,可得出两个样本容量,需选大的 4.计算出的样本容量取整数 例:某市开展职工家计调查,根据历史资料,该市职工家庭平均每人年收入的标准差为250元,而家庭消费的恩格尔系数为65%,现用重复抽样的方法要求在95.45%的保证下,平均人均收入的极限误差不超过20元,恩格尔系数的极限误差不超过4%,计算此次抽样的必要样本容量。 第四节 样本容量的确定 估计总体均值时样本容量的确定 估计总体比例时样本容量的确定 其中: 【例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为400元,应抽取多大的样本容量? 解: 已知? =2000,E=400, 1-?=95%, z?/2=1.96 置信度为90%的样本容量为 即应抽取97人作为样本 E的取值一般小于0.1 P未知时,可取最大值0.5 其中: 【例】根据以往的生产统计,某种产品的合格率约为90%,现要求
原创力文档


文档评论(0)