抽样调查-2简单随机抽样.ppt

  1. 1、本文档共80页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Chap 2 简单随机抽样 §2.1 定义与符号 一、定义与符号 定义2.2:(在具体实施过程中,)从总体中逐个等概率抽取单元(每次抽取到尚未入样的任何一个单元的概率都相等),直到抽满 n个为止。如果每次抽中一个单元,然后放回总体,重新抽取。这样一个单元有可能被重复抽中,故又称重复抽样。 定义2.3 按照从总体的N个单元中抽取n个单元的所有可能不同的组合构造所有可能的 CNn 个样本,从CNn 个样本随机抽取一个样本,使每个样本被抽中的概率都等于 1/CNn. 1 y1,…yn同分布但不相互独立,其共同分布列为 §2.2 简单估计法(SE) 引理2.2从大小为N的总体中抽取一个样本容量为n的简单随机样本。若令: 证明(P35证法1对称证法): 说明:1 抽样调查中的估计量与传统数理统计中估计量的区别(见表2.5) 2 总体方差一般也是未知的,故计算估计量方差(估计)值时总是用样本方差直接去估计它,因为该估计无偏,故这样做相对是合理的。 3 对于无限总体的简单随机抽样(或有限总体有放回简单抽样)估计中由于N一般很大, 即从有限总体抽样得到简单随机样本均值得方差是从无限总体抽样得的独立样本均值的方差的1-f 倍,要小些,这意味着对同等样本量,不放回简单随机抽样的精度高于有放回的。 由于样本点不会重复,样本量相同时所包含的有效样本点更多,因此信息更多,效果当然好些。 1-f又被称为有限总体校正系数。 4样本容量n越大,估计量方差越小。当样本容量一定时,总体方差越大,估计量方差越大。由于总体方差是固定的,因此在简单随机抽样的条件下,要提高估计量精度就只有增加样本容量了。但增加样本容量也会带来计算量骤增和成本增加,所以是矛盾的一对,需要找到合适的平衡点。 证明:仍采用对称法(P40证法1)(1) (1)证法2: (构造性) (2) §2.3 比率估计量及其性质 一、概念与作用 (一)概念 比率(Ratio)与比例(Proportion)区别 (二)作用 另一种应用场合,虽然待估的参数是某个研究变量的均值或总体总量,它本来可以通过样本均值加以估计,但是为了提高估计的效率,它通过引进一个辅助变量xi ,来计算比率,即 二、应用条件 (一)定义 比率估计量(ratio estimator)又称比估计。 (二)比率估计的性质 例2.6 解: 解 例2.7(P51例2.4) 在二十世纪90年代初的一项工资研究中,人们发现IT行业中,从业者的现薪与起薪之间相关系数ρ高达0.88,已知某IT企业474名员工的评鉴起薪为17 016.00元/年,现根据对100个按简单随机抽样方式选出的员工现薪的调查结果,估计该企业员工的现薪平均水平。数据如下: 例2.8某县在对船舶月完成的货运量进行调查,对运管部门登记的船舶台帐进行整理后获得注册船舶2 860艘,载重吨位154 626 吨。从2 860艘船舶中抽取一个n=10的简单随机样本。调查得到样本船舶月完成的货运量及其载重吨位如表4.2(单位:吨)要估计该县船舶月完成货运量 解 (三)消除比率估计偏倚的方法 事实上: 例2.9 §2.4 回归估计量及其性质 比率估计成为最优线性估计的条件: (1)样本点(yi,xi)形成过原点的直线 (2)yi对直线的偏差与xi成比例 一、回归估计的定义 Q:“β0取何值时,回归估计量的精度最高,即最 小?” 定理2.11 例2.10 续例2.8 四、精度比较 (1)根据以往的经验数据 例2.7 某销售公司希望了解全部3000家客户对公司的满意度,决定用电话调查一个简单随机样本。这时销售公司希望以95%的把握保证客户满意度比例P在样本比例[p-10%,p+10%]范围内,但对总体比例P无法给出一个大致范围。这时调查多少个客户,才能保证满足要求? 事实上 二、设计效应(Design effect)(L.Kish) 通常的值因为总体方差未知而事先无法得知,此时需注意在经费允许的前提下,样本量取值应坚持保守原则,尽量大一点,以便留有余地。例如后续的分层抽样的deff1,而取为1. 实际上,我们在调查时无法保证在每个被抽中的样本点上都能如愿地获得有效信息。例如不是每个人都愿意接受访问,也不是每个人都能按要求提供真是答案,尤其当问题涉及隐私或其它敏感内容时,所以必须考虑有效回答率。如估计有效回答率为r,则需再调整样本量为n/r. 宏村 它的一个近似估计为: 1回归估计总优于简单估计,除非ρ=0 2比率估计优于简单估计的条件 3回归估计优于比率估计的条件是 五、多变量回归估计(略 ) §2.5 样本量的确定 一、总体均值情形 1

文档评论(0)

wuhuaiyu002 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档