- 1、本文档共80页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 2、估计总体成数时的样本容量 估计总体成数时样本容量的确定方法与估计总体均值一致,设 为允许误差,在的置信度下 ,样本容量为 重复抽样: 不重复抽样: * 注:确定样本容量时,无论是总体还是样本成数均是未知的,所以要用其它的替代。若历史资料有若干个可供选择的,应该选最靠近50%的。 ? * 例 在区间估计中,若抽样允许误差扩大到原来的2倍,样本容量会如何变化,为原来的多少? 若抽样允许误差减少到原来的1/2,样本容量会如何变化,为原来的多少? * 置信区间一览表 前提条件 目的 置信度的置信区间 正态总体 方差已知 (小样本) 估计总体 均值 正态总体 方差未知 (小样本) 估计总体 均值 总体分布未知,正态总体方差未知 (大样本) 估计总体 均值 ? * 前提条件 目的 1-?置信度的置信区间 正态总体 估计总体 方差 一个属性总体 大样本 估计总体 成数 * 7.4 其他抽样组织方式的抽样误差 在统计实务中,简单随机抽样并非是最好的抽样组织方式。比如一个总体中的单位差异很大时,可能我们的样本代表性会较低,所以必须更具不同的情况来组织抽样方式。 * 7.4.1 分层抽样(类型抽样) 首先将总体单位按某一个标志分层; 然后在各层按随机抽样的方法分别抽出各层的样本。 特点:分层抽样在层内是抽样调查,层间是全面调查,所以分层时应该尽量让每层内的变异程度小,而层间的变异程度大。分层抽样的抽样误差较简单随机抽样小,样本具有很好的代表性。 * 抽样平均误差的计算公式: 通常情况下,分层抽样的抽样平均误差小于简单随机抽样的平均误差)。 * 一般方法:比例分配法 考虑每层中的总体单位数,按比例在每层中抽出相同比例的样本,即 每层的样本容量 * 概念:首先将总体单位按某一标志排队, 然后计算抽样间隔距离K=N/n , 后在第一个抽样距离内确定抽样起点 r 最后抽取样本单位(或样本点)构成样本(按固定的间隔和排队顺序)。 关键:1)排队(选择排队标志,可与调查标志有关,也可与调查标志无关); 2)确定抽样起点(即第一个样本单位)。 至于抽样距离k,样本容量一旦确定,它也随之而定。 7.4.2 等距抽样(机械抽样或系统抽样 ) * (一)无关标志排队等距抽样 排队标志X:X1到XN由小到大排列, 调查标志Y:Y1到YN呈现为无序(随机)排列。 故抽样起点可随机确定,完全遵循了随机原则, 不会产生系统偏差 。 抽样误差的计算:通常是按简单随机抽样的抽样 误差公式近似计算的。即抽样效果近似简单随机抽 样。 注意:抽样间隔≠现象的周期长度×整数。否 则所抽取的样本有系统偏差。这种周期有时是比较 隐蔽的。如工人交接班时间、地块中农作物垅长、 社区住户调查中门牌号码(楼层)。 * (二)有关标志排队等距抽样 将总体单位按某一有关标志排队, 排队标志X:X1到XN由小到大排列, 调查标志Y:Y1到YN也大体上呈现为有序排列(当X与Y正相关时,Y大体上由小到大排列; Y大体上由大到小排列。) * 1.半距起点等距抽样(中心系统等距抽样) ——在第一个抽样距离中的一半为抽取起点 r。 1 k 2k 3k 4k 优点:样本代表性高。 特点:限制了抽样的随机性受到限制; 只能抽取一个样本。 抽样误差的计算:按分层抽样的抽样误差公式计算 * 2.对称等距抽样——中心系统等距抽样的改进方式 ————在第一个抽样距离内随机地确定抽样起点r (1≤r≤k); ————然后以组界(k、2k、…、(n-1)k]为对称点两两对称地抽取样本单位(或样本点)。 如下图所示(符号◇表示样本单位的位置): └─◇──┴──◇─┴─◇───┴───◇ ─┴─◇─── 1 k 2k 3k 4k 5k * 特点:样本有较好的代表性,同时又能保证抽样的随机性,根据排队结果可以抽出k个样本。 抽样误差的计
文档评论(0)