- 1、本文档共114页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3.精度要求以 的相对误差限r(在给定的置信水平1-α下)的形式给出 * * * * 例3.7 * * * * * * * * 二、总费用给定时总样本量的确定 给定V时 * * 给定C时 * * 第七节 分层抽样的其他方面 一、多重分层 定义 当调查指标ψ与两个或多个辅助变量x1,x2,…都存在相关关系时,为了提高分层的效益,需要按每一个辅助变量进行分层,通常的做法是先按最主要的变量分成大层,在大层中再按第二主要变量分成子层,从而形成交叉分层。当存在多个分层变量时,这种分层方式即称为多重分层(multiple stratification)。 对于多重分层,当“子层”划分好以后,就要考虑样本量在各子层的分配问题。最简单常用的样本量分配方法是按照与每一子层大小成比例的原则进行分配。 在多重分层中,有时会出现这样一个问题:当总样本量n相对于子层总数RC不够大时,会出现某些子层分配不到样本的情况。 若nmax (R,C),则此时应当考虑重新确定分层变量或者不采用分层抽样,否则这种分层的效益是很难保证的。 若nRC,同时还满足n≥max (R,C),就可以考虑用试验设计的思想来进行样本量的分配。 * * * * 二、事后分层 实际工作中,有时进行事先分层会存在一定的困难 各层的抽样框无法得到 几个变量都适合于分层,要进行事先的交叉分层比较困难,并且我们并不需要交叉分层后每个子层的估计(如需要按年龄分层的结果,还需要按受教育程度分层的结果,但并不需要这两个指标的交叉结果) 一个单位到底属于哪一层要等到样本数据收集到以后才知道 总体规模N太大,事先分层太费事等 事后分层技术要求层权Wh已知或者可以通过某种途径获得,当层权Wh未知而需要进行估计时,应当确保层权的估计值与实际的层权相差甚小,否则将达不到提高估计量精度的目的。 同时,在使用事后分层技术时还应该注意“事后层”的数目不宜太多。 * * 事后分层的具体实施办法 * * * * * * 简单随机样本n,事后分层落到第h层的样本量nh nh固定并都大于0的条件下 n足够大时,为无偏估计 * * 第一项就是按比例分配分层抽样估计量的方差,第二项表示因事后分层而非事先按比例分配分层引起的方差增加量 只要样本量足够大,事后分层的精度与按比例分配事先分层的精度相当 * * 如果样本是按某一个辅助指标分层后抽取的,只要这个事先分层抽样是严格按比例分配进行的,则这个样本是自加权的,总体中每个单元被抽中的概率相同,我们可以将这个样本看作简单随机样本,分别对其它指标进行事后分层估计。 * 例3.7 某高校欲了解在校学生用于课外进修(如各种考证辅导班、外语辅导班等)的开支,在全校8000名学生中抽出了一个200人的简单随机样本,根据学生科的统计,本科生人数为全校学生的70%,调查最近一个学期课外进修支出(元)的结果如下: * 试估计全校学生用于课外进修的平均开支。 层 层权 样本量 样本均值 样本标准差 本科生 0.7 120 253.4 231.00 研究生 0.3 80 329.4 367.00 合计 1 200 283.8 294.57 * 解:全校学生用于课外进修的平均开支为: (元) 估计的方差为: =381.83 估计的标准差为: 19.54(元) 如果采用简单估计,则估计的方差为: 估计的标准差为: 20.57(元) 选择估计方法,大致需遵循的原则 在选择估计方法时,大致需遵循下面的原则: (1)由于分别估计(无论是分别比估计还是分别回归估计)要求各层的样本量都比较大,所以当某些层的样本量不够大时,建议采用联合估计 (2)当回归系数需要由样本进行估计时,回归估计量是有偏的,尤其当样本量较小的时候,回归估计量的偏倚可能会更大,从而导致均方误差增大,因此在这种情况下,采取比估计尤其是联合比估计也许更保险 (3)如果各层的样本量都比较大,同时每层的比估计或回归估计也比较有效(即ρh均比较大),而且各层的Rh之间(或βh之间)差异较大,则此时分别估计优于联合估计,估计量的方差更小 (4) 如果各层的样本量不大,而且各层的Rh之间(或βh之间)差异较小,则采用联合估计较为适宜 (5) 如果各层的Rh之间(或βh之间)差别不是太大,而且并不是每层的样本量都相当大,则联合估计可能更保险一些 如果各层的回归系数都接近于1,则可以采用差估计。虽然有时差估计量的方差偏大,但由于它为无偏估计量,所以总的均方误差不一定大。 * * 第五节 各层样本量的分配 确定样本量:总的样本量,各层样本量 估计量的
您可能关注的文档
- 第三章 第二节 几种重要金属化合物第三章 第二节 几种重要的金属化合物第三章 第二节 几种重要的金属化合物第三章 第二节 几种重要的金属化合物.ppt
- 第三章 典型机械设备电气控系统分析第三章 典型机械设备电气控制系统分析第三章 典型机械设备电气控制系统分析第三章 典型机械设备电气控制系统分析.ppt
- 第三章 地震工程地质研究第章 地震工程地质研究第三章 地震工程地质研究第三章 地震工程地质研究.ppt
- 第三章 电子商务资金流第三 电子商务资金流第三章 电子商务资金流第三章 电子商务资金流.ppt
- 第三章 非线性方程(组)的值解法第三章 非线性方程(组)的数值解法第三章 非线性方程(组)的数值解法第三章 非线性方程(组)的数值解法.doc
- 第三章 第二节 3 上肢骨结和主要肌群第三章 第二节 3 上肢骨连结和主要肌群第三章 第二节 3 上肢骨连结和主要肌群第三章 第二节 3 上肢骨连结和主要肌群.ppt
- 第三章 分组密码des第三 分组密码des第三章 分组密码des第三章 分组密码des.ppt
- 第三章 电源系统第三章 电系统源系统.ppt
- 第三章 行业分析第三章 行分析业分析.ppt
- 第三章 电气控制线路设计董三章 电气控制线路设计董第三章 电气控制线路设计董第三章 电气控制线路设计董.ppt
文档评论(0)