第三章 分层随机抽样.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 80~90 3453 83.10235 2284.106 90~100 4256 92.2605 2376.366 100~150 1246 111.6244 2487.99 150~200 800 89.44272 2577.433 200~250 365 60.41523 2637.848 250~300 90 30 2667.848 300~350 35 18.70829 2686.557 350~400 5 7.071068 2693.628 400~450 12 10.95445 2704.582 450以上 7 8.3666 2712.949 * * 最终累计频数是2712.949,如果取层数为4,则应每隔 分一层.因此应该使得累 计 最接近678.237, 1356.474, 2034.712,即较  合理的分层是: * * 二  层数的确定 层数的增加能提高估计的精度,但当层数增加到一定的时候,在精度上的收益将很小;若样本量n已确定,由于每层至少必须抽取一个样本单元,因此最多的层数为n,如果要给出估计量方差的无偏估计,则每层至少2个样本单元,那么层数不能超过n/2。 分层时应考虑:   1.分层考虑精度的要求。 一般以目标量 作为分层指标,但 未知,一般 通过与高度相关的辅助指标 来进行。根据研究,除非Y与X的相关系数 ,层数一般不超过6为宜。    2.分层考虑费用。 * * 三. 事后分层 或抽样后分层 前面讨论的分层抽样是建立在抽样之前总体已经分好层,但有时这种事先分层会遇到较大困难,而我们又很想利用分层抽样的优势之处,此时可以采用事后分层的方法。 适用情况: 没有层的抽样框,或总体特别大来不及事先分层,或几个变量都适合于分层。或 存在极大 小 值。 条件: 需知各层的大小 或层权 。 不适合:层权与实际情况相差很大 层权 :用近似层权进行校正或重新抽样 * * ,则用估计量 来替代 先抽取一个样本量n的简单随机样本,然后将样 本按某个特征进行分层,落到第h层的单元数为 样本均值 。式中 * * 当  固定且都大于零的条件下,落到各层的样本可以看成是独立地从各层中抽取的简单随机样本,这时,事后分层估计量 的方差为: 式中, * * 事后分层的合理性, 即认为既然简单随机样本是总体的一个惟妙惟肖地刻画,那么按样本特征所聚的类恰好反映了总体的某一特色部分的层,而样本的各层恰好可认为是来自总体相应层的简单随机样本。 * * 理论上,只要n充分大,事后分层估计量 是无偏估计,且它的方差有如下性质: 由上式可以看出,第一项就是按比例分配分层抽样估计量的方差,第二项表示因事后分层而非事先按比例分配分层引起的方差增加量。 * * 如果样本是按某一个辅助指标分层后抽取的,只要这个事先分层抽样是严格按比例分配进行的,则这个样本是自加权的,总体中每个单元被抽中的概率相同,可以将这个样本看做简单随机样本,分别对其它指标进行事后分层估计。 * * 【例3.10】p59 某高校欲了解在校学生用于课外进修 如各种考证辅导班等 的开支,在全校8000名学生中抽取了一个200人的简单随机样本.根据学生科的统计,本科生人数为全校学生的70%,调查最近一个学期课外进修支出的结果如下: * * 在校学生课外进修开支调查结果 试估计全校学生用于课外进修的平均开支. 解: 全校学生用于课外进修的平均开支为: 层 h 层权 样本量 样本均值 样本标准差 本科生 0.7 120 253.4 231.00 研究生 0.3 80 329.4 367.00 合计 1 200 283.8 294.57 * * 估计的方差: * * 估计的标准差: 如果采用简单估计,则估计的方差为: 估计的标准差为: 估计的标准差: * * 【例3.11】某地对载货汽车进行抽样调查,调查目标量是当月该地发生的总运量和总周转量。对全地区N 19730辆货车抽取一个n 178辆车的简单随机样本。由于单车产量(运量和周转量)均与车核定标识吨x位密切线型相关,因此为提高精度可对样本车辆进行事后分层,分层指标值如下: * * 层号 标识吨位(吨) 1 X 2 2 3 4 5 * * 而事后分层数据如下: 货车简单随机抽样的事后分层数据 h Nh Wh nh 1 5297 0.2685 45 102.2 2952.8 7976 3.978 2 4157 0.2107 37 235.5 9326.4 28787 46.936 3 6861 0.3477 69 315.4 12500.7 45450 92.163 4 2855 0.1447 23 480.7 19750.0 84518 144.869

文档评论(0)

光光文挡 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档