- 1、本文档共50页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Chap分层抽与样
4.1概述 1.分层抽样的定义 2.分层抽样的特点和适用场合 3.如何分层 4.记号 1.分层抽样的定义 定义1:总体分成互不重叠且穷尽的若干子总体,即每个单元必属于且仅属于一个子总体,称这样的子总体为层。 定义2:抽样在每一层中独立进行,总的样本由各层样本汇总构成,根据汇总样本对总体参数作出估计。这种抽样称为分层抽样,所得样本为分层样本。 定义3:每层按简单随机抽样进行的抽样,称为分层随机抽样,所得的样本为分层随机样本。 例1:全国经济调查可能的分层: 按调查对象所在的省分层,或所在地区分层(华东,华北,华南等),或按城市和农村分层; 调查对象是人,按照性别、年龄、职业、婚姻状况、文化程度及收入分层; 调查对象为企事业单位或行政单位的可按照部门、行业、所有制性质以及规模大小分层。 例2 :某省的公路交通运输量抽样调查分层: 按工具种类分类构成不同的层,对每类交通工具再按所属地市分为大层,每个地市内又可按照车辆的吨(客)位分为小层,又可按营业和非营业性分层。 2.分层抽样的特点和适用场合 可对层的参数进行估计 实施灵活方便,便于组织 分层样本在总体中的分布更为均匀,不会出现不平衡情况 能较大的提高调查的精度 3记号 设总体分为L层 第h层总体单元数: 总体单元数: 第h层总体指标量: 第h层样本量: 总的样本量: 第h层样本指标量: 第h层的抽样比: 总体 样本 第h层的层权: 第h层的均值: 第h层的总量: 第h层的方差: 总量: 均值 : 4.2简单估计及其性质 1.总体均值或总量的估计 证明: 推论1 分层随机抽样的总体均值 的简单估计为 其方差为 该方差的一个无偏估计为 推论2 分层随机抽样的总体总量Y 的简单估计为 其方差为 该方差的一个无偏估计为 【例1】 某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇23560户中抽取300户,在全部农村148420户中抽取250户(均按简单随机抽样进行),调查结果是城镇年平均户收入为15180元,标准差3972元;农村年平均收入9856元,标准差为2546元。求全市年平均户收入的估计及其90%的置信区间。 解:已知 故 按简单估计法,有 该估计的方差的无偏估计为 由 得 的90%置信区间为 即 2.总体比例的估计 总体 样本 第h层的具有特定 特征的单元数: Ah ah 第h层的比例 部分总量: 比例: 比例P的无偏估计为 该估计的方差为 此方差的无偏估计为 部分总量A的无偏估计为 该估计的方差为 此方差的无偏估计为 【例2】 为调查某个高血压高发病地区青少年与成年人高血压的患病率,对14岁以上的人分四个年龄组进行分层随机抽样,调查结果如下表所示。求总体高血压患病率P的估计及其标准差的估计。 解:根据分层随机抽样公式,P的估计量为: 为了估计 的方差,取 ,则 4.3样本量的分配 1.比例分配 2.考虑费用的最佳分配 3. 奈曼(Neyman)最优分配 【例3】(冯P79例4.3)某个总体分成三层,其层权Wh及层标准差Sh如下。设总样本量为300,考虑四种不同的样本量分配,并计算出每种分配下,总体均值估计量的方差。 自加权性质: 定义:一个估计总体均值或总和的估计量若可表达成样本观测值的总和或平均数的常数倍,称为自加权性。 总体均值的简单估计 相应的方差 其它估计情形 估计总体总量Y时 估计总体比例P时 估计总体部分总量A时 2.最优分配(考虑费用) 分层抽样的费用: 式中C0为基本调查费,Ch为在第h层调查一个样本单元的费用。 给定费用C使
文档评论(0)