整群抽样的样本量设计效应-中国传媒大学.PPT

整群抽样的样本量设计效应-中国传媒大学.PPT

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
新闻统计学 中国传媒大学调查统计研究所 Survey Statistics Institute of CUC 抽样原理与方法 中国传媒大学调查统计研究所 Survey Statistics Institute of CUC 抽样设计的几个基本概念 样本量的确定 非常简单随机抽样最小样本量 462 267 189 6% 340 196 139 7% 666 384 272 5% 1040 600 425 4% 1846 1067 756 3% 4160 2401 1702 2% 16641 9604 6806 1% 99% 95% 90% 置信度 最大容许误差 如果估计的比例P很小的话,为保证精度,最好采用最大允许相对误差公式来计算所需的样本量. 置信度95%下,最小样本量 384 864 3457 13830 10% 43 811 4225 30% 96 1852 9508 20% 384 7299 38032 10% 1537 29196 152127 5% 50% 5% 1% 置信度95% 最大容许相对误差 最常用、最简单的方法、有放回的 按与抽样单元大小成比例的概率来抽取 PPS 抽样—Sampling with Probability Proportional to Sizes 按研究目的,事先人为规定的度量标准,可以是人数、总营业额、等级等 抽样调查的组织形式 简单随机抽样 分层抽样 整群抽样 多级抽样 二项抽样 混合抽样 系统抽样等距抽样 简单随机抽样的优缺点 优点: 是最基本的抽样方法 最符合随机原则 抽样误差容易计算 复杂抽样设计的基础 衡量其它抽样方法的标准 缺点: 对所有单元编号,十分复杂,有时不可行 所抽取的单元可能十分分散,实施困难 没有利用有关总体的一些已知信息,可能不是最有效的 本科生 50% 专科生 30% 研究生 20% 总体 N=10000 专科生 n1=3000 本科生 n2=5000 研究生 n3=2000 抽样 样本n=1000 分层 专科生 n1=300 本科生 n2=500 研究生 n3=200 样本1000人 分层抽样模拟 分层原则:层内差异小,层间差异大 分层抽样 霍林希德社会地位指数(ISP) 7 无技能工人 6 操作工人、半技术性工人 5 技术性手工工人 4 职员、销售员、技术员、小业主 3 行政人员、小型企业业主、一般专业人员 2 业务经理、中型企业业主、次要专业人员 1 大企业高级主管、大企业业主、重要专业人员 得分 职业名称 职业等级(权重为7) 霍林希德社会地位指数(ISP) 7 上学少于7年 6 上学7-9年 5 上学10-11年 4 高中毕业 3 1-3年专科 2 四年制大学本科(文、理、工学学士) 1 专业人员(文、理、工学方面硕士、博士) 得分 学历 教育等级(权重为4) 霍林希德社会地位指数(ISP) 64-77 下层 48-63 中下层 32-47 中层 18-31 上中层 11-17 上层 分数 社会地位 社会地位得分=职业份*7+教育分*4 地位等级体系 分层抽样的优点 子总体内的抽样单元之间差异比较小,子样本具有较好的均匀性,可能得到较高精度的估计量 有效消除特殊个体的影响 可对各层的特性加以比较 实施管理方便 分层抽样的分层指标 人口状况:性别、年龄、种族、文化程度等 生活方式:媒介接触行为、运动偏好、娱乐类型 消费者类型 单位规模 行业类型 整群抽样 先把总体划分成R个群,然后以群为初级抽样单元,从中随机地抽取r个群,对抽中的群内的所有单元都进行调查。 整群抽样的特点 在调查组织工作方面方便 抽样误差比较大 抽样原则: 为提高精度要尽可能扩大群内的差异, 而缩小群间的差异。 整群抽样的样本量 设计效应:2 例:中央电视台的北京地区观众调查网 要求置信度90%,误差不超过3%,按照简单随机抽 样所需最小样本含量:756人。 采用整群抽样,取设计效应为2,并以调查卡回收率 95%作为修正系数,因此求得样本规模为: 756*2/95%=1591.6 北京地区每户4岁以上人员平均为3.2人,因此实际 抽样时是抽取 1600/3.2=500户 多级抽样 把整个抽样过程分成几个阶段完成。 在大规模的社会调查中应用广泛。 一般分为三、四个阶段。 三种抽样技术的比较 减少一级单元之间的差异,尽量多抽取一级单元 介于整群抽样和SRS之间 抽取部分 抽取部分 二级抽样 缩小群间差

文档评论(0)

jinzhuang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档