- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八次中国公民科学素养调查抽样与数据加权QQ:126998647 主要内容 一、追加抽样设计 二、权数的计算 三、追加后的估计 四、几个问题的说明 调查目的 通过追加抽样调查,来了解并推估各省(直辖市、自治区)18-69岁的人口在科学素养方面的有关情况。 调查对象 各个需进行样本追加省(直辖市、自治区)内的18-69岁的公民(不含现役军人、智力障碍者)。 一、追加抽样设计 追加抽样设计原则 以各省级单位为子总体,进行独立的追加抽样设计。 各省的追加抽样设计应与全国的抽样设计保持一致,采用三阶段抽样设计。 追加后的省级样本由两部分构成: 落入本省内的全国原有样本 本省独立的追加样本 在95%的置信度下,估计省级子总体比例参数,抽样绝对误差不超过3%。 追加抽样设计思路 可以采取以下两种方式对各省级单位进行样本追加: 1、通过增加各省级单位内全国抽样设计落入的末级抽样单元抽取的数量; 2、通过在各省级单位内追加一部分初级抽样单元的数量。 本次追加采用以上两种追加思路。 最终追加的样本量是69360. 各省级单位 全国抽样设 计样本 末级抽样单元 住户数翻倍 追加样本1 追加新的初级 抽样单元 排除入选全国样本 的初级抽样单元 追加样本2 二、权数的计算 抽样后如何用样本推断总体? 为了从调查得到的样本数据中得到全国目标量的无偏或近似无偏的估计,需要利用每个样本单元的调查值乘以该单元的权数,因而权数的确定是对目标量进行估计中的一个重要问题。 权数的确定 权数包含初始权数和最终权数。 (1)初始权数的确定 初始权数为样本单元入样概率的倒数。表示一个样本单元代表的总体单元数。 (2)最终权数的确定 复杂的调查过程中经常会出现样本结构与总体结构不一致的情况。对调查的样本结构进行有效的加权调整。 加权调整的必要性 大规模调查中调查样本与总体经常存在结构性偏差。产生结构性偏差的原因很多,主要原因有: (1)调查前不能进行或来不及事先分层,使得在影响目标量的主要辅助变量上,调查后样本结构与总体结构存在偏差。 (2)进行分层多阶段抽样设计时,划分总体的分类指标很多,但由于条件的限制,往往不能完全考虑这些分类指标。比如分层考虑了最主要的指标地区、城乡,没有考虑同样与调查目标量高度相关的年龄、文化程度等因素。 (3)大规模的调查涉及调查单位和人员广泛,层层监督和控制难度加大。 (4)大规模抽样调查后期对大量数据的处理会对样本结构产生影响。如调查中无回答产生的问卷失效率较高,剔除失效问卷往往会产生结构性偏差。 例如: 总体 男性 女性 具备 250 250 500(25%) 不具备 750 750 1500(75%) 1000(50%) 1000(50%) 样本 男性 女性 具备 40 5 45(22.5%) 不具备 120 35 155 (77.5%) 160(80%) 40(20%) 此外还有民族、文化程度、城乡、年龄等因素。 若在与调查目标量高度相关的指标上,调查的样本结构与总体结构有较大的偏差,直接利用调查样本的初始权数进行估计势必影响目标估计量的估计精度。 在这种情况下,要想较为准确地推断出总体的有关信息,提高估计的精度,就必须对调查的样本结构进行加权调整。 如何调整权数? 通常采用基于多变量辅助信息、事后分层、非线性口径等校准加权方法对样本结构进行加权调整,以减少样本结构与总体结构的差异性,达到减小抽样方差和偏差,提高估计精度的目的。 三、追加后的估计 为该省全国样本和追加样本的目标参数的总量估计; 为该省全国样本的目标参数的总量估计; 为该省追加样本的目标参数的总量估计。 四、几个问题的说明 1、为什么有些县有样本,而有些县没有落入样本? 由抽样的随机性本身决定。 2、为什么不能进行县域的估计? 样本追加方案设计是以省为总体设计,因此追加后的样本仅对省级层面具有代表性,目的是为了进行省级推断。落入各区县的样本对各个区县不具代表性,且样本量过小,进行县域一级的估计会产生较大的误差,与真实情况产生偏离。 3、调查样本量是怎么确定的?为什么有些人群的计算结果不能呈现? 调查样本量是根据抽样技术原理计算得到的,以估计简单随机抽样总体比例P时的样本量为基础。样本量的计算公式为: 式中,r为相对误差限, 为t统计量值。 在95%的置信度下,根据调查结果的普遍情况,以5%作为P的基准值,以50%的相对误差限计算得到n。 同时结合各地分人群样本分布状况,结合可操作性原则最终确定最低样本量为200。
您可能关注的文档
- 斯瓦希里语谚语中的辩证思想分析-中国社会科学网.PDF
- 新世纪小学一班.PPT
- 新型环形约束收缩抗裂测试装置隔板优选试验研究-福州大学学报.PDF
- 新形势下医患矛盾的成因分析和对策探讨.PDF
- 新媒体环境下社会公益网络舆情传播研究-中国科学院科技论文预发布.PDF
- 新平台校务系统盘点作业操作流程.PDF
- 新开文化实践艺术实践选修课申请表.DOC
- 新晃教育局.DOC
- 新河北版初中数学教材介绍-河北教育科学研究所.PPT
- 新课堂教育试验.PPT
- 1 阳光工程引导性培训基础知识课件-高一《蔬菜生产技术》同步教学(北理工版).pptx
- 第5章 瓜类蔬菜种植与病虫害防治课件-高一《蔬菜生产技术》同步教学(北理工版).pptx
- 6 茄果类蔬菜种植课件-高一《蔬菜生产技术》同步教学(北理工版).pptx
- 项目五茄果类蔬菜生产任务三辣椒生产(一)(课件)-高二《蔬菜生产技术》同步教学(机械工业出版社).pptx
- 9.2人格形成的生物学因素(课件)《儿童发展心理学》(华东师范大学出版社).pptx
- 2.2 蔬菜栽培的理论基础知识 生长与发育(课件)- 高一《蔬菜生产技术(南方本)》同步教学(中国农业大学出版社).pptx
- 6.2句子发展(课件)《儿童发展心理学》(华东师范大学出版社).pptx
- 6.3语言获得理论(课件)《儿童发展心理学》(华东师范大学出版社).pptx
- 13.2儿童和青少年逆反(课件)《儿童发展心理学》(华东师范大学出版社).pptx
- 项目二设施的环境特点及调节控制(课件)-高二《蔬菜生产技术》同步教学(机械工业出版社).pptx
原创力文档


文档评论(0)