- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社会调查方法第四讲
系统抽样(Systematic sampling) 系统化地选择完整名单中每第K个元素组成样本。 对抽样框内每一个抽样单位进行编号 确定抽样间距(如1000个人中抽取100人,每隔10抽一人)=总体大小 /样本大小 确定抽样起点,在间隔单位中随机选取一个起点 注意:元素排列不得具有周期性 全楼80户,抽取10户进行调查 抽样间隔为8 起始点为1 101,102,103……108 201,202,203……208 301,302,303……308 …… 1001,…… 1008 分层抽样(stratified sampling) 对简单随机抽样和系统抽样的一种修正 减少抽样误差的因素: 大样本比小样本抽样误差小 同质总体比异质总体抽样误差小 把异质总体根据一定原则分为若干相对同质的次级总体 在次级总体中进行简单随机抽样或系统抽样 分层变量:性别、专业、年龄、地区…… 分层抽样需要注意的问题 一、分层标准: 以所要分析和研究的主要变量或相关变量作为分层标准; 以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量; 以那些已经有明显层次区分的变量作为分层变量。 分层需要注意的问题 二、分层的比例问题 按比例分层:按各种类型或层次中的单位数目同总体单位数目间的比例来抽取子样本的方法。可得到一个与总体结构完全一样的样本。 不按比例分层:主要用于对不同层次的子总体进行专门研究或比较,如用于推断总体,需要进行加权处理。 整群抽样(cluster sampling) 以整群作为抽样单位(一个城市、一个社区) 只要该群(丛)被选中,则该群中的所有成员都进入随后的子样本。 适用于群内异质性较大、群间异质性较小的情况。 多级整群抽样:总体--次级总体--再次级总体 注意 效率高,受抽样框影响小 产生抽样误差的机会增多 尽量的多抽群, 减少群内元素 多阶段抽样(Multistage Sampling) 按抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行。 从总体到获得最终样本元素经过多个阶段抽样 适用于范围大、总体对象多的社会调查 误差较大,应相对增加开头阶段样本数,而适当减少最后阶段的样本数。 概率比例抽样(probability proportionate to size, PPS) 在整群抽样当中,规模不同的群体当中,每个元素被抽中的概率不一样。 一种多级整群抽样,其中的群被选取的概率并不相等,其被选中的概率和其规模大小成比例。 目的:保证样本中每个元素被的概率相等 使整群被抽取的概率与其规模成比例 本例中,假设三个街道,每个街道抽一个人。 在第一阶段街道抽样中,对A街道编4个码,B编2个码,C编1个码,则A被抽中的机会是B的2倍 在第二阶段个体抽样中,每个被抽中的街道中抽取相等数量的样本100个。 A: (4/7)*100/2000=1/35 B: (2/7)*100/1000=1/35 C: (1/7)*100/500 =1/35 A N=2000 B N=1000 C N=500 户内抽样 在多阶段抽样中,进入到户后的抽样方式 Kish选择法 材料准备:把调查表分为A,B1,B2,C,D,E1,E2,F八种,分别占1/6,1/12,1/12,1/6,1/6,1/12,1/12,1/6;对应的“选择卡” 步骤 对每户家庭中符合调查条件的对象分男女按年龄进行排序 根据调查表类型及家庭人口数,在选择卡中查询调查对象 生日法: 随机确定一年中某一天为标准日期 计算每个符合条件的人距离标准日期的天数,以最近或最远的人为调查对象 * 总体分布 骰子 平均数的抽样分布是正态分布,因此样本平均数次数所占比例是可以求得的。 68.26%的样本平均数落在μ±SE之间 SE为标准误 90%的样本平均数落在μ±1.65SE之间 95%的样本平均数落在μ±1.96SE之间 98%的样本平均数落在μ±2.33SE之间 99%的样本平均数落在μ±2.58SE之间 根据样本平均数对总体平均数进行推论 置信度(Confidence Level) 置信水平,指总体参数值落在样本统计值某一区间内的概率。反映的是抽样的可靠性程度。 置信度为95%,指总体参数值落在样本统计值的某一区间的概率。 置信区间(Confidence Interval) 指在一定的置信度下,样本统计值与总体参数值之间的相近程度,根据样本统计值,推算出总体参数可能存在的区间。反映抽样的精确性程度。 ?= X +KSE 置信度与置信区间相互关系 置信度低而置信区间精确 置信度高而置信区间宽泛 二、样本规模与抽样误差 (
您可能关注的文档
最近下载
- 农村供水建设项目建设必要性分析.docx
- 2025年广西高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 天津市纪委监委公开遴选公务员笔试试题及答案解析.docx VIP
- 岛津气相色谱仪教材161页课件.ppt VIP
- 门诊部医生诊疗行为规范.docx VIP
- adams初级培训教程第7章转动和摩擦.pdf VIP
- 2025初级会计实务第二章会计基础.pptx
- (正式版)D-L∕T 5759-2017 配电系统电气装置安装工程施工及验收规范.docx VIP
- 屋面_光伏一体化_高处作业安全施工措施方案.docx VIP
- NB∕T 32037-2017 光伏发电建设项目文件归档与档案整理规范.pdf VIP
文档评论(0)