- 1、本文档共50页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
以职位分层,某综合医院的100个样本 总体 简单随机抽样 分层抽样 相对于总体的误差 职位 N % n n 管理者 15 2.88 1 3 -2 医师 25 4.81 2 5 -3 实习医生 25 4.81 6 5 +1 护士 100 19.23 22 19 +3 护工 100 19.23 21 19 +2 医疗技师 75 14.42 9 14 +5 看护人 50 9.62 8 10 -2 职员 75 14.42 5 14 -9 维修人员 30 5.77 3 6 -3 清洁工 25 4.81 3 5 -2 总计 520 100.00 100 100 好处:当我们所感兴趣的某类群体在总体中所占比例过小,简单随机样本很可能遗漏该类群体成员时,分层可以解决此问题。 研究者要从 20,000名大学生中抽出200个样本 从注册处得知,20,000名学生中,2%的学生(400人)是离婚女性,且有一个不到5岁的孩子。 在一个有代表性的样本中,此群体应为4人,但简单随机抽样容易遗漏。 而分层抽样中,可以直接从这400人种选4人进入样本。 抽样设计的类型——3. 分层抽样(Stratified random sampling) 分层变量的选择方法: 依赖于现有的变量:性别、班级、院系、地域、选区… 考虑与想要精确描述的变量相关的变量:性别、教育(不易获知)、城市、地理位置(南城、北城、西城、东城—社会阶层相关)区域等 抽样设计的类型——3. 分层抽样(Stratified random sampling) 处理包含总体所有要素的名册,两种分层方法 将所有要素按照所使用的分层变量加以分类,成为不同的小团体;再按相对比例从各个小团体中抽出(随机方法或系统抽样法)适当数量的样本。 例如:二年级学生中GPA为3.5以上的学生占所有学生的1%,而我们要获取1000个学生样本;那么,可以在GPA3.5以上的大二学生中抽出10个作为样本的一部分。 先将学生进行分类;将所有不同类别的学生放到一个连续性的列表中;然后再对整个列表进行一个随机起始的系统抽样。 例如,将学生名册从GPA4的大一男生开始,然后以GPA不超过1的大四女生为结束。 抽样设计的类型——3. 分层抽样(Stratified random sampling) 随机起始的分层系统抽样 系统抽样中隐含的分层: 当名册顺序具有隐含分层的状态下,系统抽样方法会比简单随机抽样方法更加准确。 有时一个排过序的名册可能比一个杂乱无章的名册提供更多、更有用的信息。 例:对夏威夷大学学生进行研究:按年级分层后,又把所有的学生按学号进行排列。但是他们的学号也是他们的社会安全号码(social security number),而SSN前三位代表州名,这就粗略地提供了地区性分层。 抽样设计的类型——3. 分层抽样(Stratified random sampling) 当1)不可能或不方便编制一个完整的名单形成目标总体;2)简单随机抽样成本过高时,可以使用整群抽样方法。 例:对全国摩托车的抽样 整群抽样设计:先对群集进行抽样,然后再从选中的群中抽取要素。【只要该群被选中,该群中所有的成员都进入随后的子样本。】 抽样设计的类型——4. 整群抽样(Cluster random sampling) 多级整群抽样(multistage cluster sampling) 重复两个步骤:列表名册、抽样 先编制初级抽样单位(如教会、街道)的名册,然后对这个名册进行抽样;根据选出的初级抽样单位再编制其要素名单,再进行抽样,如此一直重复下去。 北京:抽城区?抽街道?抽社区?抽户?抽人 抽样设计的类型——4. 整群抽样(Cluster random sampling) 比较:分层抽样与整群抽样 分层抽样(stratified) 整群抽样 (cluster) 群间 (between groups) 异质的 (heterogeneous) 同质的 (homogeneous) 群内 (within groups) 同质的 (homogeneous) 异质的 (heterogeneous) 优势 (advantage) 精确 (precise) 经济(economical) 多阶整群抽样效率高,但代价是样本精确度降低。对总体名单进行简单随机抽样会产生一次抽样误差;而两阶段的整群抽样则会有两次抽样误差。 例如:有可能抽到的富裕街道超过实际比例,而进行次级抽样时,抽到的富裕家庭又超过实际比例。解决方式:选择群的数量,以及群内选择的要素的数量。 多级整群抽样与抽样误差 抽样误差的减少:增加样本容量;提高样本要素的同质性 抽样原则:尽可能多地多选取群,而减少每个群中要素的数量。 在力所能及的范围之内尽量选取较多的群
文档评论(0)