取样调查入门要什么,何时,为何.ppt

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
取样调查入门 要做什么,何时,为何 R. Heberto Ghezzo Ph. D. Meakins-Christie 实验室 McGill 大学-蒙特利尔-加拿大 什么是调查? 调查搜集信息 如果来自所有人口是否是人口普查? 如果为了政治信息是否是民意测验? 如果来自总人口中的一个样本是否是抽样调查? 调查的条件 达到目的 无偏见,准确 可归纳 合乎道德 节约 调查开始之前 确定需要回答的问题 确定取样策略 设计并测验调查问卷。 训练工作人员 确定交互证实的技术 确定最后分析 调查之中 证实并交互证实问卷 核对时间表和预算 问题 首要任务是简洁明了地确定感兴趣的主要问题以及研究的目标人口 取样单元 个人 家庭 群体,如班级 确定估计值的精密度或者容许误差:1%,5% 有无需要特别说明的任何讨厌因素? 讨厌因素 这些因素与结果相关,而现在的研究却对它们毫无兴趣 讨厌因素可能会掩盖(或增强)结果与其他处于研究之下的因素之间的关系。 分层取样 取样大小与分层大小成比例 每层取样大小相等 取样规模与层的变化律成反比 多步取样 偏见的来源 偏见被定义为系统误差 选择的误差 解释的误差 回忆的误差 没有答复 误差的修正 选择误差: 正确分层 每层中更好的随机化 解释误差 清晰,简明的问题 通晓多种语言的采访者 回忆误差 回避历史性的问题 无答复误差 调查问卷 短而简明 开放性的问题 多选 是/否 内在有效性 如何检验受试者回答的真实性? 将同样的问题询问两次 婚姻状况 配偶年龄 对已知资料多次检验 外在有效性 有没有提问恰当的问题? 问题能否被取样中所有受试者理解? 趋势研究 后继研究中的采访者 尽量相同(与初次研究相比) 若不能相同,训练必须相同 他们必须等量齐观 为有效性作准备 每个问题的有效回答的列表 为丢失的、不适用的、未知的数据确立代码 基于某些先前的问题自动建立“不适用” 分析的阐明 特殊目标1 回答特殊目标1的测验 特殊目标2 回答特殊目标2的测验 次要目标 调查此要目标的测验 探索性的数据分析 调查过程 每天收集问卷 检查昨天的问卷是否有缺失或无效的回答 重新采访无效问卷 时间表 经常忘记的任务 已回答的问卷量是否与当天的预定两相当? 是否需要更多时间以满足要求的问卷量? 是否需要更多采访者以及时完成任务? 暂时的观点 将描述性的变量交叉列表,如年龄、性别、职业等 它们与已知的(或设想的)在人口中的分布是否相似? 我们的取样是具有代表性的还是有偏差的? 我们是否需要在某些人口部分中加强对研究的宣传? 调查之后 在所有变量中,包括单独的和在逻辑上成对的,检查无关量 分布和点状度看起来是否合理? 决定是归因于还是删除明显的错误 统计分析 主要分析 样品的描述 预定的主要统计分析 结果的统计上的重要性 探索性的分析 描述使用的测验/程序 报告结果 报告 目标列表 完成的目标 估计的取样规模 样品中的答复比率 主要统计分析 有价值的结果或者估计值的置信区间 采用检验的统计学能量 探索性数据分析的结果 结论 完成了什么 主要分析与预言是否相符?如果不是,为什么? 对主要分析结果的解释 有无产生于探索性数据分析的新假设? 解释探索性数据分析的发现 调查若要有用,就必须能够提供准确的信息已完成预定目标,回答感兴趣的问题。它必须有合适规模已具备足够能量。它必须以简洁明了的方式提出合适的问题。它既不能暗示问题的答案,亦不能浪费精力于与主要目标无关的问题。这就意味着调查必须回归到它所依据的人口的真实答案。 要回答的问题必须被清晰的表达。当这个完成之后,目标人口也必须清楚地确定。 a-所有对象 b-所有成年对象 c-所有有工作的对象 d-所有一家之长 或者为了妇女研究: a-所有妇女 b-所有育龄妇女 c-所有母亲 d-所有孩子年龄小于5岁的母亲 在目标人口确定之后,必须选定取样策略。第一步是确定取样单元。是一个对象,一个家族单元,一个家庭,一个街区,亦或一整座村庄?取样策略取决于我们所掌握的人口列表--也就是所谓的取样框架—的类型。我们所有的是选举列表,学校的学生列表,还是我们自己的住址列表? 我们是否需要交叉组合或者后继研究? 下一要点是选择估计值的精密度,这取决于我们需要观察的取样大小。现在我们必须考虑存在的因素,那些可能影响观察值的所谓的讨厌因素。如果存在这些因素,我们是否需要分层取样?或者,我们只需一个简单的随机取样。 例如,欲研究饮食对某疾病的影响,社会经济地位就是一个讨厌的变量,因为饮食取决于社会经济地位。但是,社会经济地位也与许多其他可能与疾病相关的因素有关系,例如拥挤,教育,预防性的卫生保健等。 通常我们会选择分层。评估者的误差总会更小。 任何

文档评论(0)

l215322 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档