现场调查问卷的数据管理.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
现场调查问卷的数据管理 Survey Data Management 流行病学教研组 流行病学教研组 流行病与卫生统计学教研室 流行病与卫生统计学教研室主要内容 问卷录入前的核查 数据编码 常用数据管理软件介绍 数据的录入与管理…… 设计“问卷” 研究设计 实施调查 收集数据 数据录入 分析资料 分析数据 数据管理 结果解释 撰写论文一 、 问 卷 录 入 前 的 核 查核查的内容真实性:无伪造和失真,无乱答准确性:有无前后矛盾、相关问题逻辑一致完整性:整体完整性和单份完整性。标准性:调查结果中数据的计量单位要统一二 、 数 据 的 编 码 与 赋 值 ?数据编码的概念 ?数据编码的原则 ?数据编码数据编码的概念数据编码是指把资料信息转换成计算机能识别的 某些特定的符号和数码的过程,它直接关系到数 据处理和分析的繁复程度和真实性。大规模的流行病学调查需要编制一份编码手册 (也称编码簿)发给编码员,每个编码员则按编 码手册的要求,统一进行编码。将调查数据转换 成代码数据,代码数据应尽可能保留原始调查数 据的形态及包含的信息。数据编码的原则唯一性原则:每一编码与所代表的信息呈一一对应关系;简单性原则:编码的位数要尽可能少,编码的符号要尽可能简单, 一般编码都使用阿拉伯数字;概括性原则:对信息进行分门别类,然后用少数几个符号代表不同 的类。 数据编码定量变量的编码: 定量变量的编码最为简单,一般只需把变量数值 直接写成代码数据,而不需要任何转变。有时为了降低录入难度,避免录入错误,人们常 把定量资料认为的转变为等级编码,如先对年龄 进行分组,即1~191,20~392,……, 805,然后再将这些分组的年龄代码数据1, 2,3,4,5输入到计算机数据文件。数据编码定性变量的编码: 二 分 类 变 量 的 编 码 :常用0和1来编码,因此也可 以称为0-1变量。由于对阳性事物设立高次代码有助于调查者在分 析时获得正的参数估计值,所以一般情况下常用 “1”代表“有 、正或阳性”;用“0”代表“无、负或 阴性”。数据编码定性变量的编码: 多 分 类 变 量 的 编 码 :季节一般分为春、夏、秋、冬。通常的 做法是用英语字母(如A、B、C、D)或阿拉伯数字(1, 2,3,4)依次对其进行编码。值得注意的是,这里季节是个名义变量,其取值1、2、3、4只是 为了数据记录的便利而设定的代码,不能由其平均数作为该分类 变量的平均水平对资料进行描述,也不能直接参与回归分析等计 算。因为“1”不能理解为“较低水平”,“4”也不能理解为“较高水 平”,它们之间不存在自然的等级变化,如果直接参与回归分析只 能会造成结果无法解释。 数据编码定性变量的编码: 多 分 类 变 量 的 编 码 :季节一般分为春、夏、秋、冬。通常的 做法是用英语字母(如A、B、C、D)或阿拉伯数字(1, 2,3,4)依次对其进行编码。数据编码定性变量的编码: 有 序 变 量 的 编 码 :临床体检或实验室检验常用? 、±、+和++等来表 示测量结果,属于有序变量。有序变量的取值称为水平,如果有理由认为各水平之间是等 距离或近似等距离,则可把各水平取值依次记作 1、2、3、 4。例如,患者术后出血量分为少、一般、偏多、过多,分 别按这个顺序编码为1、2、3、4。如果把“1”理解为“较低 水平”,代表较少出血量,把“4”理解为“较高水平”,代表 较多出血量,完全可以和医学实际意义相吻合。 数据编码问卷中多复选题的编码:所谓复选题,也称多项选择题, 即题目的答案不止一个, 答案的选项可以根据研究需要多重选择。复选题主要包括两种情况:一种是被调查人员从选项集中任意选择符合自身情况 的选项,没有其他附加要求;另一种是被调查人员从选项集中选择最重要的3项(或 5项),并按照程度大小排序。 数据编码问卷中多复选题的编码: 1. 多 重 二 分 法 :将复选题的多个选项分别当作独立 的变量来看待,根据选项的个数分别定义为若干 个子变量。对于每一选项的赋值,选定义为“1”, 不选为“0”。如例1按照多重二分法进行编码时,就会产生5个新的且 相互独立的变量,分别用A1、A2、 A3、A4、 A5表示, 假设某位调查对象选择了“1、2、5”,编码的结果便为 A11、A21、A30、A40、A51。数据编码问卷中多复选题的编码: 2. 随 机 编 码 法 :当变量选项比较多,而题目只要求从多个 选项中选择最重要的3或5项时,仍然使用多重二分法录 入显然不方便。为了减少录入“0”的次数,常选用另一种 编码方法-随机编码法。如例2,这时候只要定义3个子变量即可(如B1,B2, B3),每个子变量的备选项可以分别定义为1-10,也可 以理解为每个子变量为被访者的一次选择。假设某位调查 对象选择了“1

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档