- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2006年4月第13卷第4期 中国中医药信息杂志 ·103·
北京地区亚健康流行病学数据库的建立及
数据管理质量控制
谢雁鸣,文天才,于嘉,刘为民,刘保延,何丽云
(中国中医科学院临床评价中心,北京100700)
关键词:亚健康;流行病学;数据库;质量控制
中图分类号:R2—05文献标识码:B 文章编号:1005—5304(2006)04—0103一02
随着课题研究的规范化、标准化,科学地搭建数据库和严 对于那些应答而未作答的条目按缺失值处理。并对所有的缺
格的数据管理成为确保课题研究质量的重要保证。笔者以“亚 失变量赋予一个固定的值,用以和因录入员疏忽而漏录的情
健康人群中医基本证候流行病学调查”为例,介绍如何建立数 况区分。在调查问卷中,有几组条目之间存在逻辑关系,如被
据库及进行数据管理质量控制。 访者平时不喝酒,那么在调查问卷中对于所喝酒的种类和酒
1 一般情况
本次流行病学调查目的在于了解35~55岁人群中亚健
康发生的相关情况及中医证候的分布规律。调查由北京市内 增加跳转功能,不仅录入效率提高了,而且录入的错误率也明
的5家三级甲等医院共同完成,每家医院在亚健康高危单位 显下降。以上数据库变量名的定义、标签的制作等均由计算
机技术人员制定,并将其汇总成为编码表,提供给数据管理人
中选取符合要求的被访者(35~55岁,无重大心脑血管疾病
者和急性病者)进行体检,填写调查问卷。问卷由自填部分和 员、统计分析人员。
访谈部分组成。自填部分由被调查者填写,访谈部分由调查员 2.2数据库的构建和试运行
通过望、闻、问、切四诊后进行填写。条目由单选题、多选 计算机专业人员和统计人员共同制定数据库构建总方案
题、填空题组成,单选题为l~5级的分级条目,多选题为有或 由数据库设计人员绘制详细的各条目间、各模块间的关系图。
无的两分类条目。 并在关系图中标明变量名、类型和长度等信息。采用目前优
2数据库的编码、构建及录入规则的制定
2.1数据库的编码 为数据库的开发软件。数据库构建以如实反映调查问卷的基
在统计软件中,变量名的长度要求在8个字节以内,由字 本内容为前提,以有利于后期统计分析为原则,详细分析调查
母或数字组成,而且汉字无法作为变量名。为了增强变量名的 问卷的设计结构,仔细分析其内在的逻辑关系。根据关系图在
可读性,在调查问卷的设计结构基础上,每一模块由一个字母
表示,如第一部分的变量名均为A字母开头,第二部分的变量 减少文本型变量的使用,严格定义各变量的长度和类型。将编
名均为B字母开头等等,以此类推。变量名由字母和数字组成, 写完毕的调查表生成数据文件。为防止非法值的录入,对新生
而且各部分的变量名数字与条目顺序一致。如第一部分的第 成的数据文件添加检查项,其中包括定义每个变量的有效值
l题,其变量名为A1。在定义变量的过程中,变量的类型也需 范围、逻辑跳转设置、是否是必填项设置、设计变量标签、
详细定义,以便于统计分析。对于填写文字的条目则变量类型 缺失值定义。
定义为字符型,有关日期的变量则定义为日期型,其他变量可 数据库设计人员在设计数据库的同时,根据数据库的结
定义为数值型。合适的变量长度不仅可以减少录入过程中的 构、变量类型、变量长度等,对文本变量、缺失值等制定出具
错误,而且可以利用eipdata的自动调转功能提高录入的速体的录入规则。其中包括数据文件运行的环境,变量值、标签
度。同时,为了后期的统计分析人员了解该变量存储的含义, 所代表的含义,日期型变量的录入方法,多选题的录入规则、
还为每个变量名添加标签,标签内容为问卷中各条目的题目。 缺失值的表示、单位换算、逻
原创力文档


文档评论(0)