- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
spss11.5操作方法
一、数据库建立的一般原则与方法
㈠ 数据库的建立方法
统计工作分为研究设计、收集资料、整理资料和分析资料四个步骤,资料的收集是科研工作的基础。现代医学的发展使得医学科研方法日趋多元化,医学科研工作中的数据越来越呈现大型化的趋势,即收集的样本含量和研究的变量数越来越多,如大规模的流行病学调研或多中心临床对照试验等。随着计算机应用技术的发展和普及,统计分析方法的不断深化,医学科研数据的分析处理越来越依赖于计算机完成。从上世纪60年代起,大型的统计软件如SAS、SPSS、STATA等以其强大的功能,便捷的操作,日趋完善的性能,给人们进行数据处理带来了很大的方便,使过去很长时间才能完成的计算在瞬间就能实现。因此,使用统计软件进行分析之前,保证将原始数据规范、准确、完整的录入数据库,是资料分析过程中的重要环节。
医学科研的原始数据大多可用一种统一的数据结构表达,如表1所示。在表1中,每一行称为一个记录(record)或一个观察单位(case),记录每一个研究个体的各研究指标;每一列称为一个变量(variable),表示研究中的各研究指标。横向的纪录和纵向的变量构成了常见的二维数据方阵。
表1 某地2005年630例65岁以上老年人健康体检纪录
编号 姓名 性别 年龄(岁) 民族 体重(kg) 身高(cm) 高血压 糖尿病 1 刘天宇 男 78 汉族 76.52 169 有 无 2 王顺义 男 82 汉族 66.72 175 无 无 3 苗凤兰 女 70 其他 55.10 160 无 无 4 马志华 男 71 回族 85.63 182 有 有 5 周淑宏 女 77 汉族 48.45 154 有 无 630 赵晓曼 女 66 汉族 58.36 164 无 有 原始数据中,变量一般分为标识变量和分析变量。标识变量用于数据的识别、核对和修改,是数据管理和质量控制不可或缺的变量,如上表中的“编号”、“姓名”即为识别变量,在数据处理时不纳入分析,只用于数据的审核和修改。其余变量如“年龄”等均为分析变量。分析变量根据数据的类型可分为数值变量和分类变量两种,数值变量又可细分为连续型变量和非连续型(离散型)变量。
数据录入的过程,应遵循方便录入、便于核查、易于转换、利于分析的原则。方便录入是指在录入过程中尽可能减少录入的工作量,将原始数据中的分类变量或非连续型变量量化,如表1中的性别、民族、高血压、糖尿病的患病情况等皆为分类变量,在原始数据中表现为字符的形式,可根据实际情况将其数量化,比如,对于“性别”变量,将“男性”赋值为“1”,“女性”赋值为“2”;对于糖尿病的患病情况,将“有”赋值为“1”, “无”赋值为 “0”,这样既可以节省录入时间,又将原始指标转化为可被统计分析软件识别和运算的量化指标形式。便于核查是指一定要有标识变量,以便数据的核查校对。易于转换是指录入数据时要考虑不同软件的要求,如一些软件不能识别中文,一些软件的变量名要求不能超过8个字符等,因此,在录入数据时,变量名一般尽可能用英文,不超过8字符,数据尽可能用数值表示,这样数据库被分析软件读入时,就不易丢失数据和出现差错。利于分析是指收集的资料尽可能录成一个数据库文件,而不要分解成多个数据文件,且录入的格式应满足多种统计分析方法的需要。
表2 由原始数据库转化的分析数据库格式
number name sexa age nationalityb weight height HBPc diabetesd 1 刘天宇 1 78 1 76.52 169 1 0 2 王顺义 1 82 1 66.72 175 0 0 3 苗凤兰 2 70 3 55.10 160 0 0 4 马志华 1 71 2 85.63 182 1 1 5 周淑宏 2 77 1 48.45 154 1 0 630 赵晓曼 2 66 1 58.36 164 0 1 注:a:1男、2女;b:1汉族、2回族、3其他;c:0无、1有;d: 0无、1有
㈡数据的质量控制
数据录入时,要注意数据的录入质量,保证录入数据的准确性和真实性。在大型数据库的录入时,建议使用专门的数据库软件如FoxPro、Access、EpiInfo、EpiData等,因为这些数据库软件具有较完善的数据管理、查询、修改功能,还可根据需要建立与录入表格一致的屏幕格式,便于录入,同时还可以在建立数据库时根据实际需要人为设定逻辑核查格式,便于控制数据的录入质量。
在数据的计算机录入完成后,应该对数据的质量进行检查,如利用数据间本身存在的逻辑关系,对数据进行逻辑核查;对原始数据的编号和数据库的数据序号进行核对,看有无缺漏;利用统计分析软件列出变量的频数表或散点图,观察其频数分布有无异常或有无离群值的出现;
您可能关注的文档
- ps制作炫光动态文字.doc
- PS制作韩国风格海报.doc
- 九年物理简答题专题训练2.doc
- PS合成教程之水中的水果.docx
- ps制作艺术照教程.doc
- PS动画实例教程:运用PS制作可爱动漫MM眨眼动态头像.doc
- PS制作流动的山水画动画图片.doc
- 九年下第三世界27章教案.doc
- ps合成打造梦幻花纹蝴蝶艺术插画.docx
- PS合成油漆效果美女海报介绍.doc
- 2025年脑机接口技术在虚拟现实教育中的应用用户接受度调查.docx
- 天然气水合物(可燃冰)开采技术地质勘探新技术应用前景与市场分析预研报告.docx
- 网络直播规范化发展背景下的商业模式创新路径研究:2025技术创新与市场应用.docx
- 2025年工业互联网数据加密算法效能评估与产业创新研究报告.docx
- 2025年城市生活垃圾分类处理公众参与模式创新与长效机制研究.docx
- 2025年新零售案例研究:O2O模式下的线上线下融合创新实践报告.docx
- 2025年中医药现代化进程中日本市场拓展的中医药国际化策略报告.docx
- 2025年脑机接口技术在虚拟现实教育领域的用户接受度分析.docx
- 2025年新能源汽车充电设备研发技术壁垒与突破策略报告.docx
- 全球工业机器人市场2025年技术创新趋势与市场潜力研究报告.docx
文档评论(0)