- 1、本文档共43页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
现场调查资料的
数据分析与表达毛广运环境与公共卫生学院现场调查资料的数据分析与表达
目的与要求掌握数据处理的基本原则统计方法选择的基本思路各种常用统计方法的前提适用条件熟悉统计描述和统计推断统计图和统计表了解统计报告现场调查资料的数据分析与表达
提纲数据处理的一般原则与基本内容统计方法选择的基本思路常见调查研究方法资料的统计分析调查资料统计分析结果的表达现场调查资料的数据分析与表达
知识回顾研究设计非正态:M(QL~QU)非参数检验资料收集统计分析研究报告统计推断统计描述定量资料分类资料正态:X±S率、构成比假设检验参数估计参数检验点值估计区间估计-现场调查资料的数据分析与表达
第一节数据处理的一般原则与基本内容现场调查资料的数据分析与表达
数据处理方法的变迁现场调查资料的数据分析与表达
数据处理数据处理定义:对数据的采集、存储、检索、加工、变换和传输。基本目的:从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。组成数据管理(约占全部工作量的60%-80%)数据分析(约占全部工作量的20%-40%)现场调查资料的数据分析与表达
数据处理的一般原则与基本内容数据库设计数据录入数据管理数据审核异常(缺失)值的处理统计整理:根据研究目的对原始数据进行科学的分类、汇总和显示;使之系统化、条理化、直观生动和反映总体的数量特征和规律。数据分析统计方法的选择统计描述与统计推断现场调查资料的数据分析与表达
数据库设计变量(研究指标)识别变量:用于数据管理的变量,如ID分析变量:根据研究目的而定、需进行数据分析反应变量:反应疗效/观察结果变化情况的变量解释变量:分组(类)变量或协变量数据:变量的测量值空白数据库事先设计、用于容纳具体数据的容器,多为二维结构常由Epidata、Excel等专用软件设计现场调查资料的数据分析与表达
数据整理的内容现场调查资料的数据分析与表达
数据审核(非常重要)定义对搜集到的资料进行认真的审查和核实目的确保资料符合要求、完整、准确无误方法逻辑审核(手工或计算机检查,以避免逻辑错误,如男性怀孕等)计算审核(多为计算机检查,如白细胞总量=酸+碱+淋巴细胞)现场调查资料的数据分析与表达
离群数据的处理离群数据严重偏离群体平均水平的数据,多为错误(如DBP=880mmHg),少量为异常的真实值可严重掩盖事实真相或扭曲两者间的关系处理原则手工处理:正态分布:>3×|均数±标准差|偏态分布:>99.5%或<0.5%软件处理箱式图:距箱体底线或顶线距离超过箱体高度1.5~3倍者现场调查资料的数据分析与表达
缺失数据的处理缺失值部分研究指标记录不完整,导致其值缺失后果:导致研究效率的下降数据的常见缺失机制完全随机缺失:缺失资料与完整资料的特征无显著性差异非随机缺失:缺失资料与完整资料的特征存在显著性差异常见处理措施直接剔除:适用于缺失量极少且为完全随机缺失单独列为一类:适用于缺失量较大,且难以合理填补者缺失值填补:均数替代中位数替代最后观察值结转回归算法多重填补法现场调查资料的数据分析与表达
统计方法前提条件的检查与描述统计学最难以掌握之处数据分析人员最应该首先掌握的技能熟悉各种统计方法的前提适用条件合理选择最合适的统计方法现场调查资料的数据分析与表达
第二节统计方法选择的基本思路现场调查资料的数据分析与表达
统计方法选择的核心要素研究目的组间差异显著性检验?优效性检验?等效性检验?非劣效性检验?相互关系相关与回归、关联性分析(OR、RR、AR)、其它设计类型完全随机设计?配对设计?随机区组设计?数据类型计量资料?分类资料?等级资料?分布特征正态分布?对数正态分布?其它偏态分布?现场调查资料的数据分析与表达
统计方法选择总结现场调查资料的数据分析与表达
统计方法选择总结(续)现场调查资料的数据分析与表达
统计方法选择总结(续)现场调查资料的数据分析与表达
常见统计分析的错误普查还是抽样调查?普查无统计推断随机抽样还是非随机抽样?非随机抽样不能使用普通的统计推断方法资料类型误认未能满足所选择统计的前提适用条件单因素ANOVA代替重复测量资料的方差分析现场调查资料的数据分析与表达
第三节常见调查研究方法资料的统计分析现场调查资料的数据分析与表达
横断面研究定义研究某一特定时点(时期)、特定范围内人群中的有关变量(因素)与疾病或健康状况的关系资料既不反映既往又不反映将来数据处理资料审核、查漏补缺、去除重复记录等三间分布:时间分布、地区分布、人间分布统计描述:均数、标准差、95%CI、率、构成比等统计推断:单一变量组间比较、两(多)变量间关系分析现场调查资料的数据分析与表达
队列研究的原理由“因”索“果”现场调查资料的数据分析与表达
队列研究资料的数据分析资料审核与数据管理统计描述研究对
文档评论(0)