现场调查资料的数据分析与表达.pptVIP

  • 2
  • 0
  • 约3.47千字
  • 约 42页
  • 2017-08-20 发布于北京
  • 举报
第四节 统计分析结果的表达 统计分析指标 计量资料 均数±标准差、中位数(四分位数间距)等 计数资料 阳性例数(%)、OR/RR、95%CI 等级资料 阳性例数(%)、OR/RR、95%CI 统计表 四大核心要素 标题 线条 标目 横标目 纵标目 数据 备注(并非必不可少的要素) 分类:简单表和复合表 统计图 定义: 使用点、线、面等几何图形来形象化的描述数据的特征 核心要素 标题 标目 刻度 纵轴从0开始?算术尺度还是对数尺度? 纵横轴比例 5:7或7:5 图例(并非必不可少的核心要素) 统计图的种类 直条图:纵轴从0开始 圆图或百分条图 线图 普遍线图 半对数线图 直方图:纵轴从0开始 箱式图 散点图 统计地图 统计推断结果的表达与解释 注意事项 多次重复假设检验 使用t检验处理3组或以上间均数比较 使用单因素ANOVA处理重复测量设计资料 P值的表达 统计意义与实际意义并不一致 应结合专业知识下结论,同时给出均数(率)差的95%CI 统计推断结果的表达与解释 注意事项 关联与因果 关联并不等于因果关系,所谓的关联只是意味着两者可能有也可能没有因果关系(混杂因素) 可信区间与假设检验 可信区间和假设检验 区别 可信区间主要推断量的大小即总体均数多大 假设检验主要推断质的不同即总体参数间是否相同 联系 可信区间同样可以回答假设检验的问题 可信区间如包含了H0,则按?水准,不拒绝H0,否则拒绝H0,接受H1 可信区间可以比假设检验提供更多的信息 可信区间和假设检验 可信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有实际意义 上图中,可信区间(1)~(3)均不包含H0,意味着相应的差异具有统计学意义,(4)与(5)均无统计学意义 (1)还提示差异具有实际意义; (2)提示可能具有实际意义; (3)提示实际意义不大; (4)提示样本量不足。 (5)属于可以接受原假设的情况。 可信区间和假设检验 可信区间不能完全代替假设检验 可信区间必须预先规定一个概率即检验水准?,不知道?以外概率的情况,故相对比较机械 假设检验则可以获得一个确切的概率P值,相对比较灵活 完整的统计推断应该是 区间估计+假设检验 谢谢大家 现场调查资料的 数据分析与表达 毛广运 环境与公共卫生学院 目的与要求 掌握 数据处理的基本原则 统计方法选择的基本思路 各种常用统计方法的前提适用条件 熟悉 统计描述和统计推断 统计图和统计表 了解 统计报告 提纲 数据处理的一般原则与基本内容 统计方法选择的基本思路 常见调查研究方法资料的统计分析 调查资料统计分析结果的表达 知识回顾 研究设计 非正态:M(QL~QU) 非参数检验 资料收集 统计分析 研究报告 统计推断 统计描述 定量资料 分类资料 正态:X±S 率、构成比 假设检验 参数估计 参数检验 点值估计 区间估计 - 第一节 数据处理的一般原则与基本内容 数据处理方法的变迁 数据处理 数据处理 定义: 对数据的采集、存储、检索、加工、变换和传输。 基本目的: 从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。 组成 数据管理(约占全部工作量的60%-80%) 数据分析(约占全部工作量的20%-40%) 数据处理的一般原则与基本内容 数据库设计 数据录入 数据管理 数据审核 异常(缺失)值的处理 统计整理:根据研究目的对原始数据进行科学的分类、汇总和显示;使之系统化、条理化、直观生动和反映总体的数量特征和规律。 数据分析 统计方法的选择 统计描述与统计推断 数据库设计 变量(研究指标) 识别变量:用于数据管理的变量,如ID 分析变量:根据研究目的而定、需进行数据分析 反应变量:反应疗效/观察结果变化情况的变量 解释变量:分组(类)变量或协变量 数据:变量的测量值 空白数据库 事先设计、用于容纳具体数据的容器,多为二维结构 常由Epidata、Excel等专用软件设计 数据整理的内容 数据审核(非常重要) 定义 对搜集到的资料进行认真的审查和核实 目的 确保资料符合要求、完整、准确无误 方法 逻辑审核(手工或计算机检查,以避免逻辑错误,如男性怀孕等) 计算审核(多为计算机检查,如白细胞总量=酸+碱+淋巴细胞) 离群数据的处理 离群数据 严重偏离群体平均水平的数据,多为错误(如DBP=880mmHg),少量为异常的真实值 可严重掩盖事实真相或扭曲两者间的关系 处理原则 手工处理: 正态分布:>3×|均数±标准差| 偏态分布:>99.5%或<0.5% 软件处理 箱式图:距箱体底线或顶线距离超过箱体高度1.5~3倍者 缺失数据的处理 缺失值 部分研究指标记录不完整,导致其值缺失 后果:导致研究效率的下降 数据的常见缺失机制 完全随机

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档