- 13
- 0
- 约6.32千字
- 约 54页
- 2018-06-02 发布于河南
- 举报
医学论文常见统计学错误与纠正 II. 分析与结果 8. 不考虑基线均衡与否 不首先考察基线是否均衡 不论基线均衡与否,一概使用单变量分析 方法: 比较百分比或均数: 检验; 比较均数:t 检验、非参数检验 比较发生某事件的时间:Kaplan-Meier 方法 应当如何? 不论干预性研究还是观察性研究,数据分析 的第一步总是考察基线是否均衡,列表报告 若干预性研究许多变量基线不均衡 ---- 随机化失败! 若观察性研究多个变量基线不均衡,很自然! ---- 从设计入手,认真解决! 对付基线不均衡的统计学方法: (1) 分层 (2) 匹配 (3) 回归 9. 缺失值处理不当 三类缺失机制: 完全随机缺失(missing completely at random, MCAR), 缺失完全由随机因素造成 随机缺失(missing at random, MAR), 缺失与 已有的观察结果有关 非随机缺失(missing not at random,NAR), 缺失与当前观察到和尚未观察到的结果有关 常见错误: 丢弃具有缺失值的个体? 仅完全随机缺失才可丢弃有缺失值的个体 临床试验中,若仅采用完整病例进行分析,违背 Intention-To-Treat原则(ITT原则) 仅在以下情况下考虑使用完整病例进行分析 ① 在探索性研究中,药物研发的初期阶段; ② 在确证性试验中,作为次要结果的处理 方法 常见错误: 数据填补(data imputation)? 仅在以下情况下 ① 相对小的缺失率(例如10%~15%) ② 含有缺失值的变量对于所要研究的问题 具有非常重要的意义; ③ 有合理的假设和结转技术, 一般宜遵循 保守原则 不同填补方式产生的结论需进行敏感性分析 10. 统计检验结论不当 差异性检验 零假设:两组(或多组)总体均数间没有差别 对立假设:两组(或多组)总体均数间有差别 检验水准 常见错误 若 ,“两组样本均数间的差异显著” ---- “总体均数不等” (忘记有假阳性可能!?) 若 ,“两组样本均数间的差异不显著” ---- “总体均数相等” 1 尚不能说有差异 C优 T优 试验组-对照组(T-C) 0 图1 差异性试验置信区间示意图 2 尚不能说有差异 3 有差异 4 有差异 C优 T优 试验组-对照组(T-C) -Δ 0 1 非劣 图2 非劣效性试验置信区间示意图 4 尚不能下结论 2 非劣 3 非劣 5 劣 试验组-对照组 (T-C) C优 T优 0 Δ 1 非优 图3 非优效性试验置信区间示意图 2 非优 3 非优 4 尚不能下结论 5 优 试验组-对照组(T-C) C优← → T 优 -Δ 0 1 非劣 Δ 图4 等效性试验置信区间示意图 2 非优 3 非劣、非优 ---- 等效 小 结 医学论文常见统计学错误往往源于研究设计 任何一项研究首先要明确定义目标总体; 从目标总体选择对象要有细致的合格标准 和排除标准; 总体和标准不清晰,切勿匆忙上阵; 基于“杂乱” 对象的研究,一定不会有 科学结论。 小 结 结局指标不是越多越好,主要指标只能一个; 次要指标可以多于一个,但不能过多; 结局指标过多,费力不讨好; 即便出现阳性结果,往往是假阳性,经不起 重复。 小 结 科学研究必须有对照;对照的选取与研究的 假说有关;对照不恰当,研究没有好下场。 样本量并非越大越好。不论干预性研究还是 观察性研究,都要事先估算最小样本量; 医学论文的“方法”部分必须有一段报告样 本量及其确定的依据; 依据不可靠,估算的样本量自欺欺人。 小 结 随机化是保证研究真实性的重要措施,将随机化当作“廉价名词”,只说不做,或做而不严,不 仅败坏科研道德,而且,往往导致研究失败。 临床试验涉及人,无论研究对象还是研究者有意无意受心理因素的影响,“盲法”是消弱此类影响的重
原创力文档

文档评论(0)