第二十二章 统计方法选择与结果解释.ppt

医 学 统 计 学(第二版) 李晓松 3. 正确理解可比性问题 应该怎样正确理解“可比性”问题? ? 比较 A 、 B 两地区肺癌死亡率的高低,总的肺癌 死亡率 A 地区高于 B 地区,但 B 地区各年龄组肺 癌死亡率却均高于 A 地区。 Why? 医 学 统 计 学(第二版) 李晓松 原因: ? 由于肺癌死亡率与年龄有关 , 通常随年龄增高而增高; ? A 、 B 两地区各年龄组人口构成不同, A 地区高年龄组 人口构成大于 B 地区,这就造成了 A 地区总的肺癌死 亡率高于 B 地区; ? 上述矛盾是因为两地人口 年龄构成 不同造成的。 医 学 统 计 学(第二版) 李晓松 A 、 B 两地区肺癌死亡率到底谁高谁低? 直接比较肺癌死亡率: A 地 B 地 比较标准化肺癌死亡率: B 地 A 地 消除年龄的影响后 无疑, A 地区肺癌死亡率高于 B 地区 医 学 统 计 学(第二版) 李晓松 ? 因此,所谓可比性问题其实与研究目的有关。 ? 如肺癌一例,假定已知年龄是肺癌死亡率的影响 因素,如果想探索除了年龄之外还有没有其它因 素影响肺癌死亡率,那么就应该对年龄进行标准 化 ( 如果标化后 A 、 B 两地肺癌死亡率相同,则说 明年龄是影响肺癌死亡率的唯一因素 ) 。 医 学 统 计 学(第二版) 李晓松 ? 但如果研究目的并非探讨分组因素对研究指标的 影响或作用,谈论可比性就没有意义,也没有必 要去调整其它混杂因素的影响。 ? 因为 A 地区肺癌死亡率高于 B 地区是一个不争的 事实。 ? 换言之,单纯描述谁高谁低无需进行调整,只是 在进一步探究导致高低不同的归因 ( 所谓因素分 析 ) 时才对混杂因素进行控制或调整。 医 学 统 计 学(第二版) 李晓松 4. 数据的分组问题 ? 另一个在数据分析时特别值得注意的问题就是 分组 或分类 问题 ? 它既是数据整理的主要内容,也是数据分析的基础。 医 学 统 计 学(第二版) 李晓松 ? 分组:就是将专业上认为性质相同的个体归在一起, 将性质不同的个体区别开来,即试图在 专业上反映 出组内的同一性和组间的差异性 。 ? 在此基础上进行的数据分析才有可能揭示出事物的 本质和规律。 医 学 统 计 学(第二版) 李晓松 美国儿科杂志曾报道了医生间关于口服氨苄 青霉素副作用研究的一场有趣的争论。 医 学 统 计 学(第二版) 李晓松 剂量 (mg/kg 天 ) 无腹泻例数 有腹泻例数 合计例数 50 79 21 100 100 70 30 100 150 61 39 100 200 68 32 100 表 1 口服氨苄青霉素的副作用 A 医生认为 :“腹泻副作用不论剂量大小均常发生,虽随剂量 增加而增加,但无统计学意义 (Pearson 检验 P 0.05 )” 。见表 1 。 2 ? 医 学 统 计 学(第二版) 李晓松 二、统计分析需注意的若干问题 1. 数据分析通常的步骤 : 数据探测 统计描述 统计推断 医 学 统 计 学(第二版) 李晓松 数据探测 ? 数据探测常常是进行统计描述和统计推断的基础。 ? 如数据分布特征的考察、方差齐性的判断、散点图的绘 制、离群值的发现,以及了解数据是否符合特定统计方 法的应用条件等,必要时可进行变量变换或转换以满足 分析的需要。 ? 数据探测将增加对数据的基本了解,为进一步的分析奠 定基础。 医 学 统 计 学(第二版) 李晓松 统计描述 ? 统计描述 : 计算各种统计指标和运用各种统计图 表描述和概括数据的数量特征及分布规律。 ? 首先需要区分 变量类型 ,定量变量和定性变量 的统计描述指标是不同的。 医 学 统 计 学(第二版) 李晓松 ? 对于 定量

文档评论(0)

1亿VIP精品文档

相关文档