2026《双向无序列联表的卡方检验分析》3100字.docxVIP

  • 1
  • 0
  • 约4.02千字
  • 约 9页
  • 2026-03-10 发布于湖北
  • 举报

2026《双向无序列联表的卡方检验分析》3100字.docx

双向无序列联表的卡方检验分析

目录

TOC\o1-3\h\u25359双向无序列联表的卡方检验分析 1

48951.1小样本2×2列联表的卡方检验 1

153451.2大样本2×2列联表的卡方检验 4

双向无序列联表,即行列变量都是称名变量,行和列变量都是无序的,检验结果与各行或各列的顺序无关。当二维列联表中的两个分类特征都是无序分类变量时,检验能够揭示两变量间的联系。然而忽视数据的特征而直接使用卡方检验,有时候会得出错误的结论。

在对维数较低的列联表进行齐性和独立性问题的检验时,如果样本数目不大,也可以不用近似的统计量来检验,而使用Fisher精确检验;而对于样本数目足够大的列联资料,使用大样本近似查表,能够很大程度的简化计算。在二维列联表中,两个分类变量均为二分类时,称为“列联表”,又称“四格表”,在医学中有着广泛应用。本节将以列联表代表,针对列联表的大样本及小样本情况分别讨论。对于及列联表也可以按照同样的方式分析卡方检验来探讨其应用。

1.1小样本2×2列联表的卡方检验

式(2-1)定义的卡方统计量计算的卡方值往往偏小,为了补救这一偏差,F.Yates在1934年提出了四格表卡方检验基本公式的连续性校正公式(3-1),它是用分布来近似2×2列联表的精确概率,服从自由度为1的卡方分布。对于一个2×2列联表(表3-1),式(3-2)为四格表卡方检验专用公式连续性校正公式。

表3-SEQ表\*ARABIC\s112×2列联表

(3-1)

(3-2)

特别地,对于2×2列联表,存在以下三种情况:

当总样本量大于40时,各单元理论数均大于5,可以使用不校正的卡方统计量;

当总样本量大于40时,存在某单元理论数小于5大于1,则应使用校正的四格卡方值;

当总样本量小于40或存在某单元理论数小于1时,不宜计算卡方值,应用Fisher精确检验直接计算概率。

本节收集到的数据为治疗患者分为复方丹参注射液治疗组和非复方丹参注射液治疗组的生存情况。该数据来源于文献[7],数据如表3-2,要研究两种治疗方法的病死率的差异,经常会考虑到用卡方检验,具体检验步骤如下:

表3-2患者治疗后生死情况列联表

组别

死亡情况

总计

死亡

生存

用注射液组

1

14

15

未用注射液组

10

18

28

总计

11

32

43

1、卡方检验的应用分析

建立检验假设:

:两处理组病死率没有差异,:两处理组病死率有差异

计算各个条件次数对应的期望频数:

对表3-2的数据的各个单元计算期望频数如表3-3:

表3-3患者治疗后生死情况期望值的列联表

组别

死亡情况

总计

死亡

生存

用注射液组

4

11

15

未用注射液组

7

21

28

总计

11

32

43

计算检验统计量

从表3-3可以知道,期望值大于1小于5的单元有1个,因此使用校正的四格表卡方统计量进行检验。自由度为。

检验结果,做出判断

利用SPSS对表3-2的数据进行卡方检验,检验结果如表3-4:

表3-4校正的四格表卡方检验结果

校正的卡方值

2.938

1

0.087

从表3-4可知,在显著性水平为5%下,,不拒绝原假设,可以认为两组病死率没有差异。

然而若使用未经校正的卡方统计量计算,得到的结果如表3-4:

表3-5卡方检验结果

统计量

4.329

1

0.039

从表3-5可知,在显著性水平为5%下,,拒绝原假设,可以认为两组病死率有差异。

Fisher精确检验的应用分析

作为对照,对表3-2的数据进行Fisher精确检验,与卡方检验结果作对比。

建立检验假设:

:两组病死率没有差异,:两组病死率有差异

计算值,做出判断

利用R软件对表3-2的数据进行Fisher精确检验,检验结果如表3-6:

表3-6Fisher检验结果

1

0.065

从表3-6可知在显著性水平为5%下,,不拒绝原假设,可以认为两组病死率没有差异。因此结论为两处理组病死率差异不具有统计学意义。

可以得知,四格表卡方检验不校正得到的概率偏小,校正后得到的概率略微偏大,但与精确计算概率较为接近。[8]若不考虑数据特征而直接使用卡方检验,可能犯拒绝一个正确假设的错误。“当卡方检验不适用时,建议使用Fisher精确检验而不是使用经过校正的卡方统计量。”[9]因此基于现有的统计软件,即使对大样本进行Fisher精确检验也是可行的,而也就不需要校正的卡方统计量。

1.2大样本2×2列联表的卡方检验

对于样本数目足够大的列联资料,使用大样本近似查表,能够很大程度的简化计算。对于大样本的2×2列联表,可直接使用检验检验变量间的相关关系,另外我们常关注比较

文档评论(0)

1亿VIP精品文档

相关文档