- 34
- 0
- 约1.63千字
- 约 2页
- 2020-11-05 发布于山东
- 举报
怎样进行独立性检验 (B 版)
山东 孙刚璞
一、独立性检验的基本思想
独立性检验的基本思想类似于数学中的反证法 .其目的是为了确认“两个分类变量有关系”这一结论成立的可信程度 .它首先假设结论不成立,即“两个分类变量没有关系”成立,
在该假设下, 构造的随机变量 X 2
的值应该很小 .如果由观测数据计算得到的
X 2 的观测值很
大,则在一定程度上说明假设不合理
.因此可以根据随机变量
X 2 的含义来确定该假设不合理
的程度 .如果 X 2 > 6.635,则说明该假设不合理的程度是
99%,从而可认为“两个分类变量
有关系”这一结论成立的可信程度为
99% .
二、独立性检验的相关概念
1.2× 2 列联表
一般地,如果有两个分类变量
X 和 Y,它们的值域分别是
{ x1, x2 }{,y1, y2} ,它们的样
本频数列联表(见下表)称为
2×2 列联表 .
X2统计量
X 2
统计量是统计学中的一个非常有用的统计量,
它是根据概率的统计定义和事件的独
立性得到的,其计算公式是
X 2n( n11n22 n12n21 )2
.利用它的大小可以决定是否拒绝原来
n1 n2 n 1n 2
的统计假设,如果计算出的
X 2 值较大,就拒绝假设;如果
X 2 值较小,就接受假设 .
3.临界值
通过对 X 2 统计量分布和大量的试验数据的研究,已经得到了一些临界值,其中比较常
用的有两个: 3.841 和 6.635.在对具体问题进行独立性检验时, 把计算出的 X 2 值与以上两个
临界值进行对比,从而确定两个事件的关系 .
三、独立性检验步骤
使用 X 2 统计量作 2× 2 列联表的独立性检验的步骤是:
( 1)检查 2× 2 列联表中的数据是否符合要求;
2
n(n n
n
n ) 2
2
( 2)由公式 X
11
22
12
21
计算出 X
的值;
n1
n2
n 1n 2
( 3)将 X 2 的值与两个临界值进行对比,
进而作出统计推断: 如果计算出的 X 2 >3.841,
则有 95%的把握说两个事件有关;如果计算出的
X 2 > 6.635,则有 99%的把握说两个事件
有关;如果计算出的
X 2
≤ 3.841,则认为两个事件是无关的 .
四、独立性检验的应用举例
例 1 运动员参加比赛前往往做热身运动, 下表是一体育运动的研究机构对 160 位专业运动员追踪而得的数据,试问:由此数据,你认为运动员受伤与不做热身运动有关吗?
解:由 X 2n(n11n22
n12n21 ) 2
160 (19 20
76 45) 2
38.974 .
n1 n2
n 1n 2
95 65
64 96
因为 38.974> 6.635,所以有 99%的把握说,运动员受伤与不做热身运动有关 . 例 2 某些行为在运动员的比赛之间往往被赋予很强的神秘色彩,如有一种说法认为,
在进入某乒乓球场比赛前先迈入左脚的运动员就会赢得比赛的胜利 .某记者为此追踪了某著名乒乓球运动员在该球场中的 308 场比赛,获得数据如下表:
据此资料,你能得出什么结论?
2
n(n
n
n
n ) 2
308 (178 19 84
27) 2
解:由 X
11
22
12
21
1.502
。 .
n1
n2
n 1n 2
205 103 262
46
因为 1.502< 3.384,所以我们认为先迈进左脚与否跟比赛的胜负是无关的
.
五、注意事项
1.使用 X 2
统计量作
2× 2 列联表的独立性检验时,要求表中的四个数据都要大于
5,因
此在选取样本时一定要注意 .
2.要注意独立性检验的结论与实际问题的差异,独立性检验的结论是一个数学统计量,
它与实际问题的确定性是存在差异的 .
3.独立性检验的结论不只是对样本成立,它对总体来说也是成立的,这体现了统计的意
义.
原创力文档

文档评论(0)