怎样进行独立性检验B版.docxVIP

  • 34
  • 0
  • 约1.63千字
  • 约 2页
  • 2020-11-05 发布于山东
  • 举报
怎样进行独立性检验 (B 版) 山东 孙刚璞 一、独立性检验的基本思想 独立性检验的基本思想类似于数学中的反证法 .其目的是为了确认“两个分类变量有关系”这一结论成立的可信程度 .它首先假设结论不成立,即“两个分类变量没有关系”成立, 在该假设下, 构造的随机变量 X 2 的值应该很小 .如果由观测数据计算得到的 X 2 的观测值很 大,则在一定程度上说明假设不合理 .因此可以根据随机变量 X 2 的含义来确定该假设不合理 的程度 .如果 X 2 > 6.635,则说明该假设不合理的程度是 99%,从而可认为“两个分类变量 有关系”这一结论成立的可信程度为 99% . 二、独立性检验的相关概念 1.2× 2 列联表 一般地,如果有两个分类变量 X 和 Y,它们的值域分别是 { x1, x2 }{,y1, y2} ,它们的样 本频数列联表(见下表)称为 2×2 列联表 . X2统计量 X 2 统计量是统计学中的一个非常有用的统计量, 它是根据概率的统计定义和事件的独 立性得到的,其计算公式是 X 2n( n11n22 n12n21 )2 .利用它的大小可以决定是否拒绝原来 n1 n2 n 1n 2 的统计假设,如果计算出的 X 2 值较大,就拒绝假设;如果 X 2 值较小,就接受假设 . 3.临界值 通过对 X 2 统计量分布和大量的试验数据的研究,已经得到了一些临界值,其中比较常 用的有两个: 3.841 和 6.635.在对具体问题进行独立性检验时, 把计算出的 X 2 值与以上两个 临界值进行对比,从而确定两个事件的关系 . 三、独立性检验步骤 使用 X 2 统计量作 2× 2 列联表的独立性检验的步骤是: ( 1)检查 2× 2 列联表中的数据是否符合要求; 2 n(n n n n ) 2 2 ( 2)由公式 X 11 22 12 21 计算出 X 的值; n1 n2 n 1n 2 ( 3)将 X 2 的值与两个临界值进行对比, 进而作出统计推断: 如果计算出的 X 2 >3.841, 则有 95%的把握说两个事件有关;如果计算出的 X 2 > 6.635,则有 99%的把握说两个事件 有关;如果计算出的 X 2 ≤ 3.841,则认为两个事件是无关的 . 四、独立性检验的应用举例 例 1 运动员参加比赛前往往做热身运动, 下表是一体育运动的研究机构对 160 位专业运动员追踪而得的数据,试问:由此数据,你认为运动员受伤与不做热身运动有关吗? 解:由 X 2n(n11n22 n12n21 ) 2 160 (19 20 76 45) 2 38.974 . n1 n2 n 1n 2 95 65 64 96 因为 38.974> 6.635,所以有 99%的把握说,运动员受伤与不做热身运动有关 . 例 2 某些行为在运动员的比赛之间往往被赋予很强的神秘色彩,如有一种说法认为, 在进入某乒乓球场比赛前先迈入左脚的运动员就会赢得比赛的胜利 .某记者为此追踪了某著名乒乓球运动员在该球场中的 308 场比赛,获得数据如下表: 据此资料,你能得出什么结论? 2 n(n n n n ) 2 308 (178 19 84 27) 2 解:由 X 11 22 12 21 1.502 。 . n1 n2 n 1n 2 205 103 262 46 因为 1.502< 3.384,所以我们认为先迈进左脚与否跟比赛的胜负是无关的 . 五、注意事项 1.使用 X 2 统计量作 2× 2 列联表的独立性检验时,要求表中的四个数据都要大于 5,因 此在选取样本时一定要注意 . 2.要注意独立性检验的结论与实际问题的差异,独立性检验的结论是一个数学统计量, 它与实际问题的确定性是存在差异的 . 3.独立性检验的结论不只是对样本成立,它对总体来说也是成立的,这体现了统计的意 义.

文档评论(0)

1亿VIP精品文档

相关文档