网站大量收购独家精品文档,联系QQ:2885784924

4.3.2独立性检验(原卷版).docx

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

4.3.2独立性检验

TOC\o1-3\h\u题型12×2列联表及其应用 2

题型2由χ2进行独立性检验 10

知识点一.2×2列联表

1.定义∶如果随机事件A与B的样本数据整理成如下的表格形式.

2×2列联表

A

A

总计

B

a

b

a+b

B

c

d

c+d

总计

a+c

b+d

a+b+c+d

因为这个表格中,核心数据是中间4个格子,所以这样的表格通常称为2×2列联表.

2.x2计算公式∶χ2=eq\f(n?ad-bc?2,?a+b??c+d??a+c??b+d?),其中n=a+b+c+d为样本容量.

3.列联表的统计意义∶

记n=a+b+c+d,则由上表可知∶

事件A发生的概率可估计为P(A)=a+cn

事件B发生的概率可估计为P(B)=a+bn

事件AB发生的概率可估计为P(AB)=an

注意:(1)2×2列联表主要用于研究两个事件之间是相互独立的还是存在某种关联性,它适用于分析两个事件之间的关系;

(2)因为P(A),P(B),P(AB)都是根据样本数据得到的估计值,而估计是有误差的,因此直接用P(AB)=P(A)P(B)是否成立来判断A与B是否独立是不合理的.

知识点二.独立性检验

1.定义∶在2×2列联表中,设χ2=eq\f(n?ad-bc?2,?a+b??c+d??a+c??b+d?),任意给定α(称为显著性水平),可以找到满足条件P(χ2≥k)=α的数k(称为显著性水平α对应的分位数).

如果根据样本数据算出χ2(读作卡方)的值后,发现χ2≥k成立,就称在犯错误的概率不超过α的前提下,可以认为A与B不独立(也称为A与B有关);或说有1-α的把握认为A与B有关.若χ2k成立,就称不能得到前述结论

2.统计学中,常用的显著性水平α以及对应的分位数k如下表所示.:

α=p(x2≥k)

0.1

0.05

0.01

0.005

0.001

k

2.706

3.841

6.635

7.879

10.828

注意:(1)独立性检验的基本思想∶独立性检验的基本思想类似于反证法,要判断两个分类变量有关系”,首先假设结论不成立,即“H0∶两个分类变量没有关系”成立.在该假设下所构造的随机变量χ2应该很小.如果由观测数据计算得到的χ2很大,则断言Ho不成立,即认为“两个分类变量有关系”;如果χ2很小,则说明在样本数据中没有发现足够证据拒绝

(2)独立性检验与反证法的比较

反证法原理

在假设Ho下,如果推出一个矛盾,就证明了Ho不成立

独立性检验原理

在假设Ho下,如果出现一个与Ho相矛盾的小概率事件,就推断Ho不成立,且该推断犯错的概率不超过这个小概率

题型12×2列联表及其应用

【方法总结】列2×2列联表的关注点:

作2×2列联表时,注意应该是4行4列,计算时要准确无误.

(2)作2×2列联表时,关键是对涉及的变量分清类别.

【例题1】(2021·西藏·日喀则市南木林高级中学)假设有两个变量X和Y,他们的取值分别为x1,x2和y1

y

y

总计

x

a

21

73

x

8

25

33

总计

b

46

106

则表中a,b的值分别是(????)

A.94,96 B.54,52 C.52,50 D.52,60

【变式1-1】1.(2022·全国·高二单元测试)假设有两个分类变量X与Y,它们的可能取值分别为x1,x2和

则当整数m取______时,X与Y的关系最弱(????)

A.8 B.9 C.14 D.19

【变式1-1】2.(2022·全国·高二课时练习)假设有两个分类变量x与y的2×

y

y

x

a

b

x

c

d

对于以下数据,对同一样本能说明x与y有关系的可能性最大的一组为(????)A.a=5,b=4,c=3,d=2 B.a=5,

C.a=2,b=3,c=4,d=5 D.a=2,

【变式1-1】3.(2023·全国·高三专题练习)(多选)为了增强学生的身体素质,某校将冬天长跑作为一项制度固定下来,每天大课间例行跑操.为了调查学生喜欢跑步是否与性别有关,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢跑步,女生中有40%不喜欢跑步,且有95%的把握判断喜欢跑步与性别有关,但没有99%的把握判断喜欢跑步与性别有关,则被调查的男、女学生的总人数可能为(????)

A.120 B.130 C.240 D.250

【变式1-1】4.(2022·全国·高三专题练习)(多选)疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的预防性生物制品,其前期研发过程中,一般都会进行动物保护测试,为了考察某种疫苗预防效果,在进行动物试验时,得到如下统计数据:

未发病

发病

总计

未注射疫苗

30

注射疫苗

40

总计

70

30

100

附表及公式:

P

0.05

0.01

0.00

您可能关注的文档

文档评论(0)

182****0427 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档