第04讲 列联表与独立性检验(解析版).docxVIP

第04讲 列联表与独立性检验(解析版).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

备战2024年高考《解读?突破?强化》一轮复习讲义(新高考)

第04讲列联表与独立性检验

【考试要求】

1.掌握分类变量的含义.

2.通过实例,理解2×2列联表的统计意义.

3.通过实例,了解2×2列联表独立性检验及其应用.

知识点一分类变量与列联表

(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量;

(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,X表示相互对立的两个事件{X=0}和{X=1},Y表示相互对立的两个事件{Y=0}和{Y=1},其中a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数,n是样本量,其样本频数列联表(称为2×2列联表)如表所示:

X

Y

合计

Y=0

Y=1

X=0

a

b

a+b

X=1

c

d

c+d

合计

a+c

b+d

n=a+b+c+d

知识点二独立性检验

(1)小概率值α的临界值:对于任何小概率值α,可以找到相应的正实数xα,使得关系P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值可作为判断χ2大小的标准.概率值α越小,临界值xα越大;

(2)χ2的计算公式:χ2=n(

(3)独立性检验:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验;

(4)基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立(其中xα为α的临界值);

(5)应用独立性检验解决实际问题的主要环节:

①提出零假设H0:X和Y相互独立,并给出在问题中的解释;

②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;

③根据检验规则得出推断结论;

④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.

(6)独立性检验中几个常用的小概率值和相应的临界值:

α

0.1

0.05

0.01

0.005

0.001

2.706

3.841

6.635

7.879

10.828

1.下列判断正确的是()

A分类变量中的变量与函数的变量是同一概念. ()

B等高堆积条形图可初步分析两分类变量是否有关系,而独立性检验中χ2取值则可通过统计表从数据上说明两分类变量的相关性的大小. ()

C独立性检验的方法就是用的反证法. ()

Dχ2的大小是判断事件A与B是否相关的统计量. ()

【答案】BD

2.观察下面各等高堆积条形图,其中两个分类变量关系最强的是 ()

【答案】B

【解析】通过等高堆积条形图可知,选项B中y1,y2的差异最大,故两个分类变量关系最强.故选B.

3.(多选)若在研究吸烟与患肺癌的关系中,通过收集、整理、分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是 ()

A.在犯错误的概率不超过0.01的前提下,认为吸烟和患肺癌有关系

B.1个人吸烟,那么这个人有99%的概率患有肺癌

C.在100个吸烟者中一定有患肺癌的人

D.在100个吸烟者中可能一个患肺癌的人也没有

【答案】AD

【解析】独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生.

4.下面是一个2×2列联表:

X

Y

合计

y1

y2

x1

a

21

73

x2

22

25

47

合计

b

46

120

则表中的a=,b=.?

【答案】5274

【解析】∵a+21=73,∴a=52.又a+22=b,∴b=74.

5.已知变量X,Y,由它们的样本数据计算得到χ2≈4.328,χ2的部分临界值表如下:

α

0.10

0.05

0.025

0.010

0.005

2.706

3.841

5.024

6.635

7.879

则最大有的把握说变量X,Y有关系(填百分数).?

【答案】95%

【解析】因为χ2≈4.328>3.841=x0.05,所以在犯错误的概率不超过0.05的前提下认为变量X,Y有关系.所以最大有95%的把握说变量X,Y有关系.

考点一等高条形图

例12018年12月28日,广州市地铁14号线开通,在一定程度上缓解从化到广州市区交通的拥堵,为了了解市民对地铁14号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析了其年龄和性别结构,并制作出如下等高条形图:根据图中(35岁以上含35岁)的信息,下列结论不一定正确的是(???)

A.样本中男性比女性更关注地铁14号线开通

B.样本中多数女性是35岁以上

C.样本中35岁以

文档评论(0)

专业写作罗老师 + 关注
实名认证
服务提供商

中级注册安全工程师、二级建造师持证人

专注于教学及企业生产文案的创作,具有多年工作经验,欢迎咨询

领域认证该用户于2024年09月21日上传了中级注册安全工程师、二级建造师

1亿VIP精品文档

相关文档