- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第2课时列联表与独立性检验
1.掌握分类变量的含义.
2.通过实例,理解2×2列联表的统计意义.
3.通过实例,了解2×2列联表独立性检验及其应用.
1.在研究打鼾与患心脏病的关系中,通过收集数据、整理分析数据得“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()
A.100个吸烟者中至少有99人打鼾
B.1个人患有心脏病,那么这个人有99%的概率打鼾
C.在100个心脏病患者中一定有打鼾的人
D.在100个心脏病患者中可能一个打鼾的人也没有
解析:D在犯错误的概率不超过0.01的前提下认为这个结论是成立的,其意义就是我们有99%的把握认为打鼾与患心脏病有关,在100个心脏病患者中可能一个打鼾的人也没有,故D正确;对于A,题设中没有给出吸烟与打鼾相关性判断,故A错误;对于B,独立性检验是对分类变量相关的判断,不能具体到个体,故B错误;对于C,在100个心脏病患者中可能一个打鼾的人也没有,故C错误.故选D.
2.已知变量X,Y,由它们的样本数据计算得到χ2≈4.328,χ2的部分临界值表如下:
α
0.10
0.05
0.025
0.010
0.005
xα
2.706
3.841
5.024
6.635
7.879
则最大有的把握说变量X,Y有关系(填百分数).
答案:95%
解析:因为χ2≈4.328>3.841=x0.05,所以在犯错误的概率不超过0.05的前提下认为变量X,Y有关系.所以最大有95%的把握说变量X,Y有关系.
3.第19届亚运会于2023年9月23日在中国杭州举行.为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,下表为“性别与会俄语”的2×2列联表,则a-b+d=.
性别
是否会俄语
合计
会俄语
不会俄语
男
a
b
20
女
6
d
合计
18
50
答案:28
解析:由2×2列联表得a+6=18,所以a=12,因为a+b=20,所以b=8,因为6+d=30,所以d=24,所以a-b+d=12-8+24=28.
分类变量与列联表
1.(多选)根据如图所示的等高堆积条形图,下列叙述正确的是()
A.吸烟患肺病的频率约为0.2
B.吸烟不患肺病的频率约为0.8
C.不吸烟患肺病的频率小于0.05
D.吸烟与患肺病无关系
解析:ABC从等高堆积条形图上可以明显地看出,吸烟患肺病的频率远远大于不吸烟患肺病的频率.A、B、C都正确.
2.对甲、乙两个班级学生的数学考试成绩按照优秀和不优秀统计人数后,得到如下的列联表,则χ2约为()
班级
数学成绩
合计
优秀
不优秀
甲班
11
34
45
乙班
8
37
45
合计
19
71
90
A.0.600 B.0.828
C.2.712 D.6.014
解析:Aχ2=90×(11×37
3.如下是一个2×2列联表,则m+n=.
X
Y
合计
y1
y2
x1
a
35
45
x2
7
b
n
合计
m
73
s
答案:62
解析:根据2×2列联表可知a+35=45,解得a=10,则m=a+7=17,又由35+b=73,解得b=38,则n=7+b=45,故m+n=17+45=62.
练后悟通
分类变量的两种统计表示形式
(1)等高堆积条形图:根据等高堆积条形图的高度差判断两分类变量是否有关联及关联强弱;
(2)2×2列联表:直接利用2×2列联表中的数据进行计算分析,用定量的方式判断两分类变量是否有关联及关联强弱.
分类变量关联性的判断
【例1】(2024·滕州模拟)某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:
患心脏病
无心脏病
秃发
20
300
不秃发
5
450
根据表中数据得到χ2≈15.968,因为χ2>10.828,则断定秃发与患心脏病有关系.那么这种判断出错的可能性为()
A.0.001 B.0.05
C.0.025 D.0.01
解析:A因为χ2>10.828=x0.001,因此判断出错的可能性为0.001,故选A.
解题技法
如果χ2>xα,则“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.
某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3000人,计算得χ2=6.023,则市政府断言市民收入增减与旅游愿望有关系的可信程度是()
A.90% B.95%
C.99% D.99.5%
解析:B由临界值表,得6.023>3.841=x0.05,所以断言市民收入增减与旅游愿望有关系的可信程度为95%.
独立性检
文档评论(0)