- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
8.3 列联表与独立性检验
(第一课时 分类变量与列联表)
课标要求
素养要求
1.通过实例,理解2×2列联表的统计意义.
2.理解判断两个分类变量是否有关系的常用方法.
通过学习2×2列联表,提升数学抽象、直观想象及数据分析素养.
【课前预习】
新知探究
饮用水的质量是人类普遍关心的问题,根据统计,饮用优质水的518人中,身体状况优秀的有466人,饮用一般水的312人中,身体状况优秀的有218人.
问题 人的身体健康状况与饮用水的质量之间有关系吗?
提示 我们可以根据2×2列联表找到人的身体健康与饮用水之间的关系,也就是本节课所要学习的内容.
1.分类变量
这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
2.2×2列联表
在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将这类数据统计表称为2×2列联表,2×2列联表给出了成对分类变量数据的交叉分类频数.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
y1
y2
合计
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
3.等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
拓展深化
[微判断]
1.分类变量中的变量与函数中的变量是同一概念.(×)
提示 分类变量中的变量是指一定范围内的两种现象或性质,与函数中的变量不是同一概念.
2.列联表中的数据是两个分类变量的频数.(√)
3.列联表、频率分析法、等高条形图都可初步分析两分类变量是否有关系.(√)
[微训练]
1.下列不是分类变量的是( )
A.近视 B.成绩
C.血压 D.饮酒
解析 近视变量有近视与不近视两种类别,血压变量有异常、正常两种类别,饮酒变量有饮酒与不饮酒两种类别.故选B.
答案 B
2.某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如2×2列联表所示(单位:人),则其中m=________,n=________.
80分及80分以上
80分以下
合计
试验班
32
18
50
对照班
24
m
50
合计
56
44
n
解析 由题意得eq \b\lc\{(\a\vs4\al\co1(24+m=50,,56+44=n,))
解得eq \b\lc\{(\a\vs4\al\co1(m=26,,n=100.))
答案 26 100
[微思考]
1.是否吸烟、是否患肺癌是什么变量?
提示 分类变量.
2.吸烟与患肺癌之间的关系还是前面我们研究的线性相关关系吗?
提示 不是.
【课堂互动】
题型一 用2×2列联表分析两分类变量间的关系
【例1】 在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用eq \f(a,a+b)与eq \f(c,c+d)判断二者是否有关系.
解 2×2列联表如下:
年龄在六十岁以上
年龄在六十岁以下
合计
饮食以蔬菜为主
43
21
64
饮食以肉类为主
27
33
60
合计
70
54
124
将表中数据代入公式得
eq \f(a,a+b)=eq \f(43,64)=0.671 875.eq \f(c,c+d)=eq \f(27,60)=0.45.
显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.
规律方法 (1)作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.
(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将eq \f(a,a+b)与eq \f(c,c+d) eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(b,a+b)与\f(d,c+d)))的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.
【训练1】 假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
y1
y2
x1
10
18
x2
m
26
则当m取下面何值时,X与Y的关系最弱( )
A.8 B.9
C.14 D.19
解析 由10×26≈18m,解得
文档评论(0)