- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高中数学必修2-3第三章3.2独立性检验的基本思想及其初步应用讲述
3.2 独立性检验的基本思想及其初步应用
1.问题导航
(1)分类变量的概念是什么?什么是列联表?什么是2×2列联表?
(2)等高条形图的优点是什么?如何利用等高条形图判断两个变量之间的关系?
(3)独立性检验的概念是什么?怎样进行独立性检验?
2.例题导读
例1是利用等高条形图和K2值的计算判断秃顶与患心脏病是否有关,请试做教材P97练习.
1.分类变量和列联表
(1)分类变量
变量的不同“值”表示个体所属的_______不同类别,像这样的变量称为分类变量.
(2)列联表
①定义:列出的两个分类变量的_______频数表称为列联表.
②2×2列联表
一般地,假设有两个分类变量X和Y,它们的取值分别为_______{x1,x2_______}和_______{y1,y2_______},其样本频数列联表(也称为2×2列联表)为下表.
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
2.等高条形图
(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否_______相互影响,常用等高条形图展示列联表数据的_______频率特征.
(2)观察等高条形图发现aa+b和cc+d相差很大,就判断两个分类变量之间_______有关系.
3.独立性检验
(1)定义
利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
(2)K2=_______n(ad-bc)2(a+b)(c+d)(a+c)(b+d),
其中n=a+b+c+d为样本容量.
(3)独立性检验的具体做法
①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定_______临界值k0.
②利用公式计算随机变量K2的_______观测值k.
③如果_______k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则,就认为在_______犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中_______没有发现足够证据支持结论“X与Y有关系”.
1.判断(对的打“√”,错的打“×”)
(1)列联表中的数据是两个分类变量的频数.( )
(2)事件A与B的独立性检验无关,即两个事件互不影响.( )
(3)K2的大小是判断事件A与B是否相关的统计量.( )
答案:(1)√ (2)× (3)√
2.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( )
A.散点图 B.等高条形图
C.2×2列联表 D.以上均不对
答案:B
3.分类变量X和Y的列联表如下:
Y1
Y2
总计
X1
a
b
a+b
X2
c
d
c+d
总计
a+c
b+d
a+b+c+d
则下列说法中正确的是( )
A.ad-bc越小,说明X与Y关系越弱
B.ad-bc越大,说明X与Y关系越强
C.(ad-bc)2越大,说明X与Y关系越强
D.(ad-bc)2越接近于0,说明X与Y关系越强
答案:C
4.若由一个2×2列联表中的数据计算K2的观测值k=4.013,那么在犯错误的概率不超过________的前提下认为两个变量有关系.
答案:0.05
详析独立性检验
(1)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.
(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论.
(3)独立性检验原理:在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超过这个小概率.
等高条形图的应用
(2015·青岛高二检测)某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.
[解] 作列联表如下:
性格内向
性格外向
总计
考前心情紧张
332
213
545
考前心情不紧张
94
381
475
总计
426
594
1 020
相应的等高条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例大,可以认为考前紧张与性格类别有关.
利用等高条形图判断两个分类变量是否相关的步骤
1.(1)观察下列各图,其中两个分类变量X,Y之间关系最强的是( )
解析:选D.在四幅图中,D图中两个阴影条的高度相差最明显,说明两个分类变量之间的关系
原创力文档


文档评论(0)