- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
PAGE
PAGE1/NUMPAGES12
第三节成对数据的统计分析
第2课时列联表与独立性检验
课程目标
课程目标
1.掌握分类变量的含义.
2.通过实例,理解2×2列联表的统计意义.
3.通过实例,了解2×2列联表独立性检验及其应用.
基础知识
基础知识
1.分类变量与列联表
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量;
(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,X表示相互对立的两个事件{X=0}和{X=1},Y表示相互对立的两个事件{Y=0}和{Y=1},其中a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数,n是样本量,其样本频数列联表(称为2×2列联表)如表所示:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
2.等高堆积条形图
(1)等高堆积条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征;
(2)如果通过直接计算或等高堆积条形图发现aa+b和cc
3.独立性检验
(1)概念:利用随机变量χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验;
(2)χ2的计算公式:χ2=n(ad
(3)独立性检验的基本思想:独立性检验的基本思想类似于反证法,要判断“两个分类变量有关系”,首先假设该结论不成立,即H0:两个分类变量相互独立成立.在该假设下所构造的随机变量χ2应该很小.如果由观测数据计算得到的χ2的观测值很大,则断言H0不成立,即认为“两个分类变量有关系”;如果观测值很小,则说明在样本数据中没有发现足够证据推断H0不成立;
(4)基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立(其中xα为α的临界值);
(5)应用独立性检验解决实际问题的主要环节
①提出零假设H0:X和Y相互独立,并给出在问题中的解释;
②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;
③根据检验规则得出推断结论;
④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
(6)独立性检验中几个常用的小概率值和相应的临界值:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
基础自测
基础自测
1.判断正误.(正确的画“√”,错误的画“×”)
(1)2×2列联表中的数据是两个分类变量的频数.(√)
(2)等高堆积条形图可初步分析两分类变量是否有关系,而独立性检验中χ2取值则可通过统计表从数据上说明两分类变量的相关性的大小.(√)
(3)χ2的大小是判断事件A和B是否相关的统计量.(√)
(4)在2×2列联表中,若|ad-bc|越小,则说明两个分类变量之间关系越强.(×)
(5)独立性检验的方法就是用的反证法.(×)
2.观察下面各等高堆积条形图,其中两个分类变量关系最强的是()
解析:B通过等高堆积条形图可知,选项B中y1,y2的差异最大,故两个分类变量关系最强.故选B.
3.某机构为调查网游爱好者是否有性别差异,通过调研数据统计:在500名男生中有200名爱玩网游,在400名女生中有50名爱玩网游.若要确定网游爱好是否与性别有关时,用下列最适合的统计方法是()
A.均值 B.方差
C.独立性检验 D.回归分析
解析:C由题意可知,“爱玩网游”与“性别”是两类变量,其是否有关,应用独立性检验判断.
4.第19届亚运会于2023年9月23日在中国杭州举行.为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,下表为“性别与会俄语”的2×2列联表,则a-b+d=28.
性别
是否会俄语
合计
会俄语
不会俄语
男
a
b
20
女
6
d
合计
18
50
解析:由2×2列联表得a+6=18,所以a=12,因为a+b=20,所以b=8,因为6+d=30,所以d=24,所以a-b+d=12-8+24=28.
5.已知变量X,Y,由它们的样本数据计算得到χ2≈4.328,χ2的部分临界值表如下:
α
0.10
0.05
0.025
0.010
0.005
xα
2.706
3.841
5.024
6.635
7.879
则最大有95%的把握说变量X,Y有关系(填百分数).
解析:因为χ2≈4.328>3.841=x0.05,所以在犯错误的概率不超过0.0
您可能关注的文档
- 2024年广东省广州市中考物理试题.docx
- 2024年广东省中考历史真题.docx
- 2024年广东省中考生物真题(附答案解析).docx
- 2024年黑龙江省牡丹江市中考地理试题(附答案解析).docx
- 2024年黑龙江省牡丹江市中考生物真题(附答案解析).docx
- 2024年湖南省长沙市中考道德与法治真题.docx
- 2024年湖南省长沙市中考化学真题.docx
- 2024年湖南省长沙市中考物理试题.docx
- 2024年四川省广元市中考历史真题(附答案解析).docx
- 2024年浙江省“山海联盟”初中学业水平考试模拟卷(三)历史与社会试题(附答案解析) (1).docx
- 2024学年广东省潮州湘桥区六校联考中考英语全真模拟试卷含答案.pdf
- 2020—2021学年初中物理八年级人教版上册第五章《透镜及其应用》测试卷.pdf
- 健康促进学校工作总结6篇.pdf
- 2024年度注册会计师(CPA)《财务成本管理》备考题库(含答案).pdf
- 2024年幼儿园年度安全工作计划5篇.pdf
- 浙江省台州市温岭市实验校2024学年中考试题猜想英语试卷含答案.pdf
- 2024年高中语文课内文言文复习《项脊轩志》课后练习、探究性阅读含答案解析翻译.docx
- 2025年高考语文备考之名篇名句默写: 掌握常见考查角度——辨明方向,寻找规律.pptx
- 2024年上海市普陀区高三语文模考思辨类作文模拟题+满分范文五篇:记忆究竟是什么?.docx
- 2025年高考作文备考之二元思辨类作文速成模板.docx
文档评论(0)