第八章-8.3-列联表与独立性检验-教案.docxVIP

第八章-8.3-列联表与独立性检验-教案.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

列联表与独立性检验

学习目标1.通过实例,理解2×2列联表的统计意义.2.通过实例,了解2×2列联表独立性检验及其应用.

知识点一分类变量

为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.

知识点二2×2列联表

1.2×2列联表给出了成对分类变量数据的交叉分类频数.

2.定义一对分类变量X和Y,我们整理数据如下表所示:

X

Y

合计

Y=0

Y=1

X=0

a

b

a+b

X=1

c

d

c+d

合计

a+c

b+d

n=a+b+c+d

像这种形式的数据统计表称为2×2列联表.

知识点三独立性检验

1.定义:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”.简称独立性检验.

2.χ2=eq\f(n?ad-bc?2,?a+b??c+d??a+c??b+d?),其中n=a+b+c+d.

3.独立性检验解决实际问题的主要环节

(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.

(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.

(3)根据检验规则得出推断结论.

(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.

思考独立性检验与反证法的思想类似,那么独立性检验是反证法吗?

答案不是.因为反证法不会出错,而独立性检验依据的是小概率事件几乎不发生.

1.分类变量中的变量与函数的变量是同一概念.(×)

2.等高堆积条形图可初步分析两分类变量是否有关系,而独立性检验中χ2取值则可通过统计表从数据上说明两分类变量的相关性的大小.(√)

3.事件A与B的独立性检验无关,即两个事件互不影响.(×)

4.χ2的大小是判断事件A与B是否相关的统计量.(√)

一、等高堆积条形图的应用

例1为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:

组别

尿棕色素

合计

阳性数

阴性数

铅中毒病人

29

7

36

对照组

9

28

37

合计

38

35

73

试画出列联表的等高堆积条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?

解等高堆积条形图如图所示:

其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.

由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.

反思感悟等高堆积条形图的优劣点

(1)优点:较直观地展示了eq\f(a,a+b)与eq\f(c,c+d)的差异性.

(2)劣点:不能给出推断“两个分类变量有关系”犯错误的概率.

跟踪训练1网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用等高堆积条形图判断学生学习成绩与经常上网有关吗?

解根据题目所给的数据得到如下2×2列联表:

学习成绩

上网

合计

经常

不经常

不及格

80

120

200

及格

120

680

800

合计

200

800

1000

得出等高堆积条形图如图所示:

比较图中阴影部分高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为学习成绩与经常上网有关.

二、由χ2进行独立性检验

命题角度1有关“相关的检验”

例2某校对学生课外活动进行调查,结果整理成下表:试根据小概率值α=的独立性检验,分析喜欢体育还是文娱与性别是否有关系.

性别

喜欢

合计

体育

文娱

男生

21

23

44

女生

6

29

35

合计

27

52

79

解零假设为H0:喜欢体育还是喜欢文娱与性别没有关系.

∵a=21,b=23,c=6,d=29,n=79,

∴χ2=eq\f(n?ad-bc?2,?a+b??c+d??a+c??b+d?)

=eq\f(79×?21×29-23×6?2,44×35×27×52)≈=x.

根据小概率值α=的独立性检验,我们推断H0不成立,即认为喜欢体育还是喜欢文娱与性别有关.

反思感悟用χ2进行“相关的检验”步骤

(1)零假设:即先假设两变量间没关系.

(2)计算χ2:套用χ2的公式求得χ2值.

(3)查临界值:结合所给小概率值α查得相应的临界值xα.

(4)下结论:比较χ2与xα的大小,并作出结论.

跟踪训练2甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸x(单位:cm)及个数y,如下表:

零件

尺寸x

零件

个数y

3

7

8

9

3

7

4

4

4

a

由表

文档评论(0)

193****8045 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档