2017学年高中数学人教A版选修2-3教材梳理:3.2独立性检验的基本思想及其初步应用 Word版含解析.docVIP

2017学年高中数学人教A版选修2-3教材梳理:3.2独立性检验的基本思想及其初步应用 Word版含解析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2017学年高中数学人教A版选修2-3教材梳理:3.2独立性检验的基本思想及其初步应用 Word版含解析

庖丁巧解牛 知识·巧学 一、两个分类变量之间关系的定性分析 1.分类变量 取不同的“值”表示个体所属不同类别的分量称为分类变量.这里的“变量”和值都应作为“广义”的变量和值进行理解.例如:对于性别变量,其取值为男和女两种.那么这里的变量指的是性别,同样这里的“值”指的是“男”和“女”,因此,这里所说的“变量”和值不一定取的是具体的数值. 要点提示 注意此处空半格分类变量是大量存在的,例如:吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别. 2.定性分析的方法 (1)频率分析 通过对样本的每个分类变量的不同类别的事件发生的频率大小比较来分析分类变量之间是否有关联关系.通常通过列联表列出两个分类变量的占少数表来进行分析. (2)图形分析 ①三维柱形图.它可以清晰的看出各个频数的相对大小; ②二维条形图.如本节引例中,可画叠在一起的二维条形图.浅色条高表示不患肺癌的人数,深色条高表示患肺癌的人数; ③频率分布条形图:为了更清晰的表示引例的特征,我们可用等高条形图表示两种情况下患肺癌的比例. 方法归纳 注意此处空半格三维柱形图和二维条形图能更直观地反映出相关数据的总体状况.作三维柱形图时要注意选择恰当的视角,以使每个柱体都能被看到. 二、独立假设 1.2×2列联表 不患肺癌 患肺癌 总计 不吸烟 7 775 42 7 817 吸烟 2 099 49 2 148 总计 9 874 91 9 965 上表称为2×2列联表.意思是问题要考虑调查的人的两种状态:是否吸烟,是否患肺癌.每种状态又分两种情况:吸烟,不吸烟以及患肺癌、未患肺癌.表中排成两列的数据是调查得来的结果,希望根据这4个数据来检验上述两种状态是否有关.这一检验就称为2×2列联表的独立性检验. 2.独立性检验:利用随机变量K2=(其中n=a+b+c+d为样本容量)来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. 要点提示 注意此处空半格上述表达式就是统计中重要的K2统计量,用它的大小可以决定是否拒绝原来的统计假设H1,如果算出的K2值较大,就拒绝H1,也就是拒绝事件“X与Y无关”,从而就认为它们是有关的了. 深化升华 注意此处空半格独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设下构造的随机变量K2应该很小.如果由观测数据计算得到的K2的观测值k很大,则在一定程度上说明假设不合理.根据随机变量K2的含义,可以通过概率P(K2≥k)的大小来评价该假设不合理的程度有多大,从而说明这“两个分类变量没有关系”这一结论成立的可信程度有多大. 三、判断结论成立的可能性的方法 1.通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度. (1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相关越大,H1成立的可能性就越大. (2)在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例,也可以估计满足条件X=x2的个体中具有Y=y2的个体所占的比例.两个比例的值相差越大,H1成立的可能性就越大. 2.利用独立性检验来考查两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是根据观测数据计算检验随机变量K2的值k,其值越大,说明H1成立的可能性就越大.当得到的观测数据a、b、c、d都不小于5时,可以通过随机变量k2来确定结论的可信程度. 要点提示 注意此处空半格在计算得检验随机变量K2的值时,要注意临界值6.635,3.841和2.706.如果k2>6.635,就有99%把握认为“X与Y有关系”.如果k2>3.841,就有95%把握认为“X与Y有关系”.如果k2>2.706,就有90%把握认为“X与Y有关系”.而如果k2≤2.706,就认为没有充分的证据显示“X与Y有关系”. 误区警示 注意此处空半格使用K2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,所以在选取样本容量时一定要注意这一点. 问题·探究 问题1某聋哑研究机构对聋哑关系进行抽样调查,在耳聋的657人中有416人哑,而另外不聋的680人中有249人哑.你能运用这组数据得出相应结论吗? 思路:认真分析后,我们就是要在聋与哑有无关系上作出结论.于是可以运用独立性检验进行判断.一种方法可以根据题目所给数据得到2×2列联表,计算K2的值,与临界值做比较;另一种方法可以用三维柱形图粗略估计得出结论.当然,我们也可以采用对照两组人群中哑的比例进行粗略

您可能关注的文档

文档评论(0)

zijingling + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档