人教新课标A版高中数学选修2—3可编辑课件第三章统计案例32独立性检验的基本思想及其初步应用.ppt

人教新课标A版高中数学选修2—3可编辑课件第三章统计案例32独立性检验的基本思想及其初步应用.ppt

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[解析] 依题意可知: 6.635, 又P(K2≥6.635)=0.01, 因此,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关. [例2] 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下,问铅中毒病人和对照组的尿棕色素阳性数有无差别? 组别 阳性数 阴性数 合计 铅中毒病人 29 7 36 对照组 9 28 37 合计 38 35 73 [解析] 由上述列联表可知,在铅中毒病人中尿棕色素为阳性的占80.56%,而对照组仅占24.32%.说明他们之间有较大差别. 根据列联表作出三维柱形图(如图1),二维条形图(如图2),频率分布条形图(如图3所示),由上述三图可知,铅中毒病人中与对照组相比较,尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性存在关联关系. [点评] 由两个分类变量之间频率大小差异可说明这两个变量之间是有关联关系的.而利用三维柱形图、二维条形图、频率分布条形图都能形象直观地反映它们之间差异的关系,进而推断它们之间是否具有关联关系.其中作三维柱形图时应注意恰当的视角,使每个柱体都能看到.而频率分布条形图由于是等高的,因此它与二维条形图相比较更能直观地反映它们之间的差异的大小,特别是当样本容量差异明显时更是如此. 3.2 独立性检验的基本思想及其初步应用 1.通过对典型案例的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用 2.通过对数据的收集、整理和分析,增强学生的社会实践能力,培养学生分析问题、解决问题的能力. 本节重点、难点:独立性检验的思想方法与初步应用. 1.两分类变量之间关联关系的定性分析 (1)分类变量:取不同的“值”表示个体所属不同类别的变量称为分类变量. 说明:①对分类变量的正确理解:这里的“变量”和“值”都应作为广义的变量和值进行理解.如:对于性别变量,其取值为男、女两种,所以这里的“变量”指的是“性别”,这里的“值”指的是“男”和“女”.故这里所说的“变量”和“值”不一定是具体的数值. ②分类变量是大量存在的,如吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别. (2)频率分析:通过对样本中每个分类变量的不同类别的事件发生的频率大小比较来分析分类变量之间是否有关联. (3)图形分析:利用三维柱形图及二维条形图来分析分类变量之间是否具有关联分析,图形的形象直观更能说明相关数据的总体状况. 一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频率列联表(即2×2列联表)如下表: y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,说明X与Y有关的可能性越大,当ad与bc的差趋近于零时,X与Y几乎没有关系,可以说X与Y是相互独立的. 2.独立性检验 (1)定义:利用随机变量 K2= (其中n=a+b+c+d)来确定是否能以一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.独立性检验的基本思想类似于反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下随机变量K2应该很小. 如果由观测数据计算得到的K2的观测值k很大,则在一定可信程度上说明假设不合理.根据随机变量K2的含义,可以通过概率P(K2≥k0)的大小来评价该假设不合理的程度有多大,从而得出“两个分类变量有关系”这一结论成立的可信程度有多大. (2)如何用K2的值判断X与Y之间是否有关? 首先列2×2列联表,当得到的观测数据a,b,c,d都不小于5时,由2×2列联表求出K2的观测值k.若k≥10.828,则我们有99.9%的把握认为X与Y有关,这种判断结果出错的可能性约为0.1%;若k≥6.635,则我们有99%的把握认为X与Y有关,这种判断结果出错的可能性约为1%;若k≥2.706,则我们有90%的把握认为X与Y有关,这种判断结果出错的可能性约为10%;若k2.706,则没有充分的证据显示X与Y有关,但也不能认为X与Y无关. 3.独立性检验的基本方法 一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为: 若要推断的结论为:H1:“X与Y有关系”,可以按如下步骤判断结论H1成立的可能性: y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d (1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档