- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
【创新设计-课堂讲义】高中数学人教A版选修1-2同步习题:1.2《独立性检验的基本思想及其初步应用》
明目标、知重点 1.了解分类变量的意义.2.了解2×2列联表的意义.3.了解随机变量K2的意义.4.通过对典型案例分析,了解独立性检验的基本思想和方法.
1.分类变量和列联表
(1)分类变量
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
(2)列联表
①定义:列出的两个分类变量的频数表称为列联表.
②2×2列联表
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为下表.
y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 2.等高条形图
(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.
(2)观察等高条形图发现和相差很大,就判断两个分类变量之间有关系.
3.独立性检验
(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
(2)K2=,
其中n=a+b+c+d为样本容量.
(3)独立性检验的具体做法
①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.
②利用公式计算随机变量K2的观测值k.
③如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.
[情境导学]
5月31日是世界无烟日.有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手.这些疾病与吸烟有关的结论是怎样得出的呢?
探究点一 列联表和等高条形图
思考1 举例说明什么是分类变量?
答 变量的不同“值”表示个体所属的不同类别的变量称为分类变量,分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级等等.
思考2 什么是列联表?怎样从列联表判断两个分类变量有无关系?
答 一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},则两个变量的频数表,称为列联表(如下图)
y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d |ad-bc|越小,说明两个分类变量x、y之间的关系越弱;
|ad-bc|越大,说明两个分类变量x、y之间的关系越强.
思考3 等高条形图对分析两个分类变量是否有关系,有何帮助?
答 通过画等高条形图,我们可以直观观察两个变量的比例关系,判断两个变量是否有关系.
例 1 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病.
根据这些数据能否断定“患呼吸道疾病与吸烟有关”?(用列联表和等高条形图说明).
解 (1)作出列联表如下:
患病 未患病 总计 吸烟 37 183 220 不吸烟 21 274 295 总计 58 457 515 在吸烟的人中,有≈16.82%的人患病,在不吸烟的人中,有≈7.12%的人患病.由上可以看出,吸烟者中患病的比例与不吸烟者中患病的比例相比有很大的差异,故“患呼吸道疾病与吸烟可能有关”.
(2)画出等高条形图如下:
通过上面的等高条形图可以直观看出,吸烟者中患病的比例与不吸烟者中患病的比例相比有很大的差异,故“患呼吸道疾病与吸烟可能有关”.
反思与感悟 利用数形结合的思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法之一.一般地,在等高条形图中,与相差越大,两个分类变量有关系的可能性就越大.
跟踪训练1 在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?
解 根据题目给出的数据作出如下的列联表:
色盲 不色盲 总计 男 38 442 480 女 6 514 520 总计 44 956 1 000 根据列联表作出相应的等高条形图:
从等高条形图来看在男人中患色盲的比例要比在女人中患色盲的比例大得多,因而,我们认为性别与患色盲是有关系的.
探究点二 独立性检验
思考1 利用列联表及等高条形图判断两个分类变量是否有关有什么优缺点?
答 优点:比较直观.
缺点:缺少精确性和可靠性.
思考2 随机变量K2有何作用?
答 利用随机变量K2=(其中n=a+b+c+d为样本容量)可以来
文档评论(0)