- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2017-2018年高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案(含解析)新人教A版选修2-3
3.2 立性检验的基本思想及其初步应用
独立性检验的有关概念 在某次调查中,480名男人中有38名患有色盲,520名女人中有6名患有色盲.
问题1:患色盲与性别有关系吗?
提示:有.
问题2:通过怎样比较看出患色盲与性别有关系?
提示:通过患色盲的人数占性别类型的比例.
1.分类变量
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2.2×2列联表
假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为:
y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 3.K2统计量
为了使不同样本容量的数据有统一的评判标准,我们构造一个随机变量K2
=,其中n=a+b+c+d为样本容量.
4.独立性检验
利用随机变量K2来确定是否能以给定把握认为“两个分类变量有关系”的方法,称为两个分类变量独立性检验.
1.2×2列联表的特征
2.在列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0.因此|ad-bc|越小,说明两个分类变量之间的关系越弱;|ad-bc|越大,说明两个分类变量之间的关系越强.独立性检验的思想
吸烟与患肺癌“列联表”中,事件A表示不吸烟,B表示不患肺癌.
问题1:事件A,B发生的频率可求吗?
提示:可以.
问题2:通常情况下,为研究问题方便,常用什么近似于概率?
提示:频率.
问题3:事件A,B无关有怎样的概率公式?
提示:P(AB)=P(A)P(B).
独立性检验的思想:要确定“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立.在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2观测值k很大,那么在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过可信度表评价该假设不合理的程度,即“两个分类变量有关系”的可信程度.
1.P(K2≥6.635)≈0.01表明H0成立的概率很小,是小概率事件,可以判断H0不成立,也就是“两个分类变量之间没有关系”错误地判断为“两个分类变量之间有关系”的概率不超过0.01,也可以理解为“有99%的把握认为两个分类变量之间有关系”.
2.利用独立性检验解决问题的基本步骤:
(1)根据相关数据作列联表;
(2)求K2的观测值;
(3)与临界值作比较,得出结论.
列联表和等高条形图的应用 某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.
:
考前心情紧张 332 213 545 考前心情不紧张 94 381 475 总计 426 594 1 020
相应的等高条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.
进行独立性检验的前提是根据题中数据获得2×2列联表,常用等高条形图展示列联表数据的频率特征,即将与(或与)的值相比,由此能直观地反映出两个分类变量间是否相互影响,但是此方法较粗劣.
为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:
父母吸烟 父母不吸烟 总计 子女吸烟 237 83 320 子女不吸烟 678 522 1 200 总计 915 605 1 520 利用等高条形图判断父母吸烟对子女吸烟是否有影响.
解:等高条形图如下:
由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.
某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
喜欢甜品 不喜欢甜品 合计 南方学生 60 20 80 北方学生 10 10 20 合计 70 30 100 根据表中数据,问能否在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
2×2列联表中的数据代入公式计算,k=
==≈4.762.
4.7623.841,0.05的前提下认为南方学生和北方学生在选用甜品的饮食习惯方面有差异.
根据题意列出2×2列联表,计算K2的观测值,如果K2的观测值很大,说明两个分类变量有关系的可能性很大;如果K2的观测值比较小,则认为没有充分的证据显示两个分类变量有关系.这需要给出正确的计算,避免计算失误.
在一次天气恶劣的飞机航程中,调查了男女乘客在
您可能关注的文档
- 2017-2018年高中数学 第三章 导数及其应用 3.1.1 变化率问题 3.1.2 导数的概念课后提升训练(含解析)新人教A版选修1-1.doc
- 2017-2018年高中数学 第三章 函数的应用 3.2.1 几类不同增长的函数模型学案(含解析)新人教A版必修1.doc
- 2017-2018年高中数学 第三章 导数及其应用 3.1.1 变化率问题 3.1.2 导数的概念课时达标训练(含解析)新人教A版选修1-1.doc
- 2017-2018年高中数学 第三章 导数及其应用 3.1.3 导数的几何意义学案(含解析)新人教A版选修1-1.doc
- 2017-2018年高中数学 第三章 导数及其应用 3.1.3 导数的几何意义课后提升训练(含解析)新人教A版选修1-1.doc
- 2017-2018年高中数学 第三章 导数及其应用 3.2 导数的计算学案(含解析)新人教A版选修1-1.doc
- 2017-2018年高中数学 第三章 导数及其应用 3.1.3 导数的几何意义课时达标训练(含解析)新人教A版选修1-1.doc
- 2017-2018年高中数学 第三章 导数及其应用 3.2.1 几个常用函数的导数与基本初等函数的导数公式课时达标训练(含解析)新人教A版选修1-1.doc
- 2017-2018年高中数学 第三章 导数及其应用 3.2.2 导数的运算法则课后提升训练(含解析)新人教A版选修1-1.doc
- 2017-2018年高中数学 第三章 导数及其应用 3.2.2 导数的运算法则课时达标训练(含解析)新人教A版选修1-1.doc
- 中国国家标准 GB/T 45390-2025动力锂电池生产设备通信接口要求.pdf
- 中国国家标准 GB/T 45393.2-2025信息技术 建筑信息模型(BIM)软件 第2部分:参数化模型.pdf
- GB/T 45393.2-2025信息技术 建筑信息模型(BIM)软件 第2部分:参数化模型.pdf
- 《GB/T 45393.2-2025信息技术 建筑信息模型(BIM)软件 第2部分:参数化模型》.pdf
- GB/T 10184-2025电站锅炉性能试验规程.pdf
- 海尔智家股份有限公司海外监管公告 - 海尔智家股份有限公司2024年度环境、社会及管治报告.pdf
- 上海复旦张江生物医药股份有限公司2024 环境、社会及管治报告.pdf
- 中国邮政储蓄银行股份有限公司中国邮政储蓄银行2024年可持续发展报告.pdf
- 豫园股份:2024年环境、社会及管治(ESG)报告.pdf
- 南京熊猫电子股份有限公司海外监管公告 - 2024年度环境、社会及治理(ESG)报告.pdf
文档评论(0)