- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高二数学独立性检验知识精讲 苏教版
一. 本周教学内容:
独立性检验
教学目的:了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。
教学重点:能用独立性检验的方法解决实际问题。
教学难点:独立性检验的思想。
二. 知识结构:
1. 独立性检验
(1)独立性检验流程图:抽取样本提出统计假设运用检验.
(2)独立性检验的其他方法。
(3)独立性检验的基本思想类似反证法。
①假设结论不成立,即“两个分类变量没有关系”.
②在此假设下随机变量应该很小,如果由观测数据计算得到的观测值k很大,则在一定程度上说明假设不合理.
③根据随机变量K2的含义,可以通过评价该假设不合理的程度,由实际计算出,
2. 假设检验问题的原理
(1)问题:数学家庞加莱每天都从一家面包店买一块1000g 的面包,并记录下买回的面包的实际质量。一年后,这位数学家发现,所记录数据的均值为950g。于是庞加莱推断这家面包店的面包分量不足。
假设“面包分量足”,则一年购买面包的质量数据的平均值应该不少于1000g ;
“这个平均值不大于950g”是一个与假设“面包分量足”矛盾的小概率事件;
这个小概率事件的发生使庞加莱得出推断结果。
(2)假设检验问题的原理
假设检验问题由两个互斥的假设构成,其中一个叫做原假设,用表示;另一个叫做备择假设,用表示。
例如,在前面的例子中,原假设为: :面包分量足,备择假设为 :面包分量不足。这个假设检验问题可以表达为:
:面包分量足 :面包分量不足
3. 求解假设检验问题
考虑假设检验问题:
:面包分量足:面包分量不足
求解思路:
(1)在成立的条件下,构造与矛盾的小概率事件;
(2)如果样本使得这个小概率事件发生,就能以一定把握断言成立;否则,断言没有发现样本数据与相矛盾的证据。
4. 二个概念
(1).分类变量
对于性别变量,取值为:男、女这种变量的不同取“值”表示个体所属的不同类别,这类变量称为分类变量。分类变量在现实生活中是大量存在的,如是否吸烟,是否患肺癌,宗教信仰,国别,年龄,出生月份等等。
(2)利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.(为假设检验的特例)
问题:为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)
吸烟与肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965
在不吸烟者中患肺癌的比重是0.54%。在吸烟者中患肺癌的比重是 2.28%
说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大
1)通过图形直观判断两个分类变量是否相关:
2)通过图形直观判断两个分类变量是否相关:
3)通过图形直观判断两个分类变量是否相关:通过数据和图表分析,得到结论是:吸烟与串肺癌有关。
5. 独立性检验
:吸烟和患肺癌之间没有关系结论的可靠程度如何?:吸烟和患肺癌之间有关系。
将数据一般化,用下列表格表示为:
吸烟与肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 独立性检验
用A表示“不吸烟”,B表示“不患肺癌”,则:吸烟和患肺癌之间没有关系等价于“吸烟”与“患肺癌”独立, 即A与B独立。即
6. 2×2列联表
引入一个随机变量作为检验在多大程度上可以认为“两个变量有关系”的标准。设有两个分类变量X和Y它们的值域分别为{x1,x2}和{y1,y2}其样本频数列表(称为2×2列联表)为2×2列联表
y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 7.
8.的概率分布表。
1)如果P(m10.828)= 0.001表示有99.9%的把握认为“X与Y”有关系;
2)如果P(m7.879)= 0.005表示有99.5%的把握认为“X与Y”有关系;
3)如果P(m6.635)= 0.01表示有99%的把握认为“X与Y”有关系;
4)如果P(m5.024)= 0.025表示有97.5%的把握认为“X与Y”有关系;
5)如果P(m3.841)= 0.05表示有95%的把握认为“X与Y”有关系;
6)如果P(m2.706)= 0.010表示有90%的把握认为“X与Y”有关系;
7)如果m≤2.706),就认为没有充分的证据显示“X与Y”有关系;
例1. 为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)
吸烟与肺癌列联表 ? 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 209
文档评论(0)