高中数学1-2独立性检验基本思想及其初步应用课件.pptVIP

高中数学1-2独立性检验基本思想及其初步应用课件.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高中数学1-2独立性检验基本思想及其初步应用课件

独立性检验的基本思想 及其初步应用 问题: 数学家庞加莱每天都从一家面包店买一块1000g 的面包,并记录下买回的面包的实际质量。一年后,这位数学家发现,所记录数据的均值为950g。于是庞加莱推断这家面包店的面包分量不足。 假设“面包分量足”,则一年购买面包的质量数据的平均值应该不少于1000g ; “这个平均值不大于950g”是一个与假设“面包分量足”矛盾的小概率事件; 这个小概率事件的发生使庞加莱得出推断结果。 一:假设检验问题的原理 假设检验问题由两个互斥的假设构成,其中一个 叫做原假设,用H0表示;另一个叫做备择假设,用H1表示。 例如,在前面的例子中, 原假设为: H0:面包分量足, 备择假设为 H1:面包分量不足。 这个假设检验问题可以表达为: H0:面包分量足 ←→ H1:面包分量不足 二:求解假设检验问题 考虑假设检验问题: H0:面包分量足 ←→ H1:面包分量不足 在H0成立的条件下,构造与H0矛盾的小概率事件; 如果样本使得这个小概率事件发生,就能以一定把握断言H1成立;否则,断言没有发现样本数据与H0相矛盾的证据。 求解思路: 1、介绍两个相关的概念 对于性别变量,其取值为男和女两种,这种变量的 不同“值”表示个体所属的不同类别,像这样的变量称为 分类变量,也称为属性变量或定性变量,它们的取值一定是离散的,而且不同的取值仅表示个体所属的类别。 (1)分类变量: 定量变量的取值一定是实数,它们的取值大小有 特定的含义,不同取值之间的运算也有特定的含义。 (2)定量变量: 例如身高、体重、考试成绩等,张明的身高是180cm,李立的 身高是175cm,说明张明比李立高180-175=5(cm)。 独立性检验 本节研究的是两个分类变量的独立性检验问题。 在日常生活中,我们常常关心分类变量的之间是否有关系 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查 了9965人,得到如下结果(单位:人): 那么吸烟是否对患肺癌有影响? 表1-9 吸烟与患肺癌列联表 1、象这样的两个分类变量的频数表叫列联表. 在不吸烟者中,有0.54%患有肺癌; 在吸烟者中,有2.28%患有肺癌。因此,直观上可以 得到结论: 吸烟者和不吸烟者患肺癌的可能性存在差异。 2、与表格相比,三维柱形图和二维条形图能更直观地反映 出相关数据的总体状况。 三 维 柱 形 图 二维条形图 不患肺癌 患肺癌 吸烟 不吸烟 不患肺癌 患肺癌 吸烟 不吸烟 0 8000 7000 6000 5000 4000 3000 2000 1000 不吸烟 吸烟 患肺癌 比例 不患肺癌 比例 等高条形图 上面我们通过分析数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否真的如此呢? 你得到这个结论有多大的把握呢? 独立性检验 H0: 吸烟和患肺癌之间没有关系 ←→ H1: 吸烟和患肺癌之间有关系 通过数据和图表分析,得到结论是:吸烟与患肺癌有关 结论的可靠程度如何? 用 A 表示“不吸烟”, B 表示“不患肺癌” 则 H0: 吸烟和患肺癌之间没有关系 “吸烟”与“患肺癌”独立, 即A与B独立 等价于 等价于 吸烟与肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 独立性检验 引入一个随机变量 作为检验在多大程度上可以认为“两个变量有关系”的标准 。 因此:若 H0成立,则K2应很小。 利用公式(1)计算得到 K2 的观测值为 如何看待这个值呢? 即在H0成立的情况下,K2的值大于6.635的概率非常小,近似于0.01。而现在K2的值56.632远大于6.635, 故它是小概率事件,所以我们认为H0是不成立的 .虽然这种判断犯错误的可能性存在, 但我们有99%的把握认为H0 是不成立的!(即吸烟与患肺癌有关系) 在H0成立的情况下,统计学家研究出如下的概率 上面这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。 独立性检验的定义: 独立性检验基本的思想类似反证法 (1)假设结论不成立,即“两个分类变量没有关系”. (2)在此假设下随机变量 K2 应该很能小,如果由观测数据计算得到K2的观测值k很大,则在一定程度上说明假设不合理. (3)根据随机变

文档评论(0)

skvdnd51 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档