编号633.2独立性检验的基本思想及其初步应用概要.pptVIP

编号633.2独立性检验的基本思想及其初步应用概要.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
编号633.2独立性检验的基本思想及其初步应用概要

课后练习 1. 答案:D 2.观察下列各图,其中两个分类变量x,y之间关系最强的是 (  ) 解析:在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强,故选D. 答案:D 3. 打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据: 患心脏病 未患心脏病 总计 每晚都打鼾 30 224 254 不打鼾 24 1 355 1 379 总计 54 1 579 1 633 根据列联表的独立性检验,能否在犯错误的概率不超过0.001的前提下认为每晚都打鼾与患心脏病有关系? 4 1、独立性检验基本的思想类似反证法 (1)假设结论不成立,即“两个分类变量没有关系”. (2)在此假设下随机变量 K2 应该很能小,如果由观测数据 计算得到K2的观测值k很大,则在一定程度上说明假设 不合理. (3)根据随机变量K2的含义,可以通过 评价该假设不合理的程度,由实际计算出的, 说明假设合理的程度为99.9%,即“两个分类变量有关系”这一结论成立的可信度为约为99.9%. * 郑平正 制作 反证法原理与假设检验原理 反证法原理: 在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立。 假设检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。 * 郑平正 制作 第一步:H0: 吸烟和患病之间没有关系 患病 不患病 总计 吸烟 a b a+b 不吸烟 c d c+d 总计 a+c b+d a+b+c+d 第二步:列出2×2列联表 2、独立性检验的步骤 第三步:计算 第四步:查对临界值表,作出判断。 P(k2≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 1)如果P(k10.828)= 0.001表示有99.9%的把握认为”X与Y”有关系; 2)如果P(k7.879)= 0.005表示有99.5%的把握认为”X与Y”有关系; 3)如果P(k6.635)= 0.01表示有99%的把握认为”X与Y”有关系; 4)如果P(k5.024)= 0.025表示有97.5%的把握认为”X与Y”有关系; 5)如果P(k3.841)= 0.05表示有95%的把握认为”X与Y”有关系; 6)如果P(k2.706)= 0.010表示有90%的把握认为”X与Y”有关系; 7)如果P(k≤2.706),就认为没有充分的证据显示”X与Y”有关系; 设有两个分类变量X和Y它们的值域分别为{x1,x2}和{y1,y2}其样本频数列表(称为2×2列联表) 为   y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 2×2列联表 适用观测数据a、b、c、d不小于5 P(k2≥k0) 说明:1、独立性检验没有直观性,必须依靠K2的观测值k作判断. 2、独立性检验的随机变量K2=2.706是判断是否有关系的临界值,K2<2.706应判断为没有充分证据显示X与Y有关系,而不能作为小于90%的量化值来判断. 互相影响 频率特征 有关系 4.独立性检验 (1)定义:利用随机变量K2来判断______________________的方法称为独立性检验. (2)K2=______________________,其中n=a+b+c+d “两个分类变量有关系” 5、独立性检验的基本思想 要判断两个分类变量是否相关及关系的强弱,需要确定一个评判规则和标准.随机变量K2和其临界值k就是评判的标准. 要确定“两个分类变量有关系”这一结论的可信程度有多大,首先假设两个分类变量没有关系,在该假设成立的条件下随机变量K2的值应该很____,如果由观测数据计算得到的K2的观测值k很____,则在一定程度上说明假设不合理,即认为“两个分类变量有关系”;如果观测值k很小,则说明在样本数据中没有发现足够证据拒绝“两个分类变量没有关系”. 小 大 * 3.2 独立性检验的基本思想 及其初步应用 分类变量:变量的不同“值”表示个体所属的不同 类别. 如:性别,是否吸烟,宗教信仰,国籍等 在日常生活中,我们常常关心

文档评论(0)

yaocen + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档