2019年数学新同步湘教版选修2-3讲义+精练:第8章 8.4 列联表独立性分析案例.docVIP

2019年数学新同步湘教版选修2-3讲义+精练:第8章 8.4 列联表独立性分析案例.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
8.4列联表独立性分析案例 [读教材·填要点] 1.列联表 一般地,对于两个因素X和Y,X的两个水平取值:A和eq \x\to(A)(如吸烟和不吸烟),Y也有两个水平取值:B和eq \x\to(B)(如患肺癌和不患肺癌),我们得到下表中的抽样数据,这个表格称为2×2列联表. Y X B eq \x\to(B) 合计 A a b a+b eq \x\to(A) c d c+d 合计 a+c b+d a+b+c+d 2.χ2的求法 公式χ2=eq \f(n?ad-bc?2,?a+b??c+d??a+c??b+d?). 3.独立性检验的概念 用随机变量χ2研究两变量是否有关的方法称为独立性检验. 4.独立性检验的步骤 要判断“X与Y有关系”,可按下面的步骤进行: (1)提出假设H0:X与Y无关; (2)根据2×2列联表及χ2公式,计算χ2的值; (3)查对临界值,作出判断. 其中临界值如表所示: P(χ2≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 表示在H0成立的情况下,事件“χ2≥x0”发生的概率. 5.变量独立性判断的依据 (1)如果χ210.828时,就有99.9%的把握认为“X与Y有关系”; (2)如果χ26.635时,就有99%的把握认为“X与Y有关系”; (3)如果χ22.706时,就有90%的把握认为“X与Y有关系”; (4)如果χ2≤2.706时,就认为没有充分的证据显示“X与Y有关系”,但也不能作出结论“H0成立”,即X与Y没有关系. [小问题·大思维] 1.利用χ2进行独立性分析,估计值的准确度与样本容量有关吗? 提示:利用χ2进行独立性分析,可以对推断的正确性的概率作出估计,样本容量n越大,这个估计值越准确.如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性. 2.在χ2运算后,得到χ2的值为29.78,在判断因素相关时,P(χ2≥6.64)≈0.01和P(χ2≥7.88)≈0.005,哪种说法是正确的? 提示:两种说法均正确.P(χ2≥6.64)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两因素相关;而P(χ2≥7.88)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两因素相关. 独立性分析的原理 [例1] 打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据: 患心脏病 未患心脏病 总计 每一晚都打鼾 30 224 254 不打鼾 24 1 355 1 379 总计 54 1 579 1 633 根据列联表的独立性分析,是否有99%的把握认为每一晚都打鼾与患心脏病有关系? [解] 由列联表中的数据,得χ2的值为 χ2=eq \f(1 633×?30×1 355-224×24?2,254×1 379×54×1 579)≈68.0336.635. 因此,有99%的把握认为每一晚打鼾与患心脏病有关系. 解决一般的独立性分析问题,首先由所给2×2列联表确定a,b,c,d,a+b+c+d的值,然后代入随机变量的计 算公式求出观测值χ2,将χ2与临界值x0进行对比,确定有多大的把握认为两个分类变量有关系. 1.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,经过调查得到如下列联表: 积极支持 企业改革 不太支持 企业改革 总计 工作积极 54 40 94 工作一般 32 63 95 总计 86 103 189 根据列联表的独立性分析,是否有99%的把握认为工作态度与支持企业改革之间有关系? 解:由列联表中的数据,得 χ2=eq \f(189×?54×63-40×32?2,94×95×86×103)≈10.7596.635, ∴有99%的把握认为工作态度与支持企业改革之间有关系. 独立性分析的应用 [例2] 下表是某地区的一种传染病与饮用水的调查表: 得病 不得病 合计 干净水 52 466 518 不干净水 94 218 312 合计 146 684 830 (1)这种传染病是否与饮用水的卫生程度有关,请说明理由; (2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异. [解] (1)假设H0:传染病与饮用水无关.把表中数据代入公式,得χ2=eq \f(830×?52×218-466×94?2,146×684×518×312)≈54.21, 因为当H0成立时,χ2≥10.828的概率约为0.001, 所以我们有99.9%的把握认

您可能关注的文档

文档评论(0)

叶倾城 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档