2013苏教版选修(2-3)3.1《独立性检验》课件1.pptVIP

2013苏教版选修(2-3)3.1《独立性检验》课件1.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表: 根据表中的数据,判定主修统计专业与性别有关系,则这种判断出错的可能性为多少? 解:根据表中的数据,得到 1、能够通过列联表,等高条形图估计 两个分类变量之间是否有关系; 2、利用 判断出两个分类变量之间是 否有关系; 3、了解独立性检验的思想。 郑平正 制作 * 3.1假设检验 * 郑平正 制作 独立性检验 本节研究的是两个分类变量的独立性检验问题。 在日常生活中,我们常常关心分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响?等等。 某医疗机构为了了解患肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965个成年人,其中吸烟者2148人,不吸烟者7817 人,调查结果是:吸烟的2148 人中49人患肺癌, 2099人不患肺癌;不吸烟的7817人中42人患肺癌, 7775人不患肺癌。 ● 根据这些数据能否断定:患肺癌与 吸烟有关? 吸烟与肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 列联表分析(单位:人) 列联表 在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是 0.54% 2.28% 探究 通过图形直观判断 二维条形图 通过图形直观判断 患肺癌 比例 不患肺癌 比例 通过数据和图表分析,容易直观得到结论是:吸烟与患肺癌有关 结论的可靠程度如何? 这需要用统计概率观点来考察这个问题。 现在想要知道能够以多大的把握认为“吸烟与患肺癌有关”,为此先假设: H0:吸烟与患肺癌没有关系. 用A表示不吸烟, 用B表示不患肺癌, 则“吸烟与患肺癌没有关系”等价于“吸烟与患肺癌独立”, 即假设H0等价于 P(AB)=P(A)P(B). * 因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强。 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 在表中,a恰好为事件AB发生的频数;a+b和a+c恰好分别为事件A和B发生的频数。由于频率接近于概率,所以在H0成立的条件下应该有 * 郑平正 制作 为了使不同样本容量的数据有统一的评判标准,基于上述分析,我们构造一个随机变量-----卡方统计量 (1) 若 H0成立,即“吸烟与患肺癌没有关系”,则K2应很小。 根据表3-7中的数据,利用公式(1)计算得到K2的观测值为: 那么这个值到底能告诉我们什么呢? (2) 独立性检验 * 郑平正 制作 随机变量-----卡方统计量 独立性检验 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 临界值表 0.1%把握认为A与B无关 1%把握认为A与B无关 99.9%把握认A与B有关 99%把握认为A与B有关 90%把握认为A与B有关 10%把握认为A与B无关 没有充分的依据显示A与B有关,但也不能显示A与B无关 判断“吸烟与患肺癌没有关系”出错的概率为0.01。 要推断“Ⅰ和Ⅱ有关系”,可按下面的步骤进行: (1)提出假设H0 :Ⅰ和Ⅱ没有关系; (3)查对临界值,作出判断。 (2)根据2× 2列表与公式计算 的值; 由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误。利用 进行独立性检验,可以对推断的正确性的概率作出估计,样本量n越大,估计越准确。 例1.在500人身上试验某种血清预防感冒作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示。问:该种血清能否起到预防感冒的作用? 未感冒 感冒 合计 使用血清 258 242 500 未使用血清 216 284 500 合计 474 526 1000 解:设H0:感冒与使用该血清没有关系。 因当H0成立时,χ2≥6.635的概率约为0.01,故有99%的把握认为该血清能起到预防感冒的作用。 P(χ≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.63

文档评论(0)

wangshirufeng + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档