独立性检验的基本思想及其初步应用幻灯片.ppt

独立性检验的基本思想及其初步应用幻灯片.ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
独立性检验的基本思想及其初步应用幻灯片

学习目标: 1.了解分类变量。 2.列联表的定义。 3.等高条形图表示什么? 自学指导: 阅读课本p10页第1段,回答问题: 1.什么是分类变量? 先从直观上来判断患肺癌与吸烟是否有关? 列联表 ①定义:列出的两个分类变量的 称为列联表. ②2×2列联表 一般地,假设两个分类变量X和Y,它们的取值分别为 和 ,其样本频数列联表(也称为2×2列联表)为下表. 1.2×2列联表是传统的调查研究中最常用的方法之一,用于研究两个变量之间相互独立还是存在某种关联性,它适用于分析两个变量之间的关系. 2.在实际问题中,判断两个分类变量的关系的可靠性时,一般利用随机变量K2来确定,而不利用三维柱形图和二维条形图. 问题情境: 思考: ×100% =0.54% × 100%=2.28% 从以上数据可以得到结论:吸烟群体和不吸烟群体患肺癌的可能性存在差异。 但是这个结论到底是否一定正确的呢?事实果真如此吗?我们能有多大把握认为“吸烟与患肺癌有关呢? 9965 91 9874 总计 2148 49 2099 吸烟 7817 42 7775 不吸烟 总计 患肺癌 不患肺癌 1、列联表 2、三维柱形图 3、二维条形图 不患肺癌 患肺癌 吸烟 不吸烟 不患肺癌 患肺癌 吸烟 不吸烟 0 8000 7000 6000 5000 4000 3000 2000 1000 从三维柱形图能清晰看出各个频数的相对大小. 从二维条形图能看出,吸烟者中 患肺癌的比例高于不患肺癌的比例. 频数表 {x1,x2} {y1,y2} 不吸烟 吸烟 患肺癌 比例 不患肺癌 比例 4、等高条形图 等高条形图更清晰地表达了两种情况下患肺癌的比例. 等高条形图与表格相比,更能直观地反映出两个分类变量间是否互相影响。常用等高条形图展示列联表数据的频率特征. 某企业为了考察同一种产品在甲、乙两条生产线的产品合格率,同时各抽取100件产品,其中甲线中合格产品的个数为97,乙线中合格产品的个数为95。请做出列联表,三维柱形图与二维条形图。 200 8 192 总计 100 5 95 乙生产线 100 3 97 甲生产线 总计 不合格 合格 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 假设吸烟与患肺癌没有关系,那么吸烟者中不患肺癌的比例应该与不吸烟者中相应的比例差不多即 独立性检验: 用字母表示的列联表 独立性检验 首先,假设结论不成立,即 H :两个分类变量没有关系 (在这种假设下k应该很小) 其次,由观测数据计算K 的观测值k, (如果k很大,则在一定可信程度上说明H 不成立,即两个分类变量之间有关系) 最后,根据k的值判断假设是否成立 2 临界值表: 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.445 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 这种判断可能有错误,但是犯错误的不会超过0.001,这是个小概率时间,我们有99.9%的把握认为“吸烟与患癌症有关系” k大小的标准是什么呢? 独立性检验基本的思想类似反证法 (1)假设结论不成立,即“两个分类变量没有关系”. (2)在此假设下随机变量 K2 应该很能小,如果由观测数据 计算得到K2的观测值k很大,则在一定程度上说明假设 不合理. (3)根据随机变量K2的含义,可以通过 评价该假设不合理的程度,由实际计算出的, 说明假设合理的程度为99.9%,即“两个分类变量有关系”这一结论成立的可信度为约为99.9%. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( ) A、若K的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个患肺病 B、从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病 C、若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推理出现错误 D、以上三种说法都不对 c 1、理解分类变量,会作列联表及三维柱形图与二维条形图 2、了解独立性检验的思想

文档评论(0)

gz2018gz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档