独 立性检验的基本思想及其初步应用--全套.pptVIP

独 立性检验的基本思想及其初步应用--全套.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
独 立性检验的基本思想及其初步应用--全套

两个概念 变量的不同取“值”表示个体所属的不同类别,这类变量称为分类变量 1、分类变量 分类变量在现实生活中是大量存在的,如是否吸烟,是否患肺癌,宗教信仰,国别,年龄,性别,出生月份等等。 2、随机变量K2: 用来确定两个分类变量在多大程度上可以认为有关系。 这种方法称为两个分类变量的独立性检验.(为假设检验的特例) 为了调查吸烟是否对患肺癌有影响,某肿瘤研究所随机的调查了9965人,得到结果如下(单位:人) 列联表: 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 那么吸烟是否会患肺癌有影响? 在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是 吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大 0.54% 2.28% 通过图形直观判断两个分类变量是否相关: 等高条形图 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 假设吸烟与患肺癌没有关系,那么吸烟者中不患肺癌的比例应该与不吸烟者中相应的比例差不多即 k大小的标准是什么呢? 独立性检验 首先,假设结论不成立,即 H :两个分类变量没有关系 (在这种假设下k应该很小) 其次,由观测数据计算K 的观测值k, (如果k很大,则在一定可信程度上说明H 不成 立,即两个分类变量之间有关系) 最后,根据k的值判断假设是否成立 2 临界值表: 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.445 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 这种判断可能有错误,但是犯错误的不会超过0.001,这是个小概率时间,我们有99.9%的把握认为“吸烟与患癌症有关系” 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( ) A、若K的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个患肺病 B、从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病 C、若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推理出现错误 D、以上三种说法都不对 c 1、理解分类变量,会作列联表及三维柱形图与二维条形图 2、了解独立性检验的思想 能否从列联表的三维柱形图与二维条形图中估计出两个分类变量是否相关吗? 总计 a b a+b c d c+d 总计 a+c b+d a+b+c+d 1、通过图形,大致地判断两个分类变量是否有关系 2、利用独立相关性检验来考察两个分类变量是否有关系,并且精确地给出这种判断的可靠程度。具体步骤如下: 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶。利用图形判断秃顶与患心脏病是否有关系。能够以99%的把握认为秃顶与患心脏病有关系吗?为什么? 例1 患心脏病 换其他病 总计 秃顶 214 175 389 不秃顶 451 597 1048 总计 665 772 1437 底面副对角线上两个柱体高度的乘积要大一些,因此可以在某种程度上认为“秃顶与患心脏病有关” 所以有99%的把握认为“秃顶与患心脏病有关” 因为这组数据来自被调查的医院,因此此结论只是用于该医院住院的病人群体 例2 为了考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随即抽取300名学生,得到如下列联表: 由表中数据计算得到 的观测值 。能够以95%的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?为什么? 喜欢数学课程 不喜欢数学课程 总计 男 37 85 122 女 35 143 178 总计 72 228 300 这一结论只适用于被调查的学校 在研究某种新措施对猪白痢的防治效果问题时,得到以下数据: 试问新措施对防止猪白痢是否有效? 存活率 死亡率 合计 对照 114 36 150 新措施 132 18 150 合计 246 54 300 1、能够通过三维柱形图与二维条形图估计两个分类变量之间是否有关系 2、利用 判断处两个分类变量之间是否有关系 3、了解独立性检验的思想

文档评论(0)

zijingling + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档