1.2独立性检验的基本思想及其初步应用在统计学中,独立性.pptVIP

  • 4
  • 0
  • 约1.69千字
  • 约 20页
  • 2017-06-28 发布于天津
  • 举报

1.2独立性检验的基本思想及其初步应用在统计学中,独立性.ppt

1.2独立性检验的基本思想及其初步应用在统计学中,独立性.ppt

* * 1.2 独立性检验的基本思想及其初步应用 在统计学中,独立性检验就是检验两个分类变量是 否有关系的一种统计方法。 所谓“分类变量”,就是指个体所属的类别不同,也 称为属性变量或定型变量。 在日常生活中,我们常常关心两个分类变量之间是 否有关系,例如吸烟是否与患肺癌有关系?性别是否对 于喜欢数学课程有影响等等。 9965 9874 91 总计 7817 7775 42 不吸烟 2148 2099 49 吸烟 总计 不患肺癌 患肺癌 吸烟与患肺癌列联表 为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人) 列联表2×2 在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是 0.54% 2.28% 1)通过图形直观判断 三维柱状图 2) 通过图形直观判断 二维 条形图 3)通过图形直观判断 患肺癌 比例 不患肺癌 比例 等高 条形图 独立性检验 H0: 吸烟和患肺癌之间 没有关系 通过数据和图表分析,得到结论是:吸烟与患肺癌有关 结论的可靠程度如何? a+b+c+d b+d a+c 总计 c+d d c 吸烟 a+b b a 不吸烟 总计 患肺癌 不患肺癌 吸烟与患肺癌列联表 吸烟的人中不患肺癌的比例: 不吸烟的人中不患肺癌的比例: 若H0成立 引入一个随机变量:卡方统计量 作为检验在多大程度上可以认为“两个变量有关系”的标准 。 通过公式计算 9965 9874 91 总计 7817 7775 42 不吸烟 2148 2099 49 吸烟 总计 不患肺癌 患肺癌 吸烟与患肺癌列联表 已知在 成立的情况下, 故有99%的把握认为H0不成立,即有99%的把握认为“患肺癌与吸烟有关系”。 即在 成立的情况下, 大于6.635概率非常小,近似为0.010 现在的 =56.632的观测值远大于6.635,出现这样的观测值的概率不超过0.010。 a+b+c+d b+d a+c 总计 c+d d c a+b b a 总计   一般地,对于两个分类变量X和Y。X有两类取值: 即类 和 (如吸烟与不吸烟);Y也有两类取值: 即类 和 (如患病与不患病)。于是得到下列样 本频数的2×2列联表为: 用卡方统计量来确定在多大程度上可以认为 “两个分类变量有关系”的方法称为这两个分类变 量的独立性检验。 要推断“X和Y有关系”,可按下面的步骤进行: (1)提出假设H0 :X和Y没有关系; (3)查对临界值,作出判断。 (2)根据2×2列联表与公式计算 的值; 10.828 7.879 6.635 5.024 3.841 0.001 0.005 0.010 0.025 0.05 2.706 2.072 1.323 0.708 0.455 0.10 0.15 0.25 0.40 0.50 P( ) 例1.在某医院,因为患心脏病而住院的665名男性病人 中,有214人秃顶;而另外772名不是因为患心脏病而住 院的男性病人中有175秃顶.分别利用图形和独立性检 验方法判断秃顶与患心脏病是否有关系?你所得的结论 在什么范围内有效? 秃顶与患心脏病列联表 1437 772 665 总计 1048 597 451 不秃顶 389 175 214 秃顶 总计 患其他病 患心脏病 有99%的把握认为“秃顶与患心脏病有关” 例2 为考察高中生的性别与是否喜欢数学课程之间的关 系。在某城市的某校高中生随机抽取300名学生。得到 如下列联表: 性别与喜欢数学课程列联表 300 228 72 总计 178 143 35 女 122 85 37 男 总计 不喜欢 喜欢 由表中数据计算得到K2的观测值k≈4.514。能够以95%的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?为什么?

文档评论(0)

1亿VIP精品文档

相关文档