- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 独立性检验的基 本思想及初步应用 知识引入: 分类变量:如果变量的不同“值”表示个体的不同类别,则称这类变量为分类变量. 例如:性别,是否吸烟等. 在日常生活中,常常要关注两个分类变量之间是否有影响,而独立性检验就是研究两个分类变量之间是否有关系的可靠度的一种检验. 吸烟与肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人) 列联表 在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是 说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大 0.54% 2.28% 1)通过图形直观判断两个分类变量是否相关: 三维柱状图 2) 通过图形直观判断两个分类变量是否相关: 二维条形图 3)通过图形直观判断两个分类变量是否相关: 患肺癌 比例 不患肺癌 比例 等高条形图 独立性检验 H0: 吸烟和患肺癌之间没有关系 ←→ H1: 吸烟和患肺癌之间有关系 通过数据和图表分析,得到结论是:吸烟与患肺癌有关 结论的可靠程度如何? 用 A 表示“不吸烟”, B 表示“不患肺癌” 则 H0: 吸烟和患肺癌之间没有关系 “吸烟”与“患肺癌”独立, 即A与B独立 等价于 等价于 吸烟与肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 独立性检验 引入一个随机变量 作为检验在多大程度上可以认为“两个变量有关系”的标准 。 P(K2≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 临界值表: 1)如果P(m10.828)= 0.001表示有99.9%的把握认为”X与Y”有关系; 2)如果P(m7.879)= 0.005表示有99.5%的把握认为”X与Y”有关系; 3)如果P(m6.635)= 0.01表示有99%的把握认为”X与Y”有关系; 4)如果P(m5.024)= 0.025表示有97.5%的把握认为”X与Y”有关系; 5)如果P(m3.841)= 0.05表示有95%的把握认为”X与Y”有关系; 6)如果P(m2.706)= 0.010表示有90%的把握认为”X与Y”有关系; 7)如果m≤2.706),就认为没有充分的证据显示”X与Y”有关系; 设有两个分类变量X和Y它们的值域分别为{x1,x2}和{y1,y2}其样本频数列表(称为2×2列联表)为 y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 2×2列联表 适用观测数据a、b、c、d不小于5 P(K2≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 0.1%把握认 为A与B无关 1%把握认为A与B无关 99.9%把握认 为A与B有关 99%把握认 为A与B有关 90%把握认 为A与B有关 10%把握认为 A与B无关 没有充分的依据显示A与B有关,但也不能显示A与B无关 例如 独立性检验 吸烟与肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 通过公式计算 独立性检验: 已知在 成立的情况下, 即在 成立的情况下,K2 大于6.635概率非常小,近似为0.01 现在的K2=56.632的观测值远大于6.635 所以有理由断定H0不成立,即认为”吸烟与患肺癌有关系” 例1.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.分别利用图形和独立性检验方法判断是否有关?你所得的结论在什么范围内有效? 例2. (2014·高考辽宁卷节选)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示: 根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”. 喜欢甜品 不喜欢甜品 合计 南方学生 60 20 80 北方学生 10
文档评论(0)