- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
-*- 对于性别变量,其取值为男和女两种. 这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量. 生活中的分类变量 是否吸烟,宗教信仰,国籍… 两个分类变量之间是否有关系 性别 是否喜欢数学课程 吸烟 患肺癌 为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人) 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 那么吸烟是否对肺癌有影响? 吸烟与患肺癌列联表 列出两个分类变量的频数表,称为列联表 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 吸烟者与不吸烟者患肺癌的可能性存在差异 等高条形图 从上面数据和图形可以看出吸烟和患肺癌有关 从上面数据和图形可以看出吸烟和患肺癌有关 我们能够有多大的把握认为“吸烟与患肺癌有关”? 吸烟 患肺癌 y1 y2 总计 x1 a b a+b x1 c d c+d 总计 a+c b+d a+b+c+d 假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表 2×2列联表 构造一个随机变量 建立统一标准 (n=a+b+c+d) K2应该很小 根据前面数据 K2的观察值 在“吸烟与患肺癌没有关系”成立的条件下可以估算出 k≈56.632 6.635 远大于 99%的把握认为“吸烟与患肺癌有关系” 利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. 可以利用独立性检验来考察两个分类变量是否有关系并且能较精确地给出这种判断的可靠程度. 根据观测数据计算检验随机变量K2的观察值k P(K2≥k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 当得到的观测数据a,b,c,d都不于5时,可以通过查阅下表来确定其可信程度 例1、在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶. (1)利用图形判断秃顶与患心脏病是否有关系; (2)能否在犯错误概率不超过0.01的前提下认为秃顶与患心脏病有关系? 患心脏病 患其他病 总计 秃顶 214 175 389 不秃顶 451 597 1048 总计 665 772 1437 解 根据数据得到如下列联表 秃顶与患心脏病列联表 因此,在犯错误概率不超过0.01的前提下认为秃顶与患心脏病有关系。 独立性检验的步骤 (1)列出列联表 (2)根据实际问题的需要确定推断“两个分类变量有关系”犯错误概率的上界a,然后通过下表确定临界值k0. 附临界值表: -*-
文档评论(0)