- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
对于性别变量,其取值为男和女两种. 这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量. 生活中的分类变量 是否吸烟,宗教信仰,国籍… 两个分类变量之间是否有关系 性别 是否喜欢数学课程 吸烟 患肺癌 为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人) 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 那么吸烟是否对肺癌有影响? 吸烟与患肺癌列联表 列出两个分类变量的频数表,称为列联表 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 吸烟者与不吸烟者患肺癌的可能性存在差异 从上面数据和图形可以看出吸烟和患肺癌有关 从上面数据和图形可以看出吸烟和患肺癌有关 我们能够有多大的把握认为“吸烟与患肺癌有关”? 吸烟 患肺癌 吸烟与患肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 假设 H0:吸烟与患肺癌没有关系 将表1-7中的数字用字母代替,得到如下用字母表示的列联表 ad-bc≈0 |ad-bc|越小 吸烟与患肺癌之间的关系越弱 |ad-bc|越大 吸烟与患肺癌之间的关系越强 若H0成立 构造一个随机变量 建立统一标准 (n=a+b+c+d) 若H0成立 K2应该很小 根据前面数据 K2的观察值 在“吸烟与患肺癌没有关系”成立的条件下可以估算出 k≈56.632 6.635 远大于 k6.635,假设不合理程度约为99% 99%的把握认为“吸烟与患肺癌有关系” 但这种判断会犯错误,犯错误的概率不 会超过0.01 在“吸烟与患肺癌没有关系”成立的条件下可以估算出 k≈56.632 6.635 远大于 利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. 确认“两个分类变量有关系”成立的可信程度 假设该结论不成 由观测数据计算K2的观测值k 通过概率评价该假设不合理的程度 k6.635,假设不合理程度约为99% y1 y2 总计 x1 a b a+b x1 c d c+d 总计 a+c b+d a+b+c+d 假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表 2×2列联表 若要推断的论述为 H1:“X与Y有关系” 可以按如下步骤判断结论H1成立的可能性 1.通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠度 2.可以利用独立性检验来考察两个分类变量是否有关系并且能较精确地给出这种判断的可靠程度. 要推断“X和Y有关系”,可按下面的步骤进行: (1)提出假设H0 :X和Y没有关系; (3)查对临界值,作出判断。 (2)根据2× 2列联表与公式计算 的值; 由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误。利用 进行独立性检验,可以对推断的正确性的概率作出估计,样本量n越大,估计越准确。 2.可以利用独立性检验来考察两个分类变量是否有关系并且能较精确地给出这种判断的可靠程度. 根据观测数据计算检验随机变量K2的观察值k P(K2≥k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 当得到的观测数据a,b,c,d都不于5时,可以通过查阅下表来确定其可信程度 10.828 7.879 6.635 5.024 3.841 2.706 2.072 1.323 0.708 0.455 xo 0.001 0.005 0.01 0.025 0.05 0.1 0.15 0.25 0.4 0.5 卡方临界值表: 则有99.9%的把握认为“X与Y有关系”; (1)若观测值χ2>10.828. (3)若观测值χ2>2.706,则 (4)若观测值χ2<2.706,则 (2)若观测值χ2>6.635, 则有99%的把握认为“X与Y有关系”; 则有90%的把握认为“X与Y有关系”; 则没有充分的证据显示“X与Y有关系”,但也不能作出结论“H0成立”,即Ⅰ与Ⅱ没有关系。 例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效? 患心脏病 患其他病 总计 秃顶 214 1
您可能关注的文档
最近下载
- 《复合材料的特性与应用》课件.ppt
- 妊娠晚期促子宫颈成熟与引产指南(2024)解读.pptx
- 保险异议处理拒绝处理ppt保险异议处理.ppt VIP
- 2025年内蒙古自治区中考数学试题卷(含答案解析).docx
- 湖南省永州市祁阳市2022-2023学年三年级下学期期末语文试题(pdf版无答案).docx VIP
- 设计和开发过程控制培训.pptx VIP
- 2019中国国内旅游发展年度报告_25页_4mb.pdf VIP
- 人教版三年级上册数学全册教学设计(配2025年秋新版教材).docx
- 安全风险分级管控和隐患排查治理双重预防机制培训课件.pptx VIP
- 各专业文件准备目录--内分泌科药物临床试验机构GCP SOP.doc VIP
文档评论(0)