- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1.2 独立性检验的基本思想 及其初步应用 现实生活中的几个问题 吸烟是否与得肺癌有关系? 性别是否与数学好坏有关? 韩国人比中国人个子高? 1、介绍两个相关的概念 对于性别变量,其取值为男和女两种,这种变量的 不同“值”表示个体所属的不同类别,像这样的变量称为 分类变量,也称为属性变量或定性变量,它们的取值一定是离散的,而且不同的取值仅表示个体所属的类别。 (1)分类变量: 定量变量的取值一定是实数,它们的取值大小有 特定的含义,不同取值之间的运算也有特定的含义。 (2)定量变量: 例如身高、体重、考试成绩等,张明的身高是180cm,李立的 身高是175cm,说明张明比李立高180-175=5(cm)。 独立性检验 本节研究的是两个分类变量的独立性检验问题。 在日常生活中,我们常常关心分类变量的之间是否有关系 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查 了9965人,得到如下结果(单位:人): 那么吸烟是否对患肺癌有影响? 表1-9 吸烟与患肺癌列联表 1、象这样的两个分类变量的频数表叫列联表. 在不吸烟者中,有0.54%患有肺癌; 在吸烟者中,有2.28%患有肺癌。因此,直观上可以 得到结论: 吸烟者和不吸烟者患肺癌的可能性存在差异。 2、与表格相比,三维柱形图和二维条形图能更直观地反映 出相关数据的总体状况。 三 维 柱 形 图 二维条形图 不患肺癌 患肺癌 吸烟 不吸烟 不患肺癌 患肺癌 吸烟 不吸烟 0 8000 7000 6000 5000 4000 3000 2000 1000 不吸烟 吸烟 患肺癌 比例 不患肺癌 比例 等高条形图 上面我们通过分析数据和图形,得到的直观印 象是吸烟和患肺癌有关,那么事实是否真的如此呢? 你得到这个结论有多大的把握呢? 为此先假设 H0:吸烟与患肺癌没有关系, 看看能够推出什么样的结论。 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 如果“吸烟与患肺癌没有关系”,(即H0 成立) 则在吸烟者中不患肺癌的比例应该与 不吸烟者中相应的比例应差不多,即: 结论: |ad-bc| 越小,说明H0 成立的可能性越大. 如下用字母表示数字得列联表(表1-10) 为了统一评判标准,我们构造一个随机变量 因此:若 H0成立,则K2应很小。 利用公式(1)计算得到 K2 的观测值为 (1) 如何看待这个值呢? 即在H0成立的情况下,K2的值大于6.635的 概率非常小, 近似于0.01。而现在K2的值 56.632远大于6.635, 故它是小概率事件,所以 我们认为H0 是不成立的 .虽然这种判断犯错 误的可能性存在, 但我们有99%的把握认为 H0 是不成立的!(即吸烟与患肺癌有关系) 在H0成立的情况下,统计学家研究出如下的 概率 上面这种利用随机变量K2来确定在多大程度 上可以认为“两个分类变量有关系”的方法 称为两个分类变量的独立性检验。 独立性检验的定义: 独立性检验的基本思想: 类似于数学上的反证法,要确认“两个分类变量有关系” 这一结论成立的可信程度, 首先,假设该结论不成立,即假设结论“两个分类变量 没有关系”成立。 其次,在假设下,计算构造的随机变量K2,如果有观 测数据计算得到的K2≥k0,则我们有[1-P(K2≥k0)]*100%把握说明假设不合理(即两个分类变量有关系)。 当K2≤k0,则我们没有[1-P(K2≥k0)]*100%把握说明假设不合理。 设要判断的结论为:H1:“X与Y有关系” 1、通过三维柱形图和二维条形图,可以粗略地判断 两个变量是否有关系。 (1)在三维柱形图中, 主对角线上两个柱形高度的 乘积ad与副对角线上的乘积bc相差越大,H1成 立的可能性就越大。 (2)在二维条形图中,(x1,y1)个体所占的比例 与(x2,y1) 个体所占的比例 , 两个比例相差越大,H1成立的可能性就越大。 2、可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度。 独立性检验的一般步骤: 2x2列联表 y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 具体作法是: 根据观测数据计算随机变量
您可能关注的文档
最近下载
- 2024-2025年数学选择性必修第一册共线向量与共面向量同步检测 2(带答案).docx VIP
- 数据治理概论课件:数据治理工具.pptx VIP
- 08J907 洁净厂房建筑构造.pdf VIP
- 04G323-2 图集钢筋混凝土吊车梁(工作级别A4、A5).pdf VIP
- 全国优质课一等奖统编版语文八年级上册唐诗五首《野望》《黄鹤楼》《使至塞上》《渡荆门送别》《钱塘湖春行》公开课课件.pptx
- 幼儿高热惊厥的急救处理.pptx VIP
- 惯性器件原理课件.pptx VIP
- 新版建设工程工程量清单计价标准解读.pptx VIP
- 危大工程专项施工方案.doc VIP
- 莫桑比克考察报告.pdf VIP
文档评论(0)