- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 第三章 统计案例 3.2 独立性检验的基本思想及其 初步应用 独立性检验 本节研究的是两个分类变量的独立性检验问题。 在日常生活中,我们常常关心分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响?等等。 9965 91 9874 总计 2148 49 2099 吸烟 7817 42 7775 不吸烟 总计 患肺癌 不患肺癌 吸烟与肺癌列联表 为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人) 列联表 在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是 说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大。 0.54% 2.28% 探究 9965 91 9874 总计 2148 49 2099 吸烟 7817 42 7775 不吸烟 总计 患肺癌 不患肺癌 1、列联表 2、三维柱形图 3、二维条形图 不患肺癌 患肺癌 吸烟 不吸烟 不患肺癌 患肺癌 吸烟 不吸烟 0 8000 7000 6000 5000 4000 3000 2000 1000 从三维柱形图能清晰看出 各个频数的相对大小。 从二维条形图能看出,吸烟者中 患肺癌的比例高于不患肺癌的比例。 通过图形直观判断两个分类变量是否相关: 不吸烟 吸烟 患肺癌 比例 不患肺癌 比例 4、等高条形图 等高条形图更清晰地表达了两种情况下患肺癌的比例。 上面我们通过分析数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否真的如此呢?这需要用统计观点来考察这个问题。 现在想要知道能够以多大的把握认为“吸烟与患肺癌有关”, 为此先假设 H0:吸烟与患肺癌没有关系. a+b+c+d b+d a+c 总计 c+d d c 吸烟 a+b b a 不吸烟 总计 患肺癌 不患肺癌 把表中的数字用字母代替,得到如下用字母表示的列联表 用A表示不吸烟,B表示不患肺癌,则“吸烟与患肺癌没有关系”等价于“吸烟与患肺癌独立”,即假设H0等价于 P(AB)=P(A)P(B). 因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强。 a+b+c+d b+d a+c 总计 c+d d c 吸烟 a+b b a 不吸烟 总计 患肺癌 不患肺癌 在表中,a恰好为事件AB发生的频数;a+b和a+c恰好分别为事件A和B发生的频数。由于频率接近于概率,所以在H0成立的条件下应该有 为了使不同样本容量的数据有统一的评判标准,基于上述分析,我们构造一个随机变量-----卡方统计量 (1) 若 H0成立,即“吸烟与患肺癌没有关系”,则K2应很小。 根据表3-7中的数据,利用公式(1)计算得到K2的观测值为: 那么这个值到底能告诉我们什么呢? (2) 独立性检验 在H0成立的情况下,统计学家估算出如下的概率 即在H0成立的情况下,K2的值大于6.635的概率非常小,近似于0.01。 也就是说,在H0成立的情况下,对随机变量K2进行多次观测,观测值超过6.635的频率约为0.01。 思考 答:判断出错的概率为0.01。 判断 是否成立的规则 如果 ,就判断 不成立,即认为吸烟与患肺癌有关系;否则,就判断 成立,即认为吸烟与患肺癌有关系。 独立性检验的定义 上面这种利用随机变量K2来判断“两个分类变量有关系”的方法,称为两个分类变量的独立性检验。 在该规则下,把结论“ 成立”错判成“ 不成立”的概率不会差过 即有99%的把握认为 不成立。 独立性检验的基本思想(类似反证法) (1)假设结论不成立,即 “两个分类变量没有关系”. (2)在此假设下我们所构造的随机变量 K2 应该很小,如果由观测数据计算得到K2的观测值k很大,则在一定可信程度上说明 不成立.即在一定可信程度上认为“两个分类变量有关系”;如果k的值很小,则说明由样本观测数据没有发现反对 的充分证据。 (3)根据随机变量K2的含义,可以通过评价该假设不合理的程度,由实际计算出的,说明假设不合理的程度为1%,即“两个分
您可能关注的文档
- 【志鸿优化设计-赢在课堂】(人教版)2015高中物理选修3-1配套课件:2.1 电源和电流讲义.ppt
- 【志鸿优化设计-赢在课堂】(人教版)2014-2015高中物理选修3-5课件16.4碰撞讲义.ppt
- 【志鸿优化设计】2015高中历史(人教版)选修二课件 课后习题 2.1 第1课 英国议会与王权矛盾的激化讲义.ppt
- 【志鸿优化设计】(教师用书)2015高中历史(人教版)选修二课件 课后习题 2.2 第2课 民主与专制的反复较量讲义.ppt
- 【志鸿赢在高考】(新课标)2016届高考生物二轮复习高考仿真测试5(含解析)讲义.doc
- 【志鸿 赢在高考】(新课标)2016届高考物理二轮复习 专题八 电磁感应与力学、电学的综合课件讲义.ppt
- 【招聘工具】万科集团校园招聘指导手册-最新版(操作样板)讲义.ppt
- 【掌控中考】(云南专版)2016中考英语第一篇教材系统复习考点精讲1七上课件人教新目标版讲义.ppt
- 【掌控中考】2015版人教版中考生物复习考点梳理:第五单元生物圈中的其他生物(共50张PPT)讲义.ppt
- 【招聘】超级面试官速成:结构化面试设计与操作技巧讲义.ppt
最近下载
- 米哈游文案策划专员岗面试题库参考答案和答题要点.docx VIP
- 20S517 排水管道出水口.docx VIP
- 医院民主评议党员制度.doc VIP
- 2025四川甘孜州民生人力资源管理有限公司招聘办案辅助人员初步筛选及笔试历年参考题库附带答案详解.docx
- 最新铁路营业线施工安全培训考试试题及答案.docx VIP
- 中国浙江省地图PPT模板.pptx VIP
- 智能体组织:AI时代的下一代组织范式+The+Agentic+Organization+Contours+Of+The+Next+Paradigm+For+The+AI+Era.docx
- (精品)《阿甘正传》剧本中英文台词对照完整版.pdf VIP
- (精益改善)工装模具定期保养检查表.pdf VIP
- 常识4600问(美化版).docx VIP
原创力文档


文档评论(0)