202032独立性检验的基本思想及其初步应用.ppt

202032独立性检验的基本思想及其初步应用.ppt

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
? 解析: 其等高条形图如图所示. ? 由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种程 度上有关系. 利用随机变量 K 2 判断分类变量间的关系 ? 下表是某地区的一种传染病与饮用水的调查表: 得病 不得病 合计 干净水 52 466 518 不干净水 94 218 312 合计 146 684 830 ? (1) 这种传染病是否与饮用水的卫生程度有关,请说明理由; ? (2) 若饮用干净水得病 5 人,不得病 50 人,饮用不干净水得病 9 人,不得病 22 人.按此样本数据分析这种疾病是否与饮用水 有关,并比较两种样本在反映总体时的差异. ? [ 思路点拨 ] (1) 根据表中的信息计算 K 2 的观测值,并根据 临界值表来分析相关性的大小,对于 (2) 要列出 2 × 2 列联表, 方法同 (1) . (1) 假设 H 0 :传染病与饮用水无关.把表中数 据代入公式得: K 2 的观测值 k = 830 × ? 52 × 218 - 466 × 94 ? 2 146 × 684 × 518 × 312 ≈ 54.21 , 4 分 ∵ 54.21 > 10.828 ,所以拒绝 H 0 . 因此在犯错误的概率不超过 0.001 的前提下认为这种传染 病与饮用不干净水有关 . 6 分 (2) 依题意得 2 × 2 列联表: 得病 不得病 合计 干净水 5 50 55 不干净水 9 22 31 合计 14 72 86 8 分 此时, K 2 的观测值 k = 86 × ? 5 × 22 - 50 × 9 ? 2 14 × 72 × 55 × 31 ≈ 5.785.10 分 由于 5.785 > 5.024 , 所以在犯错误的概率不超过 0.025 的前提下认为该种疾病 与饮用不干净水有关. ? 两个样本都能统计得到传染病与饮用不干净水有关这一相同 结论,但 (1) 中我们在犯错误的概率不超过 0.001 的前提下肯 定结论的正确性, (2) 中我们在犯错误的概率不超过 0.025 的 前提下肯定结论的正确性 . 12 分 ? [ 规律方法 ] 利用 K 2 公式判断两分类变量是否有关系的方法 ? 2 .某电视台联合相关报社对“男女同龄退休”这一公众关 注的问题进行了民意调查,数据如下表所示: ? 根据表中数据,能否在犯错误的概率不超过 0.001 的前提下认 为这一问题的看法与性别有关系? ( P ( K 2 ≥10.828)≈0.001) 赞同 反对 总计 男 198 217 415 女 476 109 585 总计 674 326 1 000 ? 3.2 独立性检验的 ? 基本思想及其初步应用 自主学习 新知突破 ? 1 .通过对实际问题的分析探究,了解独立性检验 ( 只要求 2 × 2 列联表 ) 的基本思想、方法及初步应用;了解独立性检验 的常用方法:等高条形图及 K 2 统计量法. ? 2 .通过典型案例的探究,了解实际推断原理和假设检验的 基本思想、方法及初步应用. ? 3 .理解独立性检验的基本思想及实施步骤,能运用自己所 学知识对具体案例进行检验. ? 饮用水的质量是人类普遍关心的问题. ? 据统计,饮用优质水的 518 人中,身体状 ? 况优秀的有 466 人,饮用一般水的 312 人中, ? 身体状况优秀的有 218 人. ? 人的身体健康状况与饮用水的质量之间有关系吗? ? [ 提示 ] 人的身体健康状况与饮用水的质量之间有关系. ? 1 .分类变量 ? 变量的不同“值”表示个体所属的 ___________ ,像这样的 变量称为分类变量. ? 2 .列联表 ? (1) 定义:列出的两个分类变量的 ___________ ,称为列联 表. 分类变量和列联表 不同类别 频数表 ? (2)2 × 2 列联表 ? 一般地,假设两个分类变量 X 和 Y ,它们的取值分别为 { x 1 , x 2 } 和 { y 1 , y 2 } ,其样本频数列联表 ( 称 2 × 2 列联表 ) 为: y 1 y 2 总计 x 1 a b a + b x 2 c d c + d 总计 a + c b + d a + b + c + d ? 分类变量及其关系的分析的理解 ? (1) 这里的 “ 变量 ” 和 “ 值 ” 都应作为广义的变量和值来理解, 只要不属于同种类别都是变量和值,并不一定是取具体的数 值,如:男、女;上、下;左、右等. ? (2) 频数分析是指用不同类别的事件发生的频率的大小比较来 分析分类变量是否有关联关系. ? (3) 等高条形图更加形象直观地反映两个分类变量之间的差异, 进而推断它们之间是否具有关联

文档评论(0)

wq1987 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档