独立性检验的基本思想及其初步应用(上课)汇编.ppt

独立性检验的基本思想及其初步应用(上课)汇编.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
独立性检验的基本思想 及其初步应用 1、了解利用列联表、等高条形图来判断两个 分类变量之间是否有关系。 2、了解独立性检验的基本思想,会对两个分 类变量进行独立性检验,明确独立性检验 的基本步骤,并能解决实际问题。 学习目标 这种变量的不同“值”表示个体所属的不同类别, … … 民族 国籍 宗教信仰 是否吸烟 像这样的变量称为分类变量。 为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果: 表3—7 吸烟与患肺癌列联表 单位:人 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 这样列出的两个分类变量的频数表,称为列联表 一般我们只研究每个分类变量只取两个值,这样的列联表称为2×2列联表。 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果: 表3—7 吸烟与患肺癌列联表 单位:人 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 ①在不吸烟者中患肺癌的比例为 ; ②在吸烟者中患肺癌的比例为 。 0.54℅ 2.28℅ 条件概率 由以上列联表,我们估计: 吸烟群体和不吸烟群体患肺癌的可能性存在差异 ①在不吸烟者中患肺癌的比例为 0.54 % ; ②在吸烟者中患肺癌的比例为 2.28% 。 问题1 :你认为吸烟与患肺癌有关系吗? 认为吸烟与患肺癌有关系 吸烟者中患肺癌的比例2.28 不吸烟者中患肺 癌的比例0.54 问题2 :你认为以上两个比例值越接近,还是 相差越大,越能说明吸烟与患肺癌的有关 ? 比例值相差越大,越能说明吸烟与患肺癌的有关 问题3:还有其它方法来判断吸烟和患肺癌有关吗? 等高条形图 吸烟更容易引发肺癌 问题4:由等高条形图得出的结论的可靠程度如何? 频率(比例) 转化为 图形 等高条形图可以粗略的看出吸烟与患肺癌有关。 阴影部分 高度相差越大, 相关性越强 总计 吸烟 不吸烟 总计 患肺癌 不患肺癌 H0:假设吸烟与患肺癌没有关系 吸烟中患肺癌的比例与不吸烟患肺癌的比例 (相等)相差不大 问题5:你有多大把握判断吸烟与患肺癌有关? 用什么方法进行检验呢? 探究: 的大小能说明什么? 说明吸烟与患肺癌没有关系 越大能说明吸烟与患肺癌关系越强 越小能说明吸烟与患肺癌关系越弱 总计 吸烟 不吸烟 总计 患肺癌 不患肺癌 探究: 的大小能说明什么? 这个值到底能告诉我们什么呢? 吸烟与肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 临界值表(课本P94) 6.635 5.024 3.841 2.706 2.072 1.323 0.708 0.445 0.010 0.025 0.05 0.10 0.15 0.25 0.40 0.50 为 观测值 概率 临界值 临界值表(课本P94) 6.635 5.024 3.841 2.706 2.072 1.323 0.708 0.445 0.010 0.025 0.05 0.10 0.15 0.25 0.40 0.50 概率 临界值 H0:假设吸烟与患肺癌没有关系 前提 H0成立的概率为0.01 吸烟与患肺癌没有关系的概率为0.01 吸烟与患肺癌有关系的概率为0.99 (1)有99%的把握说明吸烟与患肺癌有关系。 我们的回答: (2)在犯错误的概率不超0.01的前提下 说明吸烟与患肺癌有关系。 这种利用随机变量K2来判断“两个分类 变量有关系”的方法,称为独立性检验。 表3-11 临界值表 10.828 7.879 6.635 5.024 3.841 2.706 2.072 1.323 0.708 0.445 0.001 0.005 0.010 0.025 0.05 0.10 0.15 0.25 0.40 0.50 这说明什么? 这说明什么? 在犯错误的概率不超0.001的前提

文档评论(0)

1112111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档