2013新人教A版选修(2-3)3.2《独立性检验的基本思想及其初步应用》课件ppt1.ppt

2013新人教A版选修(2-3)3.2《独立性检验的基本思想及其初步应用》课件ppt1.ppt

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2013新人教A版选修(2-3)3.2《独立性检验的基本思想及其初步应用》课件ppt1.ppt

有一个颠扑不破的真理,那就是当我们不能确定什么是真的时,我们就应该去探求什么是最可能的。 课堂小结 * 主讲人 秦真 1、了解独立性检验的基本思想、方法及其初步应用。 2、会从列联表(只要求2×2列联表)、条形图直观分析两个分类变量是否有关 3.会用公式判断两个分类变量在某种程度上的相关性 一、目标展示 问题: 数学家庞加莱每天都从一家面包店买一块1000g 的面包,并记录下买回的面包的实际质量。一年后,这位数学家发现,所记录数据的均值为950g。于是庞加莱推断这家面包店的面包分量不足。 假设“面包分量足”,则一年购买面包的质量数据的平均值应该不少于1000g ; “这个平均值不大于950g”是一个与假设“面包分量足”矛盾的小概率事件; 这个小概率事件的发生使庞加莱得出推断结果。 相关概念 这种变量的不同“值”表示个体所属的不同类别,这类变量称为分类变量 分类变量 性别变量,取值为:男、女 请举出几个分类变量的例子 试一试 0 1 为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人) 那么吸烟是否会对患肺癌有影响? 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 吸烟与患肺癌列联表(列出两个分类变量的频数表): 在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是 0.54% 2.28% 直观上的结论:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 1.列联表 二、自主合作 等高条形图更清晰地表达了两种情况下患肺癌的比例,可以直观地得出吸烟与患肺癌有关 2.等高条形图 笛卡尔 我们能有多大把握认为 “患病与吸烟有关”呢? 将问题一般化 三、探究解疑——独立性检验 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 假设H0: 吸烟和患肺癌之间没有关系 用 A 表示“不吸烟”, B 表示“不患肺癌” 则 H0: 吸烟和患肺癌之间没有关系 等价于 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 引入一个随机变量 作为检验在多大程度上可以认为“两个变量有关系”的标准 。 若K2≥10.828则有99.9%的把握认为A与B有关若K2≥6.635则有99%的把握认为A与B有关 上面这种利用随机变量K2来判断“两个分类变量 有关系”的方法称为独立性检验. 10.828 7.879 6.635 k0 0.001 0.005 0.010 P(k2≥k0) 临界值表 通过公式计算 3.独立性检验 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 因此我们有99%的把握认为”吸烟与患肺癌有关系” 第一步:H0: 吸烟和患肺癌之间没有关系 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 第二步:列出2×2列联表 4、独立性检验的步骤 第三步:计算 第四步:查临界值表,作出判断。 独立性检验的基本思想类似于数学上的反证法. 要确认”两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论”两个分类变量没有关系”成立.在该假设下我们构造的随机变量K2应该很小.如果由观测数据计算得到的K2的观测值k很大,则断言H0不成立,即认为“两个分类变量有关系”;如果观测值k很小,则说明在样本数据中没有发现足够证据拒绝H0 . 例1.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶. (1)利用图形判断秃顶与患心脏病是否有关系 (2)能否在犯错误概率不超过0.01的前提下认为秃顶与患心脏病有关系? 例题分析 利用excel做出图形判断 解:根据题目所给数据得到如下列联表: 患心脏病 不患心脏病 总计 秃顶 214 175 389 不秃顶 451 597 1048 总计 665 772 1437 根据列联表中的数据,得到 所以在犯错误的概率不超过0.01的前提下认为“秃顶患心脏病有关”。 链接 (试一试)为考

文档评论(0)

sdfgrt + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档