数学:1.1《独立性检验(1)》课件(苏教版选修1-2).ppt

数学:1.1《独立性检验(1)》课件(苏教版选修1-2).ppt

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人,调查结果是:吸烟的220人中37人患病, 183人不患病;不吸烟的295人中21人患病, 274人不患病。 根据这些数据能否断定:患病与 吸烟有关吗? 患病 不患病 总计 吸烟 37 183 220 不吸烟 21 274 295 总计 58 457 515 为了研究这个问题,我们将上述问题用下表表示: 2×2列联表 注:什么叫列联表? 列联表:列出两个分类变量的频数统计表 分类变量:变量的不同“值”表示个体所属的不同 类别,这样的变量称为分类变量. 注:分类变量的取值一定是离散的,而且不同的 取值仅表示个体所属的类别 如性别变量,只取男、女两个值,商品的等级变量只取一级、二级,等等. 性别有两种: 性别变量,只取男、女两个值 男、女 患病 不患病 总计 吸烟 37 183 220 不吸烟 21 274 295 总计 58 457 515 为了研究这个问题,我们将上述问题用下表表示: 2×2列联表 在不吸烟者中患病的比重是 在吸烟者中患病的比重是 21/295 ≈ 7.12% 37/220≈16.82% 上述结论能说明吸烟与患病有关吗?能有多大把握认为吸烟与患病有关呢? 患病 不患病 总计 吸烟 a b a+b 不吸烟 c d c+d 总计 a+c b+d a+b+c+d 如果“吸烟与患病没有关系””,则在吸烟者中不患病 的比例应该与不吸烟者中相应的比例差不多,即 因此|ad-bc|越小,说明吸烟与患病之间关系越弱; |ad-bc| 越大,说明吸烟与患病之间关系越强. 为便于研究,用字母代替数据,得2×2列联表 患病 不患病 总计 吸烟 a b a+b 不吸烟 c d c+d 总计 a+c b+d a+b+c+d 列出2×2列联表 我们不妨作出相反的假设,H0:吸烟和患病之间没有关系 即H0:P(AB)=P(A)P(B) 其中A为某人吸烟,B为某人患病 设n=a+b+c+d 为样本量 则P(A) P(B) 故P(AB) 吸烟且患病人数 吸烟但未患病人数 不吸烟但患病人数 不吸烟且未患病人数 怎样描述实际观测值与预期值的差异呢? 统计学中,为度量观测值与预期值的差值 皮尔逊(K.Pearson)引进卡方统计量 即 卡尔.皮尔逊—— 英国著名的应用数学家 、 生物统计学家、优生学家 和科学哲学家. 若H0成立,即“吸烟与患病没有关系””,则χ2应很小 独立性检验 通过公式计算 H0: 吸烟和患病之间没有关系 解: 患病 不患病 总计 吸烟 37 183 220 不吸烟 21 274 295 总计 58 457 515 这个值是不是很大呢? 在H0成立的情况下,统计学家估算出如下的概率: H0成立可能性只有1%,因此我们有99%的把握认为H0不成立,即有99%的把握认为“吸烟与患病有关系” 即在H0成立的情况下, 的值大于6.635的概率非常小,近似于0.01. P(χ2≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 这种利用随机变量 来确定在多大程度上 可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. 独立性检验的思想类似于数学上的反证法.要确认“两个分类变量有关系”这一结论成立,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立. 在该假设下我们构造的随机变量 应该很小,如果由观测数据计算得到的 的观测值很大,则在一定程度上说明假设不合理. 独立性检验 第一步:H0: 吸烟和患病之间没有关系 通过数据和图表分析,得到结论是:吸烟与患病有关 结论的可靠程度如何? 患病 不患病 总计 吸烟 a b a+b 不吸烟 c d c+d 总计 a+c b+d a+b+c+d 第二步:列出2×2列联表 用χ2统计量研究这类问题的

文档评论(0)

新起点 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档