- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3.1 独立性检验 问题 : 数学家庞加莱每天都从一家面包店 买一块 1000g 的面包,并记录下买回的面 包的实际质量。一年后,这位数学家发 现,所记录数据的均值为 950g 。于是庞 加莱推断这家面包店的面包分量不足。 ? 假设“面包份量足”,则一年购买面包的质量数据 的平均值应该不少于 1000g ; ? “这个平均值不大于 950 g” 是一个与假设“面包份量 足”矛盾的小概率事件; ? 这个小概率事件的发生使庞加莱得出推断结果 。 一 : 假设检验 问题的原理 假设检验问题由两个互斥的假设构成,其 中一个叫做原假设,用 H 0 表示;另一个叫做备 择假设,用 H 1 表示。 例如,在前面的例子中, 原假设 为: H 0 :面包份量足, 备择假设 为: H 1 :面包份量不足。 这个假设检验问题可以表达为: H 0 :面包 份 量足 ←→ H 1 :面包 份 量不足 二 : 求解假设检验问题 考虑假设检验问题: H 0 :面包分量足 ←→ H 1 :面包分量不足 1. 在 H 0 成立的条件下,构造与 H 0 矛盾的小概 率事件; 2. 如果样本使得这个小概率事件发生,就能 以一定把握断言 H 1 成立;否则,断言没有 发现样本数据与 H 0 相矛盾的证据。 求解思路分析: 本节研究的是两个分类变量的独立性检验问题。 ? ? ? ? ? 2 定 量 变 量 — — 回 归 分 析 ( 画 散 点 图 、 相 关 系 数 r 、 变 量 相 关 指 数 R 、 残 差 分 析 ) 分 类 变 量 — — 研 究 两 个 变 量 的 相 关 关 系 : ? ? ? ? ? 定 量 变 量 : 体 重 、 身 高 、 温 度 、 考 试 成 绩 等 等 。 变 量 分 类 变 量 : 性 别 、 是 否 吸 烟 、 是 否 患 肺 癌 、 宗 教 信 仰 、 国 籍 等 等 。 两种变量: 独立性检验 在日常生活中,我们常常关心 分类变量之间是否有关系 : 例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响?等等。 例 1 .某医疗机构为了了解患慢性支气管 炎与吸烟是否有关,进行了一次抽样调查, 共调查了 339 名 50 岁以上的人,其中吸烟 者 205 人 ,不吸烟者 134 人 .调查结果是: 吸烟的 205 人中有 43 人 患呼吸道疾病(简 称患病), 162 人未患呼吸道疾病(简称 未患病);不吸烟的 134 人中有 13 人 患病, 121 人未患病.问题:根据这些数据能否 断定“患慢性支气管炎与吸烟有关”? ( 1 )为了研究这个问题,将上述数据用 下表来表示: 患病 未患病 合计 吸烟 43 162 205 不吸烟 13 121 134 合计 56 283 339 ( 2 )估计吸烟者与不吸烟者患病的可能性 差异: 在吸烟的人中,有 的人患病, 43 20.1% 205 ? 在不吸烟的人中,有 的人患病. 13 9.7% 134 ? 问题:由上述结论能否得出患病与吸烟有 关?把握有多大? ( 1 )假设 :患病与吸烟 没有关系 . 若将表中“观测值”用字母表示,则得下 列 2 × 2 列联表: B A 不吸烟( 患病( B ) 未患病 ( ) 合计 吸烟 A n 11 n 12 n 1+ 不吸烟 n 21 n 22 n 2+ 合计 n +1 n +2 n A B 即 n 11 ( n 21 + n 22 )≈ n 21 ( n 11 + n 12 ) ? n 11 n 22 - n 21 n 12 ≈0 ,因此, | n 11 n 22 - n 21 n 12 | 越小,患 病与吸烟之间的关系越弱,否则,关系越 强. 近似的判断方法: 设 n = n 11 + n 21 + n 12 + n 22 ,如果 H 0 成立,则在 吸烟的人中患病的比例与不吸烟的人中患 病的比例 应差不多 ,由此可得, 1 1 2 1 1 1 1 2 2 1 2 2 n n n n n n
原创力文档


文档评论(0)