32独立性检验的基本思想及其初步应用2课时选修2 3.pptVIP

  • 0
  • 0
  • 约5.53千字
  • 约 45页
  • 2020-12-01 发布于天津
  • 举报

32独立性检验的基本思想及其初步应用2课时选修2 3.ppt

? ( 如图 1) ,二维条形 ( 如图 2) ,频率分布条形图 ( 如图 3 所示 ) ,由上 根据列联表作出三维柱形图 图 述三图可知,铅中毒病人中与对照组相比较, 尿棕色素为阳性差异明显,因此铅中毒病人与 尿棕色素为阳性存在关联关系. ? ? 某学校对学生课外活动内容进行调查,结 果整理成下表: 体育 文娱 总计 男生 21 23 44 女生 6 29 35 总计 27 52 79 利用图形判断学生课外活动的类别与性别 是否有关系? ? [ 解析 ] 某等高条形图如图所示. 由图可以直观地看出喜欢体育还是喜欢文 娱在性别上有较大差异,说明课外活动的 类别与性别在某种程度上有关系. ? 两种变量: ? 定量变量:体重、身高、温度、考试成绩等等。 ? 变量 ? 分类变量:性别、是否吸烟、是否患肺癌、 ? 宗教信仰、国籍等等。 ? . 在日常生活中,我们常常关心 分类变量之间是否有关系 : 这种变量的不同 值 表示个体所属的不同 例如,吸烟是否与患肺癌有关系? 类 性别是否对于喜欢数学课程有影响?等等。 别 , 像这类变量称为 分类变量 . 研究两个变量的相关关系: ? 定量变量——回归分析(画散点图、相关系数r、 ? 2 变量 ? 相关指数R 、残差分析) ? 分类变量—— 独立性检验 ? 本节研究的是两个分类变量的独立性检验问题。 探究 像 这 样列出的两个分类变量 的 频数表 , 称为 为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机 地调查了 9965 人,得到如下结果(单位:人) 吸烟与肺癌列联表 不患肺癌 患肺癌 总计 列联表 . 不吸烟 吸烟 总计 7775 2099 9874 42 49 91 7817 2148 9965 在不吸烟者中患肺癌的比重是 0.54% 2.28% 在吸烟者中患肺癌的比重是 说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患 肺癌的可能性大。 ? ? ? ? 列联表 ①定义:列出的两个分类变量的 频数表 称 为 列 联表. ② 2 × 2 列联表 一般地,假设两个分类变量 X 和 Y ,它们的取值 分别为 { x 1 , x 2 } 和 { y 1 , y 2 } ,其样本频数列联表 ( 也称为 2 × 2 列联表 ) 为下表 . ? 一般地,假设有两个分类变量 X 和 Y ,它们的可 能取值分别为 { x 1 , x 2 } 和 { y 1 , y 2 } ,其样本频数 列联表 ( 即 2 × 2 列联表 ) 为: ? b + c + d ( 其中 n = a + 为样本容量 ) . y 1 y 2 合计 x 1 a b a + b x 2 c d c + d 总计 a + c b + d a + b + c + d 与表格相比 , 三维柱形图和二维条形 图 能更直观地 反映出相关数据的总体 状 况 . 二维条形图 三维柱形图 8000 7000 6000 5000 4000 不患肺癌 患肺癌 3000 不吸烟 不患肺癌 患肺癌 吸烟 2000 1000 0 不吸烟 吸烟 在三维柱形图中,主对角线上两个柱形高度的乘积与 副对角线上两个柱形高度的乘积相差越大, 两个分类变量有关系的可能性就越大. . 等高条形图 等高条形图与表格相比,更能直观地反映出两个 分类变量间是否互相影响 常用等高条形图展示列联表数据的频率特征. 等高条形图 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 患肺癌 比例 不患肺癌 比例 不吸烟 不吸烟 吸烟 吸烟 等高条形图更清晰地表达了两种情况下患肺癌的比例。 某企业为了考察同一种产品在甲、乙两条生产线的 产品合格率,同时各抽取 100 件产品,其中甲线中 合格产品的个数为 97 ,乙线中合格产品的个数为 95 。 请做出列联表,三维柱形图与二维条形图。 合格 不合格 总计 甲生产线 97 3 100 乙生产线 95 5 100 总计 192

文档评论(0)

1亿VIP精品文档

相关文档